Будущее Rambus!?

Проблема увеличения пропускной способности памяти, как одной из основных систем компьютера, определяющих его производительность, возникала уже не раз. И каждый раз это было связано с ростом пропускной способности канала процессор-чипсет. «Бутылочным горлышком» же выступали именно типы используемой памяти, и их производители, потому как контроллер памяти создавали разработчики системной логики. От производителей памяти требовалось только поддерживать и налаживать производство новых технологий памяти. Так уж сложилось, что технологии памяти развиваются эволюционным путем, плавно наращивая разрядность и частоту, но при том, наследуя основные черты предыдущих разработок. Но что еще в области памяти такого можно придумать? А судьба революционных технологий зачастую бывает трагична.

Так вот как раз в периоды «узости» оперативной памяти, когда требовался кардинальный метод, который позволит реализовать новую ступень в пропускной способности памяти и выровняет участки чипсет-память и процессор-чипсет по пропускной способности, большинство разработчиков молчало. Это и понятно – никаких затрат на модернизацию производственных мощностей, большие объемы производства и отлаженность наследственных технологий (DRAM и SDRAM тому пример).

Неудавшаяся революция

К числу поборников революционных методов развития памяти относилась компания Rambus. Это молодая компания, основанная в 1990 году, сама по себе развивалась очень быстро. Уже через месяц после своего создания компания подала в патентное ведомство США заявку на патентование технологии Rambus. Правда она будет удовлетворена позже, задним числом. Далее компания, видя некоторое сопротивление со стороны гигантов рынка, принимает очень мудрое решение о вступлении в JEDEC – с 1992 года компания официально значится членом комиссии. Это позволило компании участвовать в заседаниях комитета и голосовать против принятия стандартов SDRAM и SLDRAM. Причина всем понятна – в это время компания как раз планировала патентовать эти стандарты, но если бы она раскрыла свои карты, то доступ в JEDEC ей был бы закрыт. В 1996 году она также резко выходит из JEDEC и подписывает договор с Intel о поддержке стандарта со стороны Intel и разработке в течение 2 лет чипсета для памяти Rambus. Именно эта компания, лидер индустрии, на которого многие ориентировались, и сыграет решающую роль в судьбе Rambus. Перед этим в 1995 году патентуя свой новый стандарт Base RDRAM – развитие технологии Rambus. В 1996 году четко вырисовываются конкуренты – SDRAM и DDR, которые быстро захватывают немалую долю рынка, так как учитывают предыдущие наработки в области DRAM, а не стремятся капитально увеличить пропускную способность памяти.

В 1997 году Intel объявила о том, что следующим стандартом после PC100, который она начала использовать, станет именно RDRAM. Тем временем Rambus предлагает новую версию RDRAMConcurrent RDRAM, а производители чипов тем временем уже наладили производство PC100. Осенью 1997 года компания Intel объявила о том, что планирует использовать RDRAM с 1999 года с частотой 800 МГц. Это событие и обернуло всеобщую «любовь» в сторону Rambus: производители чипов стали выстраиваться в очередь для лицензирования этого стандарта. 1998 год стал для компании «золотым веком»: сплошные похвалы и большие прибыли от лицензирования. Даже AMD осенью 1998 года заявила о поддержке RDRAM. Тем не менее, в плане развития самой технологии все было не столь безоблачно. Новая технология с трудом осваивалась, выход годных чипов бы низким (к тому моменту уже многие производители памяти приступили к производству RDRAM, первая среди них была и осталась Toshiba) – на уровне 15-20%, а производительность была примерно равной SDRAM на стандартных задачах. Только потом стало очевидно, что при существующих потребностях памяти RDRAM не нужна, индустрия еще к ней не готова. А ведь главную направляющую роль в принятии рынком стандарта RDRAM сыграла именно Intel, чья тень постоянно присутствовала за спиной Rambus и стимулировала своим серьезным видом к поддержке новых технологий. Несмотря на проблемы с производством, производителей чипов успокаивало, что их разработки найдут применение в продуктах мирового лидера. Это при том, что ни один другой производитель чипсетов для серверов и рабочих станций эту память не поддержал!

Так настал 1999 год, в начале которого был объявлен стандарт Direct RDRAM с максимальной результирующей частотой 800 МГц. И тут выяснилось, что ни один производитель не может выпускать модули с такой частотой! Частота была снижена до 700 МГц, но все равно оставалось много брака и проблем. И тут внезапно, в июне, на который был назначен выпуск первого чипсета под RDRAMi820 переносится на сентябрь. И тут на Rambus накинулись производители, припомнив ему все: от дороговизны производства, большого тепловыделения до комиссионных за производство чипов, взимаемых Rambus. Тем более, что в марте была обнаружена ошибка CMOS truncated bit. А i820, отличавшийся нестабильностью, был назначен к выходу уже в сентябре. Intel сама начала искать запасные варианты в виде i815, уже не до конца веря в успешность проекта, тем более, что VIA как раз выпустила чипсет Apollo Pro 133. Компания даже придумала переходник RDRAM-SDRAM для установки модулей DIMM на чипсет с поддержкой DRDRAM. Производители ПК поочередно стали отказываться от использования RDRAM, мол, может быть потом. Вся эта напряженная ситуация завершилась сенсационным заявлением Intel об отмене выхода i820 в последний момент. Так и была сломлена большая технология.

В 2000 году компании Rambus ничего не оставалось, как использовать свой «запасной вариант», потребовав с производителей памяти достаточно большие проценты за лицензирование SDRAM и DDR, которые, как оказалось, нарушают ее патенты. Те самые патенты, которые компания не хотела раскрывать в 1995 году, отказываясь голосовать в JEDEC. Через полгода сдались очень многие, начиная с Toshiba и Hitachi заканчивая Samsung. Остались неколебимы только Micron, Hyundai и Infineon. Этот год стал для компании самым прибыльным – 14,5 млн. долларов за квартал, - но последним удачным. Год 2001 стал для компании разгромным – иски в судах против Infineon и иже с ним были отклонены. Micron подала иск против Rambus, обвиняя последнюю в нарушении антимонопольного законодательства, нарушении устава JEDEC и краже технологий, разработанных совместно. Акции Rambus упали более чем в 2 раза. Судебные прения продолжаются до сих пор. В 2003 году Федеральная комиссия по торговле США обвинила Rambus в преднамеренном уничтожении документов, относящихся  к «патентному делу» для того, чтобы выиграть слушания против производителей памяти. Rambus была признана виновной в преднамеренном уничтожении документов, и теперь если юристы Rambus не докажут невиновности в «деле  JEDEC», то компания будет обвинена в незаконном присвоении патентов. Правда, Intel обязалась выплачивать по 5 млн. долларов год в течение 5 лет, чтобы иметь возможность спокойно выпускать чипсеты для Pentium 4. А Крейг Баррет тогда признался, что компания Intel теперь будет ориентироваться только на поддерживаемые индустрией интерфейсы памяти. Многочисленные судебные разбирательства свели репутацию компании Rambus на нет.

Но компания Rambus вовсе не умерла, как могло показаться. И что мы все о компьютерной памяти? RDRAM изначально предназначалась как память с высокопроизводительным интерфейсом для поточных систем. Еще с 1995 года она успешно использовалась в игровых графических приставках, и ей там не было равных. Сначала RDRAM была применена в игровой приставке Nintendo 64, это так понравилось Sony, что затем эта же память была использована в Sony PlayStation и PS2. Позднее эта память была применена и в приставке Sega. Основная компания, поставлявшая память графических приставок – Toshiba – с успехом делает это и до сих пор, но об этом чуть попозже. Не меньшее применение эта память находила и в сетевых устройствах, например, интеллектуальных маршрутизаторах.

Через некоторое время было налажено производство памяти RDRAM, повышена ее стабильность, решены проблемы с задержками. В 2001 году была объявлена DRDRAM PC1066 с пропускной способностью до 2132 Мбайт/с на один канал. PC800 производилась с пропускной способностью до 3200 Мбайт/с на 2 канала. Вскоре появилась DDR333, которая имела меньшую пропускную способность (2700 Мбайт/с) из-за одноканальности. А цены на DRDRAM значительно снизились, уменьшилась себестоимость производства. После некоторого затишья компания стала плавно развивать свой интерфейс, в результате чего он получил множество различных модификаций.

Модификация с частотой 1066 МГц, несмотря на хорошую производительность и отлаженную технологию долгое время не утверждалась компанией Intel, которая, понимая, что DRDRAM уже не станет всеобщим стандартом в ближайшее время, тянула время. В итоге чипсет под эту память i850E все-таки вышел, но официально поддерживал только PC800. Надо сказать, что он по сравнению с ранними чипсетами серии i845 показывал преимущество, но с выходом двухканальных платформ для памяти DDR ситуация изменилась.

В том же 2002 году появились принципиально новые типы памяти Rambus  RIMM3200 и RIMM4200. Это были первые 32 разрядные модули DRDRAM, работающие с той же тактовой частотой, что и их 16-битные варианты (800 и 1066 МГц). Память такого типа получила новый корпус с другим количеством контактов (242 контакта против 184 или 168), изменилось расположение ключей. Поскольку это были 32-битные модули, то они сочетали в себе 2 канала по 16 бит, что устранило необходимость ставить модули памяти в материнскую плату парами, так как оба канала были сформированы уже в самом модуле. Затем появились и 64-битные образцы, соответственно, с 4 каналами.

В 2003 году появились 32-разрядные модули RIMM4800 с тактовой частотой 1200 МГц. Соответственно они имели 2 канала в одном модуле и пиковую пропускную способность 4,8 Гбайта/с. Правда успешное развитие технологии Rambus вовсе не означало ее успешное продвижение на рынок. Несмотря на то, что чипсет i850E оказался достаточно удачным и быстрым, он официально поддерживал только память стандарта PC800 с пиковой пропускной способностью до 3,2 Гбайт/с на 2 канала. Это в то время как DDR333 позволял передавать 2,7 Гбайта/с по одному каналу, а ведь nForce 2 и i875/865PE уже давно имели поддержку двухканального DDR. К тому же RDRAM до сих пор страдал латентностью доступа к памяти, в то время как задержки циклов памяти DDR все уменьшались. Только в 2003 году, наконец, с полугодовым опозданием появился долгожданный SIS R658 – первый чипсет под DRDRAM не от Intel. Несмотря на то, что чипсет поддерживал гораздо больше функций, чем аналог от Intel, он получился не очень удачным. Несмотря на малую стоимость и поддержку PC1200 и PC1333 (правда, неофициально) он имел большую латентность обращения к памяти и достаточно низкую производительность (даже ниже чем i850E с PC1066). Короче говоря, этот чипсет оказался хорошей поддержкой Rambus со стороны SIS, не позволив забыть о памяти DRDRAM, но плохим конкурентом. Оставалось надеяться только на четырехканальный SIS R659, который, наконец, должен был вывести Rambus в лидеры (пропускная способность 8,5 Гбайт/с против двухканальной DDR400 с 6,4 Гбайт/с).

На первом квартале 2003 года на Rambus Developer Forum был объявлен чипсет SIS R659. Этот чипсет стал результатом совместного проекта SIS, Samsung, Asustek и Rambus. Чипсет поддерживает четырехканальную память типа RDRAM, работающую на частоте 1200 МГц, что позволяет достичь максимальной пропускной способности памяти в 9,6 ГБ/с при использовании 16-битных модулей памяти. При использовании модулей PC1300 это величина возрастет аж до 10,4 Гбайта/с. Эта пропускная способность вдвое превышает пропускную способность двухканальной памяти DDR. Максимальный объем памяти, поддерживаемый новым чипсетом, составляет 16 Гб. В комплект чипсета R659 входит южный мост SiS964 со встроенными контроллерами USB 2.0 (до восьми портов) и Serial ATA/150 с поддержкой RAID. При использовании дополнительного чипа SiS180 в систему можно установить до шести накопителей с параллельным ATA-интерфейсом и до шести - с интерфейсом Serial ATA.

В новом чипсете SIS R659 реализован улучшенный механизм HyperStreaming Engine, ускоряющий обмен данными между процессором, памятью и чипсетом. На днях компания Silicon Integrated Systems (SiS) представила технологию Advanced HyperStreaming Engine (AHSE), которая максимально полно раскрывает преимущества чипсета при работе с четырёхканальной памятью Rambus.

AHSE включает в себя следующие технологии: Low Latency with single stream, Pipelining and Concurrent Execution with Multiple streams, Prioritized Channel with Specific stream, Smart flow control and Intelligent arbitration with Smart stream и Advanced stream accelerative technology. Они предназначены для интеллектуального управления потоками данных в системе и призваны повысить общую производительность компьютера. AHSE можно сравнить с технологией Performance Acceleration Technology (PAT), продвигаемой Intel и призванной исполнять такие же задачи. Так что, похоже, Rambus с таким арсеналом опять имеет большие надежды на успех. Посмотрим.

Direct RDRAM по-новому

Давайте посмотрим, что собой представляет современный модуль памяти DRDRAM. Дело в том, что за последние несколько лет было выпущено большое количество спецификаций на новые разновидности памяти. Технология Rambus представляет собой вовсе не стандарт чипов памяти, а узкая высокоскоростная шина для соединения компонентов по канальной архитектуре. В стандарте определена топология шины с коротким и длинным каналом, причем длинный канал является базовым и используется в ПК. Вся подсистема памяти Rambus состоит из 4 компонентов: контроллера памяти (RMC), Rambus-канала (RC), генератора тактовых импульсов (DRCG) и микросхем памяти RDRAM.

Физические, электрические и логические принципы и соглашения, применяемые в системе, определены компанией Rambus и должны строго выполняться всеми производителями для соблюдения абсолютной совместимости ее частей, так как Rambus-память работает на очень большой частоте. Контроллер памяти состоит из специализированной микросхемы Rambus ASIC Cell (RAC), которая генерирует управляющие сигналы для памяти и обменивается данными с компьютером. К одной RAC можно подключить до 4 каналов, функционирующих абсолютно независимо друг от друга. У каждого из них есть отдельный управляющий блок, который отвечает за микросхемы памяти, подключенные к каналу, их состояние, ответы, а также транслирует команды RAC в пакеты протокола Direct Rambus (преобразование CMOS-сигналов в RSL).

Канальная структура

Канал создает электрическую связь между контроллером и микросхемами RDRAM и представляет собой 30 высокоскоростных линий, передающих данные по обоим фронтам синхронизирующих сигналов частотой от 267 до 600 MHz (результирующая частота – от 533 до 1200 MHz). Высокая частота сокращает цикл синхронизации до 1,66 нс для частоты 1200 МГц и 1,87 нс для PC1066. Использование такой большой частоты стало возможным благодаря применению резистивного терминатора на конце канала, подавляющего паразитные отражения, а также сигналов низкого напряжения, точно рассчитанной топологии самих каналов для соблюдения одинаковой дистанции пробега сигналов по разным проводникам, прецизионных дифференциальных тактирующих сигналов и большой плотности размещения элементов с короткими соединениями и малого количества контактов. Собственно сами сигналы канала разделены на три группы: 16- или 18-разрядная (2 бита ЕСС) шина данных, 5 бит - адрес строки и 3 бита - адрес столбца. Использование раздельных разрядов для адресов строки и столбца позволяет увеличить быстродействие системы. Данные передаются только между управляющим устройством и микросхемой памяти, так как все чипы памяти независимы. Используется всего один общий для всех провод нулевого напряжения Uref для подавления отражения сигналов. Конечно, из-за наводок проводников могут появиться взаимные помехи, которые помешают четкой детерминации сигнала, но из-за малого количества проводников и низкого разброса напряжения этого при соблюдении требований Rambus не возникает.

Таким образом, достигается наилучший среди типов памяти показатель «пропускная способность на контакт» (PBW). Малое количество контактов значительно упрощает разводку материнской платы, но приводит к значительному усложнению и удорожанию микросхем памяти. Для устранения наводок используются дорогие корпуса mBGA, для трансляции данных, идущих от чипов памяти требуются высокочастотные мультиплексоры и демультиплексоры. К тому же, модули RIMM из-за большой частоты рассеивают большое количество тепла, поэтому требуют дополнительного теплоотвода.

Direct Rambus RIMM - это модуль расширения памяти, который вставляется в разрыв канала в соответствующий разъем. Таким образом, пустые разъемы не допускаются - в них необходимо вставлять специальный RIMM, который не содержит микросхем памяти, а только продолжает канал. Один канал может использовать максимум до 32 микросхем RDRAM, что дает возможность нарастить память до 1 GB при емкости микросхем по 256 Мбит. Для размещения большего объема памяти можно применять микросхемы-повторители, позволяющие удлинить канал (возможно использование до двух повторителей, что дает максимум 128 микросхем в 12 модулях RIMM).

Базовый протокол RSL, применяемый в DRDRAM, позволяет кодировать данные 2 уровням напряжений, при условии, что разница между «1» и «0» составляет всего 800 мВ (1,8 и 1,4 В). Недавно Rambus применила протокол QRSL, который позволяет кодировать данные 4 уровнями напряжений, позволяя передавать 4 бита данных за такт.

Direct Rambus RIMM - это модуль расширения памяти, который вставляется в разрыв канала в соответствующий разъем. Таким образом, пустые разъемы не допускаются - в них необходимо вставлять специальный RIMM, который не содержит микросхем памяти, а только продолжает канал. Один канал может использовать максимум до 32 микросхем RDRAM, что дает возможность нарастить память до 1 GB при емкости микросхем по 256 Мбит. Для размещения большего объема памяти можно применять микросхемы-повторители, позволяющие удлинить канал (возможно использование до двух повторителей, что дает максимум 128 микросхем в 12 модулях RIMM).

Rambus-канал является синхронным. Синхронизация всего канала построена таким образом, что передающиеся сигналы распространяются всегда в одном направлении с тактирующими импульсами, что позволяет избежать запаздывания импульсов за счет преодолеваемого расстояния. Тактовый генератор вырабатывает импульсы, которые распространяются от крайней точки канала к контроллеру, где разворачиваются и по другой линии идут в обратном направлении, после чего попадают в терминатор. Все сигналы, распространяющиеся по направлению к контроллеру, синхронизируются входящими тактовыми импульсами, а сигналы, исходящие из контроллера - импульсами, идущими по направлению к терминатору. Поэтому дополнительная синхронизация в принципе отсутствует.

Ядро и пакеты

Данные и сигналы управления передаются по каналу пакетами, каждый из которых всегда состоит из восьми посылок, независимо от того, сколько информации нужно передать. Это обеспечивает совместимость с будущими модулями памяти значительно большего объема. Данные и адрес передаются фрагментами восемь раз. Следовательно, один пакет позволяет передать 128 бит данных. Дело в том, что ядро чипов памяти имеет внутреннюю шину 128 бит и работает на частоте от 100 МГц (т.е. как минимум в 8 раз медленнее самого интерфейса) поэтому для посылки пакета в 16 байт (128 бит) требуется 8 посылок или 4 такта. Длительность передачи одного пакета – 10 нс. Необходимо отметить, что транзакция записи, следующая за транзакцией чтения требует задержки в 5 циклов синхросигнала (от 8,3 до 10 нс). Время задержки первого пакета составляет до 50 нс, но затем данные передаются практически непрерывно.

Такова организация ядра DRDRAM, что параметр CAS Latency (время выбора ячейки столбца) составляет 7 тактов, соответственно 11,6 нс. Это больше, чем у DDR400 с CL=2, соответственно 10 нс. Таким образом, несмотря на высокую частоту из-за большого количества циклов шины DRDRAM начинает проигрывать.

В отличие от DDR SDRAM с независимыми банками памяти, RDRAM долгое время (до появления PC1066) содержала зависимые банки. Это означает, что на два банка используются общие усилители, формирователи сигналов и другая логика. Такой подход позволяет разместить больше банков памяти на заданной площади кристалла и снизить себестоимость памяти, однако исключает возможность доступа к двум банкам в смежных операциях, так как управляющие цепи необходимо перезаряжать, на что требуется определенное время. RDRAM использует 16 банков, в то время как пакет состоит только из восьми посылок. Это позволяет подготовить смежные банки, пока обрабатывается один пакет. Модули с микросхемами по 16 или 32 зависимых банка (16d, 2x16d) имели емкость 128/144 и 256/288 Мбит.

Такая схема была очень дорогой в исполнении, поэтому в модулях PC1066 и PC1200, а также RIMM 4200, 4800 и 6400 стали применяться чипы 4i c 4 независимыми банками. При установке 2 модулей 4i по 8 чипов на каждом мы получаем 32 независимых банка. Поскольку все микросхемы памяти DRDRAM независимы, поэтому все банки доступны, в отличие от DDR, где доступна только одна микросхема (т.е. 4 банка). Короче говоря, это нововведение оказалось очень удачным, но было применено слишком поздно.

Шина и типы модулей

Давайте посмотрим, какие на данные момент модули памяти Direct RDRAM существуют. Компания выпускает и планирует продолжать выпускать 16, 32 и 64-битные модули.

1.      16-битные модули выпускаются с микросхемами плотностью до 256 (288) Мбит. Они бывают RIMM1600 и RIMM2100 (цифра указывает на пропускную способность модуля в МБ/с). Такой модуль имеет один канал и 168 контактов. Поддерживается результирующая частота от 800 до 1066 МГц.

2.      32-битные модули используются 256 и 512-разрядные микросхемы и имеют 2 встроенных канала (А и В). Такие модули бывают RIMM3200, 4200, 4800, 5300, 6400. Поддерживается частота от 800 до 1600 МГц. Модуль имеет 232 контакта.

3.      64-битные модули используются чипы памяти с плотность 256 (288) бит и имеют 4 канала (A, B, C, D). Выпускаются модули RIMM6400 и RIMM8500 c частотой 800 и 1066 МГц соответственно. Модуль имеет 326 выводов.

Как вы видите, с таким количеством типов модулей легко запутаться. Еще больше запутывает то, что микросхемы с плотностью 128 бит и 256 Мбит и частотой 800 МГц имеют 32 зависимых банка (Split Banks), а 256-Мбитные микросхемы с частотой 1066 и 1200 МГц могут иметь как 32 зависимых банка, так и 4 независимых (4i Independent Banks). 512-битные микросхемы с частотой 1066 МГц выполнены по 4-банковой независимой архитектуре, а с частотой 1333/1600 МГц – по 32-банковой архитектуре.

Контроллеры, разработанные для 16-битных модулей, могут успешно работать с 32-биными модулями, но не 64-битными. Также нельзя смешивать модули с различной разрядностью.

Из-за такого большого количества особенностей никто уже не смотрит, что 32-битные модули в 4-канальной конфигурации при использовании чипсета R659 могут обеспечить пиковую пропускную способность до 9600 МБ/с. Жаль, но, несмотря на хорошие возможности, перспективы у модулей Direct RDRAM вовсе не радужные. Похоже, RDRAM уже никогда не станет универсальным стандартом, да он им никогда и не был. Высокоскоростной, дорогой по себестоимости и требовательный стандарт – не совсем то, что нужно индустрии: производители чипов (да и конечные пользователи в итоге) всегда в таком случае предпочтут пусть чуть более медленную, не столь перспективную, но дешевую, универсальную шину, тем более открытого стандарта, за который не надо платить лицензионные отчисления.

Ближайшие перспективы DRDRAM таковы: во второй половине 2004 года компания предполагает представить 256 и 512-мегабитные чипы, работающие с результирующей частотой 1600 МГц. Тогда появятся 64-битные модули RIMM9600 с тактовой частотой 1200 МГц и пропускной способностью до 9,6 ГБ/с на 4 канала, интегрированные в один модуль.

Воскрешение Rambus

На данный момент доля Rambus на рынке памяти составляет около 3% и периодически уменьшается. Предвидя дальнейшее ухудшения ситуации, компания Rambus приняла решение продолжать совершенствовать существующие стандарты Direct RDRAM, которые используются только в узком кругу задач и одновременно приняться за разработку новых технологий, которая должна стать технологией будущего для графических станций, игровых приставок и сетевых устройств.

Итак, теперь деятельность компании сконцентрировалась в нескольких направлениях: создание высокоскоростных интерфейсов, создание новых интерфейсов памяти и создание новых типов памяти.

Работа над новой технологией под кодовым наименованием Yellowstone началась еще в 2001 году, когда дела у Rambus были не так плохи. Представлена она была на осеннем RDF 2001. Вскоре после того, как отношения Intel и Rambus окончательно испортились, компания вплотную занялась именно этой технологией. Yellowstone должна была стать новым сигнальным интерфейсом для контроллеров памяти и других высокоскоростных компонентов системы. Вместе с разработкой новых интерфейсов изменилась и схема лицензирования: теперь партнеры не должны платить за каждый чип памяти, произведенный по этой технологии, а стоимость лицензирования значительно снизилась. Это и привлекло некоторых старых партнеров Rambus, таких как Toshiba, Elpida, Sony и Samsung. Вскоре после подписания между ними контрактов технология Yellowstone была переименована в XDR.

XDR – конкуренты отдыхают

Чем же Rambus вновь смог привлечь партнеров? Новый тип памяти использует новую сигнальную технику, что позволяет ему использовать частоту от 3,2 до 6,4 ГГц для передачи данных. Соответственно, ожидается, что новый параллельный интерфейс для начала позволит передавать от 6,4 до 12,8 Гбайт данных в секунду. Такие модули будут называться RIMM11G. В будущем эту производительность можно будет еще увеличить. Кроме того, эта технология отличает высокой производительностью при малом количестве сигнальных линий, микросхем и простоте разводки трасс на платах.

Архитектура XDR состоит из 5 основных компонентов: контроллер памяти (XMC), контроллер шины данных (XIO), тактовый генератор системы (XCG), шина XDR Interconnect и памяти XDRAM. В отличие от DRDRAM, ASIC здесь содержит XMC и XIO. ASIC выполнен с учетом новейшей технологии Rambus RaSer, о которой речь пойдет ниже.

XDR Interconnect

Главный элемент новой памяти – шина XDR Interconnect, которая соединяет контроллер и модули памяти. Именно на эту шину приходится большинство нововведений, заявленных еще в Yellowstone. Эта шина состоит из 2 каналов по 16 бит, каждый из которых поддерживает по 2 устройства XDR DRAM. Один из каналов «сквозной», который проходит через все разъемы RIMM, а второй терминируется на оконечном модуле памяти.

Кроме этих двух двунаправленных каналов данных DQ она включает 12 линий шины запросов RQ, пару линий тактовой частоты и 2 группы по 4 линии управляющих сигналов. Эта шина на данный момент поддерживает пропускную способность до 12,8 ГБ/с. ASIC поддерживает до 2 XMC, поэтому может поддерживать 2 шины Interconnect с 2 каналами каждая, что обеспечивает пропускную способность до 25 ГБ/с. В перспективе Rambus планирует создать 128-разрядную шину XDR Interconnect. Основой XDR Interconnect стали несколько технологий, которые уже не первый год у нас на слуху. Основой этой шины является технология ODR (Octal Data Rate), которая позволяет передавать 8 бит данных за такт. Таким образом, при частоте синхронизации 400 МГц частота передачи данных составит 3,2 ГГц. Специальный встроенный генератор XCG выдает синхронизирующие импульсы (CTM) с частотой 400 МГц. Канал запросов RQ передает сигналы по обоим фронтам импульса, то есть с частотой 800 МГц. Частота работы XIO – 1.6 ГГц, так как на каждый синхроимпульс он выдает на шину 2 импульса, то есть происходит умножение частоты. И, наконец, по шине DQ данные передаются как по фронту, так и по спаду импульса, то есть 8 раз за такт. Это и есть залог быстродействия XDR.

Еще одна очень интересная технология, которую использует эта шина – DRSL (Differential RSL), которая пришла на смену RSL и QRSL. Новый сигнальный протокол позволяет эффективно разделять логические уровни, при этом используя низкое напряжение. Разность потенциалов между логическими уровнями здесь всего 200 мВ (от 1,0 до 1,2 В), а не 800, как в DRDRAM. Главное, для чего используется DRSL – создание двунаправленного сигнала chip-to-chip. Для синхронизации командных сигналов и адресных линий используется старый RSL (800 МГц). Очевидно, что поскольку используется меньшая амплитуда сигнала, то меньше его энергопотребление и больше частота. Это к тому же уменьшает наводки на соседние линии. Этот протокол позволяет подключать до 36 устройств.

Третий компонент называется FlexPhase. Она выполняет автоподстройку фаз сигналов данных и адреса в течение 2,5 пикосекунд. Поскольку FlexPhase использует встроенный тактовый генератор, то задержек не должно возникать (по крайней мере, так обещает Rambus). Главный плюс этой технологии в том, что теперь нет необходимости делать все дрожки строго одинаковой длины для точной синхронизации чипов памяти. Этой очень кропотливая и дорогостоящая работа при разводке материнской платы. В общем и целом, этот комплекс мер должен упростить разработку плат и удешевить сами модули памяти, особенно учитывая переход на их производство по 0,13-микронной технологии.

Ну и последняя технология этого квартета называется Dynamic Point-to-point Technology (DPP). Это технология позволяет использовать как один, так и несколько модулей памяти, так называемых XDIMM для расширения ее объема при сохранении той же разрядности шины. Так если у вас установлен один 32-битный модуль, то ему доступны все 32 бита обоих каналов. При расширении объема памяти вторым или третьим модулем, то 32-битная шина автоматически переконфигурируется так, чтобы выделить каждому модули по 16 бит (каждому по каналу).

ASIC и RaSer – одно целое

ASIC состоит из XIO и XMC. XDR IO представляет собой набор аппаратных и программных макросов, которые транслируют CMOS уровни в команды RSL/DRSL. XMC – это soft-макрос, который Rambus позволяет интегрировать уже готовым или использовать как рефференс-дизайн для создания собственного контроллера памяти.

XDR IO выполнен в соответствии с очередной уникальной разработкой Rambus. Эта высокопроизводительная технология ввода/вывода была названа ячейкой RaSer (Rambus Serializer/Deserializer). Под «ячейкой» в данном случае понимается любой элемент набора микросхем. Ячейка RaSer позиционируется как стандартный элемент аналогового ядра ASIC и ASSP-архитектур. Технологию RaSer можно использовать для организации связи между отдельными микросхемами или платами. Она способна заметно увеличить скорость передачи данных через маршрутизаторы глобальных сетей, а также через интерфейсы Fiber Channel, Gigabit Ethernet и InfiniBand. В настоящее время существуют одно-, двух- и четырехканальные конфигурации ячеек. Четырехканальная конфигурация обеспечивает пересылку информации со скоростью до 12,5 Гбит/с в каждом направлении. К началу 2003 года Rambus выдала 14 лицензий на использование технологии RaSer, среди получивших лицензии - Intel, Internet Machines, Banderacom и TranSwitch.

Rambus занимается разработкой физического слоя внедряемых компонентов по техпроцессам UMC и TSMC. Это могут быть как чипы, так и ASIC. Кроме того, компания решила предложить весь комплекс услуг по проектированию и разводке компонентов по технологии RaSer, также консультированию в этой сфере. Это должно привлечь разработчиков чипов. Вот области, в производстве чипов для которых, может применяться технология RaSer:

Семейство RaSer PHY Cell

 

Применение

0.18u

0.13u

90nm

Serial Backplane (1-4 Gbps)

+

+

2004

Serial Backplane (1-10 Gbps)

 

+

2005

Gigabit Ethernet

 

+

2004

10G Ethernet XAUI

+

+

2004

PCI Express

+

+

2004

Fibre Channel (1/2/4G)

 

2004

2005

SATA (1.5G/3G)

 

2005

2005

InfiniBand

+

+

 

Serial RapidIO

 

+

 

Примечание: + - уже имеется

К примеру, RaSer PCI Express – это готовый интерфейс физического слоя для внедрения в шину PCI Express, которую, кстати, поддерживает Intel. Она включает PMA и PCS слои стека PCI Express. Эта технология позволяет соединять северный и южный мост чипсета и присоединяет к ним шину PCI Express.

Rambus предлагает использовать новую память в нескольких альтернативных вариантах. Первый – это традиционная архитектура ПК, когда память подключается через северный мост чипсета. В таком случае для подключения к 72-разрядной (с ЕСС) системной шине следует использовать 36-битные XDIMM-модули. Доступен максимальный объем памяти 4,6 ГБ при использовании 512-битных микросхем. При использовании 4 модулей пиковая пропускная способность достигает 25,6 ГБ/с. Второй способ, предназначенный для использования в рабочих станциях и серверах подразумевает подключение модулей через XDR-буферы. В таком случае можно использовать до 72 модулей. Ну и третий способ «в духе AMD» позволяет подключать память напрямую к процессору. Это дает огромное преимущество перед DDRII память. Ведь при использовании 64-разряных XDR IO пропускная способность интерфейса возрастает до 50 ГБ/с, а при использовании 128-битного – до 100 ГБ/с. Только вот кто отважится на создание подобных систем – Rambus предлагает только концепцию…

Что касается самих микросхем DRAM, то они тоже значительно усовершенствованы: теперь они имеют 8 банков против 4 у RDRAM, упакованы в CSP-корпуса и имеют традиционную 16-битную внешнюю шину. Между каждыми 4 банками возможен interleave, а латентность снизилась до 1,25-3,3 нс. Напряжение питания снижено до 1,8 В, а ширина шины данных чипов сможет варьироваться от 1 до 32 бит. Память будет выпускаться модулями от 256 Мб до 8 Гб. Чипы будут «насаживаться» на 4-слойные печатные платы, что служит очередным несомненным плюсом XDR.

Кто же останется?

Первой лицензию на технологию XDR (тогда еще Yellowstone) получил давний союзник Rambus – компания Toshiba. Затем, в марте 2003 года этому примеру последовала Elpida. Затем Sony объявила о том, что в Sony Playstation 3 также будет использоваться XDR. Кстати говоря, PS3 будет использовать еще одну технологию под названием Redwood, которая основана на всех вышеописанных технологиях. В декабре 2003 года Toshiba представила первые опытные чипы памяти XDR, что произошло на квартал раньше, чем планировалось. Пресс-секретарь Toshiba Макото Ясуда пояснил, что опережение графика вызвано успешным ходом разработок. Что ж, Rambus можно только похвалить за то, что она создала все условия для успешного производства чипов!

Массовое производство памяти XDR с частотой 3200 МГц должно начаться в первом квартале 2005 года. Чипы с частотой 4 ГГц появятся во второй половине 2005 года, а покорение 3,4 ГГц назначено на 2006 год.

Что же касается Redwood, то это своеобразное развитие идеи XDR. Физически Redwood представляет собой ядро в виде параллельной шины, которое интегрируется в процессоры или другие чипы. Это интерфейс работает с частотой от 400 до 6400 МГц. Redwood может обеспечивать не только связь процессора ПК и чипсета, но и связь элементов чипсета – северного и южного моста, процессоров в сетевых коммутаторах и т.д. В бытовой технике, например, он может использоваться в телевизорах высокой четкости (HTDV). Интерфейс совместим с такими промышленными стандартами, как LVDS (Low voltage Differential Signalling), HyperTransport, Rapid I/O, и SDI-4.

В новом интерфейсе задействована технология FlexPhase, представленная компанией в июне 2002 года. Первоначально предназначенная для производства микросхем памяти, FlexPhase позволяет достичь очень высокой скорости передачи данных за счет точной синхронизации сигнала между электрическими контактами, а также снизить латентность. В результате уменьшения числа слоев печатной платы и сокращения общей длины разводки FlexPhase позволит снизить себестоимость конечной продукции, в том числе и материнских плат.

Второй примененной в стандарте технологией стала DRSL, о которой мы уже говорили выше. DRSL здесь унифицирован для поддержки LVDS. Применение этих технологий позволило значительно снизить напряжение питания, и, следовательно, потребляемую мощность, уменьшить электромагнитную интерференцию и повысить масштабируемость по частоте. Использование переменной частоты VDR (Variable Data Rate) позволило адаптировать шину для использования в любом другом стандарте с частотой синхронизации шины от 400 МГц. В принципе, поддерживается десятикратное умножение частоты синхронизации. В то время как последовательный интерфейс RaSer предназначен для сред передачи данных с высоким искажением и длинной контактных линий до 48 дюймов, то Redwood оптимизирован для быстрых параллельных соединений на короткое расстояние (до 15 дюймов). Хотя, как утверждает Rambus, их вполне можно использовать вместе в одном устройстве. Компания готова работать с клиентами по отдельным заказам, реализуя необходимое количество интерфейсов.

В начале 2003 года Redwood был лицензирован компаниями Sony и Toshiba. По некоторым данным, этот интерфейс будет применен в разрабатывающемся IBM, Sony и Toshiba процессоре Cell (кодовое название процессора для Playstation 3).

Короче говоря, новая технология XDR – действительно новый вызов всему остальному миру. В будущей памяти похоже исправлены все ошибки прошлого: большое тепловыделение, сложность проектирования, большая стоимость, большие лицензионные отчисления… Только вот найдутся ли компании, способные реализовать технологии, такие как RaSer и XDR компьютерах? Все же недоверие к компании из-за прошлого краха еще остается. Кроме того, нужны ли компьютерной индустрии такие сверхбыстрые технологии? Покажет будущее. Рынок всегда выбирает продукт с оптимальным соотношением цена/качество. Если XDR не будет производиться в больших объемах, то о завоевании рынка говорить не приходится. Причин, которые могут этому помешать не так уж и много, но с другой стороны нет и того импульса, которые изменит отношение рынка к нововведениям. Конъюнктура рынка может только измениться в случае, если кто-то из серьезных игроков hi-end рынка внезапно повернется в сторону Rambus. Например, AMDJ как это было 4 года назад, когда AMD первой сделала ставку на DDR. Пока что в лагере DDRII побольше «бойцов», в том числе Intel.

На данный момент ясно только то, что Rambus никогда не появится на столах пользователей ПК. Единственная компьютерная сфера, в которой Rambus может преуспеть на данный момент – это графические и рабочие станции, сервера и разработка chip-to-chip интерфейсов. В последнем амплуа компания себя попробовала недавно, но вполне удачно. И теперь Rambus не имеет права на ошибку, ибо на рынке hi-end памяти должен остаться только один…


Обновленный и дополенный вариант этой статьи на Terralab.ru

Автор: Александр Дудкин
dudkin@hwworld.ru

25.06.2004


© Авторские права и копия защищены законом: © Дудкин Александр Константинович, 2002 г.
Копирование любых материалов только с письменного разрешения автора сайта
URL сайта: www.hwworld.ru
Ваши замечания и предложения присылайте по e-mail: admin@hwworld.ru