В конце лета в новостях появились сообщения об анонсе AMD нового поколения серверных процессоров Opteron и предварительных планах компании по выпуску первых 4-ядерных (Quad-Core) чипов этого семейства. Подробности о Quad-Core архитектуре Opteron начали появляться еще раньше – на июньской выставке Computex 2006, где проскакивали первые сообщения о дебюте 4-ядерных Opteron в первом квартале 2007 года – как с соблюдением норм 65 нм техпроцесса, так и, возможно, 90 нм. Но даже после официального анонса в августе подробностей об архитектурных особенностях чипов Quad-Core Opteron не было. Поэтому AMD провела осенью ряд технических и пиар мероприятий в разных частях света, чтобы рассказать на них об этих высокопроизводительных процессорах.
Архитектурные особенности
4-ядерных процессоры AMD предположительно будут носить рабочие названия Santa Rosa и Deerhound. По словам представителей AMD, новые Opteron будут выполнены с применением норм 65 нм техпроцесса, что опровергает ранние прогнозы о возможном выпуске серверных 4-ядерных процессоров AMD с 90 мн нормами. Они будут обратно совместимы с нынешним поколением Socket F чипов, а новые технологии улучшат ключевой показатель – производительность на ватт (Performance-per-Watt).
Новые 4-ядерные процессоры, несмотря на увеличение физических размеров кристалла и значительную реорганизацию внутренней архитектуры, останутся в прежнем стандартном для топовых 2-ядерных процессоров Opteron диапазоне термодизайна, то есть, TDP новых чипов обещан на уровне порядка 95 Вт. Наряду с этим, новые процессоры будут поддерживать технологию AMD-V, то есть, AMD Virtualization.
Ключевыми технологии, реализованными в новых 4-ядерных процессоров AMD Opteron:
*Native Quad-Core Design – “нативная” четырёхъядерная архитектура, четыре ядра непосредственно на единой подложке
*Enhanced AMD PowerNow! – расширенная и улучшенная технология оптимизации энергопотребления, позволяющая динамически снижать потребление энергии ядрами – до 75% в ждущем режиме
*Direct Connect Architecture – архитектура, позволяющая эффективно снять часть традиционных “узких мест” x86 архитектуры: прямое подключение I/O шин HyperTransport (до 8 Гб/с), обеспечивающее оперативное взаимодействие между процессорами; интегрированный контроллер памяти, эффективно снижающий латентность и положительно влияющий на производительность; непосредственное подключение памяти DDR2
*Advanced Process Technology – улучшенный 65 нм техпроцесс производства с применением технологии SOI (Silicon-on-Insulator), малые токи утечек транзисторов процессора позволяют улучшить производительность на ватт и снизить тепловыделение 32-bit instruction fetch
*Улучшенный механизм предсказание ветвлений
*Исполнение команд с изменением последовательности (Out-of-order)
*Двухпотоковое управление 128-битными инструкциями SSE
*До четырёх операций с плавающей запятой двойной точности за такт
*Расширения для обработки групп битов
*Обработка расширений SSE
В качестве дополнительного преимущества новых 4-ядерных процессоров также подчёркивается сбалансированная эффективная структура кэша: 64 Кб кэша данных и 64 Кб кэша инструкций L1, по 512 Кб кэша L2 на каждое ядро, и, наконец, общий распределённый кэш L3 – 2 Мб (Santa Rosa) и 4 Мб (Deerhound) на процессор.
Новые Quad-Core Opteron с кэшем L3, появление которых запланировано на следующий год, точнее – на второй квартал 2007, будут сопровождаться обвязкой с поддержкой TCP Offload, контроллерами Gigabit Ethernet, Serial SCSI, Serial ATA II с поддержкой RAID. Следующее поколение чипов, появление которых запланировано на 2008 год, будет поддерживать технологию Direct Connect Architecture 2.0, будет обладать большим кэшем и рядом других новшество, а в плане обновления “обвязки” следует ожидать реализации шины PCI Express 2, 10 Gigabit Ethernet контроллеров и т.п.
Следующей волной инноваций, призванных в перспективе облегчить жизнь потребителю и улучшить производительность, станут технологии Torrenza, Trinity и Raiden. В основу технологии Torrenza, призванной ускорить обработку данных, положена технология Direct Connect Computing, а её реализация будет осуществляться за счёт слота HTX и специализированных аппаратных акселераторов. Улучшение безопасности системы, реализацию возможностей виртуализации и улучшение управляемости будет отвечать технология Trinity, реализованная на аппаратном уровне в чипе. Наконец, снижение общей стоимости владения (TCO) и расширение возможностей клиентского оборудования, в том числе, за счёт реализации возможностей виртуализации – прерогатива технологии Raiden.
В качестве дополнительного плюса платформы AMD Opteron приводится тот факт, что “жизнь” нынешнему процессорному разъёму под серверные чипы – 1207-контактному Socket F, обещана до 2009 года, то есть, скорее всего речь идёт о той поре, когда AMD надумает реализовать в чипах Opteron интегрированный контроллер памяти с поддержкой FB-DIMM.
Быстрота на практике.

Во время презентаций посвященных новым AMD Opteron было проведено немало тестов и сранений с конкурирующими решениями, в частности с Intel Xeon Woodcrest. Для того чтобы получить адекватные результаты тестирования для сравнения систем, был проведен комплекс тестов. Синтетические тесты использовались для оценки нагрузки на память, оценки работы системы I/O, но такие бенчмарки не в состоянии эмулировать собой реальные приложения. Именно поэтому в AMD считают, что для измерения реальной производительности необходимо в большей степени опираться на использование реальных приложений. Кроме того, в тестовых пакетах не редкость такое явление, как оптимизация, “искусственная акселерация” под ту или иную архитектуру. Были показаны тесты, в которых лидируют серверные системы на базе архитектуры Intel, затем на базе архитектуры AMD, при этом AMD подчёркивает, что тестовые приложения составлены на базе реальных приложений.
Также отмечается, что отражая пиковую производительность серверных систем, современные бенчмарки не отражают главного – популярной ныне тенденции Performance/watt, то есть, производительности на единицу затрачиваемой энергии. То есть, бенчмарки – это не единственный индикатор производительности, более того, тесты, включающие в себя менее четырёх тредов, не являются подходящими для 2-процессорных систем. Тем не менее, отмечается, что сравнение процессоров AMD с равными по тактовой частоте чипами серии Xeon Woodcrest даёт вполне конкурентные результаты. Выводы таковы: подход TPI (True Performance Initiative) хорош, но отдельные выборочные тесты непрактичны.
Для сравнения производительности с учётом затрачиваемой мощности AMD приводит ряд тестов, где противопоставляются системы на базе процессоров Intel Woodcrest и системы на базе AMD Opteron серии 2000. Именно системы, а не отдельно взятые процессоры, со всей соответствующей чипсетной обвязкой. Вель элементы северного моста чипсета являются неотъемлемой частью архитектуры процессоров Opteron, за счёт чего суммарный TDP серверной системы на чипах AMD выглядит предпочтительнее.
С реализацией нового поколения архитектуры процессоров AMD это преимущество лишь усилится.
Из всего этого AMD делает вывод о системах на базе Opteron как оптимально снижающих расходы на обслуживание и общую стоимость владения (TCO), благодаря стратегии последовательного использования общего ПО, стабильному переходу на новые поколения чипов, энергоэффективной архитектуре и использованию памяти DDR-2, и так далее.
Технология виртуализации AMD-V
Преимуществами AMD-V называются такие моменты как безопасность, обеспечиваемая за счёт аппаратной реализации Device Exclusion Vector (DEV), производительность, обеспечиваемая благодаря архитектуре Direct Connect, меченых буферов быстрого преобразования адреса (Tagged TLB), снижающих нагрузку на канал памяти в процессе загрузки новой виртуальной машины, а также специфических вложенных таблиц Nested Page Tables, ввод которых в 2007 году должен послужить быстрому переключению между виртуальными машинами.
Совсем скоро.
Компания AMD, в целом, закончила разработку Quad-Core процессоров Opteron. Уже во втором квартале 2007 года, первые 4-ядерные чипы AMD, произведённые с соблюдением норм 65 нм техпроцесса на дрезденском заводе Fab36, начнут сходить с конвейера. Новые 4-ядерные процессоры будут электрически совместимы с представленным в августе поколением 2-ядерных 1207-контактных Socket F чипов AMD Opteron (с 4-значной маркировкой), благодаря чему будут обеспечены минимальные затраты и защита инвестиций.

Владимир Зимин.
(c)InternetNews

28 november 2006