4×4 quad fxПроцессор Core 2 Duo, вышедший 14 июля, ознаменовал поворотный момент в мире CPU. В этот день AMD потеряла своё превосходство над Intel на рынке настольных ПК, длившееся почти три года. Процессоры Core 2 Duo оказались быстрее и эффективнее по энергопотреблению, чем линейка Athlon 64. Хотя, конечно, энергопотребление надо измерять у всей системы, а не только у процессора. Тем не менее, AMD продолжает ценовую конкуренцию. Но, в любом случае, AMD пришлось заняться разработкой новых решений, которые смогли бы достойно ответить на атаку Intel. И вот перед нами один из первых ответных ударов AMD: платформа 4×4 Quad FX, с двумя процессорными сокетами и архитектурой Direct Connect, нацеленной на энтузиастов и геймеров.
Сегодня Intel обладает отрывом не менее чем в девять месяцев по технологии производства. Все чипы Core 2 Duo, последние Xeon и многие процессоры Pentium D изготавливаются по техпроцессу 65 нм. Уменьшение размера транзистора приводит к снижению энергопотребления, возможности добавлять на кристалл больше функций (например, кэш большего размера) или размещать на одном кристалле два или больше ядер. Именно по этой причине Intel смогла выпустить четырёхядерный процессор (из двух кристаллов Core 2 Duo), для которого аналогов у AMD попросту нет. И то, что текущий 90-нм техпроцесс у AMD более совершенен благодаря технологии “кремний на диэлектрике” (SOI), уже не помогает: 90-нм четырёхядерный чип будет слишком большим и дорогим.
AMD уже представила первое поколение 65-нм чипов, что даёт возможность получить в будущем и четырёхядерные процессоры AMD. Первые 65-нм процессоры пойдут на недорогой и массовый рынки, и придётся подождать ещё несколько месяцев, прежде чем на прилавках магазинов появятся high-end 65-нм процессоры AMD. 65-нм четырёхядерный процессор Agena FX, с выделенным кэшем L2 и объединённым кэшем L2, появится не раньше лета 2007. А пока компания представила решение, которое должно сохранить высокий уровень конкуренции с Intel и продемонстрировать технологические достижения AMD. Не стоит забывать, что первые 45-нм процессоры Intel должны появиться весьма скоро, в конце 2007 года.
Quad FX, раньше носившая имя 4х4 – это ответ AMD на четырёхядерный процессор. Тут компания решила угодить энтузиастам и геймерам, представив двухпроцессорную платформу для так называемого “мегазадачного окружения”. То есть все свои задачи можно выполнять одновременно. Технология платформы была взята из мира Opteron: Quad FX состоит из материнской платы с двумя разъёмами Socket 1207, усиленного чипсета nVidia nForce 680a и пары процессоров Athlon 64 FX-70. Но, в отличие от Opteron, процессоры Athlon 64 FX под Socket 1207 используют не регистровую память, а обычную DDR2-800, по два DIMM на процессор. А чтобы всё было ещё более привлекательным, AMD предлагает комплекты FX-70, которые состоят из двух процессоров FX-70, FX-72 или FX-74 (им соответствуют частоты от 2,6 до 3,0 ГГц).
Два процессора и четыре ядра.
Для новой платформы был придуман новый термин “мегазадачность” (megatasking), который AMD описывает следующим образом:
*одновременный запуск множества приложений – и многопоточных, и сильно нагружающих процессор;
*запуск приложений цифрового мультимедиа;
*запуск грядущих игр с поддержкой многоядерности.
С большинством таких задач вполне нормально справится мощный современный двуядерный процессор, но в будущем ситуация может измениться. Правило для многопоточного окружения простое: чем больше ядер, тем лучше. Но четыре ядра и больше создадут немалую нагрузку на интерфейс процессора. Ему придётся загружать из памяти и записывать в память огромные массивы данных, причём делать это нужно как можно быстрее. Если процессорное ядро не будет получать данные своевременно, оно будет простаивать. И толку от такого решения уже не будет.
В начале следующего года, с чипсетом Bearlake, Intel перейдёт с 266-МГц FSB (FSB1066 с учётом учетверённой передачи данных) на 333-МГц FSB (FSB1333). В результате дву- и четырёхядерные процессоры получат более скоростной интерфейс для связи с чипсетом/оперативной памятью и друг с другом (если в упаковке два кристалла, как у Core 2 Quad).
Но у AMD давно есть преимущество по эффективной работе с памятью, ведь каждый процессор Athlon 64 оснащён встроенным высокоскоростным контроллером памяти с низкими задержками. Первые процессоры Athlon 64 поддерживали DDR400 с одним (Socket 754) или двумя (Socket 939) каналами. Текущее поколение процессоров – Athlon 64 и Athlon 64 X2 для Socket AM2 – работает с памятью DDR2-800 в двухканальном режиме. Ядро процессора получает доступ к памяти напрямую, в отличие от ситуации, когда данным приходится проходить через отдельный от CPU контроллер памяти, встроенный в чипсет.
Это важно. Но эффект довольно слабо заметен и главная причина кроется в преимуществе 65-нм техпроцесса Intel, который позволяет встраивать в процессор кэш L2 большего объёма. Ёмкий и эффективный кэш для каждого ядра обеспечивает высокую производительность, поскольку он компенсирует недостатки подсистемы памяти. Кроме того, эффективный и общий кэш, который одновременно используют два или больше ядер, также компенсирует задержки памяти.
Ситуация должна несколько измениться с появлением Microsoft Vista. Windows XP не может отличать физические процессоры от логических или ядра от процессоров, поэтому она раздаёт потоки на все доступные CPU. Ей не важно, находятся ядра на одном, двух или нескольких CPU, что приводит к переключению потоков между процессорами. А этого следует избегать, поскольку вместе с потоком необходимо перемещать и контекст, то есть данные потока. Потоки, которые работают на одном физическом ядре, в следующий раз могут просчитываться другим ядром. Четырёхядерная система Intel создана комбинацией двух двуядерных кристаллов в одной упаковке, связь между которыми идёт через FSB. Та же самая FSB отвечает ещё и за отправку/приём данных в память (через контроллер чипсета). В Windows XP процессорное ядро A CPU1 будет ждать, пока ядро B CPU1 не завершит операцию с памятью. Затем ядро A CPU1 запросит данные у подсистемы памяти, которые будут записаны в кэш L2 для обработки. Но если Windows вдруг пожелает привязать поток к процессору CPU2, то придётся переносить данные из кэша L2 блока A CPU1, что приведёт к появлению дополнительного трафика по FSB. Данные в таком случае нельзя снова считывать из памяти, поскольку они уже обрабатываются.
Windows Vista Ultimate Edition сможет отличать процессоры или узлы от процессорных ядер. В результате она сможет привязывать потоки более эффективно. Первая большая задача может выполняться только на CPU1, а другая большая задача – только на CPU2. И проблема переключения задач между процессорами будет решена в связи с тем, что Vista Ultimate будет более тонко распознавать процессоры. В результате и зависимость производительности от количества процессоров должна масштабироваться лучше.
Процессоры Athlon 64 оснащены встроенными контроллерами памяти, поэтому они обладают высокой пропускной способностью памяти на ядро. Если привязка потоков будет осуществляться более разумно, то платформа AMD Quad FX сможет хорошо себя показать, что в текущей операционной системе невозможно. Опять же речь идет о серьёзных рабочих нагрузках, которые превышают задачи, выполняемые на ПК средним пользователем.
Процессоры FX-70 только парами.
Вместе с новой платформой на рынок вышли три новых процессора, которые используют существующие технологии. Купив набор Athlon 64 FX-70 ($599), FX-72 ($799) или FX-74 ($999), вы получите два физических процессора на частоте 2,6 ГГц, 2,8 ГГц или 3,0 ГГц. Socket AM2 не поддерживает конфигурации с несколькими процессорами, поэтому AMD пришлось взять Socket 1207 из мира Opteron для Quad FX. Кстати, буквально на днях дожно произойти (или уже произошло) снижение цен на эти процессоры. Пока, на сайте производителя указаны такие оптовые цены.
AMD использовала существующие дизайны и лишь изменила наименование/рейтинги Quad FX. Двуядерные процессоры Athlon 64 X2 и Athlon 64 FX с 90-нм техпроцессом и 1 Мбайт кэша L2 на ядро построены на ядре Windsor. Egypt – аналог этого ядра для Opteron, но у него добавлено ещё два канала HyperTransport, а контроллер требует регистровую память DDR2. Во всём остальном ядра одинаковы.
Также компания решила добавить к уже существующей технологии “кремний на диэлектрике” (SOI) новую технологию “двойного напряжения” (dual stress liner, DSL). Технология DSL позволяет чипу работать на более высоких тактовых частотах, а слои диэлектрика препятствуют миграции электронов, которая приводит к появлению токов утечки и повышению температуры кристалла. С помощью DSL и SOI AMD смогла достичь отметки в 3 ГГц.
Многие не ожидали, что AMD выпустит Athlon 64 FX-62 на 2,8 ГГц до весны, но она вновь доказала, что проработанный 90-нм техпроцесс позволяет получить и более высокие тактовые частоты. FX-74 работает на частоте 3,0 ГГц и на данный момент является самым быстрым процессором AMD.

Модель Частота Сокет Шина Напряжение Тепловой пакет Кэш L2 Цена за пару
FX-70 2,6 ГГц LGA 1207 1 ГГц 1,35-1,4 В 125 Вт 1+1 Мбайт $599
FX-72 2,8 ГГц $799
FX-74 3,0 ГГц $999

Увеличение числа процессоров становится уже не таким приятным фактом, если принять во внимание соответствующий рост энергопотребления и тепловыделения. Один Athlon 64 FX-62 работает горячо, но представьте себе два таких процессора, необходимый набор стабилизаторов напряжения и мощный блок питания. Тепла будет выделяться ощутимо больше. Неудивительно, что Quad FX ставит рекорд по тепловыделению: в режиме максимальной нагрузки система с FX-74 потребляет до 426 Вт, а с FX-72 – до 417 Вт. Если оснащать систему по масимуму (две видеокарты в режиме SLI, несколько жестких дисков), то рекомендуется использовать блок питания на 800-1000 Ватт.
В режиме бездействия система потребляет 261 Вт, что достигается благодаря функции AMD “Cool & Quiet”. При её включении во время бездействия или низкой вычислительной нагрузки Windows XP (и Vista) снижает частоту процессора до 1,0 ГГц, а напряжение с 1,4 В до 1,175 В, экономя энергию и уменьшая уровень шума.
Память для каждого процессора.

Quad FX – первая настольная платформа с двумя физическими процессорами, которые связаны между собой не традиционной шиной, а каналом HyperTransport (точка-точка). Благодаря технологии неоднородного доступа к памяти (non-uniform memory access, NUMA) процессоры могут обращаться ко всей физической памяти, даже когда подсистема памяти разбита на два разных процессора и, соответственно, на два контроллера памяти. Если приложению требуются данные, находящиеся в памяти, подключённой к другому процессору, то будет задействован канал HyperTransport между двумя CPU.
Платформа nVidia nForce 680a
Технически для платформы Quad FX подошёл бы любой современный чипсет на рынке, но AMD и nVidia решили выдать улучшенную версию. Так и появился чипсет nForce 680a. По северному мосту он аналогичен nForce 570 SLI, и nForce 680a использует два таких чипсета, что позволяет обеспечить четыре слота x16 PCI Express, два из которых работают на 16 линий, а оставшиеся два на восемь линий, а также много интерфейсов. Для платформы Quad SLI пропускной способности вполне достаточно. Каждый из северных мостов подключается к своему сокету процессора через канал x16 HyperTransport.
Поскольку nForce 680i состоит, по сути, из двух чипсетов nForce 570 SLI, мы получаем в два раза больше интерфейсов. А именно, 20 портов USB 2.0, 6 + 6 портов Serial ATA/300, четыре сетевых порта nVidia с гигабитным Ethernet и достаточное число слотов PCI и PCI Express.
Dual-Socket материнская плата.
Первая модель материнской платы для платформы Quad FX и линейки процессоров FX-70 – это L1N64-SLI WS от Asus. Она не полностью использует весь впечатляющий потенциал чипсета nForce 680a, но вмещает огромное число компонентов, включая два процессорных сокета, на плате стандартного формата ATX. Обычная материнская плата для рабочих станций обладает лишь частью функций L1N64-SLI или отличается большими размерами.
К разъёмам PCI Express x16 подведено 16 линий PCIe, а к вторичным – 8 линий. Есть ещё один слот x1 PCIe и один 32-битный слот PCI. Asus установила два из четырёх доступных портов гигабитного Ethernet. Четыре порта позволили бы платформе работать в качестве мощного маршрутизатора.
На плате установлены 12 портов SATA/300. Если подключить к ним 750-Гбайт винчестеры, то мы получим целых 8 Тбайт ёмкости! Конечно, сначала надо найти подходящий корпус. Есть поддержка звука высокого разрешения (High Definition Audio), одного канала UltraATA/133 и контроллера FireWire на два порта.

Итоги.

К преимущества AMD Quad FX можно отнести то, что это крутая и современная 32/64-битная платформа для энтузиастов, имеющая высокую пропускную способность между процессорами и северными мостами и выделенный контроллер памяти для каждого процессора. Она работает с обычной памятью DDR2-800. Двухпроцессорная система лучше масштабируется под Windows Vista. Набор начального уровня из двух Athlon 64 FX-70 стоит всего $599 (для сравнения Intel Core 2 Extreme QX6700 стоит $999) и двухпроцессорная платформа позволяет в будущем обновить систему до четырёхядерных процессоров (в сумме восемь ядер).
Но есть и недостатки. Очень высокое энергопотребление по причине наличия двух процессоров, высокие требования к охлаждению, энергопотребление на уровне 500 Вт требует блока питания не меньше 750 Вт, очень высокая стоимость платформы (четыре модуля памяти и материнская плата дороже $400). Преимущества платформы не видны на большинстве нынешних приложений. Пока доступна только одна материнская плата (Asus L1N64-SLI WS), причём продается она пока не в розницу, а предустановленная на собранные компьютеры.
Хотя основной целью выпуска новой платформы для энтузиастов, близкой к рабочим станциям, является ответ на четырёхядерный процессор Intel, AMD вложила немало. Ни одно из других решений не даёт таких резервов пропускной способности, как Quad FX, и столь предсказуемой модернизации в будущем. Когда в следующем году появятся четырёхядерные процессоры AMD Agena FX, вы сможете установить их вместо текущей линейки FX-70 и существенно повысить вычислительную мощность. Так что с технологической точки зрения новая платформа выглядит великолепно.

Владимир Зимин
(c)Internet News

11 december 2006