Sources.RU Magazine Поиск по журналу
 

Ссылки

Эра больших чисел. 64 бит процессоры

Автор: orb (сайт автора)

На компьютерном рынке сейчас существует практически два крупных производителя процессоров. Если задать любому из вас вопрос "Какой процессор лучше купить?", то за ним последует множество ответов, но, по сути, преобладать будут два варианта: Intel и AMD. Обе эти корпорации не останавливаясь ни на секунду выпускают все более производительные процессоры. При этом идет не простое наращение частоты ядра, а переработка всей архитектуры и блоков процессора. Новый этап эволюции процессоров обе компании видят в направлении увеличения разрядности процессора и использовании на одном кристалле нескольких "независимых" ядер (это уже другая история), которые будут функционировать параллельно. Преимущества микропроцессоров с большей разрядностью очевидны. Они позволяют адресовать больший объем памяти, дают возможность оперировать с большим диапазоном чисел, повышают эффективность параллельных и матричных вычислений и т.д. Начнем рассмотрение с ветерана процессостроения корпорации Intel и его продукта процессора Itanium.

Intel Itanium

"Раскрутка" процессора Itanium датируется ноябрем 1997 года. Однако хотелось бы напомнить, что история Itanium началась значительно раньше.

К 1994 г. корпорация Intel испытывала определенные трудности. Продолжавшаяся два года разработка 64-разрядной архитектуры Р7 натолкнулась на серьезные трудности. Впоследствии Intel отказалась от Р7 в пользу EPIC (Explicitly Parallel Instruction Computing - детище Нewlett-Packard, 64-разрядная архитектура). В июне 1994 г. компании Intel и Hewlett-Packard подписали соглашение о совместной разработке новой 64-разрядной архитектуры, ориентированной на применение в серверах и рабочих станциях. Новый процессор получил название Merced в честь реки в Калифорнии (первоначально предполагалось, что системы Merced появятся в 1997 или 1998 г.).

Два года спустя, когда выяснилось, что мощности Merced недостаточно, чтобы при использовании HP-UX (64-разрядная система UNIX) обойти архитектуру PA-RISC, в Нewlett-Рackard решили самостоятельно создавать новый процессор на том же фундаменте, что и Merced, но с иной реализацией внутренних функциональных блоков. Обе компании расширили свое сотрудничество уже над новым 64-разрядным процессором McKinley (так называется высочайшая гора в Северной Америке).

В 1997 г. Intel и Hewlett-Packard представили архитектуру и набор команд IA-64 (Intel Architecture).

В августе 1999 г. впервые появились опытные образцы процессора, а осенью Intel представила Itanium как коммерческое наименование своего первого 64-разрядного процессора.

В октябре 2000 г. появились пилотные образцы систем на основе Itanium.

Первые образцы 64-разрядного процессора Intel представляют собой картридж размером примерно 10х6 см, который включает в себя L3 (кэш-память третьего уровня) 2 либо 4 Мбайт и радиатор. Картридж монтируется в разъем типа Slot и имеет 418 выводов. Процессор имеет трехуровневую иерархию сверхоперативной памяти. Если L1 и L2 интегрирована на кристалле процессора, то микросхемы L3 расположены на самой плате картриджа. На реализацию процессора с соблюдением проектных норм 0,18 мкм потребовалось около 320 млн. транзисторов, из которых только 25 млн. пришлось на реализацию самого ядра, а остальные - на кэш-память. Блок вычислений с плавающей запятой, занимает около 10% площади кристалла. Производительность Itanium составляет до 6,4 млрд. операций с плавающей запятой в секунду. Благодаря архитектуре EPIC и 15 исполнительным устройствам процессор может выполнять до 20 операций одновременно. 266-МГц шина данных позволяет осуществлять быстрые транзакции со скоростью 2,1 ГБит/с, при этом он может непосредственно адресовать до 16 Тбайт памяти. Процессоры Itanium будут работать на тактовой частоте 800 или 733 МГц.

Архитектура Itanium включает такие уникальные средства повышения надежности, как усовершенствованная система обнаружения, исправления и локализации ошибок, предоставляемая архитектурой машинной проверки (MCA), ведение подробного журнала ошибок и код коррекции ошибок (ECC) на кэш-памяти всех уровней и системной шине. Масштабируемость до 512 процессоров.

Для двух- и четырехпроцессорных систем Intel выпустила специальный набор микросхем Intel 460GX, которые могут включаться каскадно, увеличивая число одновременно используемых процессоров. Поскольку конфигурация таких систем изначально предусматривает объемы оперативной памяти в несколько гигабайт, то в системах Itanium применяются сравнительно недорогие микросхемы памяти типа SDRAM. При этом для увеличения производительности, по словам представителей Intel, используются такие методы, как буферирование, чередование и деление памяти на несколько банков. Набор микросхем реально поддерживает работу с 64 Гбайт памяти при максимальной пропускной способности 4,2 Гбайт/с, хотя 64-разрядная адресация памяти теоретически позволяет обращаться к гораздо большему количеству адресов.

В архитектуре Itanium насчитывается по 128 64-разрядных целочисленных регистров общего назначения и 80-разрядных регистров вещественной арифметики, а также 64 одноpазpядных пpедикатных pегистpа. Все они доступны для программирования; кроме того, имеется множество недоступных внутренних служебных регистров, используемых самим процессором. 64 одноразрядных регистра используются для организации логики предсказания ветвления и выполнения команд в порядке, отличном от последовательного.

Современные тенденции развития микропроцессоров связаны с выполнением большего числа команд за один такт. Разработчики IA-64 полагают, что добиваться более высокого уровня суперскалярности (распараллеливания) в процессоре можно, только если отказаться от обычных последовательных кодов и ввести параллелизм прямо на уровень системы команд. В этом случае задача распараллеливания ложится не на аппаратуру процессора, а на компилятор. Как уже отмечалось, в основе IA-64 лежит технология EPIC, главная идея которой - введение явного параллелизма. С выходом Itanium сравнение процессоров по частоте практически теряет смысл. Теперь придется применять новые методики, учитывающие не только количество реально выполненных за один такт инструкций, но и качество анализа компилятором исполняемой программы, поскольку результирующая производительность будет сильно зависеть от этого (процессор ведь может работать с огромной скоростью, вычисляя ненужные ветви программы).

По заявлению разработчиков, Itanium полностью совместим с современными 32-разрядными приложениями. Однако вряд ли эти программы будут работать на 64-разрядном кристалле быстрее. Более того, как полагают некоторые специалисты, возможно, придется привыкать и к более медленным темпам.

Intel Itanium 2

Процессор Intel Itanium 2 (с ядром Madison) с объемом L3 6 МБ оптимизирован для выполнения требовательных корпоративных и научно-технических приложений.

Выпускается в 3-х модификациях:


  1. с L3 объемом 6 МБ для многопроцессорных и двухпроцессорных серверов и рабочих станций;
  2. с тактовой частотой 1,40 ГГц и L3 объемом 1,5 МБ, оптимизированный для двухпроцессорных серверов и рабочих станций;
  3. с пониженным энергопотреблением, оптимизированный для двухпроцессорных серверов с высокой плотностью монтажа и рабочих станций (максимальная потребляемая мощность - 62 Вт).

Инструкции, обрабатываемые шестью параллельными конвейерами глубиной 8 команд, непосредственно выполняются в 23 функциональных блоках.

Исполняющие модули Intel Itanium 2: 6 целочисленных модулей; 2 модуля для вычислений с плавающей точкой; 2 модуля для вычислений с плавающей точкой двойной точности; 6 модулей для обработки мультимедийных команд; 4 модуля, управляющих загрузкой и выгрузкой данных; 3 модуля ветвлений.

Количество соответствующих модулей оптимально подобрано с учетом потребности в вычислительных ресурсах приложений, характерных для корпоративных СУБД, сложных инженерных расчетов и др. При этом команды практически не "задерживаются" в ожидании, пока освободится нужный исполняющий модуль. Ширина системной шины, по которой осуществляется взаимодействие нескольких процессоров друг с другом и доступ к памяти, увеличена до 128 бит, что также кардинально сказывается на скорости работы.

Число регистров, в которых размещаются данные для непосредственной обработки их процессором, свыше трехсот. Большое их количество позволяет избежать дефицита регистров при параллельной обработке многих команд. Кроме того, в процессоре Intel Itanium 2 реализованы такие механизмы повышения эффективности работы, как стек и переименование регистров.

Регистры Intel Itanium 2: 128 регистров общего назначения; 128 регистров с плавающей запятой; 64 регистра предикатов; 8 регистров перехода.

Объем кэш-памяти третьего уровня процессора Intel Itanium 2 достигает 6 Мб (доступ к кэшу в несколько раз быстрее, чем к "медленной" оперативной памяти, и составляет 48 Гб/с). Архитектура Itanium включает такие уникальные средства повышения надежности, как система расширенного самоконтроля EMCA, обеспечивающая обнаружение, коррекцию и протоколирование ошибок, а также поддержку обработки кода ECC - контроля четности.

Характеристики процессора Intel Itanium 2:

Микроархитектура - IA-64;
Частота до 1,6 ГГц;
Кэш до 6 Мб, скорость доступа к кэшу - до 48 Гб/с;
Адресуемое пространство - 16 Тб;
Ширина системной шины - 128 бит, частота системной шины - 2х200 МГц;
Число конвейеров - 6, глубина конвейера - 8, число исполняющих блоков - 23;
Число регистров - более 300;
Технология изготовления - 0,13 мкм;
Пиковая производительность - 10 Гфлопс.

Hammer - процессор 8-го поколения корпорации AMD

Второй производитель микропроцессоров с архитектурой x86 - корпорация AMD тоже обнародовала свои планы создания 64-разрядных кристаллов. Однако в отличие от конкурентов она избрала эволюционный путь: добавила 32 разряда к уже имеющимся 32. Теперь регистры расширились до 64 разрядов, появились команды манипуляции с 64-разрядными данными, да и шина адреса увеличилась до 64 разрядов. В итоге родилась архитектура x86-64. Команды нового кристалла отличаются от команд процессоров x86 только наличием префикса, указывающего на их разрядность. Обеспечена полная аппаратная поддержка выполнения инструкций x86-32 на уровне ядра. В отличие от процессора Itanium, здесь должна обеспечиваться полноценная реализация 8-, 16- и 32-разрядных приложений без потери производительности. Таким образом, на одном процессоре смогут одновременно и независимо работать 16- и 32-разрядные приложения.

Весь поток процессоров Hammer "разбит" на два русла: Clawhammer (для настольных ПК и ноутбуков, Athlon64) и Sledgehammer (серверные процессоры рассчитанные на работу в конфигурациях от 2х до 8ми процессоров, Opteron). Процессоры Hammer производятся по технологии 0.13 микрон с медными межсоединениями и с использованием технологии SOI с дальнейшим переходом на технологию 0.09 микрон. Ядра процессоров Hammer закрыты металлическими пластинами, которые выполняют еще одну функцию - равномерно распределяют выделяемое тепло.

Athlon64 использует новый разъём Socket 754, а Opteron - Socket 940. Различие в числе контактов двух процессоров Hammer связано с наличием дополнительного канала памяти и двух портов HyperThransport на Opteron. Все процессоры Hammer будут использовать упаковку mPGA.

Если сравнивать новый процессор от AMD с поколением К7, то тут сразу бросаются в глаза основные отличия:

  1. Интегрированный контроллер памяти, двухканальная или одноканальная, как небуферизованная (unbuffered), так и регистровая буферизованная.
  2. 16-битная 600/800 МГц DDR (dual simplex) шина HyperTransport для соединения с AGP и южным мостом.
  3. Поддержка инструкций SSE2 с 16 регистрами в 64-битном режиме.
  4. 12-уровневый целочисленный конвейер (Athlon имеет конвейер длиной 10 ступеней), 17-уровневый конвейер для вычислений с плавающей запятой Athlon имеет в этом конвейере 15 ступеней) для дальнейшего увеличения частоты.
  5. Дополнительная стадия конвейера анализирует зависимость инструкций сразу после их декодирования.
  6. Немного более объемные целочисленные буферы (3x8 вместо 3x6).
  7. TLB кэша первого уровня увеличилась с 24 до 40 записей.
  8. TLB кэша второго уровня увеличилась вдвое: с 256 до 512 записей.
  9. Фильтр "смыва", позволяющий сразу нескольким процессам разделять доступ к TLB.
  10. Улучшенное прогнозирование ветвлений и увеличения глобального журнала ветвлений с 4 тысяч до 16 тысяч записей.
  11. 128-битный доступ к памяти к паре модулей DDR400 DIMM (только у Athlon 64 FX).

Ниже представлены некоторые процессоры нового поколения и их технические характеристики.

Athlon 64 3400+ (Clawhammer). Частота процессора - 2,2 GHz, L1-кэш - 128 KB, L2-кэш - 1 MB, шина CPU - 1600 MHz, 6,4 GBps, контроллер памяти - одноканальный, разъем - Socket 754. Он работает с нормальными (unbuffered) DDR400.

Athlon 64 3700+ (NewCastle). Частота процессора - 2,4 GHz, L1-кэш - 128 KB, L2-кэш - 0,5 MB, контроллер памяти - одноканальный, разъем - Socket 754. Он работает с (unbuffered) DDR400.

Athlon 64 3500+ (NewCastle). Частота процессора - 2,2 GHz, L1-кэш - 128 KB, L2-кэш - 0,5 MB, контроллер памяти - двухканальный (небуферизованный DDR400), разъем - Socket 939.

Athlon 64 3800+ (NewCastle). Частота процессора - 2,4 GHz, L1-кэш - 128 KB, L2-кэш - 0,5 MB, шина CPU - 2000 MHz, 8,0 GBps, контроллер памяти - двухканальный (небуферизованный DDR400), разъем - Socket 939.

Athlon64 FX 53 (Clawhammer, есть две модификации - разные разьемы + разная работа с памятью). Частота процессора - 2,4 GHz, L1-кэш - 128 KB, L2-кэш - 1 MB, шина CPU - 1600 MHz, 6,4 GBps, контроллер памяти - двухканальный. Разъемы: Socket 940, контроллер памяти - регистровый DDR400, с поддержкой ECC; Socket 939, контроллер памяти - небуферизованный DDR400.

Интересно отметить, что рейтинг, хотя и служит оценкой производительности, в то же время не дает однозначной информации о параметрах процессора. Например Athlon 64 3400+ есть в варианте 2,2 ГГц/1 МБ L2 и в варианте 2,4 ГГц/0,5 МБ L2. Аналогично и с 3200+ и 3000+. К счастью, цифра, которая показывает объем кэша L2, легко может быть найдена в маркировке. Еще большую путаницу вносит то, что бывают не только разные модели, имеющие одинаковый рейтинг, но и наоборот - по существу одинаковые процессоры могут иметь разные имена. Например, Athlon 64 FX-51 и Opteron 148, Athlon 64 FX-53 и Athlon 64 4000+.

Что бы не говорили, но корпорация Intel была (и является :-) ) законодателем "процессорной моды", теперь у нее появился серьезный конкурент, который не будет идти по пятам лидера. Сравнивать рассмотренные выше процессоры мы не будем, каждый вправе делать свой выбор самостоятельно. Какая архитектура выживет - покажет время.



 Desingn by Шишкин Алексей (Лёха).
 ©2004-2008 by sources.ru.