Введение
Наши читатели наверняка помнят весенний Форум Intel для разработчиков, на котором были объявлены подробности новой микро-архитектуры Core. Уже тогда многие стали уж если не предрекать кончину AMD, так пророчить переход этой компании в аутсайдеры. И практические тесты новых процессоров Core 2 Duo и Xeon (Woodcrest) показали, что Intel действительно вышла вперёд. Но неужели вы считаете, что AMD будет сидеть, сложа руки? Да, новый Socket AM2 не дал ощутимого прироста производительности. Но давайте взглянем на серверный рынок, где появились новые процессоры Opteron под Socket F. Именно здесь нам следует ждать новую надежду AMD – монолитный четырёхядерный процессор, который появится на рынке во втором квартале 2007 года. После выхода нового процессора на серверный рынок наверняка можно ожидать его появление и на верхнем сегменте настольных ПК. Так что геймеры тоже получат новую “игрушку”.
5-го сентября AMD провела пресс-конференцию, посвящённую новому четырёхядерному процессору, на которой выступили Пьер Брансвик (Pierre Brunswick), вице-президент по продажам и маркетингу AMD в России, СНГ, Восточной Европе и Турции, а также Джузеппе Амато (Guiseppe Amato), технический директор отдела продаж и маркетинга AMD в Европе, на Ближнем востоке и в Африке.
AMD набирает обороты
Пьер Брансвик сразу же указал на то, что, несмотря на действия конкурента и объявленные новинки, AMD продолжает набирать обороты. Бизнес AMD растёт: во втором квартале 2006 года получен рост на 31% по сравнению со вторым кварталом 2005 года. А у Intel, как мы знаем, тот же период 2006 года оказался не таким успешным. Причём, у AMD это уже 12-й по счёту квартал, в котором наблюдается годовой прирост на 12-30%.
Во втором квартале 2006 года 25,9% серверных процессоров x86 в мире было поставлено AMD. Ещё несколько лет назад AMD была сильна лишь в потребительской и геймерской сферах. Но за несколько лет компании удалось добиться доли рынка почти в 26% на самом важном сегменте – корпоративном.
Число платформ под Opteron возросло с 25 в 2005 до 50 в 2006 (прогноз). Всё это вряд ли было бы возможно без технических преимуществ, которых смогла добиться AMD. Это отнюдь не маркетинг, поскольку он на этом рынке, по словам Пьера, не работает.
В прошлом году AMD получила более 200 отраслевых наград, что тоже говорит о многом.
Кроме того, сегодня продолжается рост авторитета AMD среди крупных корпоративных заказчиков. Если взять мировой рынок, то системы на процессорах AMD поставляются в 90 компаний из сотни крупнейших в списке Forbes. Такие компании, без сомнения, перед принятием решения о закупке изучают технические характеристики, стоимость владения, отдачу инвестиций. Поэтому подобное завоевание серверного рынка AMD – прекрасный показатель. А процессоры AMD продолжают занимать всё более прочное место на рынке настольных ПК, ноутбуков и рабочих станций.
AMD смогла наладить хорошие отношения с крупнейшими производителями серверов и ПК. Здесь для примера можно привести последние серверы IBM, объявленные 2 августа: IBM System X3455, IBM System X3655, IBM System X3755, IBM Blade Center LS21, IBM Blade Center LS41. Второй пример – компания Dell, которая сегодня успешно сотрудничает с AMD и собирает компьютеры на её процессорах.
Наконец, последнее знаковое событие – слияние компаний AMD и ATi. Оно позволит новой компании расти, расти и ещё раз расти. Пьер заинтриговал аудиторию, сообщив, что уже в следующем году мы получим потрясающие плоды этого слияния (может быть, графический сопроцессор в формате HTX?). Что ж, будем ждать.
Какие же приоритеты стоят перед AMD в 2006 году? Отвечая на этот вопрос, Пьер отметил основной фактор успеха: лидерство по технологиям и продуктам. Но лидерство для AMD не является самоцелью, поскольку в основе лежит ориентация, в первую очередь, на клиента. Именно за счёт пристального внимания к нуждам клиентов, по словам Пьера, AMD всегда удавалось добиваться успеха.
Первый приоритет 2006 года – это корпоративный рынок, где AMD будет продолжать свои завоевания. Но AMD не забудет и “родную” нишу и будет продолжать расширять бизнес на потребительском рынке. Компания продолжит фокусироваться на быстро растущих рынках. Наконец, она надеется стать лидером по маркетингу и инновациям.
Новая архитектура AMD в подробностях
Доклад Джузеппе Амато был посвящён техническим подробностям новой четырёхядерной архитектуры AMD. Хотя, конечно, подробностей было не так и много.
Начнём с производственных мощностей. Сегодня все процессоры, которые производит AMD, сделаны в Дрездене. Там же будет работать новый завод Fab36, который будет производить кристаллы по 65-нм технологии. А в 2008 году на 65 нм будет переведён завод Fab30. По соседству с заводами находится проектно-конструкторский центр.
Каковы же преимущества архитектуры AMD? Как отметил Джузеппе, AMD была первой во многих технических достижениях. Она первой показала, как вполне реально можно создать 64-разрядную архитектуру на основе x86. Затем центр тяжести был перенесён на соотношение производительности на ватт, причём в то время компания добилась рекордного результата. В процессор был интегрирован контроллер памяти, позволяющий устранить “узкое место” FSB. Потом на базе многоядерной технологии AMD обратилась к решению вопросов виртуализации, которая позволяет более эффективно использовать ресурсы сервера, а также сократить совокупную стоимость владения вычислительных систем.
Инновации на этом не заканчиваются. На второй квартал 2007 года намечен выход четырёхядерных процессоров. Интеграция будет “родная”, то есть все четыре ядра будут находиться на одном кристалле. Внутри процессора используется кросс-коммутатор (Crossbar Switch), позволяющий ядрам обмениваться информацией между собой. Параллельно могут идти запросы и в кэш, и в память: например, два процессорных ядра могут брать информацию из кэша, а другие ядра могут обращаться к внешней памяти. Кстати, все кэши работают на полной тактовой частоте процессора. Система ввода/вывода на основе трёх каналов HyperTransport позволяет ядрам параллельно обращаться к другим процессорам и внешним устройствам, например, к видеоконтроллеру.
Немаловажно и то, что четырёхядерный процессор будет обладать примерно такими же характеристиками, что и двуядерный. В результате заказчик может осуществить простую модернизацию с двух ядер на четыре, не меняя материнскую плату Socket F и сохраняя тепловые характеристики сервера. При переходе на четыре ядра может использоваться вся остальная инфраструктура, так что мы получаем вполне ощутимую экономию.
В четырёхядерный процессор AMD будет встроен контроллер памяти DDR2, который очень экономичен – тепловыделение не больше 22 Вт. Производиться процессор будет по технологии “кремний на диэлектрике” (SOI) 65 нм. Все четыре ядра, как мы уже указывали, будут на одном кристалле.
В четырёхядерных процессорах будет усовершенствована технология PoweNow!, которая позволит индивидуально регулировать тактовую частоту каждого ядра, а также отключать бездействующие ядра. В результате совокупное энергопотребление окажется ещё лучше.
AMD реализовала общий кэш L3, которым совместно пользуются четыре ядра. Минимальный объём составляет 2 Мбайт, но в будущем кэш наверняка будет увеличен. Каждое ядро использует улучшенное предсказание ветвлений, может за один такт загружать два 128-битных вектора SSE и выполнять до четырёх операций с плавающей запятой двойной точности. Ядра поддерживают расширения для побитовой обработки (LZCNT/POPCNT), а также потоковые SSE-расширения (EXTRQ/INSERTQ, MOVNTSD/MOVNTSS).
Джузеппе указал и на тот факт, что AMD выпускает “истинный” четырёхядерный процессор, а не два двуядерных кристалла в одной упаковке, как это делает Intel с грядущим Clovertown. AMD ориентируется на клиента, поэтому вводит новые технологии не ради самих технологий. Как считает AMD, объединение Intel двух кристаллов в одной упаковке до выпуска “настоящего” четырёхядерного процессора увеличивает для клиентов общую стоимость владения. Да и производительность подобного процессора будет опять упираться в “узкое место” – FSB, которая используется для связи между двумя кристаллами.
AMD решила удвоить кэш L1: сейчас он составляет 64/64 кбайт против 32/32 кбайт (для данных и инструкций). Скорость выборки из кэша была тоже удвоена: 2×16 байт/такт против 2×8 байт/такт раньше. Кэш L2 в 512 кбайт будет отдельный для каждого ядра, поскольку такой подход отличается сниженными задержками. AMD указывает, что объём в 512 кбайт является оптимальным, так как позволяет вместить большую часть используемых на сегодня рабочих пакетов. Про общий кэш L3 мы уже говорили.
Технология PowerNow! тоже была оптимизирована. Теперь частота каждого ядра меняется отдельно, и ядра даже можно выключать. Например, во время рабочего дня процессор будет работать под полной нагрузкой (все 4 ядра с максимальной частотой). А ночью можно будет снизить частоту нескольких ядер, тем самым, уменьшив общее энергопотребление.
AMD по-прежнему может похвастаться хорошей масштабируемостью подсистемы памяти на ядро. Если взять два четырёхядерных процессора AMD, то суммарная пропускная способность памяти составит 25,6 Гбайт/с (двухканальная шина DDR2-800 на каждый процессор). У двухпроцессорной платформы Clovertown/Bensley на четырёхядерных процессорах суммарная пропускная способность памяти упирается в FSB (FSB1066), и пусть там даже две шины FSB, она не превысит 17,1 Гбайт/с. Кстати, против 21,4 Гбайт/с у текущей двухпроцессорной двуядерной платформы Woodcrest/Bensley (FSB1333).
В 2006 году AMD представила двуядерные процессоры с тем же тепловыделением, что и одноядерные. Ту же самую тенденцию AMD обещает сохранить: то есть четырёхядерный процессор будет потреблять столько же энергии, сколько двуядерный. Таким образом, соотношение производительности на ватт должно улучшиться на 50% (4 ядра против двух при том же тепловом пакете). В 2008 году AMD планирует перейти на архитектуру Direct Connect 2.0, увеличить кэш-память, внедрить технологии управления и виртуализации ввода/вывода.
Обзор архитектурных особенностей хотелось бы завершить сравнительной табличкой с четырёхядерной платформой Clovertown/Bensley (источник: презентация AMD).
Характеристики | 4-ядерный Opteron | 4-ядерный (2×2) Clovertown/Bensley |
Подлинная четырёхядерная конструкция | Да | Нет |
Уровень энергопотребления/ тепловыделения аналогичен двуядерной конструкции | Да | Нет |
Выделенная кэш-память 2-го уровня на каждое ядро | Да | Нет |
Совместно используемая кэш-память L3 на процессор | Да | Нет |
Улучшенная технология AMD PowerNow! | Да | Нет |
Энергосберегающая память | Да | Нет |
Расширенные возможности виртуализации | Да | Нет |
Одновременно 2- и 4-процессорные решения | Да | Нет |
Планируется для продажи | 2-й кв. 2007 г. | 1-й кв. 2007 г. |
Преимущества четырёхпроцессорных систем
Настало время перейти к общему вопросу: кому нужна четырёхпроцессорная (четырёхядерная) система? Первое преимущество такой системы заключается в хорошей централизации. Заказчики приобретают серверы для централизации своих вычислительных ресурсов, а также для централизованного хранения совместно используемых данных. И здесь важно учитывать не только производительность, но и надёжность и устойчивость работы. Кроме того, для техники серверного класса важно снижение энергопотребления, поскольку за электричество приходится платить.
Наконец, архитектура серверов должна быть масштабируемой. Джузеппе привёл интересный пример: компанию из области СМИ, которая использовала 18 двухпроцессорных серверов. Каждый из них нагружался, в среднем, на 10%. Благодаря виртуализации удалось консолидировать 18 двухпроцессорных серверов на четырёх 4-процессорных системах. Можно легко представить, какие выгоды получил заказчик с точки энергия энергопотребления и занимаемой площади. Виртуализация позволяет повысить эффективность использования аппаратных ресурсов. Полезная нагрузка увеличилась до 70% против 10% раньше. При этом остался резерв для увеличения числа клиентов.
В 2000 году 8-процессорные системы использовались для самых “тяжёлых” приложений: ERP, CRM, SMP HPC, баз данных, виртуализации и т.д. В 2006 году даже предприятия малого и среднего бизнеса получили возможность закупать многопроцессорные серверы, которые раньше можно было встретить только в крупных корпорациях. В связи со снижением затрат, многие компании малого и среднего бизнеса с числом сотрудников меньше 100 сегодня вполне охотно переходят на 4-процессорные системы (или двухпроцессорные двуядерные).
AMD даже составила схему, позволяющую заказчику легче сориентироваться и выбрать нужные процессоры.
Сравнение 4-ядерного Opteron Deerhound с Intel Clovertown/Bensley
Джузеппе Амато привёл довольно интересное сравнение между 4-ядерным AMD Opteron и 4-ядерным (2×2) Intel Clovertown/Bensley. Поскольку Intel планирует выпустить 4-ядерный Clovertown на той же платформе Bensley, то компании пришлось пойти на снижение частоты FSB на 20% (FSB1066 против FSB1333 у Woodcrest). Джузеппе считает это шагом назад. Использование старой платформы Bensley для 4-ядерных процессоров приведёт к дальнейшему увеличению конфликтов на процессорной шине (их там, как известно, две), что негативно скажется на производительности. Наконец, поскольку 4-ядерная платформа просто объединяет два процессора Woodcrest, не очень понятно, рассчитаны ли существующие системы на повышенный тепловой пакет? AMD же с 4-ядерным Opteron сохранит прежний тепловой пакет.
Torrenza, Trinity и Raiden
Джузеппе рассказал о трёх инициативах AMD под названиями Torrenza, Trinity и Raiden.
Torrenza является открытым стандартом платформы x86, использующей архитектуру Direct Connect и каналы HyperTransport, через которые процессоры AMD могут связываться с периферийными сопроцессорами, созданными сторонними производителями. Цель выхода Torrenza заключается в попытке заинтересовать сторонние компании в разработке и выпуске специализированных сопроцессоров. Первый этап Torrenza практически выполнен, поскольку производители чипсетов как раз используют каналы HyperTransport. Второй этап подразумевает создание периферийных сопроцессоров, которые будут подключаться через слоты расширения HTX. В качестве примера можно привести графические ускорители, XML-ускорители, ускорители физики и т.д. В результате мы получим комплекс вычислительных устройств, соединённых HTT.
Trinity – стратегия AMD по объединению технологий безопасности, виртуализации и управления (Open Management Platform). Trinity призвана обеспечить большую гибкость и снижение затрат на задачах, связанных с управлением, безопасностью и масштабированием клиентских и серверных платформ. Через проект Trinity AMD создаст для партнёров открытые и функциональные программные инструменты, позволяющие создать экосистему с улучшенной безопасностью и управляемостью. Некоторые элементы Trinity уже были внедрены в платформу Socket AM2, ещё часть появится позднее в этом году.
Проект Raiden основан на Trinity и позволяет по-новому взглянуть на концепцию тонких клиентов. Raiden перенесёт фокус с физических клиентских вычислений на доставку сервисов, которые будут просчитываться на сервере. И всё это с новым уровнем управления и безопасности. Raiden будет поддерживать как традиционных клиентов на основе ПК, так и клиентов с новыми форм-факторами, скажем, умещающиеся на ладони.
Виртуализация AMD и Intel
Виртуализация заключается в отделении ОС от аппаратной части. И здесь есть несколько подходов: полная двоичная и пара-виртуализация. Для пара-виртуализации необходимо вносить изменения в ОС. Но политика Microsoft раньше этого не позволяла. Поэтому на данный момент решения пара-виртуализации были реализованы, в основном, на Linux. Кстати, в сервере Longhorn или сразу за ним Microsoft планирует поддержать пара-виртуализацию.
Есть и решения полной двоичной виртуализации, например, VMWare. В нём сначала загружается Hypervisor, после чего подгружается немодифицированная ОС. Если быть точным, то в VMWare используется VMM, но разница между VMM и Hypervisor очень тонкая. В VMM (и версиях VMWare Server и Workstation) host-ОС и VMM имеют одинаковые права на “железо”.
В сервере VMWare ESX это не так, хотя, по сути, там тоже нет того, что обычно понимают под Hypervisor (там используются два параллельно работающих ядра, урезанный консольный Linux и собственное ядро, которое с некоторой натяжкой можно назвать Hypervisor).
Недавно AMD и Intel представили свои решения аппаратной поддержки виртуализации, различия между которыми представлены на следующих слайдах.
Наибольшие различия в производительности виртуализации AMD и Intel связаны со встроенным контроллером памяти. DEV (вектор исключения устройств) открывает гостевым устройствам прямой доступ к памяти (или запрещает доступ). У AMD проверка DEV реализована аппаратно и работает быстрее.
Впрочем, по мнению специалистов, DEV по своей сути эквивалентен расширениям VT-D и Virtualized PCI-X, которые аппаратно реализуют примерно то же самое, но, правда, в других местах архитектуры.
Второе отличие касается тегированных TLB (Translation Look-aside Buffer), которые содержат ссылки между виртуальными и реальными адресами страниц памяти. На иллюстрации ниже видно, что при переключении между виртуальными машинами AMD не сбрасывает таблицу TLB, а Intel это приходится каждый раз делать.
Заключение
Как видим, AMD не сидит, сложа руки. Хотя новая микро-архитектура Intel Core действительно обогнала процессоры AMD, с выходом четырёхядерных моделей Opteron Deerhound во втором квартале следующего года ситуация может измениться. В начале 2007 года Intel представит 4-ядерные процессоры Clovertown для платформы Bensley, но это будут просто два кристалла Woodcrest в одной упаковке. И ещё не понятно, насколько изменится тепловой пакет. Можно ли будет без проблем заменить Woodcrest на Clovertown? Какие усилия для этого потребуются? Вопросов много. AMD же обещает, что четырёхядерный Deerhound будет иметь такой же тепловой пакет, как и современные процессоры Opteron для Socket F. Таким образом, мы получим 50% улучшение соотношения производительности на ватт (четыре ядра против двух при том же энергопотреблении). Сможет ли Intel догнать AMD по этому соотношению? Посмотрим.
Clovertown будет работать на старой платформе Bensley, то есть использовать для связи с контроллером памяти две FSB (по одной на процессор). Но частота FSB будет снижена с 1333 МГц до 1066 МГц, поэтому мы вновь упрёмся в “узкое место” – пропускную способность FSB, и конкурировать за доступ к памяти будут уже не два ядра, а четыре. AMD же, как и раньше, демонстрирует прекрасные результаты масштабирования производительности памяти при увеличении числа процессоров. Контроллер-то памяти встроенный.
Кстати, встроенный контроллер памяти позволяет увеличить производительность виртуализации. AMD реализовала аппаратную проверку DEV и тегированные TLB. У Intel этого нет. Как данные функции повлияют на реальную производительность виртуализации, нам ещё предстоит проверить.
Инициативы Torrenza, Trinity и Raiden тоже весьма любопытны. Torrenza позволит создавать любые сопроцессоры, которые будут подключаться к процессорам AMD через каналы HyperTransport. Trinity – достойный ответ на технологии управления и безопасности Intel. А Raiden обещает вынести концепцию тонких клиентов на новый уровень.
Битва между Intel и AMD продолжается. Во втором квартале AMD смогла отхватить 25,9% серверного рынка, что ещё несколько лет назад казалось невероятным. Да и рост доходов у AMD очень даже благоприятный: они увеличиваются уже 12-й квартал подряд.
Остаётся только ждать, когда Opteron Deerhound поступит в нашу лабораторию, и мы сможем провести тесты.