Настольный дебют А8-3850
Наши редакторы проделали невероятно сложную работу, подготовив первый обзор архитектуры AMD Llano. Если вы ещё не читали эту статью и хотите узнать больше о массовом устройстве ускоренной обработки данных компании AMD, то перед тем, как продолжить чтение этого обзора, вам обязательно надо ознакомиться с “AMD A8-3500M: обзор APU Llano”.
Так как мы описали всю суть архитектуры Llano, то собираемся посвятить наше первое знакомство с AMD Llano для настольных компьютеров под кодовым названием “Lynx” тестированию и анализу. Какую производительность можно ожидать от режима Dual Graphics? Что он покажет в сравнение с Sandy Bridge с дискретной видеокартой? Какой эффект оказывает производительность памяти на частоту кадров в играх? Насколько встроенная поддержка USB 3.0 соответствует требованиям некоторых дополнительных контроллеров, которые мы уже видели? На все эти вопросы мы и постараемся ответить в этом обзоре.
Но сначала давайте вкратце вернёмся к основным базовым характеристикам этого первого APU компании AMD для настольных компьютеров.
Антикризисный процессор
В Audi могли бы гордиться тем, что у процессоров AMD такие же названия, как и у их машин (а может, и нет, учитывая их низкую цену). AMD использует маркировку А8 и А6 для того, чтобы чётко разграничить по производительности свои первые четыре модели.
Существуют две модели А8 и две А6. Первая модель – А8-3850 со 100-ваттным термопакетом, графической видеокартой Radeon HD 6550D, четырьмя ядрами, каждое с 1 Мбайт кэша второго уровня L2 и частотой 2,9 ГГц. Данная версия не поддерживает режим Turbo Core, поэтому единственный способ заставить процессор работать быстрее 2,9 ГГц – это разгон. В AMD предполагают, что цена этой модели будет в районе 135 американских долларов.
Модель А6-3650 обладает таким же термопакетом в 100 Вт, однако у него уже попроще видеокарта – RadeonHD 6530D и меньше частота – 2,6 ГГц (режим Turbo Core тоже отсутствует). У неё на борту те же четыре ядра, 4 Мбайт кэша второго уровня L2 и он поддерживает память DDR3-1866, как и остальные три модели. Предполагаемая цена продажи – 115 американских долларов.
Модель | GPU | TDP | Колич. ядер | Базовая частота CPU | Макс. частота в режиме Turbo | Кэш второго уровня L2 | Поток. проц. | Частота GPU | Режим Turbo Core |
A8-3850 | HD 6550D | 100 Вт | 4 | 2,9 ГГц | – | 4 Мбайт | 400 | 600 МГц | – |
A8-3800 | HD 6550D | 65 Вт | 4 | 2,4 ГГц | 2,7 ГГц | 4 Мбайт | 400 | 600 МГц | Да |
A6-3650 | HD 6530D | 100 Вт | 4 | 2,6 ГГц | – | 4 Мбайт | 320 | 443 МГц | – |
A6-3600 | HD 6530D | 65 Вт | 4 | 2,1 ГГц | 2,4 ГГц | 4 Мбайт | 320 | 443 МГц | Да |
Интересно отметить, что снижение теплопакета до 65 Вт не приводит к серьёзному снижению функциональных возможностей. У модели AMD A8-3800 довольно серьёзный графический движок Radeon HD 6550D, 4-ядерная архитектура Stars и солидный запас из 4 Мбайт кэша второго уровня L2. Наличие режима Turbo Core, тем не менее, позволяет компенсировать значительное снижение частоты процессора – 2,4 ГГц, – увеличивая её до 2,7 ГГц, когда это позволяет температурный режим. К сожалению, AMD не предоставила для тестирования ни одного процессора с опцией Turbo Core, поэтому пока нельзя точно сказать, сколько времени они могут работать в этом режиме.
Модель А6-3600 тоже принадлежит к 65-ваттным процессорам. У неё более скромные характеристики: наряду с пониженной частотой процессора – по умолчанию в нормальном режиме она составляет 2,1 ГГц, а в режиме Turbo Core – 2,4 ГГц -производительность графики тоже слабее из-за не столь быстрого графического движка Radeon HD 6530D. Тем не менее, у неё есть 4 Мбайт кэша второго уровня L2, т.е. по 1 Мбайт на каждое ядро.
В чём же именно заключается разница между графическими чипами Radeon HD 6550D и Radeon HD 6530D? По сути, только в одном движке SIMD.
Графический процессор | Radeon HD 6550D (Серия A8) |
Radeon HD 6530D (Серия A6) |
Потоковые процессоры | 400 | 320 |
SIMD | 5 | 4 |
Текстурные блоки | 20 | 16 |
Блоки растровых операций | 2 | 2 |
Блоки Z/Stencil ROP | 32 | 32 |
Блоки Color ROP | 8 | 8 |
Тактовая частота GPU | 600 МГц | 443 МГц |
Пиковая вычислительная мощность | 480 Гигафлоп | 284 Гигафлоп |
Если посмотреть на диаграмму графического процессора Llano, то становится ясно, как AMD разграничивает эти две линейки. Каждый движок SIMD содержит 80 арифметико-логических устройств (АЛУ) и объединён с 4 текстурными блоками. Таким образом, отключение одного движка SMID выводит из игры сразу 320 шейдеров и 16 текстурных, как это мы видим у Radeon HD 6530D.
Торопиться нужно медленно
И без того короткая продуктовая линейка процессоров Llano, состоящая всего из 4 моделей, в день анонса сразу уменьшилась наполовину: было объявлено, что выпуск 65-ваттных процессоров А8-3800 и А6-3600 задерживается на неопределённое время, в связи с чем в наличии остались только 100-ваттные А8-3850 и А6-3650. В связи с этим мы не сможем протестировать режим Turbo Core в моделях Llano до тех пор, пока AMD не сообщит об их наличии.
Технология Dual Graphics: как это работает?
Настройка режима Dual Graphics
Мы уже описали технологию Dual Graphics AMD в своём обзоре архитектуры Llano. Теперь же можно протестировать её в реальных условиях.
В процессе подготовки статьи мы обнаружили, что в некоторых случаях, когда технология Dual Graphics не работала, по умолчанию включался более медленный графический процессор. В AMD сказали, что так не должно быть, система по умолчанию должна работать с производительностью более мощного графического процессора. Мы полагаем, что AMD пытается предложить решение этой непредвиденной проблемы путём использования дополнительной внешней видеокарты в качестве основной, в то время как внутри главного процессора уже есть два графических чипа. В результате процесс установки превращается в довольно сложную и неприятную процедуру.
По умолчанию, Llano является основным устройством. Поэтому при конфигурации BIOS, установке Windows и установке драйверов AMD рекомендует использовать выходы с видеочипа APU. При установке внешней видеокарты автоматически включается функция поддержки CrossFire. На этом этапе необходимо установить последнее обновление профилей Catalyst, отключить поддержку CrossFire, выключить компьютер и переключиться на разъём внешней видеокарты. Видео сигнала не будет на экране до полной загрузки Windows. После этого необходимо включить поддержку CrossFire, перезагрузить компьютер ещё раз и после этого можно будет использовать технологию Dual Graphics. Согласитесь, сущие пустяки!
По крайней мере, с этого момента Dual Graphics начинает поддерживать технологию многодисплейного подключения Eyefinity. Используя разъёмы каждого графического процессора, можно подсоединить три или даже более мониторов для расширения рабочего пространства. Необходимо только не ошибиться с разъёмом. Некоторые производители материнских плат используют одноканальные выводы DVI, а другие – двухканальные. Из тех материнских плат, которые есть у нас, некоторые имеют VGA и HDMI разъёмы. У Gigabyte есть ещё DisplayPort.
Итак, о каком же аналогичном графическом процессоре идёт речь?
Мы в своём обзоре также объяснили, что AMD для определения аналогичных по производительности графических процессоров в одном и том же устройстве использует специфическую систему названий. Например, Radeon HD 6550D в AMD А8-3850, плюс дополнительная видеокарта Radeon HD 6630D2, с которой мы сейчас выполняем тест, называются Radeon HD 6630D2. Такая маркировка означает, что совокупная производительность двух графических процессоров должна быть выше, чем производительность каждого отдельно взятого. Во-вторых, она показывает, что это конфигурация для настольного компьютера (в отличие от более ограниченных по тепловыделению моноблоков, маркировка которых имеет букву “А”). И в-третьих, это указывает на наличие в системе двух графических процессоров.
Модели с двумя графическими процессорами | ||
Отдельная видеокарта Radeon HD |
AMD APU |
|
Radeon HD 6550D | Radeon HD 6530D | |
Для настольных компьютеров | ||
HD 6670 | HD 6690D2 | HD 6690D2 |
HD 6570 | HD 6630D2 | HD 6610D2 |
HD 6450 | HD 6550D2 | HD 6550D2 |
HD 6350 | – | – |
Для мобильных компьютеров | ||
HD 6670A | HD 6730A2 | HD 6710A2 |
HD 6650A | HD 6690A2 | HD 6670A2 |
HD 6550A | HD 6610A2 | HD 6590A2 |
HD 6450A | HD 6550A2 | HD 6550 S2 |
HD 6350A | – | – |
Хотя нам и нравится подобная систематизация, она всё равно вызывает определённую путаницу. Технология Dual Graphics ещё далека от совершенства. Она поддерживает приложения DirectX 10/11, и производительность в этом случае зависит от оптимизации драйвера. То есть, зная, что ожидать от Radeon HD 6850, в случае с Radeon HD 6630D2 можно получить совсем непредсказуемые результаты.
Как же всё это работает?
Для того, чтобы протестировать технологию Dual Graphics, мы взяли три игры – Call of Duty: Modern Warfare 2, работающую под DirectX 9, Metro 2033 – под DirectX 10 и Word of Warcraft: Cataclysm – под DirectX 11.
Тестирование игры под DirectX 9 показало хорошие результаты. Но, как и ожидалось, технология Dual Graphics в этом случае не работает. Как и обещали в AMD, при настройках по умолчанию используется самый быстрый графического процессор, а не самый медленный, как это было в случае с версией Llano для мобильный компьютеров.
В Metro 2033 вначале заметно серьёзное преимущество, которое потом при разрешении 1680х1050 медленно сползает до двух кадров в секунду. Объяснение, в данном случае, заключается в том, что по мере нарастания нагрузки платформа не справляется с ней и поэтому разрыв сокращается. Между прочим, это не оправдывает надежды, которые обычно возлагаются на ПК с мощной графической подсистемой (платформа ограничивает производительность при низком разрешении и графика работает с задержкой). Об этом полезно будет вспомнить на следующей странице, где мы будет проверять одну из теорий, используя Core i3.
Игра Word of Warcraft: Cataclysm не такая интенсивная, как Metro 2033 и рендеринг DirectX 11 помогает увеличить производительность графики. Ускорение это довольно незначительное, учитывая уже существующую нормальную игровую производительность при разрешении 1680х1050, однако частота кадров действительно возрастает, когда Radeon HD 6570 работает на платформе А8-3850.
Технология Dual Graphics: стоит ли игра свеч?
Мы уже не раз сталкивались с ситуациями, когда недостаточно мощный процессор ограничивал производительность графической системы. По сути, результаты Metro 2033 на предыдущей странице выглядели именно так – как будто архитектура AMD Stars сдерживала её работу.
Первоначально возникло предположение, что если 4 ядра А8-3850 недостаточно быстры, чтобы справиться с 400 потоковыми ядрами графического процессора, то покупка Radeon HD 6570 за 80 долларов вряд ли что-то изменит. Если говорить о замене внешней видеокарты, то такой апгрэйд выглядит довольно глупо, потому что процессор Core i3-2105 в комбинации с точно такой же картой (по цене одного чипа AMD) обеспечивает более высокую производительность, не обладая при этом технологией Dual Graphics.
На следующих трёх диаграммах производительность Intel HD Graphics 3000 показана синим цветом. Зелёным отмечены результаты AMD A8-3850 с дополнительной внешней видеокартой Radeon HD 6570, а чёрным – результаты процессора Intel Core i3 с той же внешней видеокартой Radeon HD 6570.
В играх под DirectX 9, где технология Dual Graphics в любом случае не работает, обе конфигурации – и Intel с Radeon HD 6570, и A8-3850 с Radeon HD 6570 – демонстрируют приблизительно одинаковую производительность, обеспечивая нормальную работы игры, в то время как HD Graphics 3000 показывает довольно обескураживающие результаты.
А вот на это уже стоит обратить внимание: во всех трёх случаях с разными разрешениям пара Intel/AMD показывает более высокие результаты, чем пара AMD/AMD, несмотря на ускорение, которое обеспечивает технология Dual Graphics.
Игра World of Warcraft явно предпочитает конфигурацию с двумя графическими процессорами. Может быть игра лучше работает с четырьмя физическими ядрами главных процессоров, чем с двумя, а может в этой платформе просто не происходит задержка вывода графики для World of Warcraft, что позволяет технологии Dual Graphics показать себя во всей своей красе.
В любом случае, разница между Radeon HD 6570 и HD Graphics 3000 видна невооружённым глазом. Вполне очевидно, что встроенный графический движок Intel не в состоянии поддерживать ту частоту кадров, которая необходима игрокам для нормальной игры даже при не самом низком уровне детализации.
Чипсеты
Устройства ускоренной обработки данных Llano могут комплектоваться одним из двух чипсетов AMD: A75 и A55. Первый относится к современному поколению чипсетов, а второй уже явно устарел.
Оба чипсета поддерживают интерфейс Socket FM1 (905-пиновый) для настольных компьютеров на платформе Lynx. Также у них есть шесть портов SATA, HD Audio, поддержка программного RAID 0, 1 и 10, четыре двунаправленных последовательных соединения для PCI Express второго поколения и шина PCI. Оба чипсета совместимы с интерфейсом mSATA.
Большинство пользователей предпочитают чипсет А75
Чипсет A55 ограничен поддержкой дисков с интерфейсом 3 Гбит/с, не поддерживает режим одновременного доступа к нескольким дискам и USB 3.0. Таким образом, мы можем предположить, что чипсет A55 будет ограничен рынком мобильных компьютеров, где производительность не так важна, как цена и внешний вид, хотя USB 3.0, видимо, вскоре появится и на этом рынке.
Чипсет | AMD A75 | AMD A55 |
Платформа | Socket FM1 (Lynx для настольных компьютеров) | Socket FM1 (Lynx для настольных компьютеров) |
Поддержка SATA | 6 x SATA 6 Гбит/с | 6 x SATA 3 Гбит/с |
RAID | 0, 1, 10 | 0, 1, 10 |
Режим одновременного доступа к нескольким дискам FIS | Да | Нет |
HD Audio | Да | Да |
PCIe общего назначения | 4 двунаправленных последовательных соединения PCI Express 2.0 | 4 двунаправленныъ последовательных соединения PCI Express 2.0 |
UMI (подключение к APU) | Четыре линии PCIe + DisplayPort | Четыре линии PCIe + DisplayPort |
USB 3.0/2.0/1.1 | 4/10/2 | 0/14/2 |
Контроллер SD | Да | Да |
Поддержка 33 МГц PCI | До трёх слотов | До трёх слотов |
Поддержка mSATA | Да | Да |
Чипсет A75 представляет собой более совершенное решение. У него все шесть портов SATA обеспечивают поддержку 6 Гбит/с. По сравнению с A55, у которого есть 14 портов USB 2.0 и 2 порта 1.1, чипсет A75 имеет 4 порта с поддержкой USB 3.0, предоставляя производителям самим решать, что делать с остальными 10-ю, которые поддерживают USB 2.0. Также чипсет A75 поддерживает режим одновременного доступа к нескольким дискам.
Режим одновременного доступа к нескольким дискам (FIS): процессор посылает и получает команды от любого диска; и пересылает по обному 3 гигабитному каналу, чтобы тот был задействован полностью
Эта функция важна, если вы собираете компьютер с несколькими жёсткими дисками. Режим одновременного доступа к нескольким дискам (FIS) обеспечивает одновременно связь между контроллером промежуточного устройства хранения данных и другими дисками, что позволяет использовать аппаратную установку очерёдности команд (Native Command Queuing) так, как она и должна работать. Контроллер без поддержки режима одновременного доступа к нескольким дискам работает в режиме последовательного командного доступа, что не позволяет процессору выдавать больше одной команды одному диску за раз. Естественно, это самым непосредственным образом сказывается на производительности системы хранения данных.
Производительность системы хранения данных
На сегодняшний день чипсет AMD A75 работает с системами хранения данных намного лучше, чем любой другой чипсет, который предлагает Intel. К сожалению, чипсет A55, по сравнению со старшей моделью, производит удручающее впечатление.
Платформа чипсета A75 поддерживает шесть портов SATA 6 Гбит/с, программный RAID 0, 1 и 10, режим одновременного доступа к нескольким дискам (FIS) и четыре порта USB 3.0. Хотя из всего этого набора встроенная поддержка USB 3.0 оказалась единственной новинкой, нам хотелось протестировать все системы хранения данных данной платформы.
SATA 6 Гбит/с: должно быть немного лучше?
В AMD особо не отмечают изменения, внесённые в контроллер SATA 6 Гбит/с. Тем не менее, при использовании 240 Гбайт OCZ Vertex 3 Pro мы заметили небольшое повышение производительности при последовательной записи и возросшую пропускную способность при операциях произвольного чтения/записи.
Хотя в целом, по совокупности характеристик, контроллеры Intel обычно оказываются более производительными, чем AMD, доработки последнего оказались достаточно серьёзными, чтобы продемонстрировать лучшую производительность последовательного чтения, более высокую скорость при операциях произвольного чтения и почти полное равенство с Intel в тесте workstation workload.
USB 3.0: лучше, чем дополнительный внешний контроллер
Нельзя сказать, что поддержка USB 3.0, совсем новая функция. В нашей лаборатории на момент тестирования уже было несколько высокопроизводительных устройств, подсоединяющихся к компьютеру через USB 3.0, поэтому было логично посмотреть, как с ними будет работать интегрированный контроллер AMD.
Всё, что у нас было, это – материнская плата Asus M4A89GTD Pro/USB3 на базе 890GX с контроллером NEC µPD720200; материнская плата Asus P8Z68-V Pro на базе Z68 с контроллером ASMedia ASM1042 и ASRock A75 Extreme6 с основным интегрированным контроллером AMD и дополнительным – ASM1042. Для тестирования производительности использовалась USB-флэшка Kingston Data Traveler HyperX Max 3.0. Хотя максимальная скорость чтения этого устройства – 195 Мбайт/с – даже не приближается к максимальной нагрузке интерфейса, налицо поразительная разница в скорости, по сравнению с теми USB 2.0 устройствами, к которым мы привыкли. Тестирование заключалось в перемещении 12 772 файлов из 621 папки объёмом 56,9 Гбайт.
Все три контроллера быстрые – перемещение 50 Гбайт заняло не более 6-8 минут.Однако встроенный контроллер AMD справился с задачей быстрее, чем немного отставший от него контроллер ASMedia. Оба контроллера тестировались на одной и той же материнской плате с чипсетом A75. Контроллер NEC занял третье место, а ASMedia на материнской плате Intel Z68 Express потребовалось больше всех времени, чтобы справиться с задачей.
Несмотря на встроенный контроллер AMD, пользоваться интерфейсом USB 3.0 не очень удобно. Разъёмы для USB 3.0 не работают до тех пор, пока не установлены драйверы, что заставляет использовать USB 2.0 для мыши и клавиатуры, особенно, если возникнет необходимость установить Windows или изменить настройки BIOS.
Быстрая память снова в центре внимания
Архитектура Nehalem компании Intel серьёзно заморочила голову производителям на рынке памяти. Intel не только ввела жёсткое ограничение на потребляемое контроллером напряжение, но ещё заявила о трёхканальной конфигурации, внедрение которой не уменьшало пропускную способность. Многие производители прислали нам комплекты 2000+ MT/s, но даже внеся изменения и выполнив все требования, необходимые для быстрой работы памяти (повысив напряжение на блоке Uncore процессора), положительного результата достигнуто не было.
Можно было бы предположить, что встроенная в Clarkdale и Sandy Bridge графика поможет вернуть памяти прежнюю скорость. На самом деле не помогла, причём даже после отключения у контроллера одного канала.
Дело в том, что до того, как заставлять кого-то думать о масштабировании встроенной графики, сам графический движок должен быть достаточно производительным. Например, HD Graphics 2000, применяемый в большинстве процессоров Intel на базе Sandy Bridge, работает ничуть не лучше, чем наводящий тоску графический процессор Clarkdale. Только сейчас Intel начинает понимать, что необходимо оснащать свои основные процессоры графическим ядром HD Graphics 3000, что, в принципе, надо было делать с самого начала. Поэтому теперь в нашей лаборатории тоже есть процессоры, которые мы можем протестировать, как и Core i3-2105.
Как мы уже видели, ядро Radeon HD 6550D – это сердце AMD A8-3850 – заслуживает уважения своей производительностью. Она настолько высока, что ограничение пропускной способности памяти в 1333 MT/s, причём даже в двухканальной конфигурации, буквально подрезает ему крылья, как птице.
Поэтому давайте попробуем, используя Sandra 2011, посмотреть, что же у нас происходит с пропускной способностью памяти, начиная с DDR3-800 и заканчивая DDR3-1866. Для обеспечения максимальной масштабируемости использовался комплект модулей памяти Kingston KHX2133C9AD3T1K2/4GX. Для всех режимов памяти до DDR3-1333 схема задержек (тайминги) CAS 7 оставалась без изменений, остальные режимы, превышающие это значение, для обеспечения надёжной работы потребовали настройки задержек CAS 8.
В принципе, пропускную способность памяти можно увеличить в два раза – с 800 миллионов операций в секунду до 1866, но по мере повышения скорости и снятия задержек для увеличения частоты, значения будут расти всё медленнее. Это тоже полезно знать. Теперь давайте посмотрим на производительность приложений и как она меняется в зависимости от разных условий.
Переход с DDR3-800 на DDR3-1600 в игре Metro 2033 почти вдвое повысил её производительность, полностью подтвердив аналогичные результаты по улучшению пропускной способности памяти в Sandra 2011. Это довольно сложный графический тест и дойдя до уровня DDR3-1866, уже не имеет смысла его продолжать, потому что повышения производительности практически нет.
Игра Call of Duty давно известна своими возможностями подстраиваться под разные платформы, не сильно загружая при этом видеокарту. И снова во время тестирования произошло почти двукратное увеличение при переходе с DDR3-800 на DDR3-1600. При попытке принудительного использования задержек CAS 8, был явно заметен провал на кривой производительности, а когда дело дошло до DDR3-1866 и для поддержания стабильной работы потребовалось уменьшить параметр tRCD до 9, кривая производительности сползла вниз. Результаты были бы другими, если бы под рукой оказалась какая-нибудь хорошая память, типа DDR3-1600 CAS 7.
Архитектура процессора AMD не так зависит от производительности памяти, как графический движок. Тем не менее, при переходе с DDR3-800 на DDR3-1333 происходит значительное улучшение работы. Других отличий нет. Поэтому переплачивать только за то, чтобы получить более продвинутую память, не имеет смысла.
Перекодировка ещё меньше зависит от быстрой памяти, чем процесс сжатия файлов. Да, незначительное увеличение скорости при переходе с DDR3-800 на DDR3-1333 заметно, но съэкономить время в таком приложении как, например, MainConcept, не получится.
Быстрая/низколатентная память
Несмотря на незначительные улучшения в работе приложений, вывод из всего этого простой – если надо получить максимум из APU на базе Llano, то графический движок должен иметь возможность работать, а не задыхаться от нехватки ресурсов. Память с поддержкой высокой скорости обмена данных и малым временем ожидания (низколатентная) – единственный способ добиться в играх максимальной частоты кадров.
Не стоит прельщаться скоростью DDR3-1866, если для этого придётся устанавливать задержки CAS 8 или 9. Более мощная модель DDR3-1600 выглядит куда более привлекательно. Нам повезло протестировать на паре материнских плат наш набор Kingston HyperX DDR3-2133, настроенной как DDR3-1600 CAS 7. К сожалению, не удалось это сделать на плате ASRock, которая в этот момент использовалась для других тестов. Но даже в режиме CAS 8 производительность была невероятно высокой.
Пару слов о разгоне Llano
Llano с трудом поддаётся разгону. AMD специально заблокировала множители частоты всей линейке. При этом, компания считает, что, увеличив тактовую частоту до 133 МГц и уменьшив множитель (уменьшать можно, а повышать – нет), в 3DMark Vantage реально добиться повышения производительности на целых 30%. Однако в связи с тем, что генератор частоты на данной платформе встроенный, (как в Intel P67/H67/Z68), то путаница с изменением тактовой частоты также приведёт к разгону северного моста, графического ядра и шины PCI Express.
Более быстрый северный мост довольно-таки гибок в настройке, поэтому можно вернуть значения параметров оперативной памяти к номинальным. Более того, разгон графического ядра можно только приветствовать – ведь именно так и добиваются в играх высокой частоты кадров. А вот разогнанная шина PCIe может привести к проблемам.
Пару раз нам пришлось задержаться допоздна, обсуждая всевозможные проблемы с представителями ASRock и Gigabyte, которые практически в реальном времени помогали нам разобраться с настройками BIOS. В конце концов, при помощи множителя 23,5x и тактовой частоты 145 МГц, показанной как 143,5 МГц, нам удалось разогнать A75M-UD2H на материнской плате Gigabyte почти до 3,4 ГГц (можно было и больше, но при нагрузке он зависал). APU потребовалось ещё 0,05 В, чтобы достичь такого же результата.
Проблема была в том, что нельзя было использовать SSD. При превышении тактовой частоты в 110 МГц BIOS на материнской плате сразу переставал его определять. Даже с установленным жёстким диском надо было три или четыре раза перезагрузить систему, чтобы BIOS смог определить его. Эта проблема известна и Gigabyte как-то пытается её решить, и проявляется она в превышении значений тактовых частот выше указанных в спецификации. У ASRock после разгона проявилась другая проблема -перестала работать поддержка USB 3.0. Другие платы просто не разгонялись, отказываясь работать задолго до того момента, когда надо было начинать сражаться с своеобразными настройками скорости шины.
Разгон четырёх ядер A8-3850 с 2,9 ГГц до 3,4 ГГц однозначно повысит производительность процессоров в соответствующих тестах, но для игровых приложений гораздо полезней будет просто установить быструю память.
В общем, вывод такой: разгон Llano – это что-то типа использования турбонаддува в Ford Fiesta. Ведь этот автомобиль покупается не за его скоростные характеристики на трассе, а за его относительную дешевизну и приемлемую скорость, чтобы просто ездить на нём, а не участвовать в гонках.
Идея установления мирового рекорда по интегрированной графике вызывает, по меньшей мере, улыбку, но не по причине нашего высокомерия, а потому, что всего за 70 долларов можно купить Phenom II X3 720 Black Edition или 1 Гбайт Radeon HD 6570, получив, при этом, более высокую графическую производительность без лишних усилий, плюс, разблокированный процессор с 6 Мбайт общего кэша L3. Если же вы любитель “погонять”, то второй вариант для вас окажется более подходящим, потому что AMD Llano предназначен совсем для других целей.
Есть ли будущее у разгона Llano?
У некоторых из протестированных нами плат есть возможность устанавливать более высокие значения множителей и изменять тактовую частоту графического процессора. Естественно, поменять эти настройки у APU, у которого все эти опции заблокированы, ни к чему не приведёт. Тогда почему эти настройки видны?
По нашим источникам, AMD планирует начать отдельные продажи APU Black Edition на базе архитектуры Llano. Как скоро – неизвестно. Но если будет открыт доступ к разблокированным настройкам основного и графического процессоров, то тогда станет гораздо легче разогнать каждый из компонентов этого 32-нанометрового устройства до максимальной скорости, не запутавшись в настройках других интерфейсов.
Тестовая конфигурация и сравнение с конкурентами
Вначале необходимо сказать несколько слов о тех устройствах, которые мы собираемся тестировать. Для сравнения мы выбрали три базовые конфигурации. Мы хотели добавить ещё несколько, но у нас просто не хватило времени на подбор альтернативных устройств, которые бы соответствовали стабильным, беспроблемным настройкам Llano, типа AMD Phenom II X3 720 и других недорогих популярных решений энтузиастов в этой области. Если будет интерес, мы с радостью проведём дополнительное тестирование с этой моделью и недорогими процессорами Intel Pentium на базе Sandy Bridge и подберём что-нибудь ещё.
Для всех трёх машин было решено использовать одну и ту же подсистему памяти, которая была бы совместима с DDR3-1333. Зная, что Llano демонстрирует значительную производительность при более агрессивных частотах и задержках, мы провели тестов на целую страницу, чтобы досконально исследовать эффекты от использования быстрой памяти. В процессе анализа результатов мы будем постоянно показывать вам, где большая пропускная способность реально помогает увеличить производительность.
Первоначально планировалось протестировать Core i3 на материнской плате низкого ценового диапазона на базе H67, однако перед самым тестированием один чересчур усердный инженер из нашей команды погнул пины сокета на единственной H67, которая у нас была и, тем самым, заставил нас выбрать другую плату – Z68. Эта плата была чуть дороже, но это, в любом случае, не повлияло бы на результат, потому что в тестировании использовалась всего одна видеокарта, а процессор Core i3 нельзя было разогнать по определению.
Тестируемое оборудование | |
Процессоры | AMD A8-3850 (Llano) 2,9 ГГц (29х100 МГц) CPU, 600 МГц GPU (400 шейдеров), четыре ядра, Socket FM1, 4 Мбайт кэша L2, функция энергосбережения активирована Intel Core i3-2105 (Sandy Bridge) 3,1 ГГц (31х100 МГц), два ядра, LGA 1155, 3 Мбайт общего кэша L3, Hyper-Threading активирована, функция энергосбережения активирована AMD Phenom II X4 965 Black Edition (Deneb) 3,4 ГГц (17х200 МГц), Socket AM3, 6 Мбайт общего кэша L3, функция энергосбережения активирована |
Материнские платы | ASRock A75 Extreme6 (Socket FM1), AMD A75, BIOS A75EX61.11I Asus P8Z68-V Pro (LGA 1155) Intel Z68 Express, BIOS 0501 Asus M4A89GTD Pro/USB3 (Socket AM3) AMD 890GX/SB850, BIOS 2201 |
Память | Kingston 4 Гбайт (2 x 2 Гбайт) DDR3-2133, KHX2133C9AD3W1K2/4GX @ DDR3-1333, 7-7-7-20 и 1,65 В |
Жёсткий диск | Samsung Series 470 256 Гбайт SSD, SATA 3 Гбит/с |
Видеокарта | Radeon HD 6570 1 Гбайт |
Блок питания | OCZ ModXStream Pro 500 Вт |
Программное обеспечение и драйверы | |
Операционная система | Windows 7 Ultimate 64-bit |
DirectX | DirectX 11 |
Драйвер видеокарты | AMD 8.862 RC1 AMD Catalyst 11.6 |
3D игры | |
Metro 2033 | Настройки игры: среднее качество, PhysX: Off, AAA, 4x AF, ожидание вертикальной синхронизации: отключено, разрешение 1024?768, 1280?1024, 1680?1050, демо: встроенная программа тестирования (Frontline) |
Call of Duty: Modern Warfare 2 | Настройки игры: ультра качественные настройки, сглаживание: выключено/4xAA, анизотропная фильтрация: выключено, покадровая синхронизация: нет, разрешение1024?768, 1280?1024, 1680?1050, демо: сond Sun, 45 секунд, программа скорости смены кадров – Fraps |
World of Warcraft: Cataclysm | Настройки игры: хорошее качество, сглаживание: выключено/4xAA, анизотропная фильтрация: 4x, вертикальная синхронизация: выключена, разрешение 1024?768, 1280?1024, 1680?1050, демо: Crushblow to The Krazzworks, программа скорости смены кадров – Fraps |
Аудио | |
iTunes | Версия: 10.3.1, 64-бит Звук CD (“Terминator II” SE), 53 мин., конвертация в формат AAC |
Lame MP3 | Версия 3.98.3 Звук CD “Terминator II SE”, 53 мин, конвертация WAV в MP3, Command: -b 160 –nores (160 Кбит/с) |
Видео | |
HandBrake CLI | Версия: 0.94 Видео: Big Buck Bunny (720?480, 23.972 кадров) 5 мин, Звук: Dolby Digital, 48000 Гц, 6-канальный, английский язык: AVC аудио: AC3 аудио2: AAC (High Profile) |
MainConcept Reference v2 | Версия: 2.0.0.1555 MPEG-2 to H.264, MainConcept H.264/AVC кодек, 28 с HDTV 1920?1080 (MPEG-2), Звук: MPEG-2 (44.1 kГц, 2-канальный, 16-бит, 224 Кб/с), кодек: H.264 Pro, видео режим: PAL 50i (25 FPS), Profile: H.264 BD HDMV |
Приложения | |
WinRAR | Версия 4.01 RAR, Syntax “winrar a -r -m3”, Benchmark: 2010-THG-Workload |
WinZip 14 | Версия 14.0 Pro (8652) WinZIP Commandline версия 3, ZIPX, Syntax “-a -ez -p -r”, Benchmark: 2010-THG-Workload |
7-Zip | Версия 9.2 LZMA2, Syntax “a -t7z -r -m0=LZMA2 -mx=5”, Benchmark: 2010-THG-Workload |
Adobe Premiere Pro CS5 | Видео длительностью 2 мин 21с, экспорт в H.264 Blu-ray Источник 960?720, вывод 1280?720 |
Adobe After Effects CS5 | Создание видео, которое включает 3 потока Кадры: 210, параллельные мультикадровый рендеринг: включено |
Cinebench | Версия 11.5 Build CB25720DEMO Тестирвоание процессора одно- и многопотоковое |
Blender | Версия: 2.54 beta Syntax blender -b thg.blend -f 1, разрешение: 1920?1080, сглаживание: 8x, рендеринг: THG.blend frame 1 |
Adobe Photoshop CS 5 (64-Bit) | Версия: 11 Фильтрация 16 Мбайт TIF (15000?7266), фильтры:, Радиальное размытие (сумма: 10, метод: увеличение изображения, качество: хрошее) Размытие фигуры (радиус: 46 px; настраиваемая форма: Trademark sysmbol) Медиана (радиус: 1px) Полярные координаты (из прямоугольного в скруглённый) |
ABBYY FineReader | Версия: 10 Professional Build (10.0.102.82) Чтение формата PDF, сохранение в Doc, источник: “Политическая экономия” (J. Broadhurst 1842) 111 страниц |
Синтетические тесты | |
PCMark 7 | Версия: 1.0.4 |
3DMark Vantage | Версия 1.1.0 |
SiSoftware Sandra 2011 | Версия: 2011.SP3 Процессор арифметический, мультимедиа, криптография, пропускная способность памяти, криптография графического процессора общего назначения |
PCMark 7
В связи с тем, что AMD (а также Nvidia и VIA) недавно покинули BAPCo, мы логично решили больше не использовать пакет SYSmark в наших тестах, в связи с чем считаем необходимым отдельно остановиться на том, почему мы начинаем тестирование в обзоре синтетической производительности в таких пакетах, как PCMark 7, 3DMark Vantage и Sandra.
Синтетические измерения производительности наиболее полезны в тех случаях, когда эффективно изолируют какую-либо подсистему, загружая её работой так, как, порой не может загрузить ни одно реальное приложение. В конце концов, реальные приложения не предназначены для того, чтобы перегрузить или подвесить ту или иную систему компьютера. Тем временем, синтетическое приложение, как раз наоборот, может специально быть нацелено на передачу максимального объёма данных через какую-то конкретную шину, на измерение эффективности работы распараллеленного процессора или на проверку работы конкретного компонента по специальному алгоритму.
PCMark 7, как синтетический тест, не совсем подходит для такой работы, потому что он основывается на компонентах операционной системы Windows, а она, по своей сути, – реальное рабочее приложение. Futuremark создаёт такие тесты таким образом, что их описание было бы довольно сложным и заняло бы очень много времени.
Данный тест больше подходит для сравнения тестируемых компонентов между собой путём повторения каждого теста три раза. После этого он выдаёт суммарный результат, умножая коэффициент на среднее геометрическое значение каждого теста в пакете. Результат, близкий к 5000, означает, что производительность протестированных устройств близка к эталонным значениям Core i7-980X, GeForce GTX 580 и Crucial C300, которые Futuremark использует в качестве основы для сравнения.
Тот факт, что ни одно из трёх устройств не достигло отметки 5000, является хорошим индикатором их относительной производительности. Потому что это не самые мощные и топовые конфигурации, а устройства, ориентированные на массовый рынок.
Учитывая всё это можно сказать, что тесты пакета PCMark 7 ориентированы больше на нагрузку процессора, а не графического ядра. Основная идея технологии Fusion, скорей всего, заключается в том, чтобы улучшить работу игр и развлекательных приложений, а базовый пакет PCMark явно нацелен на тестирование обычных приложений.
Если поглубже заглянуть в документацию Futuremark, то там сказано, что этот пакет состоит из тестов источников хранения данных, перекодирования и воспроизведения видео, обработки изображений, web-браузеров, дешифровки и графики DirectX 9. Мы были немного озадачены этим выбором, потому что не понимали, зачем использовать DirectX 9, в то время как другие компоненты PCMark 7 уже используют DirectX 10, а их флагманский тест 3DMark 11 – даже DirectX 11.
Вот почему пакет PCMark не совсем подходит для такого тестирования. Он показывает действительные результаты тех тестов, которые выполняет, но они все – Windows-ориентированные, а, следовательно, их результаты – относительные. Поэтому если ориентироваться только на результаты этого пакета, из поля зрения исчезнут основные изюминки конструкторских решений AMD.
Пакет Lightweight ещё больше ориентирован на загрузку процессора, с акцентом на тестировании устройств хранения данных, редактировании текста, обработке изображений и работе web-браузеров с тремя вкладками. Ничего из перечисленного не нагружает графические ресурсы A8-3850, поэтому Llano остаётся далеко позади.
Для защиты своих позиций у AMD есть Phenom II X4 965, который стоит чуть больше Llano, но зато все транзисторы в нём работают внутри четырёх ядер. Этих ресурсов вполне достаточно, чтобы догнать двухъядерный Core i3-2105, но ещё не сравняться.
Учитывая результаты PCMark 7 и Lightweight, трудно было ожидать от Llano высоких результатов, потому что эти тесты основывались в основном на выполнении объёмных задач, таких как тестирование устройств хранения данных, работа web-браузеров, дешифровка и редактирование текста.
Поэтому A8-3850 вполне закономерно финиширует здесь последним. Но стоит задать вопрос: какая производительность действительно нужна для работы web-браузера? Как надо работать с текстовым редактором, чтобы перегрузить свой процессор? В AMD надеются, что пользователи перед тем, как купить процессор и видеокарту, зададут себе именно эти вопросы. И тогда возникнет другой вопрос: а не лучше ли выбрать один “кусок кремния” вместо двух, тем более, что он прекрасно работает и в той, и в другой области?
Не забывайте, что PCMark – это всего лишь один из пакетов, которые мы собираемся сегодня использовать для тестирования. Он не выносит вердикт и не претендует на истину в последней инстанции. Поэтому давайте перейдём к следующему тесту Futuremark, – 3DMark Vantage, – который позволяет оценить игровые возможности процессора. Наверное, нет смысла говорить, что здесь уже всё было совсем по-другому.
3DMark Vantage
Несмотря на то, что 3DMark 11 является более новым пакетом, но единственное, что нам удалось сделать, – это запустить тест Vantage. Как оказалось, программное обеспечение на основе DirectX 10 ограничивает не только встроенную графическую карту Intel HD Graphics, но ещё и графический процессор Radeon HD 4290, который встроен в чипсет AMD 890GX.
В подтверждение наших выводов о синтетических тестах, которые нацелены на максимальную загрузку определённого устройства без учёта требований реально работающих приложений, Vantage действительно демонстрирует, как невероятно далеко уходит вперёд графическая система AMD от преследователей.
У Intel в процессор встроено уже второе поколение графического ядра. У AMD – первое. Но на диаграмме прекрасно видно, что решение компании выделить больше места для графического процессора на кристалле приводит к более чем двукратному превосходству над Intel.
Когда начинаешь разбираться в цифрах, то причина превосходства AMD становится очевидной. Графический движок Radeon HD 6550D просто сводит на нет все усилия HD Graphics 3000, что уже само по себе должно подтвердить преимущества совместного расположения основного и графического процессоров на одном кристалле, разрушив некогда впечатляющие результаты чипсета 890GX.
Sandra 2011
SiSoftware Sandra 2011 идёт ещё дальше в вопросах разделения процессов тестирования. Тест Arithmetic отдельно оценивает производительность процессора при обработке целых чисел и чисел с плавающей запятой. Тест целых чисел Dhrystone является многопоточным, 64-битным и масштабируемым до 64 ядер; результаты выводятся в миллионах инструкций в секунду. То же самое происходит и в тесте Whetstone, однако здесь результаты фиксируются в миллионах операций с плавающей запятой в секунду.
Четырёхядерная архитектура Deneb демонстрирует лучшие результаты с плавающей запятой, а двухъядерный Intel Sandy Bridge оказывается немного лучше в работе с целыми числами. Низкочастотный A8-3850 явно отстаёт от них по этим параметрам.
Разница между устройством ускоренной обработки данных (ALU) и математическим сопроцессором (FPU) сразу же проявляется в тесте Multimedia. Процессоры AMD обеспечивают лучшую производительность при обработке операций с плавающей запятой. Однако при использовании целых чисел для имитации чисел с плавающей запятой архитектура Intel Sandy Bridge явно оказывается впереди.
Обычно в данном тесте всегда доминирует Intel, однако компания решила серьёзно ограничить возможности своих процессоров нижнего ценового диапазона, отключив в них ускорение для симметричного алгоритма блочного шифрования (AES). Из-за этого Core i3-2105 занял последнее место, уступив производительности четырёх ядер Phenom II X4 с частотой 3,4 ГГц и четырём ядрам A8-3850 с частотой 2,9 ГГц.
Нет ничего удивительного в том, что двухканальная память DDR3-1333 в паре с Intel по пропускной способности оказалась на самом верху. Интересно другое, что при той же частоте и задержках Llano показал результат лучше, чем Deneb. Как уже отмечалось, пропускная способность памяти является очень важной характеристикой, от которой зависит производительность A8-3850 при выполнении серьёзных графических задач во время тестирования.
С помощью OpenCL мы смогли протестировать криптографический потенциал графических решений, интегрированных на кристалле и в чипсете. Llano оказался абсолютным лидером и в симметричном алгоритме блочного шифрования (AES), и в безопасном алгоритме хэширования (SHA); процессор Intel оказался в состоянии работать с кодом OpenCL только через ядра своего основного процессора.
Metro 2033 (DirectX 10)
Тестирование в режиме DirectX 10 позволяет сравнить AMD Radeon HD 6550D, Intel HD Graphics 3000 и AMD Radeon HD 4290.
Metro 2033 – довольно требовательная к ресурсам игра, поэтому не вызвал удивления тот факт, что все три графических движка при разрешении 1024х768 и Medium-качестве настроек так и не смогли обеспечить для неё нормальную производительность.
Также логичным выглядит то, что AMD при переходе с интегрированного в чипсет графического ядра Radeon HD 4290 на встроенное в кристалл Radeon HD 6550D получает более чем трёхкратное увеличение производительности. Более того, Llano оказался в состоянии почти в два раза обойти HD Graphics 3000 в каждом разрешении.
В случае, если вы заинтересуетесь, почему и как производительность памяти отбрасывает назад всю платформу, вернитесь к той странице, где мы рассматривали вопросы масштабируемости памяти. Хотя переход с DDR3-1333 на DDR3-1600 и позволяет добавить пару кадров в секунду, переход ещё выше, на DDR3-1866, не приносит в Metro 2033 никакой пользы.
Call of Duty: Modern Warfare 2 (DirectX 9)
Call of Duty, наоборот, вполне нормально работает на графическом ядре Radeon HD 6550D процессора A8-3850.
При разрешении 1680×1050 достигается почти 4-x кратное увеличение скорости, по сравнению с предыдущим графическим решением AMD, интегрированным в чипсет. А скорость лучшего графического ядра Intel с выключенной функцией сглаживания оказывается в два раза меньше. Увеличиваем нагрузку при помощи режима сглаживания 4х АА и скорость кадров у AMD почти в три раза превышает значения Intel.
Так как Call of Duty хорошо адаптируется к разным платформам, мы решили использовать стандартную память DDR3-1333, что немного снизило результаты A8-3850. Но у нас также есть результаты тестирования другой памяти, работающей на более высокой частоте. Мы уже показывали эту диаграмму, но можно показать её ещё раз:
Максимальное увеличение производительности происходит при переходе с памяти DDR3-800 на DDR3-1066, а потом на DDR3-1333. Но даже при переходе на DDR3-1600 наблюдается серьёзный прирост, хотя при этом придётся изменить скорость подачи команд (CommandRate) на значение 2Т (перед этим он был 1Т. “Быстрый” 1T плохо дружит с высокими частотами памяти).
Переход на DDR3-1866, на самом деле, оказался пагубным для производительности, потому что из-за этого пришлось уменьшить пару других задержек, хотя CAS 8 всё-таки удалось сохранить. Идеальным решением в этой ситуации, однозначно, будет DDR3-1600 с наименьшими задержками.
World of Warcraft: Cataclysm (DirectX 9 и 11)
Игроки World of Warcraft – радуйтесь! Именно для таких игр и разрабатывался Llano. Вряд ли можно найти более популярную игру, чем World of Warcraft, и даже при разрешении 1680×1050 частота кадров остаётся ровной и непрерывной, хотя, при этом, необходимо выбрать для качества графики в настройках параметров Good и отключить функцию сглаживания. И там, где Core i3-2105 и 890GX падают вниз и сдаются, A8-3850 с гордостью продолжает работать.
В этой игре у AMD есть двойное преимущество. Оно проявляется не только в том, что AMD использует в этой перестрелке своё самое крупнокалиберное оружие, но ещё и в том, что A8-3850 – это единственный графический процессор с поддержкой DirectX 11 из всех, участвующих в тестировании. Как это обычно бывает, последний патч 4.1 добавил официальную поддержку DirectX 11 в этой игре, в то время как раньше она была экспериментальной. Если в общем, DirectX 11 может улучшить качество графики, то в дополнении Cataclysm его задача – увеличить производительность.
В результате оба графических процессора – Intel Core i3 и AMD 890GX – пришлось тестировать под DirectX 9, в то время как под DirectX 11 APU Llano с лёгкостью выигрывает это соревнование.
ContentCreation
Игры, несомненно, являются наиболее захватывающим и интересным сегментом сегодняшних тестов. Но, начиная с этого момента, нам придётся иметь дело с ограничениями архитектуры Stars и теми компромиссами, на которые пришлось пойти AMD, чтобы, урезав кэш L3, высвободить дополнительное место для графики.
Наш многопоточный тест Photoshop лучше работает с 4-х ядерной архитектурой AMD Deneb процессора Phenom II X4. Двухъядерный Intel i3-2105 занимает второе место, а четырёхъядерный A8-3850 – третье, отстав от него на одну секунду.
Premiere Pro CS5 значительно увеличивает скорость работы после установки дополнительной внешней видеокарты с CUDA, способной ускорять движок Mercury Playback Engine. Ни одна из тестируемых платформ не имеет такой функции, поэтому нам остаётся довольствоваться только кодированием на базе программного обеспечения. Интересно, что двухъядерный Core i3-2105 в этом случае показал наилучший результат, за ним следуют Phenom II X4 и A8-3850.
Подозревая, что Premiere Pro не хватит памяти после установки четырёхъядерного процессора, мы заменили наш 4 Гбайт DDR3-2133 на 8 Гбайт DDR3-1333 и попробовали пройти тест ещё раз. Phenom II X4 показал результат 3556 секунд. Это доказывает, что дополнительная память не помогает архитектуре AMD работать лучше; данный тест просто лучше подходит под процессоры Intel.
After Effects либо не хватает кэша L3 ядра Deneb, либо преимуществ его тактовой частоты, так как AMD A8-3850 уступает в сравнении с Phenom II X4 965 Black Edition. Intel Core i3-2105 не нужна большая скорость, как, впрочем, и большой кэш L3, чтобы отстать от Phenom.
Четырёхъядерные процессоры оправдали себя в Blender, где Phenom II X4 с частотой 3,4 ГГц финишировал первым, A8-3850- вторым, а IntelCore i3-2105 – третьим, так как два его ядра оказались не в состоянии достойно конкурировать с соперниками.
Как и ожидалось, самых наилучших результатов в графической дисциплине добился AMD A8-3850, а самым быстрым процессором стал четырёхъядерный Phenom II X4. Примечательно, что APU Llano оказался лучше Intel Core i3-2105 в обоих тестах.
Производительность
Этот хорошо распараллеливаемый тест показал незначительное преимущество четырёхъядерного AMD над двухъядерным Intel с технологией Hyper-Threading. На диаграмме видно, что процессоры A8-3850 и Core i3 финишируют почти одновременно. Phenom II X4 оказался быстрее, но значительно уступил в работе с графикой (из-за своего медленного чипсета 890GX).
В данном тесте многопоточность была загружена не на полную мощность, поэтому четырёхъядерному A8-3850, работающему на более низких частотах, показать было нечего. Это была территория Intel – из-за высокой эффективности за такт, что и позволило Core i3 подняться на первое место, несмотря на частоту 3,1 ГГц.
Даже 3,4 ГГц Phenom II не в состоянии выполнить за один такт такой объём работы. Поэтому вполне естественно, что флагман AMD на основе Llano, работающий на частоте 2,9 ГГц, оказывается ещё в более тяжёлом положении.
При тестировании в WinZip 14 наблюдается точно такая же картина, потому что этот тест тоже однопоточный. Правда, на этот раз Phenom II X4 финиширует с меньшим отставанием от Core i3, но A8-3850 всё ещё далеко до них.
В WinRAR многопоточность используется явно сильнее. Однако Intel удаётся остаться на первом месте, за ним следует Phenom II X4 и A8-3850 занимает третью строчку в списке.
И вот наконец-то четыре ядра обходят два ядра с технологией Hyper-Threading. AMD Phenom II X4 выходит на первое месте в тесте 7-Zip, а четырёхъядерный A8-3850 финиширует вторым. Intel Core i3 вынужден довольствоваться третьим местом, оказавшись на три секунды медленнее, чем самый быстрый APU Llano.
Если вас беспокоит настройка пропускной способности DDR3-1333, не забывайте, что пропускная способность памяти влияет на графические приложения больше, чем всё остальное. DDR3-1600 может съэкономить пару секунд при выполнении сжатия в WinRAR, но этого всё равно будет недостаточно, чтобы Llano сравнялся с Phenom II X4, имеющего огромный кэш L3 и 500 МГц преимущество в частоте.
Кодирование медиа-файлов
Результат тестирования в этом приложении всегда легко предсказать заранее. iTunes – это простое однопоточное приложение, которое ведёт себя также, как WinZip и Lame. Это говорит о том, что изменения IPC, внесённые Intel в архитектуру Sandy Bridge (в противовес Nehalem) обеспечат его процессору, в данном случае, серьёзные преимущества, а вот от четырёх ядер AMD пользы не будет никакой. Итак, 3,4 ГГц Phenom II X4 уходит вперёд и побеждает; 2,9 ГГц A8-3850 остаётся позади.
В MainConcept уже совсем другая картина. Эта программа предназначена для серьёзного тестирования многопоточности, в результате быстрый Phenom II первым пересекает финишную черту, а 2,9 ГГц A8-3850 – вторым. Двухъядерный Core i3-2105 не может за ними угнаться и занимает последнюю строчку рейтинга.
Та же ситуация повторяется и в HandBrake. Легко заметить, что, производительность большинства приложений, ориентированных на работу с медиа-файлами, зависит, в основном, от работы процессора. Поэтому для них ядра важнее, чем частота. Phenom II X4 снова занимает первое место, а A8-3850 – второе. Двухъядерный Core i3 с технологией Hyper-Threading уже второй раз оказывается в конце.
Самое интересное – это протестировать все функции вместе, а не по отдельности. И MainConcept, и HandBrake работают с программно-ориентированными кодировщиками. Поэтому они обе могут протестировать только производительность процессора. Однако и у Intel, и у AMD реализована собственная поддержка функции перекодировки с аппаратным ускорением. Графический движок HD Graphics 3000 процессора Core i3 включает QuickSync, процессор AMD A8-3850 имеет функцию ускоренного декодирования на базе UVD3 и функцию ускоренного кодирования, встроенную в 400 арифметико-логических устройств графического процессора.
Мы получили немало писем, в которых говорилось о том, что QuickSync вводит всех в заблуждение, потому что непонятно, как работает и как влияет на качество графики этот “чёрный ящик”. Это очень интересный вопрос. Дело в том, что каждый раз при использовании аппаратного ускорения для параллельного выполнения операций перекодирования, – как у Intel, так и у AMD, – файл на выходе должен отличаться от источника. Если вы хотите узнать, какую роль играет аппаратная часть в ускорении операций перекодирования, обратитесь к статье “Сжатие видео и декодирование: чем и на чём лучше”, в которой эти вопросы рассматривались более детально. Если во главе угла стоит качество графики, то отключите функции аппаратного ускорения и используйте перекодирование только при помощи программного обеспечения.
CyberLink MediaEspresso 6.5 позволяет протестировать не только программные функции, но и соответствующие аппаратные возможности Intel и AMD.
Удивительно, но QuickSync – это единственная технология, которую стоит использовать. При первом запуске 890GX и Llano программа MediaEspresso сразу же по умолчанию переключилась в программный режим, так как преимущества от аппаратного кодирования/декодирования в этом случае были минимальны.
Более дорогие и мощные внешние видеокарты, наверное, проявили бы себя лучше, но те облегчённые встроенные движки AMD, которые мы тестировали, просто не в состоянии тягаться с технологией аппартного ускорения Intel в Core i3.
Энергопотребление
APU A8-3850 имеет 100 ваттный тепловой пакет. Для сравнения, у Phenom II X4 965 Black Edition он составляет 125 Вт, а у Core i3-2105 – всего 65 Вт.
Конечно, и A8-3850, и Core i3-2105 включают графическое ядро. Чипсет 890GX добавляет 25 Вт к максимальному энергопотреблению платформы Phenom.
Неудивительно, что компьютер на базе Phenom II X4 использовал больше всего энергии во время выполнения PCMark 7 и других тестов общего назначения. Нас не шокировал тот факт, что 100 ваттный A8-3850 опустился на второе место по результатам этого теста на минимальное энергопотребление.
Но интересней всего оказалось то, что APU AMD на базе Llano закончило тест раньше Intel Core i3 (несмотря на то, что в Futuremark Intel набрал больше очков), превысив среднее энергопотребление всего на 4 Вт. Видите, простое сравнение данных термопакетов ничего не даёт, особенно когда производители не используют одну и ту же методику при классификации своей продукции.
Если сесть и вручную начертить работу каждого устройства, то в итоге получится вот такое произведение искусства в виде линейной диаграммы. И хотя, на первый взгляд, в ней трудно разобраться, мы постараемся максимально упростить этот процесс.
Первое, что бросается в глаза, это то, что Phenom II X4 со своим Radeon HD 4290 на борту требуется намного больше времени, чем другим, чтобы завершить этот тест. Единственная причина, которая могла бы объяснить данную проблему, заключается в слабом графическом процессоре. Он явно не справляется с трёхмерной графикой тестируемых приложений.
Помимо этого, вполне очевидно, что платформа на базе Dual Graphics потребляет больше всего энергии. И в то время, как всё говорит о том, что AMD Phenom II вот-вот займёт по максимальному энергопотреблению второе место, его вдруг неожиданно занимает Intel Core i3 с внешней видеокартой.
Приятно видеть, насколько мало энергии потребляет A8-3850 с Radeon HD 6550D и Core i3-2105 с HD Graphics 3000 (вся платформа потребляет 41-42 Вт в режиме ожидания).
Заключение
Мы тестировали процессоры Llano в нашей лаборатории в течение целых двух месяцев. За это время BIOS в материнских платах был доработан до такого уровня, что теперь их уже спокойно можно запускать в серийное производство, они обеспечивают стабильную работу и поддерживают все необходимые функции. После каждого апгрэйда разгон из невозможной опции превращался во вполне реальную.
Когда мы получили первую платформу AMD, нам было интересно, как она поведёт себя по сравнению с Core i3, процессором, который, как мы уже убедились, весьма прекрасно зарекомендовал себя в паре с внешней видеокартой. Однако стоимость одного Core i3-2105 составляет 140 долларов, плюс видеокарта Radeon HD 6570 за 70. Причём, это видеокарта нижнего ценового диапазона. То есть, такой комплект обойдётся уже больше 200 долларов.
Лишите процессор Core i3 внешней видеокарты, которая придаёт ему столько возможностей, и тому придётся довольствоваться оставшимся встроенным графическим процессором HD Graphics 3000. Это самый лучший встроенный графический процессор Intel, который, естественно, быстрее предыдущего HD Graphics 2000, однако он и близко не может приблизиться к тому графическому движку, который встроен в AMD A8-3850. Если рассматривать решения на базе интеловской платформы LGA 1155 и платформы AMD FM1 с точки зрения реальных преимуществ, то архитектура Llano выглядит предпочтительнее. Всё дело в цене и балансе.
Мы всегда были сторонниками баланса. “Правильный” процессор надо ставить с “правильной” видеокартой и “правильной” памятью. Если вам удаётся найти идеальное решение в рамках существующего бюджета, то вы в итоге получаете наилучшую производительность. Что касается стратегического развития, то Intel и AMD уже сделали свой внутренний выбор, начав разработку соответствующих продуктов нового поколения. Intel сфокусировался на очень мощных вычислительных ядрах. Поэтому его двухъядерный процессор часто опережает четырёхъядерное решение AMD. Но AMD потратила безумно много ресурсов на интегрированный графический процессор на кристалле, который дополняет работу центрального процессора.
В результате Llano, в целом, более сбалансирован для работы в тех сферах, где преобладает 3D-технологии. Уберите 3D, и архитектура Sandy Bridge покажет своё превосходство. Но убрать 3D невозможно. Большинство из нас сталкиваются с 3D контентом каждый день. И чтобы добиться превосходства в этой области Sandy Bridge необходима внешняя графическая карта. И вот здесь возникает вопрос цены.
По своей сути A8-3850 не нуждается в аппаратной поддержке других устройств, чтобы обеспечить высокую производительность. Установите его на дешёвую материнскую плату, вставьте 4 Гбайт быстрой памяти DDR3, добавьте жёсткий диск ценой до 100 долларов – и вы получите компьютер начального уровня, способный решать многие задачи на приемлемом уровне. За 135 долларов вы получите центральный и графический процессоры в одной упаковке с термопакетом 100 Вт. Core i3-2105 за 140 долларов обеспечит мощный центральный процессор и в дополнение графический движок. Нам по-прежнему очень нравится то, что в Intel сделали с QuickSync – они использовали все транзисторы для перекодировки видео при помощи аппаратного ускорения, вместо того, чтобы тратить их потенциал на более сложные задачи обработки 3D, в решении которых, как они понимали, конкурировать с AMD было невозможно.
Итак, кто же это будет покупать?
Нам бы очень хотелось протестировать для данной статьи ещё и AMD Phenom II X3 720 Black Edition вместе с видеокартой Radeon HD 6570, так как они вместе стоят примерно столько же, сколько и A8-3850. Разогнанный, благодаря разблокированным множителям, Phenom II почти наверняка обгонит Llano, сделанный в стиле Athlon. А внешняя графическая карта однозначно будет всегда быстрее встроенного графического ядра Radeon HD 6550D внутри Llano.
Но такой подход, ориентированный на грубое преобладание скорости, свойственен скорее энтузиастам – при этом обеспечивается более высокая производительность 95 ваттного процессора и 60 ваттной видеокарты. A8-3850 более элегантно совмещает эти две опции в одной упаковке 100 ваттного процессора. Вероятно в AMD рассчитывают на то, что сборщики компьютеров смогут извлечь дополнительную выгоду из решений с меньшим тепловым пакетом и меньшими габаритными размерами, которые предоставляет Llano, чем из существующей комбинации Phenom и Radeon.
Само собой разумеется, что данная технология предназначена не для энтузиастов. Даже самые обыкновенные геймеры с 500 долларами в кармане могут собрать систему намного лучше, чем самая крутая платформа с интегрированной графикой. Самое быстрое решение AVD – APU Llano явно и недвусмысленно нацелен на рынок настольных компьютеров нижнего ценового диапазона, в которых есть уже все устройства, и за которые пользователи готовы заплатить 400 – 500 долларов. Для других пользователей существуют более скоростные решения, но за них придётся заплатить намного дороже. Сегмент AMD с устройствами ускоренной обработки информации (APU) – это компьютеры в ценовом диапазоне от 400 до 700 долларов. Хотя, честно говоря, диапазон 400 – 600 выглядит более реалистичным.
Впрочем, AMD придётся ещё немало потрудиться, в связи с грядущим выходом Bulldozer. Осталось ждать недолго – месяца два, не более. Всех волнует вопрос, сможет ли он сравняться с Sandy Bridge по мощности, чтобы у пользователей вновь появился повод для радости от процессора с суффиксом FX? Пока это не произошло, Llano будет оставаться отличным решением для массовых компьютеров.