Введение
Не так давно мы подробно обсудили глубокую суть работы технологии AMD Cool’n’Quiet, а также и то, как энтузиасты с правильными утилитами могут оптимизировать свои процессоры Athlon или Phenom.
Теперь настало время поговорить о производительности. Подобно большинству обзоров процессоров, которые вы читали, мы планируем использовать несколько тестов для измерения производительности наших разных образцов. Но на этот раз мы пойдём ещё дальше. Кроме результатов производительности мы также добавим результаты измерения энергопотребления в каждом тесте.
Наша цель довольно простая. Разные приложения используют процессоры по-разному. Некоторые полностью загружают все доступные ядра, в то время как многие другие – нет. Это также означает, что и энергопотребление каждого сценария будет, скорее всего, различным. Измеряя энергопотребление одно- и многопоточных приложений, мы можем получить хорошее представление о производительности и энергопотреблении во многих сценариях, что позволит узнать, дали ли наши оптимизации позитивный эффект.
Мы хотели протестировать разные типы сценариев. Многие тесты накладывают 100% нагрузку на каждое ядро, так что процессор будет в самом высоком p-состоянии во время теста. Мы хотели оценить производительность и при p-состояниях для режиме бездействия или, по крайней мере, для промежуточных p-состояний. В конце концов, процессор находится в режиме бездействия большую часть времени, которое мы проводим за рабочим столом, будь то работа с web-браузером, написание писем, воспроизведение музыки или просмотр видео стандартного разрешения – всё это едва ли нагружает процессор. Кроме того, мы планируем измерить энергопотребление системы при воспроизведении видео высокого разрешения с аппаратным ускорением на видеокарте и без него.
Мы также планируем отследить уровень нагрузки ядер/процессора. Для чего? Чтобы узнать, будут или нет наши тесты задействовать все доступные ресурсы процессора. Мы сможем посмотреть, как часто процессор находится в режиме бездействия или под определённой нагрузкой. Мы также сможем узнать, полностью или нет нагружены все ядра. Для этого мы записывали нагрузку на процессор с помощью встроенного в Vista Performance Monitor.
Мы брали измерения с разными профилями энергопотребления: “Без управления энергосбережением/No Management” (мы выключили поддержку Cool’n’Quiet в BIOS), “Сбалансированный/Balanced” (поддержка Cool’n’Quiet в BIOS включена, а план электропитания в Windows выбран “Сбалансированный/Balanced”) и “Optimized/Оптимизированный” (поддержка Cool’n’Quiet в BIOS включена, план электропитания в Windows выбран “Сбалансированный/Balanced”, процессор работает с меньшими напряжениями ядра и северного моста, с меньшим временем переходов между p-состояниями, а также с синхронизированным изменением тактовых частот ядер “Ganged” в K10Stat). Эти настройки были выбраны по той причине, что мы хотели сфокусироваться на производительности и энергопотреблении при активных режимах энергосбережения.
Тестовая конфигурация
Аппаратная тестовая конфигурация | |
CPU | AMD Athlon X2 7750 (2,7 ГГц, кэш 3 Мбайт) AMD Athlon X2 7850 (2,8 ГГц, кэш 3 Мбайт) AMD Athlon II X2 250 (3 ГГц, кэш 2 Мбайт) AMD Phenom II X3 710 (2,6 ГГц, кэш 8 Мбайт) AMD Phenom II X4 945 (3 ГГц, кэш 8 Мбайт) AMD Phenom II X4 955 (3,2 ГГц, кэш 8 Мбайт) |
Материнские платы | AMD 790GX: Biostar TA790GX 128M Gigabyte GA-MA790GP-DS4H Gigabyte GA-MA790GP-UD4H |
Память | Kingston KHX8500D2K2/2G PC1066 (4 Гбайт) в режиме DDR2-800 CAS 5-5-5-16 |
Видеокарта | ATI Radeon HD 3300 (AMD 790GX), 500 МГц GPU |
Жёсткий диск | Western Digital Green Power 1 Тбайт WD10EACS, кэш 16 Мбайт, SATA 3,0 Гбит/с |
Звук | Встроенный Realtek ALC880 |
Сеть | Встроенная Gigabit Ethernet Realtek RTC8111C |
Блок питания | PC Power & Cooling Silencer 750 Вт ATX12v v.2.2, EPS 12V CrossFire Edition |
Кулер CPU | Thermalright Ultra Extreme 120, Noctua NF-P12 120-мм вентилятор |
Вентиляторы корпуса | 2 x Noctua NF-P12 120-мм (без учёта вентилятора CPU) |
Программное обеспечение | |
Операционная система | Windows Vista Home Edition 32 bit SP1 |
Видеокарта | AMD Catalyst 9.5 |
Тесты и настройки
Кодирование аудио | |
RealPlayer | Version 11.0.1, Audio CD “The Phantom of the Opera (Original 1986 London Cast)” 54:13. Default Format: AAC 320 kbps. |
iTunes | Version 8.1.1.10, Audio CD “The Phantom of the Opera (Original 1986 London Cast)” 54:13. Default Format: AAC 256 kbps. |
Кодирование видео | |
DivX | Version 6.8.5, Video Trailer “Nine Inch Nails: Beside You In Time” 2:20, 1080p. Encoding Mode: Insane Quality. Enhanced Multithreading: Enabled. Experimental SSE4 full search: Enabled using SSE2. Quality: 10. Rate Control: 1 pass, quality based. Fixed quantizer: 1 |
Xvid | Version 1.2.1, Video Trailer “Nine Inch Nails: Beside You In Time” 2:20, 1080p. Profile: Unrestricted. Encoding Type: single pass, quality based. Target quantizer: 1 |
Windows Media Encoder 9 | Version 9.00.00.2980, Video Trailer “Nine Inch Nails: Beside You In Time” 2:20, 1080p. Profile: High Definition Video/Audio. Encoding Type: two pass. Video Bitrate: 5.3 Mbps. |
Воспроизведение видео | |
Cyberlink PowerDVD 9 | Version 9.0.1530.0, Video Trailer “Nine Inch Nails: Beside You In Time” 2:20, 1080p. Hardware Acceleration: Enabled. |
Media Player Classic Homecinema | Version 1.2.908, Video Trailer “Nine Inch Nails: Beside You In Time” 2:20, 1080p. Using Internal MPC decoder. DXVA/Hardware Acceleration (for H.264): Enabled. |
Приложения | |
WinRAR 3.80 | Version 3.8, compressing a 656 MB folder and decompressing the archive. |
POV-Ray | Version 3.6.1c, built in benchmark. |
Adobe Photoshop CS4 | Version 11.0, Driverheaven.net Photoshop Benchmark script Version 3 (http://www.driverheaven.net/photoshop.php). |
Синтетические тесты | |
3DMark 2001 SE | Built 330, All Game Tests. |
3DMark Vantage | Build 1.0.1, CPU Tests AI & PhysX. |
Super Pi | SuperPi 1.5 XS mod, 1M & 8M. |
Cinebench R10 | Version 10, All Tests – OpenGL, Single and Multi core/processor Rendering Test. |
3DMark 2001
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Обратите внимание на красную линию – она показывает общую нагрузку на все ядра. Их всего только два, поскольку мы использовали процессор Athlon X2 7750 для записи графика. Почему двуядерный процессор? На то есть хорошие причины. Если тест не может использовать два ядра, то, скорее всего, он не сможет использовать три или четыре.
Вы заметите, что только одно ядро нагружается в любое время на протяжении теста. Ситуация наверняка останется прежней и после использования более двух ядер. Поэтому добавление ядер вряд ли поможет в данном случае. Фактически, добавление ядер, которые будут находиться в режиме бездействия, вряд ли имеет смысл. Почему? Ядра в режиме бездействия всё равно потребляют немного энергии (эту проблему Intel решила в архитектуре Nehalem, которая может почти полностью выключать ядра в режиме бездействия). Если приложение не использует дополнительные ядра, то вряд ли ему требуются дополнительные вычислительные ресурсы.
Какую производительность показали процессоры в этом старом тесте? Давайте посмотрим.
Теперь давайте взглянем на энергопотребление во время теста.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Как мы заметили ранее, 3DMark 2001 не полностью использует все доступные ядра. Это больше графический тест, поэтому встроенный GPU ATI играет большую роль. Именно поэтому мы наблюдаем столь большую разницу между материнскими платами Biostar TA790GX 128M (с памятью DDR2 SidePort) и Gigabyte GA-MA790GP-DS4H и GA-MA790GP-UD4H (обе с памятью DDR3 SidePort).
Из результатов можно сделать несколько любопытных выводов. Управление энергопотреблением приводит к падению производительности, хотя в реальных условиях это будет вряд ли ощутимо. Поскольку производительность напрямую сравнивать нельзя, сложно оценить, какой процессор наиболее эффективен. Что ещё хуже, уровень производительности отличается в зависимости от используемой материнской платы.
3DMark Vantage
Поскольку интегрированные графические ядра дают очень низкую производительность, мы пропустим графические тесты вообще и сфокусируемся на тестах CPU, где тестируются физика и искусственный интеллект. Поэтому перед нами больше тест процессора, а не видеокарты. Будет ли он полностью использовать все ядра?
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Да, будет. Давайте посмотрим на результаты.
А также и на энергопотребление во время теста.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Мы не наблюдаем ощутимой разницы по производительности между работой с активными и неактивными опциями энергосбережения. Однако из-за возможности полностью использовать все доступные ядра, разница между производительностью наших процессоров более ощутима. В целом же, low-end процессоры дают около 2/3 производительности своих более быстрых аналогов. Athlon X2 7750, 7850 и новый Athlon II X2 250 фактически находятся на одном уровне по производительности.
Если оценить среднее энергопотребление, то Athlon II X2 250 использует минимальное количество энергии. Это замечательно, но Phenom II X3 710 с дополнительным ядром ушёл не особо дальше. С этим процессором вы получите больше производительности (примерно на 38% быстрее), но при этом средний уровень энергопотребления будет таким же, что и у двуядерного Athlon X2 7750. Ситуация похожая, если мы посмотрим на общее количество затраченной энергии во время тестового прогона.
Но это не самый эффективный процессор. После оптимизаций напряжения Phenom II X4 945 даёт больше производительности (на 136% по сравнению с Athlon X2 7750, на 53% по сравнению с Phenom II X3 710), при этом он потребляет лишь чуть больше энергии (на 19% больше по сравнению с Athlon X2 7750). Если посмотреть на перспективу, то суммарная потреблённая энергия оказалась практически такой же, что и у Athlon X2 7750, а производительность – почти в 2,5 раза выше (если быть точным, то в 2,41 раза). Phenom II X4 955 на 156% быстрее и потребляет на 30% больше энергии.
Впрочем, выводов можно сделать больше, чем кажется на первый взгляд. Если вы помните, то разница по среднему энергопотреблению составляет около 19 Вт. Но сюда входит разница из-за разных используемых материнских плат (Biostar TA790GX 128M и Gigabyte GA-MA790GP DS4H). Если наши предположения верны, то Phenom II X4 945 потребляет почти столько же, сколько и Athlon X2 7750 с оптимизированными настройками.
SuperPi 1M и 8M
SuperPi – довольно популярное приложение для тестов вычислительной пропускной способности. Как вы можете видеть, данный тест не может полностью использовать два вычислительных ядра, не говоря уже о ещё двух. Подобно 3DMark 2001, для данного теста лучшим решением будут одно- и двуядерный процессоры.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Помните разницу между процессорами? А именно синхронное изменение тактовой частоты ядер? Поскольку тесты 3DMark 2001 и SuperPI могут полностью нагрузить только одно ядро, они постоянно “перепрыгивают” с ядра на ядро под Windows Vista, что приводит к потере времени и снижению производительности. Вновь взгляните на график загрузки процессора – “перепрыгивание” с одного ядра отчётливо заметно. Обратите, как пики и падения обоих графиков зеркально отражают друг друга.
Подобно 3DMark 2001, мы наблюдаем падение производительности при активации функций энергосбережения. Но это как раз результат “перепрыгивания” однопоточных приложений с одного физического ядра на другое под Windows Vista. Обратите внимание, насколько меньше разница с процессорами Phenom II по сравнению с Athlon X2 и Athlon II X2. Переход на синхронное изменение тактовых частот с помощью K10Stat (с оптимизированными настройками), позволяет вернуть часть производительности, хотя и не всю.
Включение синхронного изменения тактовых частот и уменьшение времени p-переходов позволило нам восстановить производительность – с потери 8-18% до потери всего 2%. Преимущество меньшего времени p-переходов составляет около 1%, что легко увидеть по результатам производительности Phenom II. Напротив, штраф от асинхронного изменения тактовых частот составляет около 17%, что довольно существенно.
Кстати, мы смогли сравнить однопоточную производительность на Phenom II, Athlon II и старом Athlon X2. Работая на 400 МГц быстрее, Athlon II предоставляет ту же самую однопоточную производительность, что и Phenom II X3 710. То есть 6 Мбайт кэша L3 могут компенсировать разницу в частотах до 400 МГц. Наличие кэша L3 также помогла старому Athlon X2 достойно показать себя по сравнению с новым Athlon II X2 250.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Давайте перейдём к энергопотреблению. При переходе к оптимизированным настройкам мы не только возвращаем обратно потерянную производительность, но и также экономим около 16% бюджета по энергопотреблению Athlon X2 7750. Это весьма немало по сравнению со штатными настройками (4%). Так что если вы искали хорошую причину для покупки Athlon II X2 250, просто посмотрите на результаты энергопотребления. Процессор потребляет примерно на 8 Вт меньше, чем Athlon X2 7750, и при этом работает немного быстрее.
Конечно, в итоге нужно оценить общую затраченную энергию на данный тест. Если вы оставите технологию Cool’n’Quiet в штатном режиме (или выключите управление энергопотреблением), то между 45-нм процессорами разница невелика. Но стоит оптимизировать напряжения, как Phenom II X4 945 выделяется среди всех остальных моделей. С этим процессором вы будете тратить меньше энергии. Это весьма интересно, поскольку мы получили представление об уровнях энергопотребления однопоточных приложений на этих процессорах.
WinRAR
Для данного теста мы выбрали папку с 616 Мбайт файлов (установочную папку Adobe Photoshop CS4), сжали её в архив .RAR с лучшим уровнем сжатия, после чего распаковали папку на рабочий стол. Давайте посмотрим на загрузку процессора во время выполнения двух этих задач.
Распаковка
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Сжатие
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Подобно своему встроенному тесту, WinRAR может полностью использовать два ядра, а также накладывать довольно существенную нагрузку на дополнительные ядра больше двух. Но если вы просто распаковываете файлы, то двуядерного процессора будет вполне достаточно. Загрузка процессора составляет выше 50% только в редких случаях.
Распаковка.
Сжатие
Данный способ тестирования имеет свои недостатки – весьма сильный разброс получающихся результатов. При повторных запусках наши результаты могли быть чуть меньше или чуть выше. В целом же, включение управления энергопотреблением приводит к заметному падению производительности на многих процессорах. В отличие от SuperPi, уменьшение времени p-переходов здесь оказывает большее влияние, позволяя нам вернуть большую часть производительности.
Хотя разница, на первый взгляд, кажется велика, на самом деле при распаковке она составляет около трёх секунд. Более значимая разница наблюдается при сжатии файлов. Поэтому на сжатии мы и сфокусируемся. Посмотрите, как распределились процессоры. Двуядерные процессоры оказываются примерно на 100 секунд медленнее, чем Phenom II X3 710, а Phenom II X3 710 – на 20-30 секунд медленнее, чем Phenom II X4 945 и 955.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Мы уже видели похожую ситуацию с 3DMark Vantage чуть выше. Athlon II X2 250 обладает самым низким средним энергопотреблением, за ним следует Phenom II X3 710 при штатных и оптимизированных настройках.
Если посмотреть на общую затраченную энергию, то Phenom II X4 945 финиширует лучше остальных. Это второй процессор по производительности, но он потребляет меньше всего энергии при оптимизированных настройках. Как и в случае SuperPi в однопоточных приложениях, данный тест должен дать нам примерное представление об энергопотреблении в многопоточных приложениях, которые могут масштабироваться до четырёх или большего количества ядер. Мораль нашей истории такова: не оценивайте энергопотребление простым взглядом на среднее энергопотребление. При штатных настройках даже Phenom II X4 955 затратит в сумме меньше энергии, чем Athlon II X2 250.
Cinebench R10
В отличие от других тестов в нашей статье, Cinebench R10 весьма уникален, поскольку он нагружает систему и процессор разными сценариями. Есть тест OpenGL viewport, который измеряет производительность видеокарты, однопоточный тест рендеринга, многопоточный тест рендеринга, которые измеряют производительность CPU.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Первая часть графика выглядит знакомо, не так ли? Как и в случае SuperPi, производительность в тесте Cinebench OpenGL и однопоточном тесте рендеринга страдает после включения Cool’n’Quiet на процессорах Athlon X2 и Athlon II. В тесте многопоточного рендеринга нагружаются все ядра – и мы больше не наблюдаем “прыжков” между ядрами.
Давайте посмотрим на результаты тестов. Поскольку нас более интересовала производительность процессора, мы сфокусируемся на тестах одно- и многопоточного рендеринга.
Однопоточный рендеринг.
Многопоточный рендеринг.
Мы уже не раз отмечали, как асинхронное изменение частоты ядер негативно влияет на производительность в однопоточных приложениях. И однопоточный тест рендеринга Cinebench это только подтверждает. Как и в случае SuperPi, “исправление” такого поведения возвращает результат на должный уровень – вплотную к работе без активной функции энергосбережения. Конечно, результат всё равно чуть ниже, но разница достаточно мала, чтобы не замечать её в реальных условиях (1–3%); да и она входит в пределы стандартной погрешности.
Отсутствие кэша L3 и асинхронное изменение тактовой частоты сильнее всего ухудшает производительность Athlon II X2 250. Намного сильнее, чем у процессоров Athlon X2. Но когда проблемы исчезают, то всё встаёт на свои места, процессор Athlon II X2 250 становится лидером среди двуядерных процессоров из-за своей более высокой тактовой частоты. Неудивительно, что частота 3,4 ГГц у Phenom II X4 955 также позволяет ему занять топовую позицию.
Тест многопоточного рендеринга по своей сути отражает то, что мы уже видели в случае 3DMark Vantage.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Некоторых может удивить, но увиденные нами результаты соответствуют тому, что мы увидели в предыдущих тестах SuperPi и WinRAR. Да, по среднему энергопотреблению большее число ядер (и более высокая тактовая частота) приводит к повышению энергопотребления. Это верно и для одно- (SuperPi), и для многопоточных (WinRAR) приложений. Однако в обоих тестах видно, что если вы сможете достаточно сильно опустить рабочее энергопотребление, то энергопотребление четырёхъ-, трёхъ- и двуядерных процессоров снижается весьма заметно.
В тесте SuperPI, который однопоточный, общая затраченная энергия всё же отдаёт преимущество меньшему числу ядер. В WinRAR ситуация обратная. Тесты Cinebench это подтверждают и добавляют интересную особенность. Даже при длительных периодах работы одного потока (в тесте OpenGL и в тесте однопоточного рендеринга), прогон многопоточного теста (и, вполне возможно, нескольких приложений) приводит к тому, что четырёхъядерные процессоры потребляют меньше энергии. Но для этого необходимо оптимизировать рабочее напряжение.
POVRay 3.6
Перейдём к POVRay. Мы провели штатный тест для данной версии, который не многопоточный. График нагрузки хорошо это подчёркивает.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Теперь обратимся к результатам тестов производительности.
А теперь давайте посмотрим, сколько энергии потребляют процессоры во время этого теста.
Мы знаем, что тест POVRay не является многопоточным, поэтому результаты не представляют особого интереса. Но можно кое-что отметить. Мы видим меньшее энергопотребление более высокопроизводительных процессоров даже если приложение однопоточное. Если же вам важна наилучшая комбинация энергопотребления и производительности на штатных настройках, то лучше брать Athlon II X2 250.
Photoshop CS4
Для данного теста мы запускали тестовый скрипт Photoshop от Driverheaven.net, используя тестовое изображение по умолчанию. Этот скрипт запускает последовательно несколько фильтров: Texturizer, CMYK Color Conversion, RGB Color Conversion, Ink Outlines, Dust & Scratches, Watercolor, Texturizer, Stained Glass, Lighting Effects, Mosaic Tiles, Extrude, Smart Blur, Underpainting, Palette Knife и Sponge.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Красный график говорит сам за себя: Adobe Photoshop CS4 или, если быть более точным, фильтры, которые используются в этом тестовом скрипте, не полностью нагружают оба ядра (кстати, тестовый скрипт редакции THG для Photoshop CS4 использует многопоточные фильтры, там ситуация может быть иной).
Диаграммы производительности выглядят знакомо. Сначала давайте поговорим о результатах. Если верить результатам, то Photoshop (или, по крайней мере, фильтры, использованные в тесте) более чувствителен к тактовой частоте, чем к размеру кэша. Мы уже знаем, что фильтры не многопоточные, поэтому число ядер влияния не оказывает. Если бы фильтры были многопоточными, то мы бы не увидели, как Athlon II X2 250 даёт больше производительности, чем Phenom II X3 710. Помните, что 6 Мбайт кэша L3 должны компенсировать отставание старых двуядерных процессоров на 400 МГц, но здесь это не так сильно себя проявляет.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Поскольку разница в энергопотреблении меньше, чем разница во времени, потраченном на прогон теста, то четырёхъядерные процессоры вновь неплохо себя показывают.
Кодирование видео
Для тестов кодирования видео мы использовали ролики 1080p в кодеках H.264 и AAC клипа группы Nine Inch Nails “Beside You In Time”, который доступен в HD-галерее Apple Quicktime HD. В отличие от многих роликов 1080p в Интернете, этот ролик длиной 2:20 имеет весьма высокий поток (30–45 Мбит/с), хотя в среднем у роликов поток составляет всего 19,38 Мбит/с.
1080p WMV с помощью Windows Media Encoder 9
Для кодирования WMV мы выбрали настройку High Definition Quality Video, но сохранили размер и формат кадра источника. Поток кодирования у данного профиля составляет 5,3 Мбит/с. Все остальные настройки мы оставили по умолчанию. Кодирование выполнялось в два прохода, и мы решили использовать общее время для кодирования, а не для прохода.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Задача кодирования видео хорошо распараллеливается, используя все доступные ядра.
Если вы выполняете большое количество задач кодирования видео, то с помощью четырёхъядерного процессора сможете управиться быстрее. В данном тесте трёхъядерный процессор даёт практически такую же производительность, что и двуядерные модели. Вероятно, это связано с тем, что данный кодировщик не умеет использовать третье ядро. Конечно, если вы параллельно будете использовать компьютер для других задач помимо кодирования видео, то третье ядро будет весьма полезно.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Со всего двумя используемыми ядрами Phenom II X3 710 потребляет даже больше энергии, чем Athlon II X2 250 в данном тесте на оптимизированных настройках. Однако эти модели потребляют примерно одинаковое количество энергии на штатных настройках с активным энергосбережением и без. Поскольку время кодирования изменяется мало, то даже Athlon X2 7750 даёт весьма интересные результаты. Пусть даже чуть ниже, но энергопотребление всё равно остаётся примерно на том же уровне. Но энергопотребление у этого процессора всё равно примерно на 11 Вт больше, чем у Athlon II X2 250, если вы снизите напряжения.
Со всеми ядрами, работающими на полной частоте, процессоры Phenom II X4 вновь можно назвать наиболее эффективными. Просто взгляните на общее количество потреблённой энергии. Даже без активного энергосбережения четырёхъядерные процессоры потребляют меньше энергии на выполнение данного задания.
1080p AVI с помощью VirtualDub и DivX
Для кодирования DivX мы выбрали неограниченный профиль и максимально возможное качество. Кодирование выполнялось через один проход, мы использовали один квантователь. Мы активировали функции “Enhanced multi-threading” и “Experimental SSE2/4”; всё остальное было оставлено по умолчанию.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Подобно любому хорошему приложению кодирования видео, кодек DivX может полностью нагрузить не только одно ядро.
Похоже, кодеку DivX не понравился процессор Phenom II X3 710. И проблема заключается не в работе функций энергосбережения; всё дело в числе ядер. Видимо, DivX и VirtualDub просто не знают, как полностью нагрузить все три ядра одновременно. Поэтому наличие дополнительного ядра в данном случае только мешает. Но решение тоже есть: просто отключите третье ядро или выполните привязку VirtualDub к двум ядрам.
Что касается производительности, то включение или выключение опций энергосбережения сказывается незначительно. Процессору Phenom II X3 710 требуется в два раза больше времени, чем Phenom II X4. Если вам нужен лучший процессор за свои деньги, то берите Athlon II X2 250.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
1080p AVI с помощью VirtualDub и XviD
Для кодирования Xvid мы выбрали неограниченный профиль с настройками общего назначения. Кодирование выполнялось с одним квантователем, одним проходом, с приоритетом на качество. Всё остальное было оставлено по умолчанию.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Xvid на самом деле требует меньше вычислительной мощности, чем DivX. Кодирование тоже выполняется быстрее. У нас получился файл чуть больше по размеру, но ненамного.
Похоже, DivX – не единственный кодек, у которого возникают проблемы с Phenom II X3 710. Мы видим значительный разрыв между обоими Phenom II X4 и двуядерными Athlon X2/Athlon II. В остальном, как и в других многопоточных приложениях, процессоры Phenom II X4 оказываются самыми эффективными по энергопотреблению.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Кодирование аудио
Для тестов кодирования звука мы извлекли дорожки с первого CD Andrew Lloyd Webber – Phantom of the Opera (London’s Original Cast Recording) в одну дорожку. Получившийся файл мы затем импортировали в RealPlayer 11 и iTunes, после чего закодировали в AAC. Для RealPlayer мы выбрали максимально возможное качество (320 кбит/с), а для iTunes мы оставили настройку по умолчанию (256 кбит/с).
RealPlayer 11
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
iTunes
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Оба приложения не могут полностью нагрузить более двух ядер. На самом деле, они едва могут использовать два доступных ядра. RealPlayer смог выполнить кодирование намного быстрее, чем iTunes. Давайте посмотрим на результаты всех наших процессоров.
Как и в предыдущих тестах, включение опцией энергосбережения на наших процессорах дало незначительный эффект. Единственная заметная разница в производительности связана с асинхронным изменением тактовых частот ядер.
Оба теста кодирования показывают, что вы получите лучшее преимущество от Athlon II X2 250, чем от Phenom II X3 710. Здесь на первом месте находятся высокие тактовые частоты; увеличение числа ядер и размера кэша помогает не очень сильно. Что интересно, несмотря на схожесть двух приложений, они по-разному нагружают процессоры. Кроме того, что RealPlayer быстрее, энергопотребление у этого теста меньше, чем у iTunes.
Среднее энергопотребление во время прогона, Вт.
Среднее энергопотребление во время прогона, Вт.
Суммарное количество затраченной энергии на прогон, Втч.
Суммарное количество затраченной энергии на прогон, Втч.
Два этих приложения позволяют интересно оценить энергопотребление. Обычно однопоточные приложения показывают меньшее суммарное потребление энергии у процессоров с меньшим числом ядер. Напротив, у многопоточных приложений меньше всего потребляют энергии четырёхъядерные процессоры. Два приведённых приложения многопоточные, но они не полностью загружают все доступные ядра. При настройках по умолчанию это видно. Но при оптимизации напряжения “цена” за дополнительные ядра минимальная (с точки зрения энергопотребления).
Проигрывание видео
Теперь настало время оценить энергопотребление наших процессоров, когда они выполняют очень мало работы. Впрочем, за такими сценариями мы проводим большую часть нашего времени. В конце концов, далеко не каждый пользователь запускает тесты и игры в режиме 24×7.
В наших тестах мы будем проигрывать то же самое видео H.264, что и раньше – Nine Inch Nails Beside You In Time (ролик 1080p). Для воспроизведения мы будем использовать разные кодеки, такие как DivX и WMV (не VC1). Зачем нужны дополнительные тесты? Они покажут нам уровень энергопотребления с аппаратным ускорением и без такового.
Мы также будем использовать не одно, а несколько приложений для просмотра видео. Для H.264 мы будем использовать Cyberlink PowerDVD и Media Player Classic Homecinema. Для DivX мы возьмём Media Player Classic Homecinema, наконец, для WMV мы будем использовать Microsoft Windows Media Player.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
![]() |
Нагрузка на два ядра и суммарная во время прогона. Нажмите на картинку для увеличения.
Мы можем видеть, насколько сильно аппаратное ускорение позволяет снизить энергопотребление – процессор находится в режиме бездействия намного чаще. У PowerDVD и MPC-HC использование процессора находится ниже 20% (если быть более точным, то 14%). WMV кажется наиболее ресурсоёмким кодеком, он нагружает процессор до уровня около 75%, а DivX чуть менее “тяжёлый” (от 55 до 75%).
Поскольку мы тестируем воспроизведение видео, то производительность нас не интересует. Достаточно сказать, что все процессоры справились с воспроизведением видео плавно на уровне 30 fps как с активными функциями энергосбережения, так и с выключенными.
Давайте посмотрим, сколько энергии потребляет каждый процессор при воспроизведении видео.
H.264 с аппаратным ускорением
Начнём с PowerDVD. Даже при настройках Cool’n’Quiet по умолчанию, Athlon II X2 250 потреблял меньше всего энергии. Результаты по среднему энергопотреблению и общей потреблённой энергии отличаются слабо, поскольку нагрузка и потраченное время одинаковые. Впрочем, дополнительные ядра приводят к увеличению энергопотребления на 8-12 Вт даже при пониженном напряжении. Разница больше при настройках Cool’n’Quiet по умолчанию, а также ещё больше без активных опций энергосбережения. Ситуация оказывается почти такой же, если вы используете в качестве плеера Media Player Classic Homecinema.
Даже если вы не будете оптимизировать напряжения, наши результаты показывают, насколько сильно процессоры могут экономить энергию при выполнении “лёгких” задач. Оптимизация напряжения ещё сильнее увеличивает экономию при активных опциях энергосбережения.
DivX и WMV без аппаратного ускорения
Данный сценарий характерен для пользователей, кто смотрит видео на ПК без аппаратного ускорения. Он нам показался более интересным, поскольку здесь мы будем видеть энергопотребление, когда процессор полностью нагружен.
Что интересно, DivX использует меньше ресурсов для воспроизведения, чем WMV. Кодек с поддержкой многопоточности способен распределять задание более равномерно по доступным ядрам. В свою очередь это означает, что наличие большего количества ядер (с меньшими p-состояниями) приводит к большей экономии, чем наличие меньшего числа ядер (с промежуточными p-состояниями). Сравните результаты DivX и WMV. В случае WMV все процессоры не могут использовать меньшие p-состояния (поэтому не могут экономить энергию) по сравнению с DivX.
Но это не означает, что DivX не требует большого числа ресурсов. Просто посмотрите на результаты Athlon X2 7750 и Phenom II X3 710. Эти процессоры не обеспечивали достаточной производительности для воспроизведения нашего клипа DivX в их низких p-состояниях, что заставляло эти CPU переходить на самые высокие или промежуточные p-состояния. Можно предотвратить подобные переходы, настроив множитель для нижних p-состояний, как мы описывали в первой части статьи.
Производительность и экономия, лучшее из двух миров
Мы рассмотрели шесть разных процессоров AMD с различных перспектив. Мы замерили их энергопотребление. Мы провели анализы производительности, причём как с активными технологиями энергосбережения, так и с отключенными. Мы оптимизировали рабочие напряжения. Затем мы разгоняли процессоры, чтобы оценить взаимодействие между напряжениями и энергопотреблением, а также проверили, насколько далеко они могут масштабироваться, всё ещё потребляя энергию пропорционально производительности.
Всё это мы осуществляли, не меняя ни одной настройки BIOS. Впечатляет, не так ли? Всё это стало результатом простой работы с технологией AMD Cool’n’Quiet, которая присутствует у всех современных процессоров AMD.
В данном процессе мы узнали, что версии BIOS могут существенно повлиять на энергопотребление. Да и выбор материнской платы тоже довольно существенен. Если Gigabyte GA-MA790GP DS4H предлагает большое число параметров и опций, она потребляет больше энергии, чем та же Biostar TA790GX 128M. Как нам кажется, это, по большей части, связано с тем, что материнская плата рассчитана на серьёзный разгон, а не на низкое энергопотребление.
Не всё так просто, как кажется
Действительно, одновременно получить лучшую производительность и оптимальное энергопотребление не так просто, как кажется. Но награда того стоит. Заставив технологию Cool’n’Quiet изменять частоты ядер синхронно (на моделях, где это не предусмотрено), мы вернули большую часть потерь производительности, связанных с активацией функций энергосбережения под Windows Vista. Мы получили чуть больше производительности, изменяя время перехода между p-состояниями.
Без изменения напряжений мы получили экономию энергии 1-9%, когда ядра работают под нагрузкой на процессоре AMD Phenom II X4 945 и 1-15% на процессоре Phenom II X4 955. Снизив напряжение, мы получили экономию 13-18% у Phenom II X3 710. Мы получили более существенную экономию на Phenom II X4 945 (26%) и Phenom II X4 955 (25-32%), но это связано с тем, что материнская плата изначально подавала больше напряжения, чем нужно. Если вам интересно, экономия энергии у Athlon X2 7750 близка к Phenom II X3 710 – около 14%. Верите вы или нет, но улучшения существенны. При настройках Cool’n’Quiet по умолчанию экономия составляет около 2%.
В режиме бездействия тоже всё довольно интересно. Энергопотребление видео H.264 с аппаратным ускорением соответствует обычным настольным задачам – от 70 до 80 Вт. В процентах экономия составила 12-19% с настройками with Cool’n’Quiet по умолчанию у процессоров Phenom II. Снизив напряжения, экономия увеличилась до 25-37%. Экономия с процессором Athlon X2 7750 составила около 9%.
Конечно, все эти значения экономии важны, только если оценивать ещё и производительность. Какова будет разница при работе без функций энергосбережения и с таковыми, если их оптимизировать? Производительность падает на 1-11% или, в среднем, на 3,3% для Athlon X2 7750. Для Phenom II падение составляет между 0% и 5% – едва заметно и почти что в пределах погрешности.
Но важно помнить следующее: большинство упомянутых экономий энергии (за исключением воспроизведения видео) были получены на задачах, которые выполняются за определённый промежуток времени. Как мы показали, нет разницы между средним энергопотреблением и общей потреблённой энергией в задачах, которые выполняются бесконечно, пока вы из неё не выйдете (воспроизведение видео, игры).
Какой процессор AMD даёт наилучшую эффективность?
Если вы внимательно прочитали обе статьи, то наверняка уже знаете ответ: Phenom II X4 945 и 955 обладают чуть большим потреблением энергии, но эти процессоры полностью оснащены ядрами, кэшем и тактовыми частотами, что приводит к меньшему суммарному потреблению энергии. Ещё одно преимущество – они выполняют задания быстрее. Но главной трудностью будет выбор правильных напряжений и материнских плат. Но если вы не хотите перейти на четыре ядра (или не можете себе позволить), то Athlon II X2 250 может статьи прекрасным выбором (или как альтернатива – Athlon II X4 620).
Некоторые могут сказать, что выбор более производительного процессора для получения меньшего энергопотребления ошибочен. Мы надеемся, что наша статья станет свидетельством обратного. Процессоры, подобные Phenom II X4 955 Black Edition, производятся из лучших кристаллов кремния с подложек AMD. Они не имеют отключённых ядер, да и риск повышенных токов утечки (повышенное тепловыделение) в данном случае меньше. Именно поэтому мы вряд ли будет брать процессоры, подобные Phenom II X3 710. Наверняка есть хорошие причины, почему AMD отключила четвёртое ядро. Просто взгляните на значения напряжений, которые мы смогли выставить.
Кроме того, топовые процессоры наверняка относятся к линейке Black Edition. Эти процессоры с их разблокированными множителями позволяют выполнять разгон без изменения частоты подключения HyperTransport (что тоже требует изменения напряжений). Даже если вы запустите процессор Phenom II X4 955 Black Edition на 3,7 ГГц, то вы можете по-прежнему использовать штатную частоту HT 200 МГц. Да, но приводит ли разгон процессора к дополнительному энергопотреблению? Не всегда – посмотрите на результаты в нашей предыдущей статье. Там вы можете видеть, что даже на 3,7 ГГц правильно оптимизированные процессоры, такие как Phenom II 955 Black Edition и Athlon II X2 250, могут потреблять меньше энергии под полной нагрузкой, чем при штатных напряжениях.