Приемлемая расплата за эффективность?
Похоже, все производители в 2008 году работали в едином порыве. Они называли свои технологии “зелёными” или эффективными, но задача была одна: снизить энергопотребление всех компонентов ПК и сфокусироваться на соотношении производительности на ватт, а не на чистой скорости. Конечно, это несколько смещает акцент в оценке решений, но производительность всё равно остаётся ключевым параметром. Поэтому мы захотели поглубже ознакомиться с тем, как технологии энергосбережения современных процессоров и материнских плат влияют на производительность.
Нажмите на картинку для увеличения.
Разговоры об энергопотреблении и эффективности энергопотребления, конечно, ведутся давно, но только в последнее время они стали одной из центральных тем обсуждения у производителей “железа”, поскольку затраты на энергию продолжают возрастать. Проблема здесь в том, что комплектующие ПК используют разное количество энергии при активной работе или в режиме бездействия, и компонент должен потреблять ровно столько энергии, сколько ему требуется для выполнения задачи.
Tom’s Hardware Guide уже давно публикует статьи, критикующие чрезмерное энергопотребление многих аппаратных компонентов, мы находимся в постоянном поиске наиболее эффективных решений. Исторически в фокусе нашего внимания находились процессоры, поскольку именно они потребляли в компьютере больше всего энергии. Сегодня ситуация изменилась, и самым “прожорливым” компонентом стали high-end видеокарты, а также видеокарты для верхнего сегмента массово рынка.
История публикаций.
- Процессоры Intel Pentium 4 560 на частоте 3,6 ГГц могут включать троттлинг тактовой частоты при пиковых нагрузках из-за высокого энергопотребления, что приводит к слишком высокой температуре ядра. “Высокое тепловыделение Pentium 4 560: он всё же включает троттлинг” (ноябрь 2004). Впрочем, ситуация улучшилась с выходом Pentium 4 570.
- “Материнские платы для Pentium M от AOpen и DFI: быстрые и тихие” (декабрь 2004).
- “Технология энергосбережения AOpen Powermaster: снижение частоты CPU и уровня шума “на лету”” (апрель 2005).
- Мы сравнили энергопотребление популярных платформ в режиме бездействия и под нагрузкой ещё в 2005 году, когда почти никого проблемы эффективности не волновали: “Сравнение энергопотребления платформ AMD и Intel: сколько можно сэкономить на счёте за электричество?“.
- “Тесты экономичных настольных платформ: так ли хорош Core Duo?” (апрель 2006).
- “Экономичная двуядерная платформа AMD: всего 54 Вт!” (сентябрь 2006).
Экономия энергопотребления: что дальше?
Всё больше производителей понимают требования рынка, поэтому многие компоненты потребляют меньше энергии, но обеспечивают более высокий уровень производительности, чем их предшественники. Одним из лучших примеров можно назвать процессор Intel Core 2 Duo, который потребляет в два раза меньше энергии, чем двуядерный Pentium D (не путайте с процессором Pentium Dual Core, который построен на ядре линейки Core 2), обеспечивая при этом намного большую производительность. Ещё один пример можно найти на рынке накопителей – последний жёсткий диск WD обходит по производительности многие обычные жёсткие диски.
Конечно, у экономии тоже есть свои пределы, которые определяются используемой технологией. Однако в будущем мы прогнозируем увеличение эффективности энергопотребления. Это означает, что энергопотребление будет продолжать снижаться или оставаться на нынешнем уровне, а производительность будет продолжать увеличиваться. Сочетание меньшего энергопотребления и большей производительности существенно увеличит эффективность. Давайте посмотрим на два пути снижения энергопотребления процессора, прежде чем мы перейдём к результатам тестов с разными популярными технологиями энергосбережения.
Технологии и функции снижения энергопотребления
Энергопотребление процессора можно снизить двумя путями. Первый подразумевает использование новых техпроцессов/технологий изготовления, а второй заключается в использовании специальных архитектурных функций.
Энергосбережение благодаря техпроцессу
Intel систематически обновляет техпроцессы производства процессоров, примерно каждые два года, что позволяет выпускать кристаллы с большим числом транзисторов. 65-нм техпроцесс, который был запущен в 2005 году, был замещён 45-нм техпроцессом в 2007 году. В 2009 году Intel, скорее всего, начнёт переход на 32-нм техпроцесс. В последние годы каждое новое поколение техпроцесса увеличивало производительность, уменьшая энергопотребление как в режиме бездействия, так и при пиковых нагрузках, что компенсировалось тем, что маленький транзистор обычно повышает риск утечки.
Техпроцесс | Кодовое название | Дата введения | Основные характеристики |
90 нм | P1262 | 2003 | Напряжённый кремний (strained silicon), медные проводники (copper interconnects), диэлектрик low-k |
65 нм | P1264 | 2005 | 2-е поколение напряжённого кремния, диэлектрик затвора high-k |
45 нм | P1266 | 2007 | Диэлектрик затвора high-k на основе гафния + металлические затворы для снижения утечек |
32 нм | P1268 | Ожидается в 2009 году | … |
22 нм | P1270 | Ожидается в 2011 году | … |
Intel утверждает, что утечки на оксидном затворе транзисторов можно уменьшить в десять раз, а у процессоров, которые выпускаются по 45-нм техпроцессу, дренажная утечка составляет всего одну пятую от того уровня, который был у 65-нм техпроцесса. Эти утверждения проверить сложно, но можно определённо подтвердить, что энергопотребление Core 2 Duo E8000 существенно ниже, чем у 65-нм процессоров E6000. Поэтому каждая новая линейка процессоров даёт прирост в эффективности энергопотребления.
C-состояния процессора
Нажмите на картинку для увеличения.
Новые функции тоже могут снизить энергопотребление. Первое, что можно сделать – использовать разные режимы энергопотребления CPU, которые также известны как C-состояния (C-State). C-состояния могут применяться к операционной системе, но в следующей таблице они приведены для всего процессора.
C-состояние (C-State) | AMD | Intel | Время перехода обратно на C0 |
C0* | Н/Д | ||
C1* | Состояние Halt (Halt State) для основных блоков CPU |
~ 10 нс | |
C1E | Enhanced Halt – останавливает все блоки CPU | Enhanced Halt – останавливает все блоки CPU и снижает Vcore | >10 нс |
C2 | Stop Grant – аппаратно блокирует внутренние тактовые сигналы, включая буферы ввода/вывода, чтобы экономить энергию |
~ 100 нс | |
C2E | Н/Д | Extended Stop Grant – аппаратно останавливает тактовые импульсы CPU и снижает Vcore | > 100 нс |
C3 | Sleep: останавливает все внутренние тактовые сигналы CPU Deep Sleep: останавливает все внутренние и внешние тактовые сигналы |
~ 50 мкс | |
C4 | Deeper Sleep: снижает напряжение CPU |
~ 150 мкс | |
C4E / C5 | Enhanced Deeper Sleep: ещё сильнее снижает напряжение CPU и отключает кэш |
~ 250 мкс | |
C6 | Deep Power Down: ещё сильнее снижает напряжение CPU Контекст CPU не сохраняется |
Неизвестно |
* требуется от всех современных процессоров.
Обратите внимание, что не все процессоры поддерживают все C-состояния, некоторые процессоры могут поддерживать только часть. Мобильные процессоры обычно поддерживают больше высокоуровневых C-состояний, а настольные процессоры часто ограничены только немногими C-состояниями. Поскольку незначительная экономия энергии не так актуальна для настольных ПК, но весьма важна для ноутбуков, подобная дифференциация имеет значение.
Режимы HFM и LFM (высокочастотный и низкочастотный, соответственно), реализуются через технологии Cool’n’Quiet (AMD) и Enhanced Speedstep (Intel). Есть причина, по которой мы приводим технические детали столь подробно: переключение с производительного режима на экономичный требует времени. Обратите внимание на правый столбец в таблице выше. При переключении с C1 или C2 обратно в режиме C0 задержка минимальная, но выход из более глубоких C-состояний требует модификации большего числа системных параметров, и выход в производительный режим может занимать до 250 микросекунд.
P-состояния CPU
Затем следует упомянуть технологии энергосбережения AMD Cool’n’Quiet и Intel SpeedStep или Enhanced SpeedStep (EIST), которые знакомы многим пользователям. Cool’n’Quiet и EIST сегодня поддерживаются почти всеми процессорами на рынке. Если C-состояния реализуются только когда процессор находится действительно в режиме бездействия или переходит в режим сна (например, в режиме ожидания системы), система в любое время может воспользоваться P-состояниями (performance states), которые AMD и Intel сегодня реализуют схожим образом.
Когда CPU находится в активном режиме (C0), могут включиться технологии Cool’n’Quiet или Enhanced SpeedStep. Для этого необходима поддержка в BIOS и со стороны операционной системы. Если это требование выполняется, то Windows может изменять тактовую частоту и напряжение процессора, обычно снижая тактовые частоты AMD до уровня 1,0 ГГц, а у Intel – до уровня от 1,2-2,0 ГГц, в зависимости от частоты шины процессора FSB. Все эти функции весьма критичны для снижения энергопотребления при работе в повседневных приложениях.
Материнская плата MSI P45 Neo2-FIR
Нажмите на картинку для увеличения.
Версия платы: 1.0
Версия BIOS: 1.1 B5
Когда мы изначально планировали написать эту статью, MSI выслала нам образец материнской платы P45 Neo2-FIR для обзора. Это обычная материнская плата на P45 для массового рынка, которая не блещет очень уж богатым набором аксессуаров. Однако она прекрасно продумана, да и на плате есть все текущие “бонусы” MSI, включая DrMOS и собственную технологию энергосбережения производителя, которая хорошо показала себя в тестах энергопотребления платформы Intel P45.
Материнская плата называется ещё и MS-7558, она обеспечивает прекрасный набор функций за свою цену. Система охлаждения на тепловых трубках довольно компактная, при этом охлаждаются только северный и южный мосты. Система использует воздушный поток от кулера CPU, так что компромисс вполне хороший. MSI решила установить четырёхфазный стабилизатор напряжения, который более эффективен, чем стабилизатор с большим количеством фаз. Конечно, большее число фаз позволяют лучше распределить подачу энергии и обеспечивают большую стабильность во время разгона при увеличенных уровнях напряжения, но эта задача перед материнской платой P45 Neo2-FIR не стоит.
Нажмите на картинку для увеличения.
Материнская плата использует память DDR2, что весьма разумно, учитывая нынешние цены. Два слота x16 PCI Express 2.0 можно использовать для видеокарт AMD CrossFireX, а ещё два слота x1 (PCI Express) PCIe – для подключения дополнительных карт расширения. Есть и два 32-битных слота PCI для наследственных карт. MSI добавила контроллер дисковода и ещё один дополнительный контроллер накопителей, добавляющий два порта SATA/300 и один канал UltraATA/133 помимо шести портов SATA/300 ICH10. Есть гигабитная сеть, HD-аудио и полный набор функций разгона, что сегодня обязательно. Функция GreenPower, входящая в набор DrMOS, обеспечивает динамическое отключение фаз стабилизатора напряжения, чтобы экономить энергию при низких нагрузках.
Когда мы проводили наши тесты с процессором Core 2 Duo E8500, то обнаружили, что система потребляет больше энергии с включённой EIST, чем без этого механизма энергосбережения. Связавшись с MSI, мы получили обновлённую версию BIOS, которая исправляла ошибку, связанную с недостаточным напряжением питания CPU при отключении EIST. Процессор работал вне пределов спецификаций, и MSI быстро исправила эту ошибку.
Core 2 Duo E8500 и Extreme QX9650
Нажмите на картинку для увеличения.
Intel Core 2 Duo E8500 поддерживает C-состояния C2 и C4, а Core 2 Extreme QX9650 – нет. Процессор Extreme ориентирован на энтузиастов и продаётся по цене $1000, он обеспечивает практически всё, о чём может мечтать оверклокер. Первое и самое важное – у процессора разблокирован множитель, в результате чего можно поднимать частоту ядра без увеличения тактовой частоты FSB. По умолчанию частота FSB составляет 1333 МГц, до разгона штатная частота CPU 3,0 ГГц, но большинство QX9650 можно разогнать до 4 ГГц и больше с приличным охлаждением и FSB 1600 МГц. Кодовое название процессора Yorkfield, он состоит из двух 45-нм кристаллов Wolfdale. Мы использовали этот экстремальный процессор, чтобы показать, какую экономию энергии может дать система для энтузиастов.
Нажмите на картинку для увеличения.
Второй процессор, который мы выбрали – модель для массового рынка Core 2 Duo E8500, которая построена на 45-нм ядре Wolfdale. Процессор соответствует базовой архитектуре для всех 45-нм моделей Core 2, включая процессоры Core 2 Quad Q9000, а также линейку QX9000 Extreme. На кристалле установлено целых 6 Мбайт кэша L2, что приводит к 12 Мбайт кэша L2 у процессора QX9650, где два кристалла работают параллельно. Мы выбрали E8500, поскольку этот процессор обеспечивает прекрасное соотношение цена/производительность с высокой эффективностью энергопотребления.
Протестированные режимы энергопотребления
Как мы уже упоминали, мы использовали два разных процессора для этого проекта: один Core 2 Duo E8500 для массового рынка (45 нм, 3,0 ГГц, два ядра), а второй – Core 2 Extreme QX9650 (45 нм, 3,0 ГГц, четыре ядра). Если двуядерный процессор поддерживает режимы C2 и C4, то Intel Extreme Edition – нет. Мы не получили опцию BIOS, которая позволила бы включить эти режимы на high-end четырёхъядерном процессоре.
Высокопроизводительный режим
Чтобы получить максимальные результаты производительности, мы проводили тесты без каких-либо технологий энергосбережения. То есть вы выключили поддержку EIST и всех дополнительных C-состояний, после чего выбрали режим “Высокая производительность” в Windows Vista. Мы не включали каких-либо опций экономии энергопотребления у материнской платы.
Сбалансированный режим
Мы использовали эту конфигурацию в качестве основной для массовых ПК. Мы выбрали “Сбалансированный” профиль в Windows Vista и включили технологию EIST на обоих процессорах, но не активировали C-состояния или дополнительные функции энергосбережения материнской платы.
Экономия энергии
На этот раз мы хотели оценить, сколько энергии могут сэкономить наши тестовые системы, если включить все опции энергосбережения. Конечно, при этом мы отслеживали и производительность, причём мы уже обнаружили ряд отличий при сравнении высокопроизводительного режима и сбалансированного. Для экономии энергии мы выставили “Сбалансированный” профиль под Windows Vista, включили поддержку EIST и режима C4, который частично сбрасывает кэш L2 при переходе в этот режим, после чего настроили работу платы MSI в “зелёном” режиме для максимальной экономии энергии.
Тестовая конфигурация
Системное аппаратное обеспечение |
|
CPU I | Intel Core 2 Extreme QX9650 (45 нм, 3,0 ГГц, 12 Мбайт кэша L2) |
CPU II | Intel Core 2 Duo E8500 (45 нм, 3,16 ГГц, 6 Мбайт кэша L2) |
Чипсет Intel P45 | MSI P45 Neo2-FIR, Rev. 1.0, Intel P45, BIOS: 1.1 B5 |
Память | 4x 1 Гбайт DDR-1066 Crucial BL12864BA1608 |
HDD | Seagate Barracuda 7200.11, 500 Гбайт, 7200 об/мин, SATA/300, кэш 32 Мбайт |
DVD | Samsung SH-S183 |
Видеокарта | GeCube Radeon HD 4850, GPU: 625 МГц, память: 512 Мбайт GDDR3 (993 МГц) |
Блок питания | Cooler Master, ATX 2.3, 850 Вт |
Системное ПО и драйверы | |
ОС | Windows Vista Enterprise Version 6.0 (Build 6000) |
DirectX 10 | Vista default |
DirectX 9 | April 2007 |
Графический драйвер | Radeon 8.7 (Vista) |
ЧипсетIntel | INF : 9.0.0.1008 |
Java | Java Runtime Environment 6.0 Update 1 |
Системное ПО и драйверы для Sysmark | |
ОС | Windows XP SP2 |
DirectX 9 | April 2007 |
Графический драйвер | Radeon 8.8 |
Чипсет Intel | INF: 9.0.0.1008 |
Java | Java Runtime Environment 6.0 Update 1 |
3DMark Vantage
3DMark Vantage демонстрирует мизерную разницу между тремя режимами энергосбережения, поскольку компоненты в этом тесте обычно работают под высокой нагрузкой.
3D-игры
То же самое касается и игр, поскольку процессор, как правило, хорошо нагружается большую часть времени, да и видеокарта работает, что приводит к дополнительному потреблению энергии для вывода высококачественных 3D-сцен.
Тесты приложений
Антивирусная проверка выявила небольшую разницу между высокопроизводительным и экономичным режимами.
Studio 12 справилась с работой чуть быстрее, когда функции энергосбережения были выключены.
WinRAR демонстрирует явное преимущество производительности на конфигурации, когда все опции энергосбережения выключены.
Тесты аудио/видео
Ни один из тестов кодирования аудио/видео не показал разницу больше нескольких секунд.
PCMark Vantage
PCMark демонстрирует небольшую разницу у высокопроизводительной конфигурации, но отрыв невелик.
Sisoft Sandra 2008
Тест Sandra не показал разницы в производительности CPU, а также мизерную разницу в остальных тестах, хотя высокопроизводительная конфигурация и вышла вперёд.
SYSmark 2007 Preview
Тест SYSmark 2007 Preview играет особую роль, поскольку он запускает популярные приложения, а также учитывает и время бездействия. В результате система чаще переключается в более экономичные состояния, когда производительность ниже. Конечно, на практике такие переключения заметны слабо, но на суммарную производительность они всё же влияют. Производительность экономичных систем оказалась ниже, но при этом они потребовали меньше энергии.
Энергопотребление и производительность на ватт
Разница в среднем энергопотреблении в режиме бездействия оказалась существенной.
То же самое можно сказать и про пиковую нагрузку процессора, хотя разница здесь уже не такая важная. Поскольку системы проводят больше времени в состоянии, близком к полному бездействию, чем в состоянии с пиковой нагрузкой, то результат энергопотребления в режиме бездействия более интересен.
Экономичные системы потребляли, в среднем, меньше энергии во время прогона SYSmark 2007.
Суммарное количество потреблённой энергии (в ватт-часах) для завершения прогона SYSmark 2007 Preview оказалось меньше на системах с включёнными функциями экономии энергии, что демонстрирует их эффективность.
Здесь мы привели результат производительности SYSmark 2007 Preview на каждый затраченный ватт-час энергии. Но следует помнить, что разница в производительности SYSmark 2007 может и не быть заметна из-за промежутков бездействия между отдельными тестами.
Нажмите на картинку для увеличения.
Заключение
В большинстве обычных тестов, которые базируются на основе игр, приложений или синтетических тестов, когда тестовый прогон должен пройти за максимально короткое время, мы не обнаружили существенно разницы в производительности между экономичным, высокопроизводительным или сбалансированным прогонами. Разница в большинстве тестов не превысила 2%, что приводит к сокращению времени выполнения на несколько секунд, а также к мизерному отличию частоты кадров в 3D-играх. Причина столь малой разницы очевидна: как только запускается тест, процессор остаётся в состоянии C0 и в активном режиме большую часть времени. Только если тест требует более серьёзной нагрузки на подсистему памяти, чем постоянной пиковой нагрузки на CPU (WinRAR), мы получаем выигрыш производительности от выключения механизмов энергосбережения.
Где производительность отличается
Однако мы провели тесты SYSmark 2007 Preview для анализа разницы в производительности в нагрузках, которые соответствуют обычному использованию офисного ПК или домашнего ПК для работы, а также отследили энергопотребление систем в режиме бездействия и под пиковой нагрузкой. SYSmark основывается на запуске популярных приложений, позволяя дать оценку производительности. Поскольку SYSmark также измеряет производительность, когда процессор находится в режиме бездействия, процессоры AMD и Intel переходили в более эффективные P-состояния с помощью технологий C’n’Q/Enhanced SpeedStep, снижая вычислительную производительность. Разница, замеренная SYSmark, вряд ли будет ощутима во время повседневного использования компьютера, но она очевидно показывает, что снижение производительности в сценариях приложений есть.
Экономия или производительность?
Поскольку в требовательных приложениях мы не обнаружили существенной разницы в производительности, а сценарии приложений чаще ограничены пользователем, чем доступными ресурсами, мы всё же рекомендуем включать ключевые механизмы энергосбережения, такие как SpeedStep, и переводить систему в сбалансированный режим работы. Тогда вы получите максимальную экономию энергии без значительной потери производительности. Без сомнения, влияние на производительность подавляющее большинство пользователей не заметят.
Что касается энергопотребления, то система в режиме бездействия потребляла от 99 до 96 Вт в паре с процессором Core 2 Extreme QX9650 и от 92 до 86 Вт в паре Core 2 Duo. Учитывая, что все остальные компоненты не менялись, подобная разница весьма существенна. Разница в пиковом энергопотреблении тоже очень похожа, 175 Вт против 168 Вт для четырёхъядерного процессора Extreme и 135 Вт против 129 Вт для двуядерного Core 2.
Энтузиастам, которым нужна максимальная производительность, а также опытным пользователям можно рекомендовать отключить многие функции энергосбережения. Всем остальным лучше оставить функции энергосбережения и выбрать сбалансированный режим работы.