Развенчиваем мифы о производительности видеокарт | Определяем понятие производительности
Если вы автолюбитель, то наверняка не раз спорили со своими друзьями о возможностях двух спорткаров. У одной из машин может быть больше лошадиных сил, более высокая скорость, меньший вес и лучшее управление. Но очень часто споры ограничиваются сравнением скорости прохождения круга Нюрнбургринг (Nurburgring) и всегда заканчиваются тем, что кто-то из компании портит всё веселье, напоминая, что никто из спорящих всё равно не сможет себе позволить обсуждаемые машины.
Подобную аналогию можно провести с дорогими видеокартами. Мы имеем среднюю частоту кадров, колебание времени подачи кадра, шумовыделение системы охлаждения и цену, которая в некоторых случаях может вдвое превышать стоимость современных игровых консолей. А для большей убедительности в конструкции некоторых современных видеокарт используются алюминиевые и магниевые сплавы – практически как в гоночных автомобилях. Увы, имеются и отличия. Несмотря на все попытки впечатлить девушку новым графическим процессором, будьте уверены, что спорткары ей нравятся больше.
Каков же эквивалент скорости прохождения круга для видеокарты? Какой фактор отличает победителей и проигравших при равной стоимости? Это явно не средняя частота кадров, и доказательством тому служит наличие колебаний времени кадра, разрывы, притормаживания и гудящие как реактивный двигатель вентиляторы. Кроме того, есть и другие технические характеристики: скорость прорисовки текстур, производительность вычислений, пропускная способность памяти. Какое значение имеют эти показатели? Придётся ли играть в наушниках из-за невыносимого шума вентиляторов? Как учесть разгонный потенциал при оценке графического адаптера?
Прежде чем углубиться в мифы о современных видеокартах, сначала необходимо разобраться, что же такое производительность.
Производительность – это комплекс показателей, а не один параметр
Дискуссии о производительности GPU часто сводятся к обобщённому понятию частоты кадров, или показателю FPS. На практике в понятие производительности видеокарты входит гораздо больше параметров, чем только частота, с которой визуализируются кадры. Их проще рассматривать в рамках комплекса, а не одного значения. Комплекс имеет четыре основных аспекта: скорость (частота кадров, задержка кадра и задержка ввода), качество картинки (разрешение и качество изображения), тишина (акустическая эффективность, учитывающая энергопотребление и конструкцию кулера) и, конечно, доступность в отношении стоимости.
Есть и другие факторы, влияющие на ценность видеокарты: например, игры, идущие в комплекте, или эксклюзивные технологии, используемые определённым производителем. Мы их рассмотрим кратко. Хотя на самом деле значение поддержки CUDA, Mantle и ShadowPlay в значительной степени зависит от потребностей конкретного пользователя.
Показанный выше график иллюстрирует позицию GeForce GTX 690 относительно ряда факторов, которые мы описали. В штатной конфигурации графический ускоритель в тестовой системе (её описание приводится в отдельном разделе) достигает показателя 71,5 FPS в тесте Unigine Valley 1.0 в режиме ExtremeHD. При этом карта генерирует ощутимый, но не беспокоящий шум на уровне 42,5 дБ (A). Если вы готовы мириться с шумом на уровне 45,5 дБ(A), то смело можете разгонять чип до достижения стабильной частоты 81,5 FPS в этом же режиме. Понижение разрешения или уровня сглаживания (который влияет на качество) приводит к существенному приросту частоты кадров, при неизменных оставшихся факторах (включая и без того высокую цену в $1000).
В целях обеспечения более контролируемого процесса тестирования необходимо определить эталон производительности видеокарты.
MSI Afterburner и EVGA PrecisionX являются бесплатными утилитами, позволяющими использовать ручную настройку скорости вращения вентилятора и, как следствие, регулировку уровня шумовыделения.
Для сегодняшней статьи мы определили производительность как количество кадров в секунду, которое видеокарта может выводить на выбранном разрешении в пределах конкретного приложения (и при выполнении следующих условий):
- Настройки качества выставлены на максимальные значения (как правило, Ultra или Extreme).
- Разрешение выставлено на постоянный уровень (обычно 1920×1080, 2560×1440, 3840×2160 или 5760×1080 пикселей в конфигурации из трёх мониторов).
- Драйверы настроены на штатные параметры производителя (как в общем, так и для конкретного приложения).
- Видеокарта работает в закрытом корпусе при уровне шума 40 дБ(A), который измеряется на расстоянии 90 см от корпуса (в идеале, тестируется в рамках эталонной платформы, которая обновляется ежегодно).
- Видеокарта работает при окружающей температуре 20 °C и давлении в одну атмосферу (это важно, поскольку это напрямую влияет на срабатывание теплового троттлинга).
- Ядро и память работают при температурах вплоть до теплового троттлинга так, чтобы частота ядра/температура под нагрузкой оставались стабильными или изменялись в очень узком диапазоне, при сохранении постоянного уровня шума 40 дБ(A) (и, соответственно, скорости вращения вентилятора)..
- Колебания времени кадра 95-го перцентиля не превышают 8 мс, что равняется половине времени кадра, на стандартном дисплее с частотой обновления 60 Гц.
- Карта работает при 100%-ой загрузке GPU или примерно на этом уровне (это важно для демонстрации отсутствия “узких мест” в платформе; если таковые имеются, загрузка GPU будет ниже 100%, и результаты теста потеряют смысл).
- Показатели среднего значения FPS и колебания времени подачи кадров получены не менее чем в результате трёх прогонов для каждого замера, при этом каждый прогон длится не менее одной минуты, а отдельные образцы не должны иметь отклонения более 5% от среднего значения (в идеале, мы хотим опробовать различные карты одновременно, особенно если есть подозрения в наличии существенных расхождений у продуктов от одного производителя).
- Частота кадров одной карты измеряется с помощью Fraps или встроенных счётчиков. FCAT используется для нескольких карт в связке SLI/CrossFire.
Как вы уже поняли, эталонный уровень производительности зависит как от приложения, так и от разрешения. Но он определён таким образом, который позволяет независимо провести повтор и проверку тестов. В этом смысле данный подход действительно научный. На самом деле мы заинтересованы в том, чтобы производители и энтузиасты повторили тесты и сообщили нам о любых расхождениях. Только так можно обеспечить целостность нашей работы.
Данное определение производительности не учитывает разгон или диапазон вариантов поведения конкретного GPU в различных видеокартах. К счастью, мы заметили данную проблему лишь в нескольких случаях. Современные механизмы теплового троттлинга спроектированы для извлечения максимальной частоты кадров в большинстве возможных сценариев, поэтому видеокарты работают очень близко к своим максимальным возможностям. Причём предел часто достигается ещё до того, как разгон обеспечивает реальное преимущество в скорости.
В данном материале мы будет широко использовать бенчмарк Unigine Valley 1.0. Он использует несколько особенностей DirectX 11 и позволяет проводить легко воспроизводимые тесты. Кроме того, он не опирается на физику (и, как следствие, CPU) так, как это делает 3DMark (по крайней мере, в общих и комбинированных тестах).
Чтоб мы собираемся делать?
В ходе данного материала, который выйдет в двух частях, мы планируем рассмотреть каждый фактор, составляющий комплексное понятие производительности видеокарты, а затем попытаемся ответить на общие вопросы. Мы расширим обсуждение производительности видеокарты до таких понятий, как задержка ввода, гоустинг дисплея и разрывы в выводе изображения – данные факторы влияют на игровой опыт, но не обязательно сказываются на частоте кадров. Также нам нравится сравнивать карты, используя данные критерии. Нетрудно представить, что такое тестирование отнимает уйму времени. Но нам кажется, что результат стоит усилий. Это не значит, что наши обзоры видеокарт изменятся. Мы просто экспериментируем, и решили поделиться экспериментами с вами.
С определением производительности видеокарт мы уже разобрались. Далее мы рассмотрим методологию, вертикальную синхронизацию, шум и производительность, скорректированную по уровню шума видеокарты, а также количество видеопамяти, которое действительно необходимо для работы. Во второй части мы рассмотрим техники сглаживания, влияние дисплея, различные конфигурации линий PCI Express и ценность ваших вложений в приобретение видеокарты.
Пришло время ознакомиться с тестовой конфигурацией. В контексте данной статьи на этот раздел следует обратить особое внимание, поскольку он содержит важную информацию о самих тестах.
Развенчиваем мифы о производительности видеокарт | Как мы тестируем
Две системы, две цели
Все тесты мы проводили на двух разных стендах. Один стенд оснащается старым процессором Intel Core i7-950, а другой – современным чипом Intel Core i7-4770K.
Тестовая система 1 | |
Корпус | Corsair Obsidian Series 800D |
Процессор | Intel Core i7-950 (Bloomfield), разгон до 3,6 ГГц, Hyper-Threading и энергосбережение выкл. Башня |
Кулер CPU | CoolIT Systems ACO-R120 ALC, Tuniq TX-4 TIM, вентилятор Scythe GentleTyphoon 1850 RPM |
Системная плата | Asus Rampage III Formula Intel LGA 1366, Intel X58 Chipset, BIOS: 903 |
Сеть | Cisco-Linksys WMP600N (Ralink RT286) |
Оперативная память | Corsair CMX6GX3M3A1600C9, 3 x 2 Гбайт, 1600 MT/с, CL 9 |
Накопитель | Samsung 840 Pro SSD 256 Гбайт SATA 6Гбит/с |
Видеокарты | AMD Radeon R9 290X 4 Гбайт (образец для прессы) Nvidia GeForce GTX 690 4 Гбайт (розничный образец) Nvidia GeForce GTX Titan 6 Гбайт (образец для прессы) |
Звуковая карта | Asus Xonar Essence STX |
Блок питания | Corsair AX850, 850 W |
Системное ПО и драйверы | |
Операционная система | Windows 7 Enterprise x64, Aero выкл. (см. примечание ниже) Windows 8.1 Pro x64 (только для эталона) |
DirectX | DirectX 11 |
Видеодрайверы | AMD Catalyst 13.11 Beta 9.5 Nvidia GeForce 331.82 WHQL |
Тестовая система 2 | |
Корпус | Cooler Master HAF XB, гибридны форма для настольного ПК/тестового стенда |
Процессор | Intel Core i7-4770k (Haswell), разгон до 4,6 ГГц, Hyper-Threading и энергосбережение выкл. |
Кулер CPU | Xigmatek Aegir SD128264, Xigmatek TIM, вентилятор Xigmatek 120 мм |
Системная плата | ASRock Extreme6/ac Intel LGA 1150, Intel Z87 Chipset, BIOS: 2.20 |
Сеть | mini-PCIe карта Wi-Fi 802.11ac |
Оперативная память | G.Skill F3-2133C9D-8GAB, 2 x 4 GB, 2133 MT/c, CL 9 |
Накопитель | Samsung 840 Pro SSD 128 Гбайт SATA 6Гбит/с |
Видеокарты | AMD Radeon R9 290X 4 Гбайт (образец для прессы) Nvidia GeForce GTX 690 4 Гбайт (розничный образец) Nvidia GeForce GTX Titan 6 Гбайт (образец для прессы) |
Звуковая карта | Встроенная Realtek ALC1150 |
Блок питания | Cooler Master V1000, 1000 W |
Системное ПО и драйверы | |
Операционная система | Windows 8.1 Pro x64 |
DirectX | DirectX 11 |
Видеодрайверы | AMD Catalyst 13.11 Beta 9.5 Nvidia GeForce 332.21 WHQL |
Первая тестовая система нужна нам для получения повторяемых результатов в реальных окружениях. Поэтому мы собрали относительно старую, но всё же мощную систему на базе платформы LGA 1366 в большом корпусе формата “полноразмерная башня”.
Вторая тестовая система должна отвечать более специфическим требованиям:
- Поддержка PCIe 3.0 с ограниченным числом линий (CPU Haswell для LGA 1150 предлагает только 16 линий)
- Отсутствие моста PLX
- Поддержка трёх карт в CrossFire в конфигурации x8/x4/x4 или двух в SLI в x8/x8
ASRock прислала нам материнскую плату Z87 Extreme6/ac, которая подходит под наши требования. Ранее мы уже тестировали данную модель (только без модуля Wi-Fi) в статье “Тест пяти материнских плат на чипсете Z87 стоимостью менее $220”, в которой она получила нашу награду Smart Buy. Образец, который пришёл к нам в лабораторию, оказался прост в настройке, и мы без проблем разогнали наш Intel Core i7-4770K до 4,6 ГГц.
UEFI платы позволяет настроить скорость передачи данных PCI Express для каждого слота, благодаря чему можно протестировать первое, второе и третье поколение PCIe на одной материнской плате. Результаты этих тестов будут опубликованы во второй части данного материала.
Компания Cooler Master предоставила корпус и блок питания для второй тестовой системы. Необычный корпус HAF XB, который также получил награду Smart Buy в статье “Обзор и тестирование корпуса Cooler Master HAF XB”, обеспечивает необходимое пространство для свободного доступа к комплектующим. Корпус имеет множество вентиляционных отверстий, поэтому компоненты внутри могут быть довольно шумными, если система охлаждения подобрана неправильно. Однако эта модель может похвастаться хорошей циркуляцией воздуха, особенно если установить все опциональные вентиляторы.
Модульный блок питания V1000 позволяет установить в корпус три высокопроизводительные видеокарты и при этом сохранить аккуратный вид кабельной проводки.
Сравниваем тестовую систему № 1 с системой № 2
Поразительно насколько близки эти системы по производительности, если не обращать внимания на архитектуру, а сконцентрироваться на частоте кадров. Вот их сравнение в 3DMark Firestrike.
Как видите, производительность обеих систем в графических тестах, по сути, равна, даже несмотря на то, что вторая система оснащена более быстрой памятью (DDR3-2133 против DDR3-1800, причём у Nehalem трёхканальная архитектура, а у Haswell – двухканальная). Только в тестах хост-процессора Intel Core i7-4770K демонстрирует своё преимущество.
Основное преимущество второй системы заключается в большем запасе для разгона. Intel Core i7-4770K на воздушном охлаждении смог удержать стабильную частоту 4,6 ГГц, а Intel Core i7-950 не смог превысить 4 ГГц с водяным охлаждением.
Также стоит обратить внимание на то, что первая тестовая система тестируется под операционной системой Windows 7×64 вместо Windows 8.1. На это есть три причины:
- Во-первых, менеджер виртуального рабочего стола Windows (Windows Aero или wdm.exe) использует значительный объём видеопамяти. При разрешении 2160p Windows 7 берёт на себя 200 Мбайт, Windows 8.1 – 300 Мбайт, дополнительно к 123 Мбайт зарезервированных Windows. В Windows 8.1 отключить эту опцию без значительных побочных эффектов невозможно, однако в Windows 7 проблема решается переходом к базовой теме. 400 Мбайт – это 20% от общего объёма видеопамяти карты, составляющего 2 Гбайт.
- При активации базовых (упрощённых) тем потребление памяти в Windows 7 стабилизируется. Она всегда забирает себе 99 Мбайт при разрешении 1080p и 123 Мбайт при 2160p с видеокартой GeForce GTX 690. Это позволяет обеспечить максимальную повторяемость тестов. Для сравнения: Aero забирает около 200 Мбайт и +/- 40 Мбайт.
- С драйвером Nvidia 331.82 WHQL существует баг при активации Windows Aero в разрешении 2160p. Он появляется только тогда, когда Aero включается на дисплее, в котором изображение 4K реализуется двумя плитками и проявляется в пониженной нагрузке на GPU при тестировании (она скачет в диапазоне 60-80% вместо 100%), что сказывается на потери производительности до 15%. Мы уже уведомили Nvidia о нашей находке.
Дополнительное оборудование для тестирования | |
Фотографирование экрана | Canon EOS 400D Линза Canon EF 50 мм f/1.8 1/400s, ISO 800, f/1.8-2.8 |
Измерение уровня звукового давления | ART SPL-8810, настройка дБ(A)/Low/Fast |
На обычных скриншотах и игровом видео невозможно показать эффекты гоустинга и разрывов. Поэтому мы использовали высокоскоростную видеокамеру для захвата реального изображения на экране.
Температура в корпусе измеряется встроенным температурным датчиком Samsung 840 Pro. Температура окружающей среды составляет 20-22 °C. Фоновый уровень шума для всех акустических тестов составил 33,7 дБ(A) +/- 0,5 дБ(A).
Конфигурация тестов | |
Игры | |
The Elder Scrolls V: Skyrim | Версия 1.9.32.0.8, собственный тест THG, 25 секунд, HWiNFO64 |
Hitman: Absolution | Версия 1.0.447.0, встроенный бенчмарк, HWiNFO64 |
Total War: Rome 2 | Патч 7, встроенный бенчмарк “Forest”, HWiNFO64 |
BioShock Infinite | Патч 11, Версия 1.0.1593882, встроенный бенчмарк, HWiNFO64 |
Синтетические тесты | |
Ungine Valley | Версия 1.0, ExtremeHD Preset, HWiNFO64 |
3DMark Fire Strike [Extreme] | Версия 1.1 |
Для измерения потребления видеопамяти можно использовать множество инструментов. Мы остановили свой выбор на HWiNFO64, который получил высокие оценки у сообщества энтузиастов. Такой же результат можно получить с помощью MSI Afterburner, EVGA Precision X или RivaTuner Statistics Server.
Развенчиваем мифы о производительности видеокарт | Включать или не включать V-Sync – вот в чём вопрос
При оценке видеокарт первым параметром, который хочется сравнить, является быстродействие. Насколько самые современные и самые быстрые решения обгоняют предыдущие продукты? Всемирная сеть пестрит данными тестирований, проведёнными тысячами онлайн-ресурсов, которые пытаются ответить на этот вопрос.
Итак, давайте начнём с изучения быстродействия и факторов, которые стоит учесть, если вы действительно желаете узнать, насколько быстра конкретная видеокарта.
Миф: частота кадров – это индикатор уровня графической производительности
Начнём с фактора, который нашим читателям, скорее всего, уже известен, но многие по-прежнему имеют неправильное представление о нём. Здравый смысл подсказывает, что пригодной для игры считается частота кадров 30 FPS и выше. Некоторые люди считают, что и меньшие значения сойдут для нормального геймплея, другие настаивают, что даже 30 FPS – это слишком мало.
Однако в спорах не всегда очевидно, что FPS – это просто частота, за которой кроются некоторые сложные материи. Во-первых, в фильмах частота постоянная, а в играх она изменяется, и, как следствие, выражается средним значением. Колебания частоты являются побочным продуктом мощи видеокарты, требуемой для обработки сцены, и с изменением контента на экране изменяется частота кадров.
Всё просто: качество игрового опыта важнее, чем высокий показатель средней частоты кадров. Стабильность подачи кадров – ещё один крайне важный фактор. Представьте себе поездку по шоссе с постоянной скоростью 100 км/ч и ту же поездку со средней скоростью 100 км/ч, при которой много времени уходит на переключение передач и торможение. В назначенное место вы приедете в одно время, но вот впечатления от поездки будут сильно различаться.
Так что давайте на время отложим вопрос “Какой уровень производительности будет достаточным?” в сторону. Мы вернёмся к нему после того, как обсудим другие важные темы.
Представляем вертикальную синхронизацию (V-sync)
Мифы: Необязательно иметь частоту кадров выше 30 FPS, поскольку человеческий глаз не видит разницу. Значения выше 60 FPS на мониторе с частотой обновления 60 Гц необязательны, поскольку картинка уже отображается 60 раз в секунду. V-sync всегда нужно включать. V-sync всегда нужно выключать.
Как на самом деле отображаются визуализированные кадры? Почти все ЖК-мониторы работают таким образом, что изображение на экране обновляется фиксированное количество раз в секунду, как правило, 60. Хотя есть модели способные обновлять картинку на частоте 120 и 144 Гц. Данный механизм называется частота обновления и измеряется в герцах.
Расхождение между меняющейся частотой кадров видеокарты и фиксированной частотой обновления монитора может стать проблемой. Когда частота кадров выше частоты обновления, за одно сканирование могут отображаться несколько кадров, что приводит к артефакту под названием “разрыв экрана”. На изображении выше цветные полосы подчёркивают отдельные кадры из видеокарты, которые по готовности вывелись на экран. Это может сильно раздражать, особенно в активных шутерах от первого лица.
На изображении ниже показан ещё один артефакт, часто появляющийся на экране, но трудно фиксируемый. Поскольку данный артефакт связан с работой дисплея, на скриншотах его не видно, а вот невооружённым глазом он хорошо заметен. Чтобы его поймать, нужна высокоскоростная видеокамера. Утилита FCAT, которую мы использовали для захвата кадра в Battlefield 4, показывает разрыв, но не эффект гоустинга.
Разрыв экрана очевиден на обоих изображениях из BioShock Infinite. Однако на панели Sharp с частотой обновления 60 Гц он проявляется гораздо явнее, чем на мониторе Asus с частотой обновления 120 Гц, поскольку частота обновления экрана VG236HE вдвое выше. Данный артефакт является самым явным свидетельством того, что в игре не включена вертикальная синхронизация, или V-sync.
Второй проблемой на изображении BioShock является эффект гоустинга, который хорошо заметен в нижней части левого изображения. Этот артефакт связан с задержкой вывода изображения на экран. Если коротко: отдельные пиксели недостаточно быстро меняют цвет, и так появляется данный тип послесвечения. Этот эффект в игре проявляется гораздо ярче, чем показано на изображении. Время отклика от серого к серому у панели Sharp слева составляет 8 мс, и при быстрых движениях изображение кажется размытым.
Вернёмся к разрывам. Вышеупомянутая вертикальная синхронизация – это довольно старое решение проблемы. Оно заключается в синхронизации частоты, на которой видеокарта подаёт кадры, с частотой обновления монитора. Поскольку несколько кадров одновременно больше не появляется, разрывов тоже не наблюдается. Но если на максимальных графических настройках вашей любимой игры частота кадров упадёт ниже 60 FPS (или ниже значения частоты обновления вашей панели), то эффективная частота кадров будет скакать между кратными значениями частоты обновления, как показано ниже. Это ещё один артефакт под названием притормаживание.
Один из старейших споров в интернете касается вертикальной синхронизации. Кто-то настаивает, что технологию всегда нужно включать, кто-то уверен, что её всегда нужно выключать, а кто-то выбирает настройки в зависимости от конкретной игры.
Так включать или не включать V-sync?
Предположим, вы принадлежите к большинству и используете обычный дисплей с частотой обновления 60 Гц:
- Если вы играете в шутеры от первого лица и/или у вас наблюдаются проблемы с воспринимаемой задержкой ввода, и/или ваша система не может постоянно поддерживать минимум 60 FPS в игре, и/или вы тестируете видеокарту, то вертикальную синхронизацию нужно выключать.
- Если ни один из вышеперечисленных факторов вас не касается, и вы наблюдаете заметные разрывы экрана, то вертикальную синхронизацию нужно включить.
- Если вы не уверены, лучше оставить V-sync выключенной.
Если вы используете игровой дисплей с частотой обновления 120/144 Гц (если у вас есть один из таких дисплеев, вполне вероятно, что вы купили его как раз из-за высокой частоты обновления):
- Включать вертикальную синхронизацию следует только в старых играх, в которых геймплей проходит на частоте кадров выше 120 FPS, и вы постоянно сталкиваетесь с разрывами экрана.
Обратите внимание, что в некоторых случаях эффект снижения частоты кадров из-за V-sync не проявляется. Такие приложения поддерживают тройную буферизацию, хотя данное решение не очень распространено. Также в некоторых играх (например, The Elder Scrolls V: Skyrim), V-sync активирована по умолчанию. Принудительное отключение посредством модификации некоторых файлов приводит к проблемам с игровым движком. В таких случаях лучше оставить вертикальную синхронизацию включённой.
G-Sync, FreeSync и будущее
В статье “Обзор технологии G-Sync: меняем правила игры” мы рассмотрели решение Nvidia для перечисленных проблем. AMD сделала слабую попытку ответить на вызов, представив технологию FreeSync в начале 2014 года, и, хотя на данный момент её положительный эффект проявляется только в игре на ноутбуках, стоит отдать должное AMD за открытый доступ к технологии. Обе технологии нивелируют компромиссы V-sync, позволяя дисплею работать на изменяемой частоте обновления.
Трудно сказать, какая технология выйдет вперёд, но, как мы уже отмечали в обзоре G-Sync, мы не любители проприетарных стандартов (и многие производители и разработчики с нами согласятся). Хотелось бы, чтобы Nvidia открыла G-Sync для остальной части сообщества, хотя исходя из нашего опыта, компания вряд ли так поступит.
Развенчиваем мифы о производительности видеокарт | Стоит ли беспокоиться о задержке ввода?
Миф: видеокарты влияют на задержку ввода
Предположим, что вас постоянно убивают в многопользовательских шутерах, прежде чем вы успеваете реагировать. Неужели ваши оппоненты действительно намного быстрее вас? Может они жульничают? А может причина в чём-то другом?
Хотя жульничество иногда встречается, вполне вероятно, сверхчеловеческая (на первый взгляд) реакция подкреплена технологически. Причём это не относится к видеокарте.
Чтобы показать происходящее в игре на экране, необходимо время. Также проходит какое-то время, пока вы среагируете. Кроме того, на регистрацию ввода с мыши и клавиатуры тоже необходимо время. Время, проходящее между моментом, когда вы отдаёте команду, и реальным действием на экране называется задержкой ввода, что немного некорректно. Таким образом, если в шутере от первого лица вы нажимаете клавишу “огонь”, и оружие срабатывает через 0,1 секунды, задержка ввода составляет 100 миллисекунд.
Скорость реакции человека на происходящее различается. Согласно исследованиям, проведённым в США в 1986 году, среднестатистический боевой пилот истребителя F-14 реагирует на простые визуальные раздражители в течение 223 мс (средний показатель). Может, вам так не покажется, но человек быстрее реагирует на звук, чем на изображение. Время реакции на звуковые раздражители находилось в диапазоне 150 мс.
Если интересно, вы можете проверить свою реакцию в визуальном тесте, а затем в звуковом.
К счастью, даже на самых слабых компьютерах задержка ввода не будет превышать 200 мс. Поэтому наибольшее влияние на результаты игры имеет ваша собственная реакция.
Однако с ростом различий в задержке ввода их влияние на геймплей растёт. Представьте себе профессионального геймера, чью реакцию можно сравнить с реакцией лучших пилотов, то есть 150 мс. Задержка ввода на 50 мс означает, что человек будет реагировать на 30% медленнее (это четыре кадра на дисплее с частой обновления 60 Гц) своего оппонента. На профессиональном уровне это весьма заметная разница.
Для простых смертных (включая наших редакторов, показавших результат 200 мс в визуальном тесте) и для тех, кому больше нравится играть в Civilization V, а не в Counter Strike 1.6, всё немного иначе. Вполне вероятно, вы вообще можете игнорировать задержку ввода.
Вот некоторые факторы, которые могут ухудшить показатель задержки ввода при прочих равных условиях:
- Игра на HDTV (особенно если отключён режим игры) или игра на ЖК-дисплее со средствами обработки видео, которые нельзя отключить. Упорядоченный список показателей задержек ввода различных дисплеев можно найти в базе данных DisplayLag.
- Игра на ЖК-дисплеях, использующих панели IPS с более высоким временем отклика (обычно 5-7 мс G2G), вместо панелей TN+Film (1-2 мс GTG) или ЭЛТ-дисплеев (самые быстрые из доступных).
- Игра на дисплеях с низкой частотой обновления. Новые игровые дисплеи поддерживают 120 или 144 Гц.
- Игра при низкой частоте кадров (30 FPS – это один кадр каждые 33 мс; 144 FPS – один кадр каждые 7 мс).
- Использование USB-мышки с низкой частотой опроса. Время цикла на частоте 125 Гц составляет около 6 мс, что в среднем даёт задержку ввода около 3 мс. В то же время, частота опроса игровой мыши может доходить до 1000 Гц, при этом задержка ввода в среднем составит 0,5 мс.
- Использование клавиатуры низкого качества (как правило, задержка ввода клавиатуры составляет 16 мс, но в дешёвых моделях может быть и выше).
- Активация V-sync, особенно в сочетании с тройной буферизацией (существует миф, что Direct3D не включает тройную буферизацию. На самом деле, Direct3D учитывает опцию нескольких фоновых буферов, но немногие игры её используют). Если вы технически подкованы, можете ознакомиться с рецензией Microsoft (англ.) по этому поводу.
- Игра с высоким временем предварительной визуализации. По умолчанию очередь в Direct3D составляет три кадра или 48 мс при частоте 60 Гц. Это значение может увеличиваться до 20 кадров для большей “плавности” и понижаться до одного кадра для повышения отзывчивости за счёт повышения колебаний времени кадра и, в некоторых случаях, общей потери в показателях FPS. Нулевого параметра не существует. Ноль просто сбрасывает настройки на исходное значение, равное трём кадрам. Если вы технически подкованы, можете ознакомиться с рецензией Microsoft (англ.) по этому поводу.
- Высокая задержка интернет-соединения. Хотя это не совсем относится к определению задержки ввода, оно всё же заметно на неё влияет.
Факторы, которые не влияют на задержку ввода:
- Использование клавиатуры с разъёмом PS/2 или USB (смотрите дополнительную страницу в нашем обзоре “Five Mechanical-Switch Keyboards: Only The Best For Your Hands”(англ.)).
- Использование проводного или беспроводного сетевого соединения (проверьте пинг вашего маршрутизатора, если не верите; пинг не должен превышать 1 мс).
- Использование SLI или CrossFire. Более длинные очереди визуализации, необходимые для реализации этих технологий, компенсируются более высокой пропускной способностью.
Вывод: задержка ввода важна только для “быстрых” игр и действительно играет значимую роль на профессиональном уровне.
На задержку ввода влияют не только технология дисплея и видеокарта. Железо, настройки железа, дисплей, настройки дисплея и настройки приложения – всё это вносит свою лепту в данный показатель.
Развенчиваем мифы о производительности видеокарт | Мифы о видеопамяти
Видеопамять отвечает за разрешение и настройки качества, но не увеличивает скорость
Производители часто используют видеопамять в качестве маркетингового инструмента. Поскольку геймеров убедили, что больше – значит лучше, мы часто видим видеокарты начального уровня, объём оперативной памяти у которых значительно больше, чем нужно на самом деле. Но энтузиасты знают, что самое важное – это баланс, причём во всех комплектующих ПК.
В широком смысле видеопамять относится к дискретному GPU и задачам, которые он обрабатывает, независимо от системной памяти, установленной в материнскую плату. На видеокартах используются несколько технологий оперативной памяти, самые популярные из которых – это DDR3 и GDDR5 SDRAM.
Миф: видеокарты с 2 Гбайт памяти быстрее моделей с 1 Гбайт
Не удивительно, что производители оснащают недорогие графические ускорители большим объёмом памяти (и получают более высокую прибыль), поскольку многие люди верят, что больший объём памяти прибавит скорости. Давайте разберёмся в этом вопросе. Объём видеопамяти видеокарты не влияет на её быстродействие, если вы не выбираете игровые настройки, которые используют весь доступный объём памяти.
Но для чего тогда нужна дополнительная видеопамять? Чтобы ответить на этот вопрос, необходимо выяснить для чего она используется. Список упрощённый, но полезный:
- Прорисовка текстур.
- Поддержка буфера кадров.
- Поддержка буфера глубины (“Z Buffer”).
- Поддержка других ресурсов, которые требуются для визуализации кадра (карты теней и др.).
Конечно, размер текстур, которые загружаются в память, зависит от игры и настроек детализации. Например, пакет текстур высокого разрешения в Skyrim включает 3 Гбайт текстур. Большинство игр динамически загружают и выгружают текстуры при необходимости, однако не все текстуры должны находиться в видеопамяти. А вот текстуры, которые должны визуализироваться в конкретной сцене, должны быть в памяти.
Фрейм-буфер используется для хранения изображения в том виде, в котором оно визуализируется перед тем или во время того, как отправляется на экран. Таким образом, необходимый объём видеопамяти зависит от выходного разрешения (изображение в разрешении 1920×1080 пикселей по 32 бита на пиксель “весит” около 8,3 Мбайт, а 4K-изображение в разрешении 3840×2160 пикселей по 32 бита на пиксель – уже около 33,2 Мбайт) и количества буферов (минимум два, реже три и больше).
Особые режимы сглаживания (FSAA, MSAA, CSAA, CFAA, но не FXAA или MLAA) эффективно повышают количество пикселей, которые должны быть визуализированы, и пропорционально увеличивают общий объём требуемой видеопамяти. Сглаживание на базе рендеринга оказывает особенно больше влияние на потребление памяти, которое возрастает с ростом размера выборки (2x, 4x, 8x и т.д.). Дополнительные буферы также занимают видеопамять.
Таким образом, видеокарта с большим объёмом графической памяти позволяет:
- Играть на более высоких разрешениях.
- Играть на более высоких параметрах качества текстур.
- Играть при более высоких уровнях сглаживания.
Теперь разрушаем миф.
Миф: вам нужно 1, 2, 3, 4 или 6 Гбайт видеопамяти для игр на (вставьте родное разрешение вашего дисплея).
Самый важный фактор, который нужно учесть при выборе объёма оперативной памяти, – это разрешение, на котором вы будете играть. Естественно, более высокое разрешение требует больше памяти. Вторым важным фактором является использование упомянутых выше технологий сглаживания. Другие графические параметры имеют меньшее значение в отношении объёма требуемой памяти.
Прежде чем мы перейдём к самим измерениям, позвольте вас предупредить. Есть особый тип видеокарт класса high-end с двумя GPU (AMD Radeon HD 6990 и Radeon HD 7990, а также Nvidia GeForce GTX 590 и GeForce GTX 690), которые оснащаются определённым количеством памяти. Но в результате использования конфигурации из двух GPU данные, по сути, дублируются, разделяя эффективный объём памяти надвое. Например, GeForce GTX 690 с 4 Гбайт ведёт себя, как две карты по 2 Гбайт в SLI. Более того, когда вы добавляет вторую карту в конфигурацию CrossFire или SLI, видеопамять массива не удваивается. Каждая карта оставляет за собой только свой объём памяти.
Эти тесты мы проводили на Windows 7 x64 с отключённой темой Aero. Если вы используете Aero (или Windows 8/8.1, у которой Aero нет), то к показателям можно добавить около 300 Мбайт.
Как видно из последнего опроса на Steam, большинство геймеров (около половины) использует видеокарты с 1 Гбайт видеопамяти, около 20% имеют модели с 2 Гбайт, и небольшое количество пользователей (менее 2%) работают с графическими адаптерами, имеющими 3 Гбайт видеопамяти и более.
Мы протестировали Skyrim с официальным пакетом текстур высокого качества. Как видите, 1 Гбайт памяти едва хватает, чтобы играть при разрешении 1080p без сглаживания или с использованием MLAA/FXAA. 2 Гбайт позволяют запускать игру на разрешении 1920×1080 точек с максимальной детализацией и на 2160p с пониженным уровнем сглаживания. Чтобы активировать максимальные настройки и сглаживание 8xMSAA, даже 2 Гбайт недостаточно.
Bethesda Creation Engine – уникальная составляющая данного пакета бенчмарков. Она не всегда ограничивается скоростью GPU, но зачастую упирается в возможности платформы. Но в этих тестах мы впервые увидели, как Skyrim на максимальных настройках достигает предела возможностей видеопамяти графического адаптера.
Также стоит отметить, что активация FXAA не потребляет дополнительную память. Поэтому есть неплохой компромисс, когда использование MSAA не возможно.
Развенчиваем мифы о производительности видеокарт | Дополнительные измерения видеопамяти
Графический движок Glacier 2 от Io Interactive, на который опирается игра Hitman: Absolution, очень прожорлив на память и в наших тестах уступает только движку Warscape от Creative Assembly (Total War: Rome II) при максимальных настройках детализации.
В Hitman: Absolution видеокарты с 1 Гбайт видеопамяти недостаточно для игры на настройках ультракачества в разрешении 1080p. Модель с 2 Гбайт позволит включить 4xAA в разрешении 1080p или играть без MSAA в 2160p.
Чтобы включить 8xMSAA в разрешении 1080p, требуется 3 Гбайт видеопамяти, а 8xMSAA в разрешении 2160p точек сможет вытянуть видеокарта не слабее GeForce GTX Titan с 6 Гбайт памяти.
Здесь активация FXAA тоже не использует дополнительную память.
Примечание: новый тест Ungine Valley 1.0 не поддерживает MLAA/FXAA автоматически. Таким образом, результаты потребления памяти с MLAA/FXAA получены принудительно с помощью CCC/NVCP.
Данные показывают, что тест Valley хорошо проходит на карте с 2 Гбайт памяти в разрешении 1080p (по крайней мере, в отношении видеопамяти). Можно даже использовать карту с 1 Гбайт с активным 4xMSAA, хотя не во всех играх это будет возможно. Тем не менее, в разрешении 2160p бенчмарк показывает высокие результаты на карте с 2 Гбайт, если не включать сглаживание или эффекты постобработки. Порог в 2 Гбайт достигается при активации 4xMSAA.
Ultra HD с 8xMSAA требует до 3 Гбайт видеопамяти. Это значит, что на таких настройках бенчмарк будет пройден только на GeForce GTX Titan или на одной из моделей AMD с памятью 4 Гбайт и чипом Hawaii.
Total War: Rome II использует обновлённый движок Warscape от Creative Assembly. На данный момент он не поддерживает SLI (но CrossFire работает). Также он не поддерживает любые формы MSAA. Из всех форм сглаживания может использоваться только MLAA от AMD, которая является одной из техник постобработки наподобие SMAA и FXAA.
Интересной особенностью данного движка является возможность понижать качество изображения исходя из доступной видеопамяти. Игра может поддерживать приемлемый уровень скорости с минимальным вовлечением пользователя. Но отсутствие поддержки SLI убивает игру на видеокарте Nvidia в разрешении 3840×2160 пикселей. По крайней мере, на данный момент в эту игру лучше играть на карте AMD, если вы выбираете 4K-разрешение.
Без MLAA встроенный в игру бенчмарк “forest” на установке Extreme использует 1848 Мбайт доступной видеопамяти. Предел GeForce GTX 690 в 2 Гбайт превышается при активации MLAA в разрешении 2160p точек. На разрешении 1920×1080 пикселей использование памяти находится в диапазоне 1400 Мбайт.
Обратите внимание, что технология AMD (MLAA) работает на железе Nvidia. Поскольку FXAA и MLAA являются техниками постобработки, технически нет причин, почему они не могут функционировать на аппаратном обеспечении другого производителя. Либо Creative Assembly тайно переключается на FXAA (несмотря на то, что говорит файл конфигурации), либо маркетологи AMD не приняли этот факт во внимание.
Чтобы играть в Total War: Rome II в разрешении 1080p на графических параметрах Extreme, вам понадобится видеокарта на 2 Гбайт, а для плавной игры на 2160p потребуется массив CrossFire на более чем 3 Гбайт. Если в вашей карте есть только 1 Гбайт видеопамяти, то вы всё же сможете поиграть в новый Total War, но только на разрешении 1080p и пониженных настройках качества.
Что происходит, когда видеопамять полностью задействована? Если коротко, то данные переносятся на системную память через шину PCI Express. На практике, это означает, что производительность значительно снижается, особенно когда текстуры были загружены. Вряд ли вам захочется с этим сталкиваться, поскольку в игру из-за постоянных притормаживаний играть будет практически невозможно.
Так сколько же видеопамяти нужно?
Если у вас видеокарта с 1 Гбайт видеопамяти и монитор с разрешением 1080p, то об апгрейде на данный момент можно и не задумываться. Тем не менее, карта на 2 Гбайт позволит устанавливать более высокие настройки сглаживания в большинстве игр, так что считайте это минимальной отправной точкой, если хотите наслаждаться современными играми в разрешении 1920×1080 точек.
Если вы планируете использовать разрешения 1440p, 1600p, 2160p или конфигурации из нескольких мониторов, то лучше рассматривать модели с объёмом памяти выше 2 Гбайт, особенно если хотите включать MSAA. Лучше рассматривать к покупке модели на 3 Гбайт (или несколько карт с более 3 Гбайт памяти в SLI/CrossFire).
Конечно, как мы уже говорили, важно соблюдать баланс. Слабый GPU, подкреплённый 4 Гбайт памяти GDDR5 (вместо 2 Гбайт) вряд ли позволит играть на высоких разрешениях только благодаря наличию большого объёма памяти. Именно поэтому в обзорах видеокарт мы тестируем несколько игр, несколько разрешений и несколько настроек детализации. Ведь прежде чем делать какие-либо рекомендации, необходимо выявить все возможные недочёты.
Развенчиваем мифы о производительности видеокарт | Терморегулирование в современных видеокартах
Современные видеокарты AMD и Nvidia используют защитные механизмы для увеличения скорости вращения вентилятора и, в конечном итоге, понижения тактовых частот и напряжения, если чип перегревается. Данная технология не всегда работает во благо стабильности вашей системы (особенно при разгоне). Она предназначена для защиты оборудования от повреждений. Поэтому нередко карты со слишком высокими регулировками параметров дают сбой и требуют сброса.
Немало споров ходит о максимальной температуре для GPU. Однако более высокие температуры, если они переносятся оборудованием, более предпочтительны, поскольку свидетельствуют о повышенном рассеивании тепла в целом (благодаря разнице с окружающей температурой, количество тепла, которое можно передать, выше). По крайней мере, с технической точки зрения, разочарование AMD касательно реакции на тепловой потолок GPU Hawaii понятно. Пока не существует долгосрочных исследований, чтобы можно было говорить о жизнеспособности данных температурных установок. Исходя из личного опыта относительно стабильности устройств, мы предпочли бы полагаться на характеристики производителя.
С другой стороны, хорошо известно, что кремниевые транзисторы лучше работают при меньших температурах. Это основная причина, по которой оверклокеры используют кулеры с жидким азотом для максимального охлаждения чипов. Как правило, более низкие температуры помогают обеспечить больший запас для разгона.
Самыми прожорливыми видеокартами в мире являются Radeon HD 7990 (TDP 375 Вт) и GeForce GTX 690 (TDP 300 Вт). Обе модели оснащаются двумя графическими процессорами. Карты с одним GPU потребляют гораздо меньше энергии, хотя видеокарты серии Radeon R9 290 приближаются к уровню 300 Вт. В любом случае, это высокий уровень тепловыделения.
Значения указаны в описании систем охлаждения, поэтому сегодня мы не будем в них углубляться. Нас больше интересует, что происходит, когда на современные GPU подаётся нагрузка.
- Вы запускаете интенсивную задачу, такую как 3D-игра или биткоин-майнинг.
- Тактовая частота видеокарты повышается до номинальных или boost-значений. Карта начинает нагреваться из-за повышенного потребления тока.
- Скорость вращения вентиляторов постепенно возрастает до точки, обозначенной в прошивке. Как правило, рост останавливается, когда уровень шума достигает 50 дБ(A).
- Если запрограммированной скорости вентилятора недостаточно для удержания температуры GPU ниже определённого уровня, тактовая частота начинает понижаться, пока температура не упадёт до указанного порога.
- Карта должна стабильно работать в относительно узком диапазоне частот и температур, пока подача нагрузки не прекратится.
Нетрудно представить, что момент, по достижении которого активируется тепловой троттлинг, зависит от множества факторов, включая тип нагрузки, воздухообмен в корпусе, окружающую температуру воздуха и даже давление окружающего воздуха. Вот почему видеокарты включают троттлинг в разное время. Точка включения теплового троттлинга может использоваться для определения эталонного уровня производительности. И если мы выставляем скорость вращения вентилятора (и, соответственно, уровень шума) вручную, мы можем создать точку измерения в зависимости от шума. Какой в этом смысл? Давайте выясним…
Развенчиваем мифы о производительности видеокарт | Тестируем производительность на постоянном уровне шума 40 дБ(A)
Почему 40 дБ(A)?
Во-первых, обратите внимание на A в скобках. Она означает “с учётом коррекции “A”. То есть уровни звукового давления корректируются по кривой, имитирующей чувствительность человеческого уха к уровням шума на различных частотах.
Сорок децибел считаются средним значением для фонового шума в обычном тихом помещении. В студиях звукозаписи это значение находится в районе 30 дБ, а 50 дБ соответствуют тихой улице или разговору двух человек в комнате. Ноль – это минимальный порог для человеческого слуха, хотя очень редко можно услышать звуки в диапазоне 0-5 дБ, если вам больше пяти лет. Шкала децибел логарифмическая, а не линейная. Таким образом, 50 дБ звучат вдвое громче, чем 40, которые, в свою очередь, вдвое громче 30.
Уровень шума ПК, работающего при 40 дБ(A), должен смешиваться с фоновым шумом дома или квартиры. Как правило, его не должно быть слышно.
Любопытный факт
Любопытный факт: в самой тихой в мире комнате уровень фонового шума составляет -9 дБ. Если провести в ней менее часа в темноте, то из-за сенсорной депривации (ограничение сенсорной информации) могут начаться галлюцинации.
Как удержать постоянный уровень шума 40 дБ(A)?
На акустический профиль видеокарты влияют несколько факторов, одним из которых является скорость вентилятора. Не все вентиляторы производят одинаковое количество шума при одинаковой скорости вращения, но каждый вентилятор сам по себе должен шуметь на одном уровне при постоянной скорости вращения.
Итак, измеряя уровень шума напрямую с помощью измерителя SPL на расстоянии 90 см, мы вручную выставили профиль вентилятора так, чтобы звуковое давление не превышало 40 дБ(A).
Видеокарта | Настройка вентилятора % | Скорость вращения вентилятора, об/мин | дБ(A) ±0,5 |
Radeon R9 290X | 41 | 2160 | 40 |
GeForce GTX 690 | 61 | 2160 | 40 |
GeForce GTX Titan | 65 | 2780 | 40 |
Таблица выше показывает, что Radeon R9 290X и GeForce GTX 690 достигают 40 дБ(A) при одинаковой скорости вращения вентиляторов, однако настройки вентиляторов у них разные. В целом, вентиляторы Radeon могут вращаться быстрее и шуметь сильнее, чем у кулера GeForce GTX 690. С другой стороны, GeForce GTX Titan использует другой акустический профиль, достигая 40 дБ(A) при более высокой скорости вращения 2780 об./мин. При этом настройка вентилятора (65%) близка к GeForce GTX 690 (61%).
Данная таблица иллюстрирует профили вентилятора наряду с разнообразием предустановок. Разогнанные карты под нагрузкой могу быть очень шумными: мы получили значение 47 дБ(A). При обработке типичной задачи тише всех оказалась карта GeForce GTX Titan (38,3 дБ(A)), а самой громкой – GeForce GTX 690 (42,5 дБ(A)).
Развенчиваем мифы о производительности видеокарт | Может ли разгон повредить производительности на уровне 40 дБ(A)?
Миф: Разгон всегда даёт прирост производительности
Если настроить конкретный профиль вентилятора и позволить картам снижать частоту до стабильного уровня, то мы получим интересные и повторяемые тесты.
Видеокарта | Окр. тем-ра (°C) | Настройка вен-ра, % | Скорость вращения вен-ра, об/мин | дБ(A) ±0,5 | Час-та GPU1, МГц | Час-та GPU2, МГц | Час-та памяти, МГц | FPS |
Radeon R9 290X | 30 | 41 | 2160 | 40 | 870-890 | нет | 1250 | 55,5 |
Radeon R9 290X разгон | 28 | 41 | 2160 | 40 | 831-895 | нет | 1375 | 55,5 |
GeForce GTX 690 | 42 | 61 | 2160 | 40 | 967-1006 | 1032 | 1503 | 73,1 |
GeForce GTX 690 разгон | 43 | 61 | 2160 | 40 | 575-1150 | 1124 | 1801 | 71,6 |
GeForce GTX Titan | 30 | 65 | 2780 | 40 | 915-941 | нет | 1503 | 62 |
GeForce GTX Titan разгон | 29 | 65 | 2780 | 40 | 980-1019 | нет | 1801 | 68,3 |
Только GeForce GTX Titan показала более высокий результат в разгоне. Radeon R9 290X никаких преимуществ не получила, а GeForce GTX 690 даже потеряла в производительности на тестовом уровне 40 дБ(A). Если точнее, при разгоне её тактовая частота упала до 575 МГц.
Данный тест показывает, насколько велик запас производительности GeForce GTX Titan по сравнению с другими моделями. GeForce GTX Titan не дотягивает до уровня GeForce GTX 690, но довольно близко к нему подбирается, при этом оставляя Radeon R9 290X позади в более стандартных тестах.
Также любопытно более резкое повышение окружающей температуры в корпусе при использовании GeForce GTX 690 (12-14 °C). Оно связано с осевым вентилятором, который расположен по центру видеокарты. Он выдувает воздух внутрь корпуса, ограничивая тепловой запас. В большинстве обычных корпусов мы ожидаем похожую картину. Таким образом, вам предстоит самостоятельно решиться на повышение шумовыделения для повышения производительности (или наоборот) основываясь на собственных предпочтениях.
Подробно разобравшись с вертикальной синхронизацией, задержкой ввода, видеопамятью и протестировав конкретный акустический профиль, мы можем вернуться к работе над второй частью статьи, которая уже включает исследование скорости передачи данных PCIe, размеры экрана, подробное изучение эксклюзивных технологий различных производителей и анализ цен.