Обзор GeForce GTX 750 Ti | Представляем GPU GM107 на базе Maxwell
В наши дни геймеры предпочитают мощные видеокарты. Они оснащаются двухслотовыми системами охлаждения с причудливыми кожухами вентиляторов, ведь для обеспечения высокой частоты кадров требуются сложные и большие графические процессоры. Миллиарды транзисторов могут сильно нагреваться, обрабатывая Battlefield 4 на максимальных настройках детализации. А ведь лишнее тепло нужно куда-то отводить.
Если перед вами короткая, почти “голая” печатная плата, то вполне возможно, что производитель пошёл на хитрости, чтобы решить проблемы с тепловыделением.
Тем не менее, Nvidia, похоже, пытается сказать в этой связи своё слово, выпуская референсную карту GeForce GTX 750 Ti на плате длиной около 150 мм. У карты нет разъёмов вспомогательного питания, а вместо большого кулера установлен небольшой цилиндрический радиатор с вентилятором. Плата равна по размеру GeForce GTX 650 Ti, но без большого кулера. GeForce GTX 750 Ti, по сути, меньше многих звуковых карт.
Nvidia утверждает, что первый продукт на базе архитектуры Maxwell предназначается для современных игр на разрешении 1920×1080 пикселей на требовательных графических настройках. Может быть, это своего рода Prius в мире видеокарт?
Maxwell в центре внимания
История Maxwell интригует – отчасти потому, что компания использует новый подход к дизайну, отчасти из-за того, что Nvidia скрывает больше архитектурных деталей, чем обычно. Начнём с дизайна.
В декабре прошлого года в Санта-Кларе мы кое-что узнали об Nvidia Tegra K1 SoC. Мы уже знали, что графический движок K1 был построен на архитектуре Kepler. По сути, это был один блок SMX с заметными изменениями в структуре соединения различных подсистем для оптимизации питания. Но Джона Альбен (Jonah Alben), первый заместитель директора по разработке GPU, также дал понять, что каждая новая архитектура, начиная с Maxwell, будет разрабатываться, в первую очередь, для мобильных решений. Инженеры будут оптимизировать структурные элементы в компонентах GPU, опираясь на определённые показатели производительности и ограничения мощности. Тем не менее, основные элементы останутся неизменны, а важные решения касательно архитектуры будут приниматься, учитывая в первую очередь эффективность.
Tegra: откуда она взялась
Толчком к разработке Maxwell послужили разработки Nvidia в сегменте смартфонов и планшетов. В статье “Nvidia Tegra K1: сила Xbox в мобильной платформе?” вы найдёте подробности этой истории.
Это определённо хорошие новости для семейства Tegra, которое компания активно продвигает на рынке. Устройства на базе K1 ещё не появились, а мы уже думаем о заявленном Nvidia двойном приросте производительности на ватт в архитектуре Maxwell по сравнению с Kepler и о том, к каким усовершенствованиям в играх на мобильных платформах это может привести.
Новый акцент производителя на эффективности также может положительно сказаться на сегменте решений для ПК, поскольку компания обещает, что переоборудованная архитектура хорошо масштабируется в плане температурного предела.
К счастью, чтобы узнать это, долго ждать не придётся. GeForce GTX 750 Ti, которую мы сегодня рассмотрим, хорошо демонстрирует возможности Maxwell (по крайней мере, при TDP 60 Вт). По словам Nvidia, более эффективный дизайн снижает энергопотребление и повышает производительность, даже несмотря на то, что GPU использует меньше ядер CUDA. Nvidia пришлось реализовывать все улучшения Maxwell с учётом производственного процесса 28 нм. Другими словами, компании нужно, в первую очередь, заставить GPU быть “умнее”, поскольку вариант развития архитектуры на основе увеличения ресурсов здесь не подходит.
Потоковый мультипроцессор Maxwell
Представители компании рассказали нам, что главное улучшение Maxwell связано с усовершенствованным потоковым мультипроцессором (Streaming Multiprocessor, или SM), который теперь имеет аббревиатуру SMM.
В Kepler каждый SMX содержит до 192 ядер CUDA, четыре warp-планировщика и файл реестра объёмом 256 Кбайт. 64 Кбайт резервируются как общая память кэша первого уровня, отдельного кэша для текстур и однородного кэша, плюс 16 блоков текстурирования. Значительное повышение количества ядер CUDA и алгоритмов управления помогли Nvidia компенсировать отсутствие удвоенной шейдерной частоты, свойственной Fermi. Но, видимо, в такой конфигурации оказалось трудно использовать потенциал SMX на полную мощность.
Maxwell пытается решить данную проблему путём деления SMX на четыре блока, в каждом из которых есть свой буфер команд, warp-планировщик и пара блоков диспетчеризации. Файл реестра Kepler на 256 Кбайт теперь поделён на четыре части по 64 Кбайт, каждый блок имеет по 32 ядра CUDA, что в совокупности составляет 128 ядер на SMM (у Kepler – 192). 32 блока загрузки/сохранения и 32 блока специальных функций достались Maxwell от предыдущей архитектуры. Тем не менее, скорость вычислений с двойной точностью была урезана ещё сильнее до 1/32 частоты FP32. В графических процессорах Kepler это значение составляет 1/24.
GM107 SMM (слева) против GK106 SMX (справа) | |||
На каждый SM: | GM107 | GK106 | Соотношение |
Кол-во ядер CUDA | 128 | 192 | 2/3x |
Блоки со спец. Функциями | 32 | 32 | 1x |
Загрузка/сохранение | 32 | 32 | 1x |
Блоки текстур | 8 | 16 | 1/2x |
Планировщики “варпов” | 4 | 4 | 1x |
Движки геометрии | 1 | 1 | 1x |
Каждая пара блоков связана с кэшем для текстур на 12 Кбайт и L1; в итоге имеем 24 Кбайт на блок SMM. Пары блоков также связаны с четырьмя блоками текстурирования, то есть SMM оснащаются восемью. Это вдвое больше по сравнению с SMX Kepler. Из таблицы выше может показаться, что GM107 слабее GK106. Но не стоит преждевременно беспокоиться относительно узких мест в некоторых узлах. Не забывайте, архитектура разработана так, чтобы выполнять больше работы, используя при этом меньше ресурсов.
И, наконец, есть ещё 64 Кбайт общего кэша для SMM, который достался от Fermi, а затем и от Kepler. Только теперь он не называется кэшем L1 для вычислительных задач. Раньше считалось, что это пространство можно сконфигурировать как 48 Кбайт общего пространства кэша и 16 Кбайт L1 и наоборот. Теперь в этом нет необходимости, поскольку все 64 Кбайт используются как общее адресное пространство для вычислений на GPU.
Как вы можете себе представить, удаление 64 ядер CUDA и восьми блоков текстурирования из SMM привело к тому, что каждый структурный элемент потребляет меньше места на кристалле. Тем временем, Nvidia заявляет, что архитектура способна удерживать до ~90% производительности мультипроцессора, сохраняя постоянную нагрузку на ядра. Если вы задумались, что это может значить для планшетов, то вы не одиноки. Но в настольных решениях Nvidia просто может расположить большее количество SMM в рамках отведённого пространства. GeForce GTX 650 Ti, которую заменяет новая видеокарта, использует четыре блока SMX, в то время как GeForce GTX 750 Ti оснащается пятью SMM.
Построение GM107
Это первый раз, когда Nvidia представляет новую архитектуру на видеокарте среднего ценового диапазона. В случае архитектуры Fermi, это был полноценный GF100. Даже GK104 на Kepler отличался впечатляющей скоростью. С GM107 ситуация иначе. Конечно, это связано с тем, что с GeForce GTX 750 Ti компания хочет занять место в портфолио, заполненном преимущественно картами на базе Kepler, а не просто залезть на трон.
Компания добивается цели с помощью полноценной версии GM107, состоящей из пяти SMM в одном кластере обработки графики (Graphics Processing Cluster) с собственным движком растеризации (Raster Engine). GM107 может выводить один видимый простейший элемент за один тактовый цикл. Напомним: GK106 мог выводить 1,25 элемента за такт, а GK107 – 0,5 элемента за такт.
Как и в предыдущей архитектуре Nvidia, разделы ROP и кэш L2 уравновешены. Как и в случае процессора GK106 в GeForce GTX 650 Ti, GM107 имеет два раздела с восемью блоками в каждом, что в итоге даёт до 16 32-битных целочисленных пикселя за такт. Основные различия между этими GPU наблюдаются в объёме кэша L2. В GK106 на каждый раздел приходится 128 Кбайт, всего 256 Кбайт в двух разделах ROP. GM107 оснащается 1 Мбайт на раздел, в итоге получается 2 Мбайт памяти для обслуживания загрузки, хранения и запросов на текстуры. Согласно данным Nvidia, такое решение обеспечивает существенное перераспределение нагрузки с внешней памяти, а также заметную экономию энергии.
Снижение нагрузки на пропускную способность памяти – это разумный ход, поскольку GM107 имеет пару 64-битных контроллеров памяти, работающих с 1 либо 2 Гбайт видеопамяти GDDR5 1350 МГц. Любопытно, но пиковая пропускная способность точно такая же, как у GeForce GTX 650 Ti: 86,4 Гбайт/с. Память получает данные от меньшего числа ядер CUDA, но распределяется более эффективно. Таким образом, большой кэш L2 играет важную роль в устранении узких мест.
И в самом деле, оценив в общем произвольные задержки страницы кэша, можно убедиться, что структура памяти Maxwell обеспечивает более стабильную нагрузку на GPU.
Кроме компонентов GM107, отведённых для игр и вычислительных задач, Nvidia также утверждает, что улучшила блок NVEnc с фиксированной функцией. Эта часть логики отвечает за кодирование игрового видео силами ShadowPlay с минимальным воздействием на производительность. Она позволяет организовывать потоковую передачу на Shield. Также она ускоряет несколько транскодирующих приложений для быстрого вывода “тяжёлых” фильмов на портативное устройство. Kepler способна кодировать контент H.264 в четыре раза быстрее реального времени, Maxwell же предположительно кодирует в 6-8 раз быстрее реального времени. Длительность декодирования H.264 также стала до десяти раз короче, чем раньше. По словам Nvidia, это достигается путём простого ускорения блоков с фиксированной функцией.
Разъёмы вспомогательного питания | Нет |
Выходы | 1 x DVI-D (двухканальный) 1 x HDMI 1 x D-Sub (аналоговый) |
Форма-фактор | Двухслотовая |
Плюсы | Очень холодная Очень тихая |
Минусы | Относительно длинная |
Размеры (ДхВхШ), мм | 250х121х36 |
Вес, г | 533 |
Графический процессор GM107 состоит из 1,87 миллиардов транзисторов, размещённых на кристалле площадью 148 мм². GK106 в GeForce GTX 650 Ti для сравнения имеет 2,54 миллиардов транзисторов на кристалле 221 мм2. Прежде чем мы перейдём к результатам тестов производительности, нужно признать, что упор на эффективность достаточно сильный, а инженеры решили использовать меньше транзисторов на меньшем кристалле, убрать лишние ядра CUDA и блоки текстурирования, и при этом повысить производительность. По крайней мере, такого результата мы ждём.
С другой стороны, если вы хотите сопоставить тепловые пакеты, то можно сравнить GM107 с чипом GK107, у которого 1,3 миллиарда транзисторов размещены на кристалле площадью 118 мм². В таком случае, процессор Maxwell является более сложным, большим и гораздо более быстрым продуктом, и при этом он должен потреблять меньше энергии.
Обзор GeForce GTX 750 Ti | Референсная видеокарта
При использовании GPU с низким энергопотреблением в создании видеокарты, вам не обязательно полагаться на активную двухслотовую систему охлаждения. Для эталонного дизайна Nvidia выбрала печатную плату длиной менее 150 мм, то есть она заканчивается вместе со слотом PCI Express. Используется одна скоба с двумя двухканальными разъёмами DVI и одним выходом mini-HDMI. Nvidia снабжает процессор GM107 цилиндрическим радиатором и вентилятором, занимающими пространство двух слотов, и это стоит учесть при планировании конфигурации системы.
Для теплового пакета на 60 Вт достаточно одного слота PCI Express на 16 линий, поскольку он рассчитан на 75 Вт. Поэтому дополнительного разъёма питания на плате нет (даже несмотря на наличие отверстий для него). Мы любим карты с таким профилем благодаря их гибкости. Раньше для апгрейда старой системы со слабым блоком питания мы рекомендовали Radeon HD 7750. Теперь эту позицию занимает GeForce GTX 750 Ti.
К сожалению, разъёма для моста SLI нет. В соответствии с подходом Nvidia, именно в сегменте $150 вы теряете возможность объединения двух видеокарт для повышения графической производительности. С точки зрения конкуренции, это не совсем логично, поскольку решения AMD в данном сегменте позволяют создавать конфигурации CrossFire. Nvidia легко могла бы внедрить SLI через PCI Express, но, по словам компании, среди карт за $150 особого спроса на эту функцию со стороны энтузиастов она не видит. Но нам было бы любопытно сравнить пару GeForce GTX 750 Ti с одной GeForce GTX 770.
Nvidia планирует продавать две версии GeForce GTX 750 Ti: модель с 1 Гбайт GDDR5 за $140 будет доступна в конце февраля, и модель на 2 Гбайт, которая уже должна продаваться за $150. Более того, позже появится GeForce GTX 750 по цене $120.
Среди партнёрских решений имеются разные версии как с одной, так и с двумя скобами расширения, но все они представлены в двухслотовом дизайне. Кроме того, нам сообщили, что ожидаются двухслотовые модели с пассивными охлаждением. Также возможны однослотовые конфигурации, хотя мы не уверены, что это обеспечит приятный игровой опыт.
Обзор GeForce GTX 750 Ti | MSI GTX 750 Ti Gaming OC
MSI GTX 750 Ti Gaming следует эталонному дизайну Nvidia, отказываясь от вспомогательного разъёма питания. Однако инженеры MSI устанавливают большой кулер, который, как нам кажется, мог бы охлаждать 60-ваттный GPU GM107 без участия вентиляторов.
Но даже с вентиляторами конфигурация MSI не показалась нам шумной; кроме того, температура не превышала 51-52 градусов Цельсия, а вентиляторы вращались не более чем на 32–33% от своей максимальной скорости. Это также означает, что уровень шума под нагрузкой едва превышает данный показатель в простое. Фактически акустические измерения нам сначала показались не совсем правдоподобными, поскольку различия находились в пределах погрешностей наших комплектующих.
Размеры, вес и разъёмы
Наши замеры почти никогда не совпадают с характеристиками производителя. Мы проводим измерения согласно схеме, представленной ниже.
Разъёмы вспомогательного питания | Нет |
Выходы | 1 x DVI-D (двухканальный) 1 x HDMI 1 x D-Sub (аналоговый) |
Форма-фактор | Двухслотовая |
Плюсы | Очень холодная Очень тихая |
Минусы | Относительно длинная |
Размеры (ДхВхШ), мм | 250х121х36 |
Вес, г | 533 |
Как всегда, для обзора характеристик карты мы используем данные GPU-Z.
Спереди и сзади
С боков
Обзор GeForce GTX 750 Ti | Gigabyte GTX 750 Ti Windforce OC
Прямо перед публикацией обзора в дополнение к карте MSI мы получили GTX 750 Ti Windforce OC от Gigabyte. Компания также полагается на референсную печатную плату Nvidia. Тем не менее, она использует точки припоя для шестиконтактного разъёма питания, что обеспечивает дополнительный запас для разгона.
Размеры, вес и разъёмы
Наши замеры почти никогда не совпадают с характеристиками производителя. Мы проводим измерения согласно схеме, представленной ниже.
Разъёмы вспомогательного питания | 1 x 6 pin |
Выходы | 1 x DVI-D (двухканальный) 1 x HDMI 1 x DVI-I |
Форма-фактор | Двухслотовая |
Плюсы | Холодная Тихая Компактная |
Минусы | Относительно высокая |
Размеры (ДхВхШ), мм | 191х118х36(3) |
Вес, г | 418 |
Как всегда, для обзора характеристик карты мы используем данные GPU-Z.
Спереди и сзади
С боков
Обзор GeForce GTX 750 Ti | Zotac GTX 750 Ti
Zotac GTX 750 Ti идёт по пути MSI, отказываясь от шестиконтактного разъёма питания в пользу дизайна с единственным слотом PCI Express х16. Карта построена на той же печатной плате, но только эта модель использует один вентилятор.
Размеры, вес и разъёмы
Наши замеры почти никогда не совпадают с характеристиками производителя. Мы проводим измерения согласно схеме, представленной ниже.
Разъёмы вспомогательного питания | нет |
Выходы | 1 x DVI-D (двухканальный) 1 x HDMI 1 x D-Sub (аналоговый) |
Форма-фактор | Двухслотовая |
Плюсы | Очень холодная Очень тихая |
Минусы | Относительно длинная |
Размеры (ДхВхШ), мм | 250х121х36(4) |
Вес, г | 533 |
Как всегда, для обзора характеристик карты мы используем данные GPU-Z.
Спереди и сзади
С боков
Обзор GeForce GTX 750 Ti | Тестовый стенд и бенчмарки
Все карты из сегодняшнего обзора мы тестируем с драйверами последних бета-версий: Catalyst 14.1 beta 6 от AMD и 334.67 beta от Nvidia. Однако новая GeForce GTX 750 Ti требует специальный драйвер 334.69 beta. Чтобы обеспечить реалистичную нагрузку на GeForce GTX 750 Ti и другие решения, мы проводим игровые тесты на разрешении 1920×1080 пикселей, используя средние и высокие настройки детализации. Это должно обеспечить оптимальный баланс между качеством изображения и производительностью для видеокарт данного уровня.
Конфигурация тестового стенда | |
Процессор | Intel Core i5-2550K (Sandy Bridge), разгон до 4,2 ГГц @ 1,3 В |
Системная плата | Asus P8Z77-V LX LGA 1155, чипсет Intel Z77M |
Сеть | встроенный контроллер Gigabit LAN |
Оперативная память | Corsair Performance Memory, 4 x 4 Гбайт, 1866 MT/с, CL 9-9-9-24-1T |
Накопитель | Samsung 840 Pro SSD 256 Гбайт SприA 6Гбит/с |
Видеокарты | Sapphire Radeon R7 260X 1100 МГц GPU, 2 Гбайт GDDR5 при 1625 МГц (6500 МТ/с) XFX Radeon HD 7850 860 МГц GPU, 1 Гбайт GDDR5 при 1200 МГц (4800 МТ/с) Sapphire Radeon R7 265 925 МГц GPU, 2 Гбайт GDDR5 при 1400 МГц (5600 МТ/с) реф. Radeon R9 270 925 МГц GPU, 2 Гбайт GDDR5 при 1400 МГц (5600 МТ/с) реф. Nvidia GTX 650 Ti 925 МГц GPU, 1 Гбайт DDR3 при 1350 МГц (5400 МТ/с) реф. Nvidia GTX 650 Ti Boost 980/1033 МГц GPU, 2 Гбайт GDDR5 при 1502 МГц (6008 МТ/с) реф. Nvidia GTX 660 980/1033 МГц GPU, 2 Гбайт GDDR5 при 1502 МГц (6008 МТ/с) реф. GeForce GTX 750 Ti 1020/1085 МГц GPU, 2 Гбайт GDDR5 при 1350 МГц (5400 МТ/С) |
Блок питания | XFX PRO850W, приX12V, EPS12V |
Системное ПО и драйверы | |
Операционная система | Windows 8 Professional 64-bit |
DirectX | DirectX 11 |
Видеодрайверы | AMD Catalyst 14.1 Beta 6, Nvidia GeForce 334.67 Beta, Nvidia GeForce 334.69 Beta для GeForce GTX 750 Ti |
В нашей лаборатории мы почти полностью избавились от механических жёстких дисков, и вместо них используем твердотельные накопители, для которых нехарактерны задержки, связанные с операциями ввода/вывода. Компания Samsung прислала в наши офисы накопители Samsung 840 Pro на 256 Гбайт, поэтому они у нас используются в качестве стандартных.
Естественно, дискретная графика требует стабильного электропитания, для этого XFX прислала нам блок питания PRO850W с сертификатом 80 PLUS Bronze. Модульный БП имеет одну шину +12 В, рассчитанную на 70 А. Как утверждает XFX, данная модель обеспечивает непрерывную (не пиковую) мощность до 850 Вт при температуре 50 градусов Цельсия (заметно больше, чем в большинстве корпусов).
Конфигурация тестов | |
Metro: Last Light | версия 1.0.0.14, встроенный бенчмарк |
Grid 2 | верcия 1.8.85.8679, встроенный бенчмарк сцена D6 |
Assassin’s Creed IV: Black Flag | верcия 1.05, тест THG, 40 секунд, |
Battlefield 4 | версия 1.0.0.1, встроенный бенчмарк, 60 с |
BioShock Infinite | версия 1.1.24.21018, встроенный бенчмарк |
Far Cry 3 | версия 1.05, тест THG, 55 секунд |
Arma 3 | версия 1.10.114.700, тест THG, 30 секунд |
Обзор GeForce GTX 750 Ti | Результаты тестов
Arma 3
Мы начинаем с Arma 3. Эта игра во многом напоминает военный симулятор, нежели шутер от первого лица. Но, независимо от реализма игры (или, может быть, по его причине), она достаточно нагружает графическую подсистему при использовании самых современных функций.
GeForce GTX 750 Ti заметно обгоняет Radeon R7 260X, но не дотягивает до показателей GeForce GTX 650 Ti Boost и Radeon R7 265. Первая карта Nvidia на архитектуре Maxwell отлично справляется с высокими настройками детализации на разрешении 1920×1080 точек с активным сглаживанием 4x MSAA. Частота кадров остаётся выше уровня 36 FPS на протяжении всего бенчмарка.
Мы выявили умеренные скачки времени подачи кадра на разных видеокартах в Arma 3, хотя на геймплее они никак не отражаются. Любопытно, что Radeon R7 265 демонстрирует более высокие колебания, чем конкуренты, несмотря на высокую частоту кадров. Результат подтвердился в нескольких прогонах.
Assassin’s Creed IV: Black Flag
Assassin’s Creed: Black Flag проспонсирована Nvidia, поэтому нам крайне интересно, как в этой красивой игре графические процессоры этой же компании покажут себя в сравнении с чипами AMD.
На нормальных настройках GeForce GTX 750 Ti позволяет играть без проблем, однако она всё же осталась ближе к концу списка. Новинка незначительно отстала от GeForce GTX 650 Ti Boost и заметно обогнала GeForce GTX 650 Ti, которую и призвана заменить.
Мы наблюдаем низкие колебания времени подачи кадра в этой игре. Тем не менее, GeForce GTX 750 Ti показала несколько скачков. Естественно, стоит учитывать, что это первое выступление архитектуры Maxwell, и вполне возможно, что в этом виноваты сырые драйверы. Будем надеяться, что со временем инженеры Nvidia разберутся с мелкими недостатками.
Battlefield 4
В Battlefield 4 мы можем выбрать настройки Ultra, хотя при этом пришлось снизить MSAA до 2x, а глобальное освещение до SSAO при разрешении 1920×1080 пикселей.
GeForce GTX 750 Ti определённо справляется с задачей, хотя иногда её частота кадров уходит ниже уровня 30 FPS. В любом случае, она пришла к финишу практически в одно время с GeForce GTX 650 Ti Boost.
На этом уровне детализации три карты из выборки страдают от скачков времени кадра, и GeForce GTX 750 Ti входит в их число. Оставшиеся две – это Radeon R7 260X и Radeon HD 7850, оснащённые по 1 Гбайт видеопамяти.
BioShock Infinite
GeForce GTX 750 Ti обладает достаточно высоким уровнем производительности для игры в BioShock Infinite на ультранастройках с разрешением 1920×1080 точек.
По средней частоте кадров GeForce GTX 750 Ti сравнялась с GeForce GTX 650 Ti Boost и существенно обогнала её по минимальной.
Движок Unreal в сердце BioShock хорошо оптимизирован, и колебания времени подачи кадров очень незначительные по сравнению с другими играми.
Far Cry 3
В нашей тестовой последовательности GeForce GTX 750 Ti закрепилась между GeForce GTX 650 Ti Boost и Radeon R7 260X.
В нескольких местах шкала колебания времени подачи кадров демонстрирует всплески. Однако во время игры они не чувствуются, поэтому сильно критиковать результат мы не будем.
Grid 2
Из прошлых обзоров мы знаем, что Grid 2 не сильно нагружает видеокарту. Напротив, игра чувствительна к изменениям центрального процессора и системной памяти. В результате нам удалось запустить игру в разрешении 1920×1080 пикселей с настройками Ultra с 8x MSAA.
GeForce GTX 750 Ti обеспечивает приемлемый уровень производительности, хотя и остаётся позади других видеокарт, кроме GeForce GTX 650 Ti, как мы и ожидали.
Мы зарегистрировали несколько скачков времени подачи кадров, однако на плавность картинки в игре это они не повлияли.
Metro: Last Light
Последним из игровых бенчмарков идёт Metro: Last Light. Мы тестируем карты на разрешении 1920×1080 пикселей в режиме DirectX 11 со средними настройками детализации графики.
По среднему показателю GeForce GTX 750 Ti не отстаёт от Radeon R7 260X, а по минимальному даже немного обгоняет.
Все карты демонстрируют невысокие колебания времени кадра, хотя редкие скачки наблюдаются у графических адаптеров обеих компаний.
Средняя скорость и производительность на ватт
Усреднив показатели всех тестов, мы увидели, что GeForce GTX 750 Ti оказалась очень близка по производительности к старой Radeon HD 7850. Даже сам по себе это достойный результат, поскольку Radeon HD 7850 стартовала по цене $250 (единственная карта на Newegg сейчас продаётся по цене $200), а если учесть, что карте Maxwell не требуется вспомогательное питание, результат впечатляет ещё больше.
Далее мы взяли средний показатель производительности всех видеокарт в пяти играх и подробные данные энергопотребления во время прогонов. С помощью этих цифр мы высчитали среднюю частоту кадров на ватт потребляемой мощности:
Этот график важен, когда при обсуждении карты необходимо учесть тепловой пакет на 60 Вт. GeForce GTX 750 Ti в этом плане просто затмила всех, почти удваивая соотношение производительность на ватт по сравнению с Radeon R7 265 и GeForce GTX 650 Ti Boost. Radeon R7 260X справляется чуть лучше своих конкурентов, но всё же ей очень далеко до карты на чипе GM107.
Обзор GeForce GTX 750 Ti | GPU Boost и разгон
Заводские частоты и GPU Boost
Нам уже известно, что базовая тактовая частота графических процессоров Nvidia не позволяет понять, как процессор будет работать под нагрузкой, поскольку при соблюдении определённых условий используется технология GPU Boost.
Параметры базовой частоты и частоты в режиме GPU Boost могут устанавливаться партнёрами карты в прошивке. Поэтому в зависимости от кулера и самой карты, в пределах частоты Boost могут быть расхождения, даже если у продуктов одинаковая базовая тактовая частота. На следующем графике Gigabyte демонстрирует самый скромный предел. Тем не менее, карта может поддерживать такую частоту без колебаний. Остальные три карты, не имеющие разъёмов вспомогательного питания, демонстрируют некоторые изменения в этом показателе.
Разгон? Да, но незначительный
После продолжительных тестов на стабильность партнёрских карт, мы пришли к выводу, что самой высокой стабильной частотой GPU Boost является ~1,3 ГГц. На этой отметке свои ограничения вводит предел TDP. К сожалению, он установлен на 100%. Пока Nvidia не уберёт преграду, мешающую установить боле высокие пределы мощности, больше производительности из этой видеокарты выжать не получится (она упирается в ограничение PCI Express, составляющее 75 Вт).
В плане производительности модели Gigabyte и MSI оказались очень близки. GTX 750 Ti Gaming OC смогла обеспечить более высокую пиковую частоту, но последняя очень часто опускалась из-за ограничений TDP. Решение Gigabyte демонстрирует более сбалансированное поведение. Кроме того, карта работает при довольно низкой температуре 46 °C, несмотря на разгон.
Сначала мы сравним настройки базовой частоты с наблюдаемыми частотами GPU Boost:
Понятно, что чем выше частоты в разгоне, тем чаще карта их понижает. На практике это означает, что во время игры особых преимуществ вы не получите. Давайте сравним повышенные частоты с нормальными в игре Metro: Last Light и Crysis 3, показатели которых мы нормализовали и привели к среднему значению.
Повышение базовой частоты примерно на 14% (11% в режиме GPU Boost) даёт около 7% прироста скорости в играх. При этом энергопотребление едва вписывается в бюджет мощности, и GeForce GTX 750 Ti не выходит за пределы TDP. Кратковременные всплески (102%) сразу компенсируются понижением тактовой частоты. Но путём ограничения предела мощности на 100% мы получили довольно скромный прирост скорости, независимо от того, потребовалось ли дополнительное питание со вспомогательного разъёма или нет. Прежде чем разгонять дальше, нужно, чтобы Nvidia исправила программно предел мощности.
Обзор GeForce GTX 750 Ti | GPGPU: скорость вычислений с плавающей запятой
Одинарная точность – хорошо. Двойная точность – плохо
Графические процессоры Nvidia Kepler предлагают вычислительную производительность двойной точности на скорости 1/24 вычислений FP32. Maxwell в этом плане ещё хуже – 1/32. Конечно, всё это теория. Лучше перепроверить этот параметр в реалистичных тестах.
Бенчмарк Folding@Home особенно хорошо подходит для сравнения видеокарт с OpenCL. В этот раз нам придётся обойтись без показателей CUDA, поскольку карта на базе Maxwell не распозналась корректно. Придётся проверить этот параметр позже.
Насколько велика разница между вычислениями с одинарной и двойной точностью? Результаты наших тестов показали соотношение 8:1 на GeForce GTX 750 Ti (Maxwell). Это заметно ниже, чем у GeForce GTX 760 (Kepler) – 4:1 в нашем тесте (Explicit Solvent).
Однако GM107 отличается высоким показателем вычислений с одинарной точностью. Новая модель в этом плане может конкурировать с гораздо более сильными графическими адаптерами. Для вычислений с двойной точностью немного не хватает пропускной способности вычислений.
Тесты одинарной точности (Single-Precision или SP)
Тесты двойной точности (Double-Precision или DP)
Нам тяжело делать какой-то конкретный вывод относительно возможностей GM107 в FP64. Можно сказать, что скорость вычислений с двойной точностью плохая, но с одинарной – хорошая. В любом случае, искусственные ограничения, преграждающие дешёвым настольным видеокартам путь в рабочие станции, по-прежнему нас раздражают.
Обзор GeForce GTX 750 Ti | GPGPU: Bitcoin, Litecoin, LuxMark и RatGPU
Следующие дисциплины не охватывают все аспекты вычислений общего назначения (в нашем тестовом пакете есть ещё тесты Photoshop, WinZip и редактирование видео, которые провести не удалось). Тем не менее, они дают неплохое представление об улучшениях Maxwell по сравнению с Kepler, а также о том, какую позицию занимает Nvidia по отношению к AMD теперь.
BTC Mining
Хотя компания не уточняла подробности о проведённых усовершенствованиях, нам известно, что Maxwell справляется с хешированием гораздо быстрее Kepler, что отражено в победе над GeForce GTX 680 и GeForce GTX 770. Однако в BTC mining GeForce GTX 750 Ti проигрывает Radeon R7 260X и некоторым другим массовым графическим ускорителям AMD.
Естественно, Bitcoin – не единственная криптовалюта, которая полагается на хеширование. Например, MaxCoin является частью семьи SHA3, и поддерживается в новой версии CudaMiner. Нам стала любопытна позиция GeForce GTX 750 Ti по отношению к GeForce GTX 650 Ti, и мы выполнили следующий тест SHA2 в Sandra 2014:
DirectX Compute Shader зарегистрировал значительный прирост, но пропускная способность через CUDA просто поражает. Вероятно, в Maxwell была улучшена обработка целочисленных операций, которая медленно выполнялась на Kepler. Надеемся, Nvidia расскажет больше о возможностях новой архитектуры.
LTC Mining
Добыча Bitcoin-ов на CPU и GPU сегодня практически не имеет значения лишь потому, что конкурировать со специализированными ASIC- и FPGA-устройствами просто невозможно. Но, по крайней мере, ещё некоторое время Litecoin остаются жизнеспособным вариантом. Использование скрипта (ключевая функция вывода на основе пароля) в алгоритме proof-of-work вместо Bitcoin SHA-256 усложняет разработку специального оборудования. Так что GPU по-прежнему у руля, даже несмотря на то, что из-за постоянно возникающих трудностей инвестиции в комплектующие часто превышают доходы от майнинга валют.
Исторически сложилось так, что карты Nvidia в конкурентном плане были хуже Radeon, вот почему мы видим, как Radeon R9 290X продаётся по цене $700 и выше. Однако усовершенствования архитектуры Maxwell позволяют 60-ваттной GeForce GTX 750 Ti обогнать 140-ваттную GeForce GTX 660 и приблизиться к Radeon R7 265 (150 Вт), которая после премьеры до сих пор не поступила в продажу, но ожидается по цене $150. По шкале производительности (в кХ/с (kH/s)) на ватт Nvidia выходит вперёд AMD. Сегодня четыре карты с чипами GM107 в системе для майнинга смогут обогнать Radeon R9 290X, при этом вы потратите меньше денег на сами карты и счета за электроэнергию.
LuxMark 2.0
LuxMark – это ещё один оплот AMD, где вычислительная производительность её графических процессоров, как правило, значительно выше, чем у конкурирующих решений Nvidia. Фактически карты Radeon настолько сильно обгоняют Nvidia, что последняя даже не комментирует эти показатели, заявляя лишь, что игровые карты компании не оптимизированы для вычислительных задач.
Но повторимся, для 60-ваттной карты GeForce GTX 750 Ti справилась на “отлично”. Она по-прежнему отстаёт от карт на чипе Bonaire в данном ценовом сегменте. Но сравните её показатель (943) с показателем GeForce GTX 580 (893). Если вы забыли, 580-я модель – это бывший флагман с потребляемой мощностью почти 250 Вт!
RatGPU
Обзор GeForce GTX 750 Ti | Профессиональные приложения
AutoCAD 2013: 2D Performance DirectX (Cadalyst)
Несмотря на близкие результаты всех тестируемых видеокарт, модель с чипом Maxwell продемонстрировала небольшое преимущество. Этот тест показывает, что двухмерные функции больше не осуществляют доступ непосредственно к аппаратному обеспечению (кроме блиттинга и растяжения), ввиду чего узкие места возникают в других компонентах платформы. Тем не менее, производительности хватит на любой случай.
AutoCAD 2013: 3D Performance DirectX (Cadalyst)
У GeForce GTX 750 Ti довольно интересная позиция в Cadalyst 3D. На лицо улучшенная производительность вычислений с одинарной точностью. В конце концов, DirectX использует SP в основном в своих библиотеках, а все вершины и их трансформации приносят пользу чаще всего в этой простой 3D-презентации.
Autodesk Inventor 2013: DirectX
Мы снова используем экстремальную задачу с 1000 кубами. В противовес тому, что мы видели в Cadalyst, GeForce GTX 750 Ti показала себя вполне ожидаемо, учитывая позицию этой карты на рынке.
Maya 2013: OpenGL
И, наконец, у нас есть тест, отражающий производительность OpenGL. Он подразумевает интенсивную вычислительную нагрузку и зависимость от памяти. Дело в том, что теоретическая производительность не отражает реальное поведение, и менее мощные видеокарты часто достигают более высоких результатов, что всегда интересно.
Обзор GeForce GTX 750 Ti | Температура и уровень шума
Температура
Показатели температур мы получаем во время повторяющейся тестовой последовательности Metro: Last Light. Ближе к концу графика вы увидите максимальную температуру в реальных игровых ситуациях. Естественно, в зависимости от игры показатели могут меняться.
Две наших лаборатории проводили тесты в закрытом корпусе формата mid-tower, и выяснилось, что различные версии GeForce GTX 750 Ti отличаются по температуре на 1-2 градуса Цельсия. Даже несмотря на то, что такие карты выводят воздух внутрь корпуса, вместо его выброса через задние слоты ввода/вывода, карта выделяет так мало тепла, что проблемы с ним вряд ли могут возникнуть.
Модель | В простое | В игре |
GeForce GTX 750 Ti Reference | 28 °C | 65 °C |
Gigabyte GTX 750 Windforce OC | 25 °C | 45 °C |
MSI GTX 750 Ti Gaming OC | 26 °C | 54 °C |
Zotac GTX 750 Ti OC | 27 °C | 63 °C |
Графики показывают изменения температуры в динамике. На показатели влияют радиатор, вентиляторы и профиль прошивки вентилятора.
Gigabyte очень агрессивно охлаждает свою карту, и может снижать скорость вращения вентилятора для понижения уровня шума (хотя карту и так не слышно при работе).
Шум
Мы измеряем уровень шума в различных сценариях использования карты, для чего применяем студийный микрофон, откалиброванный для измерения акустических характеристик персональных компьютеров. Микрофон располагается перпендикулярно центру видеокарты на расстоянии 50 см.
Модель | В простое | В игре |
GeForce GTX 750 Ti Reference | 31,5 дБ(А) | 34,1 дБ(А) |
Gigabyte GTX 750 Windforce OC | 31,9 дБ(А) | 33,2 дБ(А) |
MSI GTX 750 Ti Gaming OC | 30,0 дБ(А) | 31,9 дБ(А) |
Zotac GTX 750 Ti OC | 31,1 дБ(А) | 33,0 дБ(А) |
Очень хорошо, что мы получили несколько версий карт GeForce GTX 750 Ti для обзора, поскольку так мы можем произвести измерения продуктов как с большими и мощными кулерами, так и с более скромными решениями (как эталонная модель).
Собственный дизайн Nvidia доказывает, что большой кулер для охлаждения GM107 не требуется. Всё, что нужно, – это маленький радиатор и вентилятор. И в закрытом корпусе вы вряд ли услышите, как работают эти образцы.
Тем не менее, MSI GTX 750 Ti Gaming OC, похоже, предлагает лучший компромисс между тишиной работы и высокой производительностью. Только плохо, что карты MSI и Gigabyte используют такие массивные кулеры. Ведь, учитывая эффективность Maxwell, хотелось бы видеть соответствующие системы охлаждения.
Обзор GeForce GTX 750 Ti | Энергопотребление в играх
Тестовая методика и конфигурация
Мы совершенствуем стенд для измерения энергопотребления в сотрудничестве с HAMEG (Rohde & Schwarz). Сейчас наша конфигурация практически готова.
Мы регистрируем показатели по всем каналам, а значения измерений и графики сохраняются на осциллоскопе. Наш накладной амперметр рассчитан на 100 мВ/А, поэтому мы легко можем определить силу тока на базе измерений напряжения. Позже фактическое напряжение блока питания записывается и умножается на величину полученного тока. В зависимости от выбранного разрешения, данная процедура обеспечивает получение довольно подробных показателей энергопотребления в динамике. Как правило, мы устанавливаем шаг в 1 мс, что позволяет зарегистрировать все колебания, связанные с технологиями AMD PowerTune или Nvidia GPU Boost.
Конфигурация тестового стенда для измерения энергопотребления | |
Конфигурация измерений | Безконтактное измерения постоянного тока в слоте PCIe Безконтактное измерения постоянного тока на внешнем блоке питания PCIe Прямое измерение напряжения 3,3 В / 12 В |
Измерительные устройства | Осциллоскоп: HAMEG HMO 1024 четырёхканальный DSO с фукнций хранения и удалённым управлением через Ethernet Адаптер накладного амперметра: HAMEG HZO50 (1 мА-30 A, 100 кГц, разрешение: 1 мА), Voltcraft VC-511 Зонд: HAMEG HZ154 (1:1, 1:10), разнообразие дополнительных адаптеров Цифровой мультиметр: Voltcraft VC-950 с функцией многоканальной регистрации данных |
Тестовый стенд | Microcool Banchetto 101 |
Тестовая конфигурация | Intel Core i7-3770K (Ivy Bridge), разгон до 4,5 ГГц Жидкостная система охлаждения замкнутого цикла Corsair H100i 16 Гбайт (2 x 8 Гбайт) Corsair Vengeance DDR3-1866 Gigabyte G1 Sniper 3 + модифицированный адаптер PCIe с токовой петлёй |
Блок питания | Corsair AX860i (модифицированные выходы с измерительными ответвлениями) |
Энергопотребление во время прогона игровой последовательности
Нам очень интересно, как Nvidia увеличила эффективность своей архитектуры. Общее энергопотребление карты в среднем (в прогретом состоянии, при полной нагрузке) лишь немного превышает значение теплового пакета GPU. Однако общий показатель включает энергопотребление памяти. Таким образом, Nvidia сдерживает обещание и действительно устанавливает новый стандарт эффективности.
Впервые среднее значение энергопотребления не находится между минимальными и максимальными значениями, а смещено к меньшему показателю. Скачки энергопотребления появляются гораздо реже, но и выражены сильнее. Это важно, поскольку карта питается только через слот PCI Express на системной плате, что повышает требования к качеству платформы.
Поскольку прогон в 170 секунд тяжело отобразить на используемом разрешении, мы взяли 10-секундый отрезок:
Из него видно, как важна скорость измерения при формировании среднего значения энергопотребления. Естественно, мы можем предоставить более точный график, что и сделали далее. Колебания в энергопотреблении демонстрируют нагрузку, с которой придётся справляться вашему блоку питания.
Но как изменится энергопотребление в других сценариях использования карты?
Обзор GeForce GTX 750 Ti | Энергопотребление в простое, при вычислениях и в других ситуациях
GeForce GTX 750 Ti, действительно, заслуживает уважения в плане энергопотребления.
Кстати, из-за изменений в настройках теста, по сравнению с предыдущим разделом, были потеряны два ватта. Хотя мы, как правило, используем наиболее требовательные настройки, для отображения более ярких различий в обзоре мы понизили детализацию до приемлемой частоты кадров. Любопытно, что при таких условиях энергопотребление немного повысилось.
Судя по этим измерениям, Nvidia можно поздравить с существенным повышением эффективности. GeForce GTX 750 Ti действительно избавилась от вспомогательного питания, даже при экстремальных нагрузках
Но, возможно, GeForce GTX 750 Ti оперирует близко к “золотой середине” GM107. Если это так, то эффективность будет страдать при сильном разгоне, приближаясь к небольшому запасу слота PCI Express. Тот факт, что партнёры Nvidia добавляют в конфигурацию шестиконтактные разъёмы питания, говорит о том, что более мощный разгон может обеспечить дополнительную скорость.
Обзор GeForce GTX 750 Ti | Невероятная производительность для карты на 60 Вт
Совсем недавно AMD сделала два объявления. Во-первых, она практически сразу скинула цену на Radeon R7 260X до $120. Во-вторых, была анонсирована Radeon R7 265 по цене $150. Сегодня Radeon R7 260X встречается за $140. А Radeon R7 265 придётся подождать ещё некоторое время.
Итак, GeForce GTX 750 Ti 2 Гбайт, которая уже должна продаваться за $150, действительно даёт отпор Radeon R7 260X и является достойной заменой уходящей GeForce GTX 650 Ti. Опираясь на результаты тестов, мы можем сказать, что новая карта с чипом GM107 быстрее обеих чуть более доступных моделей. По крайней мере, с точки зрения игровых карт, цена Nvidia нам кажется целесообразной, хотя и немного завышенной.
Ситуация на рынке видеокарт сейчас очень нестабильная. Если AMD будет поставлять свою Radeon R7 265 по цене $150, то мы получим гораздо более быструю видеокарту, способную побороться с GeForce GTX 660, которая сейчас стоит примерно $200. Геймеры с не очень мощными блоками питания наверняка найдут привлекательным соотношение производительности на доллар у Radeon R7 265.
Трудно сравнивать GPU на 60 и 150 Вт только по частоте кадров. Необходимо учитывать потребляемую мощность и эффективность. Но мы не очень заостряем внимание на этих значениях, поскольку геймеры редко сильно пекутся о том, сколько денег они заплатят за электричество. Однако характеристики питания являются важнейшим показателем при создании платформ малого форм-фактора, или же если вы обновляете старую систему, или при добыче криптовалюты.
В каждой из описанных ситуаций GeForce GTX 750 Ti превращает увеличение эффективности Maxwell в ощутимые преимущества. Прежде всего, карта имеет компактные размеры. Хотя все рассмотренные сегодня версии занимали два слота расширения, они должны поместиться там, где не поместятся длинные модели. Кроме того, мы надеемся увидеть однослотовые реализации новой модели. И, естественно, рассеивать 60 Вт тепла в компактной игровой платформе гораздо легче.
А что насчёт старых, недорогих систем с интегрированной графикой и блоком питания на 300 Вт? Без дополнительных коннекторов для поддержи современных видеокарт вам либо придётся купить новый блок питания, либо найти графический адаптер, который не требует вспомогательного питания. Раньше под эти нужды подходила Radeon HD 7750. Сейчас её место заняла GeForce GTX 750 Ti.
А как же добыча криптовалюты? Многие видят в ней основной фактор “задирания” цен на видеокарты AMD. В абсолютном выражении GeForce GTX 750 Ti также быстра, как Radeon R7 265. Но повторимся, последняя имеет 150-ваттный GPU. TDP новой карты GeForce составляет всего 40% от этого значения. На материнскую плату можно установить четыре таких карты, и при этом потратить на $100 меньше денег, чем за одну Radeon R9 290X, сэкономив на электроэнергии и добившись более высоких частот хеширования. Будем надеяться, что карты Nvidia Maxwell не пострадают от собственного потенциала в данной дисциплине.
В конце концов, существует ряд ситуаций, когда GeForce GTX 750 Ti нельзя сравнить с другими картами обоих производителей. В других сравнениях карта на GM107 показала себя довольно хорошо, но оценена, просто исходя из правил конкурентной борьбы. Кроме того, вполне возможно, что AMD сможет обеспечить себе хорошие позиции при противостоянии с AMD в плане ценообразования, однако мы скептически настроены в отношении цены и наличия Radeon R7 265.
Но даже если AMD удастся обеспечить поставку необходимого количества Radeon R7 265 по обещанной цене, компания вскоре столкнётся с другими моделями на GPU Maxwell. Если учесть, что продемонстрировал GPU GM107, нам крайне любопытно, на что будет способен графической процессор Nvidia на новой архитектуре с бюджетом мощности 250 Вт.