Введение

Когда nVidia реализовала Quad SLI на GeForce 7900 GX2, компьютерный мир затаил дыхание в предвкушении перспектив четырёх GPU для рендеринга. Но системы были доступны только от OEM-производителей (в России, например, от Kraftway), что несколько разочаровало энтузиастов.
Затем nVidia перепаковала GeForce 7900 GX2 в карты GeForce 7950 GX2. Новый дизайн избавил от нужды в одном мостике SLI и позволил сократить длину плат. Среди других улучшений по сравнению с 7900 GX2 отметим лучшую раскладку модулей памяти, вентиляцию нижней платы и уменьшенный форм-фактор. Выпуск GeForce 7950 GX2 позволил наслаждаться официальным двухпроцессорным графическим решением на одной карте, конечно, если вы могли себе его позволить.
И хотя nVidia разработала продукт для геймеров, которым нужно высокое разрешение и максимальное качество картинки, энтузиасты, любящие собирать своими руками, были незаслуженно оставлены в стороне. Официальные драйверы не поддерживали самосборные системы Quad SLI. Но в июле ситуация изменилась, поскольку для тестеров, OEM-производителей и системных интеграторов была предложена бета-версия драйверов ForceWare 91.33, которая утекла и в широкие массы.
Хотя драйвер не получил сертификацию Windows Hardware Quality Labs (WHQL), он прекрасно установился в нашу систему и дал результаты, сравнимые с тестированием Quad SLI на GeForce 7900 GX2. Кстати, в конце прошлой недели вышла версия драйверов Quad SLI 91.45, которую мы протестируем в ближайшем будущем.
Предыдущие проблемы с Quad SLI

Если вы помните выход на рынок решения Quad SLI и нашу статью, то знаете, что с конфигурацией на материнской плате Asus A8N32-SLI и видеокартами GeForce 7900 GX2 появились определённые проблемы. В некоторых тестах мы получали «голубой экран», а иногда система просто «повисала». Проблемы были и у материнской платы Asus A8N32-SLI, поскольку настройки BIOS не позволяли запустить HyperTransport с нужными шириной канала и множителями. Да и несколько версий драйверов так и не смогли решить выявленных проблем. В итоге мы собрали сравнимую тестовую платформу, на которой без проблем прошло большинство игровых тестов, а «зависания» в 3DMark05 прекратились.
Как и в случае ATi, на web-сайте nVidia приводятся только WHQL-сертифицированные драйверы. Бета-версии драйверов на обычной странице скачивания отсутствуют, чтобы не вводить в искушение неопытных пользователей. До сих пор конфигурации Quad SLI не поддерживались через WHQL-драйверы или бета-версии. Ситуацию изменил драйвер ForceWare 91.33, появившийся на сайте nZone, но в документации драйвера не присутствовало никакого упоминания о поддержке Quad SLI на картах GeForce 7950GX2.

Тем не менее, драйвер всё же позволил провести некоторые предварительные тесты, и мы смогли посмотреть, какие улучшения произошли с момента выхода GeForce 7900 GX2 в режим Quad SLI. У нас по-прежнему время от времени появлялись проблемы в Oblivion, причём в разных местах, но тесты мы завершить смогли.
Тестовая конфигурация и результаты тестов
| Системное аппаратное обеспечение | |
| Процессор | AMD Athlon 64 FX-60, 2,6 ГГц, 1,0 ГГц HTT, 1 Мбайт кэша L2 |
| Платформа | Asus AN832-SLI Premium, nVidia nForce4 SLI, версия BIOS 1205 |
| Память | Corsair CMX1024-4400Pro, 2x 1024 Мбайт @ DDR400 (CL3,0-4-4-8) |
| Жёсткий диск | Western Digital Raptor, WD1500ADFD, 150 Гбайт, 10 000 об/мин, кэш 16 Мбайт, SATA/150 |
| Сеть | Встроенная nForce4 Ethernet 1 Гбит/с |
| Видеокарты | XFX GeForce 7950 GX2 1 Гбайт (2 x 512 Мбайт) GDDR3, ядро 570 МГц, память 700 МГц (1,4 ГГц DDR) Sparkle GeForce 7950 GX2 1 Гбайт (2 x 512 Мбайт) GDDR3, ядро 570 МГц, память 700 МГц (1,4 ГГц DDR) эталонная nVidia GeForce 7900 GTX 512 Мбайт GDDR3, ядро 675 МГц, память 820 МГц (1,64 ГГц DDR) PowerColor Radeon X1900 XTX 512 Мбайт GDDR3, ядро 650 МГц, память 775 МГц (1,55 ГГц DDR) |
| Блок питания | PC Power & Cooling Turbo-Cool 1000 Вт |
| Системное ПО и драйверы | |
| ОС | Microsoft Windows XP Professional 5.10.2600, Service Pack 2 |
| Версия DirectX | 9.0c (4.09.0000.0904) |
| Драйвер платформы | nForce 6.70 |
| Графический драйвер | ATi Catalyst 6.6 WHQL nVidia ForceWare 91.33 не-WHQL (только для 7950 GX2) nVidia ForceWare 84.21 WHQL |
| Готовые системы | |
| Falcon Northwest Mach V | AMD Athlon 64 FX-60 (разгон до 3,0 ГГц), 2 Гбайт памяти, 2x nVidia GeForce 7900 GX2 (Quad SLI) |
| Monarch Hornet Revenge | AMD Athlon 64 FX-60 (2,8 ГГц), 2 Гбайт памяти, 2x EVGA UberClock GeForce 7900 GTX (SLI) |
| CyberPower PC Ultimate SLI Quad | AMD Athlon 64 FX-60 (2,8 ГГц), 2 Гбайт памяти, 2x nVidia GeForce 7900 GX2 (Quad SLI) |
3DMark05


3DMark05 не кажется полностью оптимизированным в драйвере 91.33 для Quad SLI на GeForce 7950 GX2. Система проигрывает традиционным конфигурациям SLI и даже GeForce 7950 GX2. Да и одиночные решения Radeon X1900 XTX и GeForce 7900 GTX не очень-то отстают. Включение сглаживания 4x и анизотропной фильтрации 8x позволяет оторваться от одиночных карт, но не особо. Что интересно, оригинальная GeForce 7900 GX2 в режиме Quad-SLI в системе CyberPower Systems Ultimate SLI Quad работает примерно на том же уровне и с бета-драйверами Quad SLI. Ситуация понятна: драйверы ещё не слишком хорошо отлажены, поэтому система Monarch Hornet с разогнанной картой EVGA GeForce заметно обходит Quad-системы.
Doom 3


В Doom 3 мы наблюдаем иную картину, когда конфигурации SLI и Quad SLI упираются в процессор AMD Athlon FX-60. Результаты с отключённым сглаживанием очень близки на всех разрешениях, то же самое прослеживается и после включения сглаживания. Результаты SLI GeForce 7900 GTX в системе Monarch показывают, что пока система Quad SLI ещё не готова продемонстрировать всю свою мощь.
Half-Life 2: Lost Coast


В Half-Life 2, как и в Doom 3, видеокартам не хватает ресурсов системы и CPU. Все карты позволяют играть в Half-Life 2 и во все варианты Counter-Strike Source и Episode 1 на разрешении 1600×1200 со сглаживанием 4x, анизотропной фильтрацией 8x и HDR-рендерингом (в случае nVidia HDR-рендеринг вместе с фильтрацией не поддерживается). К сожалению, карты Quad SLI GeForce 7950 GX2 показали себя хуже, чем предыдущий вариант Quad SLI на картах GeForce 7900 GX2, а также существенно хуже одиночной карты Radeon X1900 XTX. В зависимости от уровня качества картинки, одиночная карта GeForce 7900 GTX выходит вперёд в большинстве разрешений, за исключением 2048×1536 и 2560×1600 с включёнными сглаживанием и анизотропной фильтрацией.
Black & White 2


Картам nVidia в Black & White 2 обычно приходилось туговато. GeForce 7900 GTX в режиме SLI оказывается победителем, но одиночная карта Radeon X1900 XTX очень неплохо себя показывает по сравнению с другими картами и конфигурациями. Именно здесь B&W 2 и будущие игры с хорошим использованием пиксельных шейдеров показывают силу большого числа пиксельных блоков. Здесь же мы должны увидеть всю мощь будущего ядра с унифицированными шейдерами, которое позволяет выделять при необходимости пиксельные блоки. А nVidia следует провести в драйверах дальнейшие оптимизации.
F.E.A.R.


Разогнанная система Falcon Northwest System показывает, что более скоростной центральный процессор позволяет Quad SLI выделиться среди других конфигураций. Хотя, как мы видим, одиночные GeForce 7900 GTX и Radeon X1900 XTX весьма неплохо себя показывают в низких разрешениях, в которых играет большинство геймеров. Переход на более высокие разрешения позволяет проявить многопроцессорные графические решения, а Quad SLI GeForce 7950 GX2 выигрывает 7 fps по сравнению с другими Quad-системами. Но победа не слишком убедительная. Будем надеяться, в будущих версиях драйверов производительность систем Quad SLI улучшится.
Oblivion


Эта игра способна «поставить на колени» даже Quad-системы. Только разогнанные карты GeForce 7900 GTX и система Quad SLI GeForce 7950 GX2 смогли выдать в разрешении 1600×1200 больше 30 fps. Все остальные карты показали результаты хуже. Но следует заметить, что одна GeForce 7950 GX2 показала почти такую же хорошую производительность, как две карты в Quad SLI
Заключение по тестированию

Результаты GeForce 7950GX2 в режиме Quad SLI не слишком-то радуют. Стоят они немало, а производительность оказывается меньше, чем того хотелось бы. С нынешними драйверами два графических процессора в одной карте GeForce 7950X2 вполне могут сравниться с четырьмя в режиме Quad.
Возможно, для nVidia имело бы смысл отложить выход драйвера WHQL Quad ещё на более позднее время, пока производительность не окажется достойной. Мы надеемся в скором времени получить результаты тестов на системах Conroe, которые позволят оценить, может ли новая микро-архитектура Intel дать прирост производительности карт Quad.
Пока же системы Quad SLI нужны больше для имиджа. Когда в наших тестах одиночные карты Radeon X1900 XTX или GeForce 7900 GTX показывают весьма достойные результаты, система Quad кажется ещё не такой заматеревшей. Опять же, возможно nVidia слишком уж поспешила с выходом четырёх карт на рынок. ATi готовится к выпуску ещё одной видеокарты, так что в перспективах Quad невольно начинаешь сомневаться. По крайней мере, пока. Что ж, время покажет.
P.S. Из-за низких результатов мы немного задержали выход этого материала. Мы хотели получить комментарии от nVidia и мнения экспертов, которые приведены дальше в нашей статье. Ниже мы также попытаемся разобраться в причинах такой низкой производительности.
Решение для избранных

На прошлой неделе на одном из сайтов фанатов nVidia была выложена информация о том, как включить режим Quad SLI на обычном драйвере. Но результаты производительности системы Quad SLI с драйвером 91.33 нас смутили. Действительно, самое мощное графическое решение на рынке должно просто порвать конкурентов, но этого почему-то не случилось.
Лишь немногие игры в нашем тестовом пакете показали хорошую масштабируемость в Quad SLI. Но для этого следует использовать высокие разрешения и опции улучшения качества картинки: полноэкранное сглаживание и анизотропную фильтрацию. На низких же разрешениях и с базовым качеством Quad SLI себя показывает не очень.
В конце прошлой недели nVidia достаточно быстро отреагировала на эту новость. Мы получили новое руководство для обозревателей, где пояснялись причины не всегда высокой производительности Quad SLI. nVidia убедила нас в том, что компания сделает ряд шагов для улучшения производительности Quad SLI и перенесёт многопроцессорную графику на новый уровень.

Было подчёркнуто, что «Quad SLI нацелена на определённую аудиторию пользователей, которым требуется самое высокое качество рендеринга на экстремальных разрешениях. Пользователи Quad SLI, по сути, больше всего заинтересованы в фантастическом качестве картинки при высоких разрешениях». nVidia представила график рыночного спроса, на котором как раз и показала, где предполагается появление энтузиастов Quad SLI. Вряд ли мы будем спорить, что рынок Quad SLI предназначен как раз для экстремалов.
В данной статье мы хотели бы объяснить разницу в производительности системы Quad SLI против одно- и двухпроцессорных графических решений.
Quad SLI теперь работает

nVidia указывает, что «технология Quad SLI теперь доступна рынку энтузиастов и самосборщиков на основе двух видеокарт GeForce 7950 GX2, которые короче по длине, поэтому их будет проще установить во многие пользовательские ПК». Бета-тестирование началось в конце июля, причём в тестировании участвовало сообщество энтузиастов. nVidia выпустила официальную бета-версию драйвера 91.37, которую и порекомендовала энтузиастам и тестерам. nVidia желала получить ответ от сообщества и выявленные ошибки. 9 августа nVidia выпустила последний драйвер Quad SLI 91.45, который мы протестируем в ближайшем будущем.

Для драйверов Quad SLI на сайте появился свой раздел.
Судя по различной информации, включая новую документацию, nVidia соглашается с тем, что производительность Quad SLI отличается от традиционной двухкарточной SLI от приложения к приложению. Если Quad SLI нацелена на высокое разрешение и глубокое погружение в игру с высоким качеством картинки, то некоторые приложения на Quad SLI работают медленнее, чем на системах с одной или двумя видеокартами.
nVidia в руководстве отмечает, что «Quad SLI разработана для экстремальных геймеров: HD 2560×1600 с высокими уровнями полноэкранного сглаживания и фильтрации (а именно 8x SLI-AA и 16X-AF). На разрешениях ниже 1920×1200 и с низкими настройками фильтрации производительность упирается в CPU, и Quad SLI может работать чуть медленнее стандартной конфигурации SLI из-за дополнительной расчётной нагрузки четырёх GPU».
Собственно, в нашем обзоре первых систем Quad SLI от OEM-производителей мы уже делали соответствующие выводы. Для обычного геймера, которых процентов так 95% от общей массы, система Quad SLI лежит в запредельном ценовом диапазоне, да и большинство геймеров играют с разрешением ниже 1600×1200. Хардкорные и профессиональные геймеры обычно предпочитают максимальную скорость, поэтому выбирают низкие разрешения и низкое качество картинки для повышения реакции и точности в играх.
Самосборные системы Quad-SLI подойдут далеко не для всех, и тем более не для сборки компьютера в первый раз. Следует очень внимательно относиться к качеству «железа» и надёжности драйверов, а также установить мощный процессор, чтобы он справлялся с четырьмя видеокартами.
Задержки и рабочая нагрузка

Для оценки чистой производительности nVidia указывает четыре ключевые версии процессов рендеринга на четырёх GPU: AFR, SFR, AFR of SFR и однопроцессорную работу. Первый режим расшифровывается как Alternative Frame Rendering (AFR). nVidia использует режим AFR для увеличения частоты кадров. Кадры выбираются четвёрками и распределяются, соответственно, каждая на свой графический процессор. Звучит фантастически, но в некоторых приложениях Direct3D этот режим не работает. Как указывает nVidia, «DirectX 9 не поддерживает очередь достаточного числа задних буферов для эффективной поддержки высокопроизводительного режима 4-way AFR, а GPU у 7950 GX2 работают на чуть меньшей тактовой частоте, чем у стандартной GeForce 7900 GTX».
Менеджер nVidia по линейке SLI Крис Даниэл (Chris Daniel) в своём интервью утверждал, что «если не считать режимы сглаживания SLI, например, 2560×1600 на 4xAA/8xAF, то преимущества Quad-SLI будут существенны в играх OpenGL, но менее заметны в играх Direct3D. Получается, что DX9 не поддерживает очередь достаточного числа кадров со стандартным подходом к программированию API D3D, необходимым для сертификации WHQL, чтобы поддерживать высокопроизводительный режим 4-way AFR на системах Quad SLI. Поэтому во многих играх D3D Quad SLI использует режим «AFR of SFR». В будущем, когда выйдет DirectX 10, мы предполагаем такую же эффективную работу 4-way AFR, как у приложений OpenGL на сегодняшний день».
Чтобы прояснить ситуацию, отметим, что роль переднего буфера заключается в отсылке завершённых кадров на экран, а задний буфер содержит кадры с различным уровнем просчёта. Неприятности начинаются с режимом AFR и четырьмя графическими процессорами. Дело в том, что задний буфер может содержать, максимум, три кадра, то есть один графический процессор будет простаивать без работы. Если Direct 3D не может предоставить Quad-системе очередь нужного размера, то GPU будут готовы к большему количеству работы, но CPU дать её просто не может. Именно поэтому производительность упирается в CPU. С подобным ограничением производительность не будет эффективно масштабироваться по мере увеличения числа GPU. Действительно, сегодня есть преимущество четырёх графических процессоров против двух, но оно составляет далеко не 100%. В некоторых случаях даже 30% не получается.
Как nVidia указала раньше, есть проблема и с рабочей вычислительной нагрузкой. Нужно загрузить очередь большим числом кадров. Распределение работы между четырьмя процессорами вносит свои задержки. На прилагаемой диаграмме видно, как nVidia обозначила задержки в графическом виде. Если пойти дальше, то по мере снижения эффективности масштабирования (scaling) задержки на кадр увеличиваются. Таким образом, в определённый момент мы получим меньшую частоту кадров, чем на двухпроцессорной SLI или на одной видеокарте. Чтобы обеспечивать высокую производительность Quad-SLI, nVidia приходится постоянно контролировать задержки.
В приложениях Open GL 4-way AFR работает эффективно

Как сказал Крист Даниэл, проблемы с задним буфером в приложениях Direct 3D под OpenGL не проявляются. Поэтому игры на основе API OpenGL должны масштабироваться лучше, не так ли? Не всегда, поскольку есть ограничения, не связанные с API.
Перенос в очередь большего числа кадров не означает, что вы сразу же получите лучшую производительность. Большее число кадров в очереди означает, что нужно управлять большим количеством информации и больше задач просчитывать. Поскольку первый кадр система должна выдать перед вторым, второй перед третьим и т.д., то могут возникнуть задержки. Если перенести управление кадрами на CPU, то мы можем попросту его перегрузить. Не забывайте, что с одной и двумя видеокартами процессор уже достаточно загружен. Что уж говорить про четыре GPU?
Хорошо, ну а как насчёт режима, когда два кадра просчитываются четырьмя процессорами? То есть «AFR of SFR»? nVidia указывает, что «система Quad SLI по умолчанию во многих приложениях D3D использует режим «AFR of SFR», он хорошо работает в некоторых D3D-играх, но в других уже не так эффективен». Если использовать два GPU, то кадр разбивается на две части, каждая из которых просчитывается своим процессором. Для каждого кадра приходится рассчитывать все вершины, лишь часть из которых будет использоваться. В итоге мы увеличиваем нагрузку на обе карты. Эту нагрузку нельзя назвать эффективной, но она необходима для правильного рендеринга кадров. Чтобы нагрузка распределялась правильно, кому-то нужно управлять всем этим процессом, что тоже приводит к увеличению вычислительной нагрузки, связанной с управлением.
Возможно, именно поэтому некоторые игры не столь хорошо масштабируются. Режим AFR of SFR хорошо работает в Far Cry и F.E.A.R., но далеко не идеально, скажем, в Black and White 2 или играх на движке Source Engine.
nVidia упоминает, что сначала в игре пробуется режим AFR, затем AFR of SFR, затем традиционный режим SLI и, если профиля SLI нет, то Quad SLI переходит на однопроцессорную работу. Большинство приложений OpenGL работают в режиме AFR, большинство приложений Direct 3D — в режиме AFR of SFR, некоторые в двухпроцессорном режиме SLI, а редкие старые игры без профиля SLI будут работать с Quad SLI как с одной видеокартой. И хотя вопрос, какая игра в каком режиме работает, по-прежнему интересует многих пользователей, ответить на него можно. Достаточно посмотреть XML-файл в каталоге с драйвером.
Заключение

Всё началось с тестирования Quad SLI с бета-драйвером 91.33, доступным на сайте nVidia для энтузиастов где-то с месяц. И с вопросов, которые возникли после тестирования. Почему мы всё это затеяли? Да потому, что уже около месяца можно самому собрать конфигурацию Quad SLI. Если вложить $1300 в видеокарты, $1600 в 30″ панель и ещё сколько-то денег в мощный процессор. Тогда вы сможете выжать максимум из Quad SLI.
Мы провели этот эксперимент, чтобы показать возможности сборки Quad SLI своими руками. Да и преследовали свои цели. Действительно, нам было очень интересно узнать, возникнут ли проблемы с работой четырёх графических процессоров? Если не придираться к производительности, то проблемы не возникли. nVidia успешно использует профили приложений, причём иногда лучше конкурентов. Будем надеяться, что дальнейшие улучшения драйверов позволят сделать игры быстрее, красивее и лучше.
nVidia предполагает, что пользователь будет запускать Quad SLI с высокими уровнями сглаживания: «Мы настоятельно рекомендуем тестировать Quad SLI в режиме 8xSLI AA и 16xAF на разрешении 2560×1600, что прекрасно подходит ко многим играм. Если требуется меньшее разрешение и/или меньшие уровни фильтрации в приложениях D3D, мы рекомендуем использовать 7900 GTX в режиме SLI».
В выпуске Quad есть свой смысл. По мере увеличения качества картинки число кадров в секунду падает, и Quad SLI тогда действительно может «поиграть мускулами». Некоторые сравнивают Quad SLI с машиной Hummer H1. Здоровый джип, стоит дорого и потребляет уйму бензина по сравнению с полноприводными или даже спортивными машинами. Да, Quad плохо подходит для низких разрешений и низкого качества картинки, но и H1 покупают отнюдь не из целей простого перемещения из точки A в точку B. Дайте H1 горную дорогу или песок пустыни. Или съездите на сафари. Так что Quad SLI тоже хороша для определённой работы.
Но, как уже говорилось, мы всё же ждём дальнейшего прироста производительности. Мы понимаем, что многопроцессорные графические конфигурации упираются в CPU по разным причинам, но у Quad SLI всё же остаются нарекания там, где это решение должно просто уйти в отрыв.
В общем, Quad SLI пока находится в младенческом состоянии, как когда-то были SLI и CrossFire. На доработку уйдёт некоторое время. Будем надеяться, что ожидание будет недолгим, и nVidia сможет быстро и эффективно убрать все ограничения, ведь производительность нужна всем. И не забывайте, чем лучше будут работать high-end решения, тем лучше окажутся и карты для массового рынка.
Мы планируем провести тесты с последним драйвером 91.45, который должен стать следующим WHQL-кандидатом. Тогда мы сможем посмотреть, какие произошли улучшения. Мы знаем, что сейчас в разработке находится ещё один драйвер, который должен ещё больше увеличить производительность. А пока выбирайте то, что лучше подходит вашим нуждам.