Введение
12 000 баллов в 3DMark 2003. Результат больше 60 000 в AquaMark 3. Более 60 fps в Halo на разрешении 1600×1200 и больше 50 fps в FarCry при включении усиленного FSAA и анизотропной фильтрации 4-tap на разрешении 1024×768. Подобные показатели впечатлят любого энтузиаста в мире ПК.
Нам придётся обратиться к истории 3D-графики, чтобы оценить схожие “прорывы” производительности. Возможно, переход с 3dfx Voodoo 1 на Voodoo 2 близок по величине. Или переход с nVidia TNT2 на GeForce 256 DDR, или, возможно, переход с ATi Radeon 8500 на 9700 Pro… Но давайте обо всём по порядку.
С выпуском GeForce 6800, первого чипа линейки графических процессоров NV4x, nVidia пытается заставить всех забыть о прошедшем годе. Как вы помните, год назад nVidia выпустила нового флагмана – GeForce FX 5800 Ultra под кодовым названием NV30. По сравнению с конкурентами, эта карта произвела не слишком хорошее впечатление по 3D-производительности. К тому же, с самого начала её преследовали проблемы высокого тепловыделения, что обусловило использование экстравагантного и очень громкого кулера, в шутку названного “пылесосом”. Кроме этого, возникли споры по поводу низкого качество картинки, сомнительных оптимизаций драйверов nVidia и пониженной точности вычисления программ-шейдеров. Поскольку вся последовавшая линейка продуктов базировалась на том же дизайне, другие модели испытывали те же самые проблемы. Архитектуру NV30 и дизайн ни в коем случае нельзя считать плохими – в теории они выглядят очень достойно и в некоторых отношениях даже превосходят спецификации Microsoft DirectX 9. Однако оказалось, что игровым разработчиком трудно создавать код, который бы использовал новые возможности. Наконец, производительность стандартного кода шейдеров, откомпилированного на Microsoft HLSL, была не оптимальной.
Старое и новое поколение: NV40 (слева) в сравнении с RIVA TNT (NV4). Другими словами, 222 миллиона транзисторов слева и 7 миллионов – справа.
nVidia, понимая суть проблемы, всего через несколько месяцев выпустила замену. Хотя новая карта FX 5900 (NV35) и решала многие проблемы FX 5800, но даже она встретила очень серьёзную конкуренцию со стороны карт ATi Radeon 9800. Казалось, каждую карту, выпущенную nVidia, ATi сразу же контратаковала своей версией на дизайне R300. Причём, весьма успешно.
Вернёмся к настоящему. До сего дня конкурентами в high-end секторе были карты FX 5950 Ultra (NV38) от nVidia и Radeon 9800XT (R360) от ATi. Что касается производительности, то nVidia смогла максимально использовать весь потенциал карты – благодаря частому совершенствованию драйверов. Но ATi всё так же лидировала по производительности и качеству картинки, поскольку карты компании использовали лучшую реализацию полноэкранного сглаживания и, чаще всего, обеспечивали лучшее визуальное качество в играх с шейдерами.
Новый дизайн NV4x должен кардинально изменить ситуацию. Первая карта, базирующаяся на новом дизайне, – это GeForce 6800 Ultra. Она с лёгкостью оставляет в тени свою предшественницу FX 5950 Ultra в любой категории – и не только теоретически!
NV40 или GeForce 6800 Ultra
Представляем GeForce 6800 Ultra. В отличие от изначальных планов, AGP-версия карты, которая должна выйти первой, использует двухслотовый кулер.
Быстрый взгляд на технические спецификации GeForce 6800 Ultra (NV40) заставит учащённо биться сердце любого геймера: 222 миллиона транзисторов, 16 “настоящих” пиксельных конвейеров в суперскалярном дизайне, полная производительность при использовании 32-битной точности с плавающей запятой, пиксельные и вершинные программы-шейдеры 3.0, шесть блоков вершинных программ (600 миллионов полигонов в секунду), встроенный процессор видео, аппаратно поддерживающий кодирование и декодирование MPEG, память GDDR3 с пропускной способностью 35,2 Гбайт/с, сглаживание методом поворота сетки (rotated grid), анизотропная фильтрация вплоть до 16x, настоящая трилинейная фильтрация при необходимости – и это только начало.
nVidia обещает следующий прирост производительности по сравнению с NV35/38:
- 4-8x производительность шейдеров с плавающей запятой;
- 4x производительность обработки теней;
- 4x эффективность отсечения скрытых поверхностей;
- 2x производительность вершинных программ;
- ~2x пропускная способность кадрового буфера.
Если вы думаете, что PR-отдел nVidia высосал прирост производительности из пальца, дождитесь результатов нашего тестирования далее в статье. Скажем сразу, скорость работы карты вполне убедительна.
Сравнение GeForce 6800 Ultra с другими топовыми продуктами
ATi Radeon 9800 XT | nVidia GeForceFX 5950 Ultra | nVidia GeForce 6800 Ultra | |
Кодовое название | R360 | NV38 | NV40 |
Технология чипа | 256 бит | 256 бит | 256 бит |
Техпроцесс | 0,15 мкм | 0,13 мкм | 0,13 мкм |
Число транзисторов | ~107 млн. (?) | 130 млн. | 222 млн. |
Шина памяти | 256 бит GDDR | 256 бит GDDR | 256 бит GDDR3 |
Пропускная способность | 23,4 Гбайт/с | 30,4 Гбайт/с | 35,2 Гбайт/с |
Пиксельная скорость заполнения | 3,04 Гигапиксель/с | – Texelrate (Color+Z): 1900 тексель/с – Z-rate (Z): 3800/с – Stencilrate: 3800/c – Texturerate: 3800/c |
неизвестна |
Макс. режим FSAA | 6x | 4x / 4xMS+2xSS | 4x / 4xMS+2xSS |
Скорость трансформации треугольников | 412 M Треугольник/с | 356 M Треугольник/с | 600 M Треугольник/с |
Шина AGP | 2x/4x/8x | 2x/4x/8x | 2x/4x/8x |
Память | 256 Мбайт | 128/256 Мбайт | 128/256/512 Мбайт |
Частота GPU | 412 МГц | 475 МГц | 400 МГц |
Частота памяти | 365 МГц (730 DDR) | 475 МГц (950 DDR) | 550 МГц (1100 DDR) |
Память (на эталонной плате) |
Hynix BGA сертифицирована на 400 МГц | аSamsung 600 МГц GDDR | |
Число блоков вершинных программ | 4 | Массив FP | 6 |
Число пиксельных конвейеров | 8×1 | 4×2 / 8×0 | 16×1 / 32×0 |
Текстурных блоков на конвейер | 1 | 2 | 1 |
Текстур на текстурный блок | 8 | 16 | неизвестно |
Версия вершинных программ | 2 | 2.0 | 3.0 |
Версия пиксельных программ | 2 | 2.0 | 3.0 |
Поколение DirectX | 9.0 | 9.0 | 9.0c |
Режимы FSAA | Мультисэмплинг | Мультисэмплинг Суперсэмплинг – смешанный режим |
Мультисэмплинг Суперсэмплинг – смешанный режим |
Оптимизация памяти | Hyper Z III+ | Оптимизированная LMA II Цветовое сжатие |
Оптимизированная LMA III Цветовое сжатие |
Оптимизации | SmartShader 2.1 SmoothVision 2.1 |
IntelliSample HCT | IntelliSample 3.0 |
Число выходов на дисплей | 2 | 2 | 2 |
Внутренние RAMDAC | 2 x 400 МГц | 2 x 400 МГц | 2 x 400 МГц |
Внешние RAMDAC | – | – | – |
Число битов на цветовой канал | 10 | 10 | 10 |
Дополнительно | ТВ-кодер на чипе; FullStream адаптивная фильтрация F-Buffer |
ТВ-кодер на чипе; расширенная программируемость адаптивная фильтрация UltraShadow |
Видеопроцессор и ТВ-кодер на чипе; расширенная программируемость адаптивная фильтрация, настоящая трилинейная фильтрация UltraShadow |
Цена на момент выхода | $499 (старая цена) | $499 (старая цена) | $499 |
Розничная цена (уточняйте по price.ru) | ~ $365 | ~ $379 |
Аппаратное содержание
Графический процессор NV40. Несложно увидеть, что мы использовали инженерный образец.
Поскольку число транзисторов нового графического процессора достигает 222 миллионов, GeForce 6800 Ultra легко побивает рекорд самого большого количества транзисторов для чипа потребительского рынка. Сегодня high-end графические процессоры типа NV38 и R360 имеют примерно в два раза меньшее число транзисторов. Для сравнения, процессор Pentium 4 EE имеет “всего” 178 миллионов транзисторов – из них 149 миллионов составляют 2 Мбайт кэша L2! Само же ядро процессора состоит всего из 29 миллионов транзисторов! Подобный “бегемот” в мире чипов производится для nVidia компанией IBM по техпроцессу 0,13 мкм.
Карта GeForce 6800 Ultra имеет ту же длину, что и GeForce FX 5950 Ultra. Даже вес практически одинаков (~460 грамм). Несмотря на массивный внешний вид, радиатор весит меньше, чем вы могли бы подумать.
Карта GeForce 6800 Ultra, вид сзади. Все восемь 256-Мбит чипов памяти GDDR3 расположены на лицевой стороне карты, что оставляет достаточно места для монтажа ещё 256 Мбайт! Если вы внимательно посмотрите, то справа от порта AGP карта была доработана вручную (катушка и зелёный кабель). Причиной является изменённое в последний момент напряжение питания вентилятора. Похоже, nVidia не была удовлетворена стандартной скоростью и уровнем шума вентилятора.
По своей природе NV40 является чипом AGP, но он разработан уже с учётом его использования в паре с мостом nVidia HSI PCI Express. Этот мост позволяет передавать данные по шине AGP со скоростью до 16x (4,2 Гбайт/с) между графическим процессором и мостом, что, как надеется nVidia, компенсирует недостаток пропускной способности по сравнению с “родными” решениями PCI Express. Дополнительную информацию о работе моста HSI вы можете получить из следующей нашей статьи. Выпуск NV30 оказался слишком рискованным – ведь чип использовал одновременно несколько новых, не отработанных технологий, среди которых память DDR2 и 0,13-мкм техпроцесс. И nVidia, похоже, усвоила этот урок, решив на этот раз вести более безопасную игру. Поэтому NV40 использует проверенный интерфейс AGP. Остальные карты семейства NV4x будут “родными” чипами PCI Express, то есть их AGP-аналоги будут тоже использовать мост HSI, который теперь будет переводить интерфейс PCI Express чипа в AGP.
Чип GeForce 6800 Ultra работает на частоте 400 МГц, а частота памяти составляет 550 МГц (1,1 ГГц DDR). В результате, карта GF 6800 Ultra стала второй моделью nVidia, использующей память GDDR3 – она следует по стопам FX 5700 Ultra, которую мы рассматривали здесь. Собственно, поэтому GeForce 6800 имеет потрясающую пропускную способность памяти – 35,2 Гбайт/с. Модули памяти Samsung нашей карты имели спецификацию 600 МГц, так что у любителей “разгона” есть шансы. Поскольку Samsung не производит модули на 550 МГц вообще, то есть хорошие перспективы появления розничных версий карты тоже с памятью 600 МГц.
Чипы памяти GDDR3 сертифицированы на частоту до 600 МГц. Так что у оверклокеров есть определённый запас.
Тепловая трубка отводит тепло от чипов памяти на массивный радиатор.
nVidia вновь решила использовать для охлаждения GeForce 6800 Ultra массивный кулер, который занимает два слота. Конечно, партнёры компании наверняка решат использовать системы охлаждения собственных дизайнов. Во время загрузки вентилятор карты вращается на максимальных оборотах, и его отчётливо слышно. После инициализации драйвера скорость вращения вентилятора понижается, в результате чего уровень шума уменьшается до показателей GF FX 5950 Ultra. Изначально nVidia планировала выпустить карту с кулером, занимающим один слот, но решение было изменено буквально в последний момент. Кулер на два слота значительно улучшает эффективность охлаждения и снижает уровень шума. Наконец, в материнских платах с AGP подобный размер вряд ли будет критичен.
Под крышкой кулера скрывается большой радиатор. В верхней его части можно заметить тепловую трубку. Она охлаждает модули памяти.
Кулер карты состоит из трёх основных элементов.
Радиатор графического процессора.
Пока мы предаёмся гигантомании, отметим высокое энергопотребление GF 6800 Ultra. Карта использует два дополнительных разъёма питания. nVidia рекомендует, чтобы к каждому из них подключался четырёхконтактный кабель питания, идущий напрямую от блока питания, без подключения других устройств (за исключением вентиляторов). То есть каждый из разъёмов требует отдельного кабеля питания – и подключать надо оба. В результате у пользователей могут возникнуть проблемы – ведь многие блоки питания дают всего три независимых кабеля питания ATX. В результате, для всех остальных устройств в системе, типа жёстких дисков, оптических приводов и т.д., остаётся всего один кабель.
Для “кормления” этого “бегемота” из 222 миллионов транзисторов nVidia настоятельно рекомендует использовать блок питания с минимальной мощностью 480 ватт. По данным nVidia, 6800 Ultra потребляет около 110 Вт, 2/3 из которых уходят на графический процессор. В результате его энергопотребление оказывается примерно на 25% выше, чем у GeForce FX 5950 Ultra. Посмотрим, настолько ли высоко энергопотребление чипа на самом деле. Вероятно, решение использовать мощный блок питания обусловлено тем, что системам с 6800 Ultra необходим блок питания с четырьмя кабелям. Вполне очевидно, что мощные блоки питания удовлетворяют этому требованию.
Каждый из двух разъёмов molex требует подключения отдельного кабеля питания. Расположение разъёмов может вызвать проблемы при установке длинной карты в некоторых корпусах ATX.
Стабилизаторы питания имеют свой радиатор.
В дополнение к GeForce 6800 Ultra, nVidia планирует выпуск карты GeForce 6800. Она будет идентична Ultra по возможностям, за исключением всего 12 пиксельных конвейеров, одного разъёма molex и кулера, занимающего один слот.
Цены:
- 6800 Ultra, $499, 16 конвейеров, два разъёма Molex, два слота, 400/550
- 6800, $299, 12 конвейеров, один разъём Molex, один слот, TBD
Cine FX 3.0
Новая и улучшенная архитектура CineFX 3.0 является основой для целого семейства графических процессоров, которые появятся на рынке в ближайшие месяцы. На данный момент NV40 – флагман этого семейства. nVidia сконцентрировала немалые усилия на придании архитектуре хорошей масштабируемости. Поэтому компоненты чипа можно использовать как, своего рода, “кирпичики” – несколько из них будут присутствовать в картах начального уровня, в более дорогих продуктах их будет больше.
Все карты семейства NV4x будут иметь одинаковый набор возможностей – по крайней мере, что касается функций DirectX 9. Растровые конвейеры ROP (raster operations pipes) карт начального уровня и продуктов для массового рынка будут, скорее всего, урезаны. Но вполне уверенно можно утверждать, что новые модели будут оснащены упрощёнными вершинными блоками и пиксельными конвейерами. В конце концов, число транзисторов напрямую влияет на себестоимость чипа, следовательно, и на розничную цену – а в данных сегментах рынка цена является важным фактором.
Движок обработки пикселей
Схема графического процессора GeForce 6800.
Архитектура движка пиксельных программ NV40 подверглась практически полному пересмотру – с предшествующей архитектурой здесь мало общего. После длительных обсуждений спецификаций пиксельного конвейера NV35/38 в прошлом году, nVidia решила определить его как архитектуру 4×2/8×0. Чип NV40, с другой стороны, оказался ближе к дизайну 16×1 (16 пикселей за такт – цвет и Z)/32×0 (32 пикселя за такт – только Z). В результате NV40 использует 16 “настоящих” пиксельных конвейеров.
Для ясности приведём несколько примеров из жизни. Doom III, к примеру, активно использует трафаретные (stencil) тени. Для создания объёмных теней используется только Z-stencil. В результате NV40 может просчитать в этих ситуациях 32 пикселя за такт, в то время как чип NV35/38 мог просчитать только 8. Игровой тест в 3DMark 2003 использует, в основном, наложение одной текстуры. В этом случае NV40 может выдавать 16 пикселей за такт (NV35/38 = 4). Наконец, в Quake III большинство объектов используют две текстуры, то есть NV40 может выдавать 8 пикселей за такт (NV35/38 = 4).
В отличие от предшественника, блоки пиксельных программ NV40 разработаны для оптимальной работы с 32-битной точностью плавающей запятой. Хотя чип поддерживает режим половинной точности линейки NV3x, он больше не зависит от них для достижения пиковой производительности.
Разработчикам игр часто приходилось снижать точность пиксельных программ в играх до FP16 или FX12 для получения нормального уровня производительности на чипах NV35/38. С выходом NV40 это стало историей. Наподобие ATi R360, который всегда просчитывает пиксельные программы с точностью FP24, NV40 даёт полную производительность при FP32. Если пиксельные программы с FP16 могут дать небольшой прирост производительности в отдельных случаях, разница в скорости будет намного меньше, чем у NV35/38.
Итог по пиксельным программам (шейдерам) | ||||
Модель пиксельных программ | 2.0 | 2.0a | 2.0b | 3.0 |
Dependent Texture Limit | 4 | без ограничения | 4 | без ограничения |
Texture Instruction Limit | 32 | без ограничения | без ограничения | без ограничения |
Position Register | – | – | – | да |
Instruction Slots | 32+64 | 512 | 512 | >= 512 |
Executed Instruction | 32+64 | 512 | 512 | 65535 |
Interpolated Registers | 2+8 | 2+8 | 2+8 | 10 |
Instruction Predication | – | да | – | да |
Indexed Input Registers | – | – | – | да |
Temp Registers | 12 | 22 | 32 | 32 |
Constant Registers | 32 | 32 | 32 | 224 |
Arbitrary Swizzling | – | да | – | да |
Gradient Instructions | – | да | – | да |
Loop Count Register | – | – | – | да |
Face Register (2-sided lighting) | – | – | – | да |
Dynamic Flow Control Depth | – | – | – | 24 |
Примечание: для исключения двусмысленности мы оставили в таблице английскую терминологию. Специалистам она будет понятна, остальным эта таблица вряд ли интересна.
Новый чип nVidia полностью удовлетворяет требованиям спецификации Microsoft DirectX 9.0c, которая оговаривает 32-битную точность работы пиксельных программ.
Каждый из 16 пиксельных конвейеров имеет два блока пиксельных программ (суперскалярный дизайн) и один текстурный процессор с плавающей запятой. NV40 также оснащён четырьмя кэшами текстур L1, каждый из которых обслуживает четыре конвейера. Разгрузить интерфейс памяти помогает и массивный кэш L2. Архитектура блоков пиксельных программ-шейдеров имеет настоящий дизайн SIMD (одна инструкция – много данных). Если первый блок пиксельных программ на каждом конвейере может выполнять как арифметические операции, так и чтение текстур и нормализацию, то второй блок ограничен только арифметикой. Другими словами, первый блок связан с текстурами. Если блок не занимается текстурированием, то он может выполнять (в данный проход) пиксельное затенение. Блок 2 всегда доступен для пиксельного затенения.
В целом, NV40 работает как графический процессор с 16 конвейерами (16×1 – классическое накладывание текстур с цветом и Z). Представьте, к примеру, пиксельную программу с отношением арифметики к текстуре 4:1. В подобном случае блок шейдеров 1 потратит 75% времени на проходы арифметики, в то время как блок шейдеров 2 будет загружен арифметикой на 100%. В данном случае один пиксельный конвейер может просчитывать 7 операций за такт.
В случае пиксельных программ, нам нужно различать инструкции и операции (ops). Инструкции определяют функции, которые необходимо применить к заданным составляющим (R, G, B или альфа) пикселя. Блоки вершинных программ затем выполняют свои вычисления (операции) в соответствии с этими инструкциями.
NV40 способна выполнить 4 или больше инструкций на пиксель и 8 или больше операций на пиксель за такт. По данным nVidia, семейство ATi R3xx может выполнять только две инструкции на пиксель и, максимум, четыре операции на пиксель за такт.
В целом, можно уверенно сказать, что движок пиксельных программ NV40 имеет потрясающую скорость и эффективность.
Ниже мы просуммировали новые функции движка пиксельных программ:
- полная поддержка модели пиксельных программ 3.0;
- 216 (65535) длинных пиксельных программ – превышает ограничение PS2.0 в 96;
- динамический контроль выполнения (flow control) – циклы и ветвления, вызов подпрограмм и возврат;
- высокая точность пиксельного затенения – “родная”/оптимизированная поддержка вычислений с 32-битной точностью;
- гибкая поддержка формата данных – форматы операндов и текстур FP32, FP16;
- Full speed non-power of 2 textures with mipmapping;
- Multiple Render Target Support;
- Centroid Sampling AA Support.
Вершинный движок
Блоки вершинных программ соответствуют спецификации Microsoft DirectX 9.0c, то есть Vertex Shader 3.0.
Общая информация по вершинным программам (шейдерам) | |||
Shader Model | 2.0 | 2.0a | 3.0 |
#of instruction slots | 256 | 256 | >= 512 |
Max # of instructions executed | 65535 | 65535 | 65535 |
Instruction Predication | – | да | да |
Temp Registers | 12 | 13 | 32 |
#constant registers | >= 256 | >= 256 | >= 256 |
Static Flow Control | да | да | да |
Dynamic Flow Control | – | да | да |
Dynamic Flow Control depth | – | 24 | 24 |
Vertex Texture Fetch | – | – | да |
#of texture samplers | – | – | 4 |
Geometry Instancing Support | – | – | да |
Примечание: для исключения двусмысленности мы оставили в таблице английскую терминологию. Специалистам она будет понятна, остальным эта таблица вряд ли интересна.
Вершинный движок значительно улучшился и расширился по сравнению с NV35/38. NV40 имеет 6 вершинных блоков с дизайном MIMD (много инструкций, много данных). nVidia также поставила новый рекорд по скорости трансформации треугольников – 600 миллионов полигонов в секунду (Radeon 9800XT = 412, FX 5950 = 356).
В стандарте VS3.0 вершинные программы, теоретически, могут иметь бесконечную длину. Благодаря расширению динамического выполнения (больше вариантов по циклам/ветвлениям и новые функции подпрограмм), можно создавать более эффективный код и реализовывать новые возможности для эффектов.
Вновь просуммируем основные функции:
- полная поддержка вершинных программ 3.0;
- 216 (65,535) длинных вершинных программ;
- вершинная обработка с учётом текстуры – карты смещения (displacement mapping);
- динамический контроль выполнения (flow control) – циклы и ветвления, вызов подпрограмм и возврат;
- Geometry Instancing (vertex stream divider).
Программы-шейдеры версии 3.0
Информация о модели Microsoft Shader Model 3.0, которая входит в состав DirectX 9.0c, известна уже достаточно давно. Как nVidia любит подчёркивать, эта модель была разработана совместно с Microsoft. Означает ли это, что мы можем ожидать ещё одного рывка производительности – на уровне того продвижения, которое мы увидели полтора года тому назад с Shader Model 2.0, разработанной MS и ATi?
Сегодня чёткий ответ дать трудно. Но мы точно знаем, что GeForce 6800 соответствует всем требованиям новой модели шейдеров. Есть хорошие шансы, что это будет относиться ко всей линейке NV4x. На данный момент наиболее интересный вопрос заключается в том, каковы будут действия ATi? Новые минимальные требования по 32-битной точности вычислений с плавающей запятой могут оказаться весьма проблематичными для ATi, поскольку компания планировала удерживаться на уровне 24-битной реализации.
Разработчики продолжают спорить на форумах по поводу потенциала новой модели шейдеров для создания игр. Геймеры прикидывают, сколько времени займёт переход на SM3.0. Можно уверенно сказать, что переход произойдёт быстрее, чем от SM1.x (DirectX 8.x) к SM2.x (DirectX 9), так как сегодня большая часть оптимизации выполняется компиляторами. Разработчику просто нужно задать набор параметров – и волшебство произойдёт, новые программы будут оптимизированы для SM2.x или 3.x (впрочем, мы относимся к этой лёгкости несколько скептически). В результате, перевести игру на новую модель шейдеров будет относительно легко и просто. Конечно, возникает вопрос в целесообразности подобного перевода. Да и сможет ли поколение NV4x эффективно и быстро выполнять длинные и сложные программы-шейдеры?
nVidia не поленилась создать своеобразную выставку приложений для разработчиков и программистов, с которой можно познакомиться здесь.
Если nVidia громко и настойчиво рекламирует новую модель шейдеров, то ATi пытается плыть в обратном направлении. Прекрасным и довольно забавным примером этой тактики является презентация Ричарда Хадди (Richard Huddy) из ATi для разработчиков под названием “Спасти наносекунду”, случайно просочившаяся в Интернет. Проблема с этой презентацией заключается в заметках к слайдам, по которым становится понятно, что лектор будет уговаривать разработчиков не применять динамический контроль выполнения в PS3.0 (flow control), поскольку это приводит к ощутимому падению производительности. Цитата:
“Увести людей от использования контроля выполнения в ps3.0, поскольку, как мы полагаем, он будет значительно снижать производительность. [Также это основная дополнительная функция NV40 по сравнению с R420, поэтому нужно разочаровать слушателей в ней, пока не появится R5xx с приличной производительностью…]”
Форумы в Интернете просто накалились в попытках трактовки этого выражения. С одной стороны, можно понять, что будущие чипы ATi будут либо слишком медлительны для этой функции, либо вообще не будут её не поддерживать. С другой стороны, графические ускорители ATi смогут справиться с дополнительной сложностью этой функции только в следующем поколении…
Что же нам делать? Как обычно – ждать. В любом случае, нас ждут интересные анонсы. К примеру, текущее исправление FarCry, по всей видимости, должно добавить поддержку SM3.0. Будем ждать результатов!
Пиксельные конвейеры ROP (растровые операции)
Количество пикселей, обрабатываемых за такт, в немалой степени зависит от настроек драйвера и от 3D-движка текущей версии игры. nVidia приводит следующую иллюстрацию для подтверждения этой мысли.
По сравнению с NV35/38, новый движок ROP получил довольно много улучшений, типа нового режима сглаживания методом поворота сетки (rotated grid) и усиленного интерфейса памяти. nVidia заявляет о двукратном возрастании скорости работы с памятью по сравнению с NV35. Прямое сравнение теоретической пропускной способности памяти на основе её частоты (425 МГц для NV35, 550 МГц для NV40) указывает на то, что улучшения достигнуты не только увеличением тактовой частоты. Результаты тестов в разрешении 1600×1200 при включении FSAA вполне наглядно подтверждают слова nVidia.
Подсистема ROP карты GeForce 6800 имеет следующие характеристики:
- 16 пикселей на такт, цвет и Z;
- 32 пикселей на такт, только Z;
- 64-bit FP Frame Buffer Blending;
- цветовое и Z-сжатие без потерь;
- качественное сглаживание – поворот сетки (Rotated Grid);
- полная поддержка MRT;
- ускоренный рендеринг теней.
Возможные применения и другие особенности
Сейчас, когда мы рассмотрели теоретическую информацию, давайте перейдём к более наглядным практическим аспектам. Как можно использовать все новые функции, и какие особенности имеет дизайн NV40?
Ultra Shadow II
Эта технология впервые появилась в поколении карт NV35/38 (см. дополнительную информацию), реализуя более скоростные просчёты теней. С новой и улучшенной версией Ultra Shadow II, чип NV40 в целых четыре раза быстрее предыдущего поколения. Поэтому можно с уверенностью сказать, что чип готов к будущим играм, типа Doom III, которые будут активно использовать трафаретные тени.
Для ускоренного просчёта теней Ultra Shadow II игру не нужно специально оптимизировать. Однако адаптация кода игры позволит всё же выжать дополнительную производительность. К примеру, в движке игры могут быть выделены определённые поверхности, где тени будут видны. Это уменьшает лишние вычисления, поскольку просчёт будет вестись только для указанных теней.
В качестве примера nVidia использует DOOM III:
Просчитанная сцена, как она будет видна на экране.
Необходимая геометрия для вычисления теней без…
…и с использованием Ultra Shadow II.
Ultra Shadow II будет также хорошо работать вместе с полноэкранным сглаживанием, то есть границы теней будут тоже сглаженными.
Карты смещения (Displacement Mapping)
Вершинные конвейеры позволяют чипу NV40 отображать карты смещения. Эта технология создаёт данные о геометрии (Z) из текстур.
В целом, карты смещения – лёгкий способ для создания геометрической информации. В качестве примера nVidia использовала модель динозавра, которая была создана с помощью карт смещения. Благодаря этой технологии разработчики игр могут создавать очень сложные формы, не ставя старые видеокарты “на колени”, – они будут использовать простые модели объектов и обычные текстуры.
IntelliSample 3.0
nVidia отреагировала на критику по поводу качества изображения, получаемого с помощью реализации полноэкранного сглаживания. NV40 стал первым графическим процессором с новой технологией сглаживания – поворота сетки (rotate grid) сабпиксельного участка. В любом случае, максимальное число сэмплов осталось 4 (4x FSAA для мультисэмплинга). Режим 8x является смешанным, базируясь на мултисэмплинге 4x и суперсэмплинге 2x.
Проблема с сабпиксельным участком заключалась в том, что до сих пор карты nVidia использовали его прямую ориентацию – это приводило к появлению артефактов, если границы объектов были близки к вертикали или горизонтали. Новый метод поворота сетки должен решить указанную проблему.
Помимо улучшенного сглаживания границ в проблемных областях, новый сабпиксельный участок улучшает также воспроизведение цветов, так как при этом учитываются все вертикальные и горизонтальные области сабпикселя.
Далее в нашей статье мы привели сравнение качества изображения, которое поможет ответить на вопрос: сможет ли новый метод сглаживания NV40 догнать ATi по качеству картинки? В конце концов, карты ATi обеспечивают не только более высокие режимы сглаживания (до шести сабпикселей), но и регулируют гамму.
Дополнительное богатство
Карта GeForce 6800 стала первым продуктом nVidia, поддерживающим рендеринг High-Dynamic-Range, следуя стандарту OpenEXR. nVidia называет эту функцию HPDT. В результате разработчики получают возможность использования метода OpenEXR, который даёт более точные цвета, вместо широко известного метода sRGB HDR. Дополнительную информацию вы можете получить на сайте Industrial Light & Magic (ILM).
Эффекты полупрозрачности и различной степени проникновения света. Их можно создавать с помощь метода subsurface scattering (рассеивание под поверхностью).
Пример nVidia по использованию технологии Multiple Render Targets (MRT) (несколько целей рендеринга).
Видеопроцессор
Графические чипы уже достаточно давно поддерживают ускорение вывода видео. Но на данный момент функции декодирования и кодирования сжатых форматов видео продолжали оставаться прерогативой центрального процессора.
Карта nVidia GeForce 6800, как и другие модели семейства NV4x, поставляется с раздельным программируемым видеопроцессором. Его можно считать, своего рода, чипом в чипе. Процессор поддерживает функции по ускорению видео, а также оснащён аппаратным блоком кодирования/декодирования видео.
- Видео высокого качества
- Адаптивный деинтерлейсинг
- Качественное масштабирование и фильтрация
- Удаление эффекта блочности
- Встроенный ТВ-кодер
- Поддержка транспорта потока
- Выход HDTV (720p, 1080i, 480p, CGMS)
- Аппаратное аудио/видео
- Синхронизация
- Кодирование/декодирование MPEG 1/2/4
- Ускорение декодирования WMV9
Для поддержки аппаратных функций декодирования не требуется внесение каких-либо изменений в программу или файлы видео, поскольку драйвер перехватывает все запросы DirectX и направляет их напрямую на видеопроцессор. Однако в случае декодирования MPEG 1/2/4 специальное программное обеспечение всё же требуется. Adobe уже анонсировала поддержку новых технологий в будущей версии пакета After Effects.
По данным nVidia, архитектура NV4x значительно снижает нагрузку на центральный процессор во время воспроизведения видео. К тому же, чип должен улучшить производительность кодирования видео в оптимизированных программах, что должно понизить энергопотребление – значимый фактор для мобильных реализаций чипа NV4x. Если производительность видеопроцессора зависит от тактовой частоты работы всего графического процессора, то все другие функции последнего можно отключать, чтобы экономить энергию при работе видеопроцессора. Также новый видеопроцессор поддерживает функцию ТВ-выхода.
Эта диаграмма показывает работу видеопроцессора во время декодирования MPEG…
…и во время кодирования MPEG.
Мы протестировали нагрузку на процессор во время воспроизведения MPEG и WMV – результаты представлены в отдельной части нашей статьи.
Драйвер ForceWare 60
Как бывает с выходом почти каждого нового чипа, NV40 сопровождает новая версия драйвера ForceWare – теперь уже под номером 60. В драйвере существует несколько отличий между FX5950 и GeForce 6800 Ultra.
FSAA: комбинированные режимы мультисэмплинга и суперсэмплинга 4xS и 8xS с 6800 не доступны. Вместо них появился новый режим 8x, который делает, по сути, то же самое, что и старый режим 8xS: 4xMS+2xSS. Карта GeForce 6800 Ultra предлагает следующие режимы FSAA.
- Application Controlled – управление приложением (по умолчанию)/ выкл. / 2x / 2x Quincunx / 4x / 8x
Анизотропная фильтрация: в дополнение к существующим режимам, GeForce 6800 также поддерживает анизотропную фильтрацию 16-tap. В результате вы можете выставить следующие уровни анизотропной фильтрации:
- Application Controlled – управление приложением (по умолчанию)/ выкл / 2x / 4x / 8x / 16x
Качество: с помощью движка в меню драйвера можно изменять качество текстурной фильтрации. nVidia добавила новый высококачественный режим High-Quality для тех, кто желает получить максимально высокое качество картинки и не желает снижать уровни фильтрации текстур, даже если при этом скорость карты уменьшится. Вы можете выставить следующие режимы:
- High Performance (высокая производительность) / Performance (производительность) / Quality (качество, по умолчанию) / High Quality (высокое качество)
Трилинейная оптимизация: после включения дополнительных настроек (advanced settings) пользователь может отключить адаптивную трилинейную фильтрацию вообще. После этого драйвер будет производить настоящую трилинейную фильтрацию. По умолчанию оптимизация трилинейной фильтрации активирована.
Добавление новых настроек является ответом nVidia на пожелания сообщества энтузиастов, которому требовалось получить способ отключения адаптивной фильтрации. nVidia также подчёркивает, что на практике видимых отличий между режимами Quality и High Quality не наблюдается. Мы проверим заявления nVidia в соответствующем разделе нашего обзора, посвящённого качеству изображения.
Энергопотребление
Для измерения энергопотребления графических карт мы использовали простое измерительное устройство, произведённое Conrad Elektronik (Energy Check 3000), которое показывает энергопотребление всего компьютера, включая материнскую плату, центральный процессор и т.д. Мы признательны нашим читателям, подсказавшим идею подобного тестирования. На результатах не отражается КПД блока питания (у Antec True Control 550W он составляет около 69%). В конце концов, вы ведь будете платить за потребляемую энергию, независимо от эффективности её передачи на компоненты ПК.
Для внесения ясности мы ещё раз подчеркнём, что полученные значения не являются энергопотреблением одной видеокарты, а показывают энергопотребление всего компьютера.
Многие современные карты требуют больше энергии, чем может обеспечить порт AGP. Поэтому на них присутствуют дополнительные разъёмы питания. Эта особенность значительно усложняет прямое измерение энергопотребления карты. Зато наша упрощённая процедура тестирования позволяет сделать сравнительный анализ энергопотребления карт.
Чтобы компоненты вроде оптических приводов и жёстких дисков не влияли на результат тестирования, мы измеряли энергопотребление во время путешествия по разделам BIOS. Как вы можете видеть, энергопотребление GeForce 6800 Ultra в режиме загрузки оказывается ниже, чем у Radeon 9800XT.
Это измерение было получено после загрузки Windows и драйверов – в режиме бездействия. И вновь Radeon 9800XT потребляет чуть больше энергии, чем GeForce 6800 Ultra. Карта GeForce FX 5950 Ultra намного менее требовательна, чем любая из этих двух.
Приведённые значения показывают максимальное энергопотребление во время прохождения различных игровых тестов 3DMark 2003 в различных разрешениях и режимах качества (FSAA, анизотропная фильтрация). Карты ATi и nVidia по-разному реагируют на игры. В FarCry, к примеру, картам требовалось намного меньше энергии, чем в 3DMark 2003. И если энергопотребление карт nVidia достигает пика в четвёртом игровом тесте, то Radeon 9800XT проявляет свой максимальный аппетит в первом игровом тесте.
В целом, ATi Radeon 9800XT и nVidia GeForce FX 5950 имеют очень схожее энергопотребление, хотя карта ATi чуть более экономна. GeForce 6800 Ultra, с другой стороны, любит полакомиться энергией, но не настолько уж и сильно, как можно было ожидать при наличии двух разъёмов питания. В целом, новая карта потребляет на 24 Вт больше предшествующей модели. Учитывая КПД нашего блока питания в 69%, мы получаем разницу в 17 Вт с GeForce FX 5950, несмотря на использование экономной памяти GDDR3.
Мы можем также экстраполировать требования по питанию для других карт. Допустим, что nVidia правильно указала максимальное энергопотребление для карты 6800 Ultra на уровне 110 Вт. Давайте также допустим, что в нашем тестировании мы получили самый худший случай. В результате максимальное энергопотребление Radeon 9800XT составляет около 91,5 Вт, а FX 5950 нужно 93,5 Вт.
Примечание: не следует напрямую сравнивать полученные значения с данными нашей предыдущей статьи. В этом тесте мы использовали другую материнскую плату, что уже делает прямое сравнение бессмысленным. Кроме того, мы отрегулировали наш блок питания.
Тесты ускорения видео
В следующих тестах мы попытались определить прирост производительности от использования нового видеопроцессора. В конце концов, у NV40 эта особенность горячо рекламируется. И не следует забывать, что аппаратное декодирование и кодирование является весомым аргументом при начинающемся широком распространении HDTV.
Однако наши измерения быстро показали, что nVidia пока ещё не достигла желаемого результата. Декодирование Microsoft WMV9 особо не ускорялось. Скорее, наоборот.
Здесь мы протестировали нагрузку на процессор при воспроизведении видео MPEG VCD. Впрочем, у всех карт она близка к нулю.
При воспроизведении DiVX карты FX5950 и Radeon 9800XT нагружают процессор примерно на одном уровне. Карта 6800 Ultra, напротив, заставляет центральный процессор выполнять больше работы по декодированию видео.
Если FX5950 и 9800XT вновь дают примерно одинаковые результаты, GeForce 6800 стала самой “ленивой” картой, переложив большую нагрузку на центральный процессор.
Когда мы поделились полученными результатами с nVidia, нам объяснили, что драйвер, высланный для обзора, пока не поддерживает все возможности видеопроцессора. Хотя декодирование MPEG уже осуществляется аппаратно, разработчики драйвера ещё не закончили работу над WMV9 и другими форматами. Команда разработчиков драйвера пока концентрирует свои усилия на улучшении 3D-производительности. Поэтому для оценки видеопроцессора нам придётся подождать…
Тестовая конфигурация
Тестовая система | |
Процессор | Intel Pentium 4 3,2 ГГц |
FSB | 200 МГц |
Материнская плата | Gigabyte GA-8IG 1000 PRO (i865) |
Память | 2x Kingston PC3500, 1024 Мбайт |
Жёсткий диск | Seagate Barracude 7200.7 120GB S-ATA (кэш 8 Мбайт) |
DVD | Hitachi GD-7000 |
Сеть | Netgear FA-312 |
Блок питания | Antec True Control 550W |
Драйверы и конфигурация | |
Графика | ATi Catalyst v4.3 nVidia v60.72 |
Чипсет | Intel Inf. Update |
ОС | Windows XP Prof. SP1a |
DirectX | DirectX 9.0b |
Видеокарты, использованные нами в тестировании | |
ATi | Radeon 9800XT (Sapphire) |
nVidia | GeForce FX 5950 Ultra (NV) GeForce 6800 Ultra (NV) |
Тесты | |
Unreal Tournament 2004 | Custom Timedemo Max Details/Quality Map: Assault-Toran |
Call Of Duty | Custom Timedemo Max Details/Quality Map: mp_brecourt |
AquaMark 3 | Benchmarking Software |
X2 The Thread | Retail Version v1.3 Rolling Demo |
Breed | Single Player Demo1 Cutscene FRAPS Meassurement |
Colin McRae Rally 4 | Demo Version Max Quality FRAPS Meassurement |
Nascar Thunder 2004 | Replay Max details FRAPS Meassurement |
Halo | Build-in benchmark Max details PS2.0 |
Farcry | Retail v1.1 Build-in benchmark Max details PS2.0 Demos: Cooler01, Research |
Unreal Tournament 2004
Для теста UT2004 мы взяли собственноручно записанное timedemo на карте Assault-Torlan (без ботов). Все настройки качества были выставлены на максимум
Unreal Tournament 2004 – обычный режим
В низких разрешениях результаты упираются в производительность CPU. При достижении 1600×1200 мы уже можем восхищаться производительностью GeForce 6800 Ultra.
Unreal Tournament 2004 – 4x FSAA
Даже при включении 4xFSAA результаты timedemo на GeForce 6800 Ultra ограничиваются CPU. При достижении 1600×1200 карта демонстрирует небольшое падение производительности – и работает в два раза быстрее FX5950 или 9800XT.
Unreal Tournament 2004 – 8 x анизотропная фильтрация
Карта 6800 Ultra обеспечивает лучшую производительность, по сравнению с конкурентами, при включении анизотропной фильтрации 8x.
Unreal Tournament 2004 – 4x FSAA и 8x анизотропная фильтрация
Потрясающе! Что ещё можно сказать? С картой GeForce 6800 Ultra вы можете комфортно играть в UT2004 с включением 4x FSAA и 8x анизотропной фильтрации при высоком разрешении.
Call of Duty
Для измерения производительности в Call of Duty мы использовали собственную timedemo на карте MP_Brecourt. И вновь все настройки качества были выставлены на максимум.
Call of Duty – обычный режим
Карта GeForce 6800 Ultra демонстрирует впечатляющую производительность. На высоких разрешениях она более чем в два раза быстрее других. Поначалу мы погрешили на ошибку в тесте. Но после нескольких прогонов убедились в правильности результатов…
Call of Duty – 4x FSAA
И вновь при включении 4x FSAA карта в два раза обгоняет остальные модели!
Call of Duty – 8x анизотропная фильтрация
При включении анизотропной фильтрации GeForce 6800 достигает трёхкратного преимущества…
Call of Duty – 4x FSAA и 8x анизотропная фильтрация
Результаты лишили нас речи! Если мы когда-либо сомневались в аккуратности измерений, то здесь именно тот случай. Но игра Call of Duty настаивает: результаты верны! По сравнению с GeForce 6800 Ultra, карты Radeon 9800XT и FX 5950 Ultra кажутся просто антиквариатом.
AquaMark 3
В AquaMark 3 мы тестировали как обычный режим AM3, так и другие разрешения. Мы прогоняли тест в обычном качестве и при включении 4x сглаживания и 8x анизотропной фильтрации.
AquaMark 3 – режим AM3
GeForce 6800 Ultra легко преодолела отметку в 60 000.
AquaMark 3 – обычный режим
По мере увеличения разрешения отрыв 6800 Ultra от Radeon 9800XT и FX 5950 Ultra только возрастает.
AquaMark 3 – 4x FSAA и 8x анизотропная фильтрация
Новейшая карта nVidia продолжает давать впечатляющие результаты даже при включении 4x FSAA и 8x анизотропной фильтрации.
X2 – The Threat
Игра X2 активно использует вычисления трафаретных теней, что позволяет применять её в качестве удобного теста функции Ultra Shadow на картах nVidia.
X2 – The Threat – обычный режим
В стандартном режиме качества карта GeForce 6800 Ultra выходит на первое место, но её отрыв не столь заметен, как в других играх.
X2 – The Threat – 4x FSAA и 8x анизотропная фильтрация
Как только мы включили 4x FSAA, карта 6800 Ultra ушла в отрыв от конкурентов.
Breed Demo
Для измерения производительности в Breed мы использовали FRAPS. Частота кадров измерялась во время прохождения заставки однопользовательского demo. Движок Breed задействует как эффекты пиксельных программ, так и трафаретные тени.
Breed Demo – обычный режим
Несмотря на увеличение разрешения, GeForce 6800 показывает очень небольшое падение производительности, демонстрируя впечатляющий отрыв от остальных карт при достижении максимального разрешения.
Breed Demo – 4x FSAA и 8x анизотропная фильтрация
При включении 4x FSAA и 8x анизотропной фильтрации карта 6800 Ultra вновь даёт в два раза большую производительность при разрешении 1600×1200 – по крайней мере, по сравнению с GeForce FX 5950 Ultra.
Colin McRae Rally 4 Demo
Поскольку эта игра не имеет встроенного режима тестирования, для измерения частоты кадров мы использовали FRAPS. Мы начали новую трассу (Japan, stage 2), затем прекратили пробег (retire) и измерили частоту кадров при повороте камеры на 360°.
Colin McRae Rally 4 Demo – обычный режим
Демо-версия Colin McRae даёт на картах ATi высокую производительность. По крайней мере, таково было наше впечатление при сравнении результатов FX 5950 и Radeon 9800XT. Карта 6800 Ultra поначалу не слишком впечатляет, однако при высоком разрешении она даёт в два раза большую скорость, чем ближайший конкурент.
Colin McRae Rally 4 Demo – 4x FSAA и 8x анизотропная фильтрация
И вновь, несмотря на включение 4x FSAA и 8x анизотропной фильтрации, 6800 Ultra почти в два раза быстрее конкурентов.
Nascar Thunder 2004
В игре Nascar Thunder мы использовали повторный просмотр (replay) всей трассы с видом из кабины при максимальных настройках качества. Поскольку эта игра значительно нагружает центральный процессор, помимо графики, мы решили ограничить наше тестирование режимом с включёнными 4x FSAA и 8x анизотропной фильтрацией.
Nascar Thunder – 4x FSAA и 8x анизотропная фильтрация
Карта GeForce 6800U, определённо, достойна лавров победителя. Radeon 9800XT может состязаться только на разрешении 1024×768.
Halo – Combat Evolved
Поскольку игровой разработчик Gearbox не одобряет использование FSAA в этой игре, мы смогли протестировать Halo только в обычном режиме с PS2.0.
Halo – обычный режим
Результаты на карте 6800 Ultra кажутся нереальными – она более чем в два раза обгоняет GeForce FX 5950 и Radeon 9800XT при разрешении 1600×1200. Потрясающие результаты!
FarCry
Для тестирования FarCry мы использовали две различные timedemo (созданные “Bug”), которые присутствуют в Интернете. Демо Cooler01 измеряет производительность внутри помещения (Cooler), а демо Rebellion02 – на улице ночью. Фонарик был включён во всех тестах, а настройки качества выставлены на максимум. Помимо максимальной частоты кадров (AVG), мы также измеряли и минимальную (MIN).
FarCry Rebellion02 – обычный режим
GeForce 6800 здесь явно лидирует, хотя по минимальным fps отрыв невелик.
Примечание: карта Radeon 9800XT даёт более высокое качество изображения в FarCry. См. раздел тестирования качества для дополнительной информации.
FarCry Cooler01 – обычный режим
Внутри помещения GeForce 6800 демонстрирует своё превосходство как по средним, так и по минимальным fps. Минимальные fps на 6800 Ultra выше, чем средняя частота кадров на Radeon 9800XT!!!
Примечание: карта Radeon 9800XT даёт более высокое качество изображения в FarCry. См. раздел тестирования качества для дополнительной информации.
FarCry Rebellion02 – FSAA: High, анизотропная фильтрация: 4
При включении FSAA и анизотропной фильтрации 6800 Ultra укрепляет своё лидерство по сравнению с FX 5950 Ultra и Radeon 9800XT. Однако минимальные fps здесь вновь не слишком отличаются от двух других карт.
Примечание: карта Radeon 9800XT даёт более высокое качество изображения в FarCry. См. раздел тестирования качества для дополнительной информации.
FarCry Cooler01 – FSAA: High, анизотропная фильтрация: 4
Переход внутрь помещения привёл к тому, что карта GeForce 6800 Ultra вновь показала, кто здесь хозяин. Как и прежде, минимальные результаты 6800 Ultra оказались выше, чем средние на Radeon 9800XT.
Примечание: карта Radeon 9800XT даёт более высокое качество изображения в FarCry. См. раздел тестирования качества для дополнительной информации.
Качество изображения – FSAA
Все скриншоты ниже были получены при разрешении 1024×768 пикселей. Мы рекомендуем выставить такое же разрешение вашего монитора, чтобы лучше видеть различия!
Начнём с качества картинки при включении полноэкранного сглаживания. FSAA играет очень важную роль в гонках. Давайте посмотрим на качество картинки в Nascar Thunder 2004:
Все карты с 4x FSAA
На этом примере заметно, что nVidia с картой GeForce 6800 Ultra, наконец-то, смогла догнать ATi по качеству полноэкранного сглаживания. При сравнении изображения с 9800XT мы можем обнаружить лишь минимальные различия в нижней окантовке стекла. Однако карты ATi получают преимущество от коррекции гаммы. Как видно по столбам освещения, качество FX 5950 Ultra оставляет желать лучшего.
В следующем сравнении показаны преимущества смешанных режимов FSAA у nVidia при использовании комбинации суперсэмплинга и мультисэмплинга. Ограда, тени, машины и некоторые другие элементы выглядят более чётко. Недостатком этого режима является очень заметное снижение производительности (см. тесты ниже).
При одинаковом уровне сэмплирования карты Radeon 9800XT и GeForce 6800 Ultra дают практически одинаковое качество. На картах ATi качество можно ещё улучшить, перейдя в режим 6x FSAA. nVidia компенсирует отсутствие этого режима наличием смешанных режимов FSAA, которые значительно снижают скорость работы, зато дают максимально возможное качество картинки.
Для сравнения мы рекомендуем посмотреть на следующие результаты производительности GeForce 6800 Ultra в UT 2004 при разрешении 1600×1200.
Качество изображения – анизотропная фильтрация
Как мы уже упоминали в разделе, посвящённом драйверам, реализация анизотропной фильтрации nVidia претерпела определённые изменения. Впрочем, перечисление и тестирование всех доступных режимов выходит за рамки нашей статьи.
Так как мы не смогли, по большей части, обнаружить какие-либо отличия между режимами Quality и High-Quality на GeForce 6800 U, то ограничим наше тестирование сравнением между режимом Quality с включённой и выключенной оптимизацией трилинейной фильтрации.
Texture Filter TestApp v1.2
Нажмите на значок, чтобы получить увеличенную несжатую версию (.png). Угловые оптимизации в GeForce 6800 U соответствуют шаблону, использованному Radeon 9800XT. Как показывает наше сравнение, стандартный режим nVidia использует значительно урезанный трилинейный фильтр. При отключении оптимизации, карта выполняет полную трилинейную фильтрацию. При этом шаблон 6800 U кажется более чётким, чем у 9800XT.
В этой сцене AquaMark3 мы можем видеть значительные оптимизации, присутствующие в драйвере GeForce 5950 Ultra. Старые версии драйвера дают более высокое визуальное качество (см. здесь).
Карта GeForce 6800 Ultra корректно прорисовывает сцену – и даже демонстрирует небольшое преимущество по сравнению с Radeon 9800XT (заметное на белых полосках в центре картинки).
В этой сцене мы не смогли обнаружить заметных отличий между Radeon 9800XT и GeForce 6800 Ultra.
И вновь карты 9800XT и 6800 U дают визуально идентичный результат. Хотя FX 5950 U осуществляет неплохую фильтрацию на переднем плане, мы можем заметить ухудшение качества фильтрации на крышке и на заднем плане (ландшафт).
Итак, как видим, с выпуском GeForce 6800 Ultra nVidia смогла сравняться с ATi по качеству анизотропной фильтрации. Благодаря наличию возможности отключить оптимизацию трилинейной фильтрации nVidia легко обходит ATi в этой категории.
Обратите внимание, насколько сильно nVidia снизила качество фильтрации FX 5950 U за последние несколько месяцев.
Для сравнения мы решили привести результаты GeForce 6800 Ultra в разных режимах анизотропной фильтрации (UT 2004, 1600×1200).
Качество шейдеров – FarCry
Наконец, давайте посмотрим на качество работы пиксельных программ у GeForce 6800 Ultra. Ведь теперь уже не нужно выполнять оптимизацию шейдеров для уменьшения точности вычислений с плавающей запятой.
Все скриншоты были получены при использовании версии v1.1 игры, которая поддерживает NV40 и имеет профили SM3.0. Однако с текущим драйвером карта 6800 U почему-то была определена в игре как карта PS1.1/2.0, подобно FX 5950 U и 9800XT.
Мы выбрали несколько сцен, в которых обнаружили значительные отличия качества между различными картами.
Это сравнение показывает, что GeForce 6800 Ultra продолжает использовать оптимизированный код шейдеров в FarCry. На картах nVidia пол имеет меньшую детализацию в верхней части сцены (обратите внимание на отражение света). На этой сцене фонарик был включён. Уровень: Archive.
“Грубые” пиксели видны и на других сценах. Перед вами – стена на уровне Cooler. Похоже, что отражения света на картах nVidia просчитаны с меньшей точностью. (Фонарик выключен).
Как показывает сравнение, 6800 U работает всё же не в том режиме, что FX 5950 U. Разница в отражении света на двух картах nVidia может быть связана с разными моделями освещения – это доказывает следующее сравнение.
Этот пример, на котором мы подсветили поверхность пола фонариком, прекрасно иллюстрирует различные модели освещения. Если на FX 5950 Ultra пол достаточно грубо заливался светом, на Radeon 9800XT и GeForce 6800 Ultra вы можете отчётливо видеть фокусировку. Да, и на круге света 6800 Ultra заметны те же “грубые” пиксели.
Качество изображения – заключение
По сравнению с GeForce FX 5950 Ultra, карта 6800 Ultra обеспечивает значительно улучшенное качество изображения, при включении как полноэкранного сглаживания, так и анизотропной фильтрации. NV40 больше не придётся опасаться и конкурирующих карт от ATi. Хотя ATi обеспечивает более высокую степень сэмплирования (6x), карта 6800 Ultra контратакует эту возможность наличием смешанного режима сглаживания 8x. Также не следует забывать и о великолепной производительности 6800. Карта работает в UT2004 на разрешении 1600×1200 с включением 4x FSAA заметно быстрее, чем Radeon 9800XT с 4x на разрешении 1280×1024!
То же самое верно и для анизотропной фильтрации. nVidia вняла критике за последние месяцы, и теперь компания позволяет отключать оптимизацию трилинейной фильтрации. В этом режиме GeForce 6800 Ultra обеспечивает превосходное качество фильтрации. Вообще, было бы неплохо получить возможность отключать угловую оптимизацию, скажем, в режиме High-Quality. Пока что режим HQ не даёт заметных отличий в качестве, по сравнению с режимом Quality. Также и производительность при включении режима HQ падает крайне незначительно.
Мы были разочарованы качеством шейдеров новой карты – по крайней мере, в игре FarCry. Так как у нас нет других современных игр для тестирования, мы пока воздержимся от заключения. Вполне возможно, что Crytek и nVidia не успели убрать все оптимизации шейдеров для NV3x вовремя. Скорее всего, ситуация будет улучшена с выходом патча или нового драйвера. Пока что качество картинки в FarCry просто недостойно карты GeForce 6800 Ultra – особенно в свете великолепной производительности.
Заключение
Достижения nVidia с выпуском карты GeForce 6800 Ultra лишают дара речи даже матёрых геймеров и журналистов. Производительность новой карты буквально сбивает энтузиастов (и автора этой статьи) с ног и переносит в состояние экстаза и наслаждения результатами тестов и игр. По сравнению с GeForce 6800 Ultra, бывшие лидеры Radeon 9800XT и FX 5950 Ultra кажутся просто дешёвыми “бюджетными” поделками, достойными только антикварного магазина.
Как только сознание медленно возвращается к норме, вы обнаруживаете, что, помимо выдающейся производительности, новая карта, наконец-то, даёт великолепное качество полноэкранного сглаживания, а также текстурной фильтрации – здесь будут удовлетворены даже пуристы, особенно из-за возможности отключения трилинейной оптимизации. Технологически nVidia тоже ушла в отрыв, поскольку карта полностью поддерживает спецификации DirectX 9.0c и ShaderModel 3.0, а 32-битная точность вычислений с плавающей запятой больше не снижает производительность.
Если вам не терпится пойти в магазин и потратить деньги на новую карту – будьте осторожны! Первым барьером на пути к графическому экстазу станет высокое энергопотребление карты. Для её установки ваш компьютер должен иметь блок питания с мощностью не меньше 480 Вт. К тому же, имеет значение не только мощность – блок питания должен выделить карте два подключения, которые не используется для других устройств. Конечно, истинных фанатов это не остановит. А моддеры обожают новые препятствия.
Но, конечно, не обошлось и без ложки дёгтя. Во-первых, нас разочаровало качество работы шейдеров в игре FarCry. nVidia должна исправить эту проблему как можно быстрее, поскольку она выделяется, как бельмо в глазу, на фоне прекрасных результатов в других тестах. Во-вторых, новый видеопроцессор тоже пока не может показать всю свою мощь через драйверы. Карта GeForce 5950 Ultra без видеопроцессора нагружает CPU при просмотре фильмов меньше, чем карта GeForce 6800 Ultra с видеопроцессором. Но эти недостатки вполне решаются доработкой драйверов – и у nVidia, определённо, есть в запасе время до выпуска розничных версий карт. Небольшие детали, типа изменения в последний момент напряжения питания вентилятора, тоже не говорят о законченности продукта.
С выпуском NV40 или GeForce 6800 Ultra nVidia вывела на рынок прекрасный продукт, который послужит основной для целого семейства карт. После впечатляющей производительности NV40 мы будем ожидать не меньших подвигов и от других карт. nVidia, по сути, установила новый стандарт графической производительности. Теперь нам осталось ждать ответного удара ATi в виде графического R420, который выйдет в конце апреля и будет использовать 12 или 16 пиксельных конвейеров.