Какая пропускная способность нужна видеокартам PCI Express?
Читатели THG.ru наверняка помнят наш подобный проект, который мы уже проводили около двух с половиной лет назад. Мы
Интерфейс PCI Express быстро обеспечил рост графической индустрии, поскольку он позволил nVidia и ATi/AMD устанавливать в компьютер две и даже четыре видеокарты. Кроме того, PCI Express необходим для карт расширения с высокими требованиями к пропускной способности, такими, как RAID-контроллеры, гигабитные сетевые адаптеры или физические ускорители для 3D-приложений и игр. Вычислительную мощь дополнительных видеокарт можно использовать для увеличения производительности на высоких разрешениях, добавления визуальных функций или для увеличения скорости при стандартных разрешениях и настройках качества. Впрочем, последняя опция не всегда интересна, так как многие современные видеокарты достаточно мощны для стандартных разрешений 1024×768 и 1280×1024. Потенциал роста благодаря решениям ATi CrossFire и nVidia SLI впечатляет, но обоим решениям требуется подходящая платформа. Но универсала, то есть материнской платы, которая поддерживала бы CrossFire и SLI одновременно, не существует. По крайней мере, пока.
Впрочем, конфигурации на двух и четырёх видеокартах являются только частью графического рынка. Большинство компьютеров и сценариев модернизации по-прежнему построены на одной видеокарте, именно поэтому мы решили не расширять наши тесты масштабирования PCI Express до двух видеокарт. Мы взяли обычные high-end видеокарты ATi и nVidia, после чего провели их через серию тестов в разных режимах PCI Express.
Основы PCI Express
Самые распространённые слоты PCI Express: крупный поддерживает 16 линий, а маленький – одну линию для простейших карт расширения.
В отличие от шин PCI и PCI-X, интерфейс PCI Express основан на последовательном протоколе “точка-точка”. То есть для интерфейса PCI Express требуется относительно небольшое число проводников. Зато интерфейс использует намного более высокие тактовые частоты по сравнению с параллельными шинами, что даёт высокую пропускную способность. Кроме того, пропускную способность можно легко увеличить, связав вместе несколько линий PCI Express. Чаще всего используются следующие типы слотов: x16, x8, x4, x2 и x1, где цифры указывают на число линий PCI Express.
PCI Express – двунаправленный интерфейс “точка-точка”, который обеспечивает одинаковую пропускную способность в двух направлениях, и которому не требуется делиться пропускной способностью с другими устройствами, как это происходило в случае PCI. Благодаря модульной архитектуре производители материнских плат могут распределять доступные линии PCI Express на те слоты, на которые требуется. Скажем, 20 доступных линий PCI Express можно направить на один слот x16 PCIe и на четыре слота x1 PCIe. Так у многих чипсетов и происходит. А для серверных систем, например, можно установить пять портов x4 PCIe. В общем, с PCI Express можно создавать любые математические конфигурации. Наконец, PCI Express позволяет смешивать мосты чипсета от разных производителей.
Впрочем, у PCI Express есть один недостаток: чем больше линий PCIe, тем выше энергопотребление чипсета. Именно по этой причине чипсеты с 40 и большим количеством линий PCI Express требуют больше энергии. Как правило, 16 дополнительных линий PCI Express увеличивают энергопотребление современных чипсетов на 10 Вт.
Число линий PCI Express | Пропускная способность в одном направлении | Суммарная пропускная способность |
1 | 256 Мбайт/с | 512 Мбайт/с |
2 | 512 Мбайт/с | 1 Гбайт/с |
4 | 1 Гбайт/с | 2 Гбайт/с |
8 | 2 Гбайт/с | 4 Гбайт/с |
16 | 4 Гбайт/с | 8 Гбайт/с |
PCI Express: x1, x4, x8, x16
На большинстве материнских плат для подключения видеокарты используется 16 линий PCI Express.
На многих системах с двумя видеокартами два физических слота x16 PCI Express работают в режиме x8 линий каждый.
Чтобы видеокарта заработала в режиме x8 PCI Express, мы заклеили часть контактов скотчем.
Чтобы видеокарта заработала в режиме x4 PCI Express, нам пришлось заклеить скотчем ещё больше контактов.
Та же самая видеокарта, но заклеено больше контактов. Она работает в режиме x4 PCI Express.
То же самое можно сказать и про x1 PCI Express. Мы заклеили все контакты, которые не требовались в режиме x1.
Если заклеить лишние контакты, то видеокарта PCI Express станет работать в режиме всего x1 PCI Express. Пропускная способность составляет 256 Мбайт/с в обоих направлениях.
Следует учитывать, что не каждая материнская плата может работать с видеокартами с низким числом линий PCI Express. В нашей
Схема слота x16 PCI Express. По ней можно определить, какие контакты требовалось заклеивать скотчем. Нажмите на картинку для увеличения.
Конкуренты: ATi Radeon X1900 XTX и nVidia GeForce 8800 GTS
Мы взяли две high-end видеокарты от двух конкурентов: AMD/ATi и nVidia, а именно, Radeon X1900 XTX и GeForce 8800 GTS. Модели, конечно, не самые топовые, но определённо класса high-end.
ATi Radeon X1900 XTX
ATi Radeon X1900 XTX состоит из 384 млн. транзисторов и предлагает 48 блоков пиксельных шейдеров. Они организованы по четыре блока в так называемые “квады”. GPU работает на частоте 675 МГц, на видеокарту установлено 512 Мбайт памяти GDDR3, работающей на частоте 775 МГц (1,55 ГГц DDR). Обратите внимание, что видеокарты ATi из линейки X1xxx не относятся к стандарту DirectX 10.
Мы взяли модель HIS X1900 XTX IceQ3, которая использует улучшенную систему охлаждения. Поскольку дизайн эталонный, то вентилятор карты по-прежнему радиальный, зато есть система тепловых трубок и массивный радиатор. По нашему опыту, видеокарта HIS работает тише, чем эталонные модели ATi.
nVidia GeForce 8800 GTS
Линейка GeForce 8 от nVidia является передовой у этой компании. Хотя перед нами первые видеокарты класса DirectX 10 потребительского уровня, nVidia не очень удачно стартовала под Windows Vista из-за проблем с драйверами. Чип работает на частоте 500 МГц, а пиксельные процессоры – на 1,2 ГГц. В продаже есть карты с 320 и 640 Мбайт ОЗУ, все они используют 800-МГц память (1,6 ГГц DDR).
Мы взяли GeForce 8800 GTS с 320 Мбайт памяти GDDR3 от Zotec. Карта построена по эталонному дизайну nVidia.
Тестовая конфигурация
Системное аппаратное обеспечение | |
Socket 775 | Intel Core 2 Extreme X6800 (Conroe 65 нм, 2,93 ГГц, 4 Мбайт кэша L2) |
Материнская плата | MSI 975X Platinum PowerUp Edition, чипсет: Intel 975X, BIOS: 2007-01-24 |
Общее аппаратное обеспечение | |
Память | 2x 1024 Мбайт DDR2-8000 (CL 4,0-4-4-12), Corsair CM2X1024-6400C3 XMS6403v1.1 |
Видеокарта I | HIS X1900 XTX IceQ3, GPU: ATi Radeon X1900 XTX (650 МГц), память: 512 Мбайт GDDR3 (1 550 МГц) |
Видеокарта II | Zotec GeForce 8800 GTS, GPU: GeForce 8800 GTS (500 МГц), память: 320 Мбайт GDDR3 (1 200 МГц) |
Жёсткий диск | 400 Гбайт, 7 200 об/мин, кэш 16 Мбайт, SATA/300, Western Digital WD4000KD |
DVD-ROM | Gigabyte GO-D1600C (16x) |
Программное обеспечение | |
Графический драйвер I | ATi Catalyst Suite 7.2 |
Графический драйвер II | nVidia ForceWare 97.92 |
Драйверы платформы Intel | Chipset Installation Utility 8.1.1.1010 |
DirectX | Версия: 9.0c (4.09.0000.0904) |
ОС | Windows XP Professional, Build 2600 SP2 |
Тесты и настройки
Тесты и настройки | |
3D-игры | |
Call Of Duty 2 | Version: 1.3 Retail Video Mode: 1600×1200 Anti Aliasing: 4x Texture Filter: Anisotropic Timedemo demo2 |
Quake 4 | Version: 1.2 (Dual-Core Patch) Video Mode: 1600×1200 Video Quality: Ultra (ATI)/High(Nvidia) Anti Aliasing: 4x Multi CPU: Yes THG Timedemo waste.map timedemo demo8.demo 1 (1 = load textures) |
Приложения | |
SPECviewperf 9 | Version: 9.03 All Tests |
3D Mark06 | Version: 1.1 Video Mode: 1600×1200 Anti Aliasing: 4x Anisotropic Filter: 8x |
Call of Duty 2
Как видим, nVidia GeForce 8800 GTS работает на скоростях x1 и x4 просто ужасно, заметно ниже максимального уровня производительности, который достижим только при скоростях x16. ATi Radeon X1900 XTX, с другой стороны, для нормальной работы в Call of Duty 2 требуется пропускная способность не больше x4 PCI Express.
Quake 4
Ситуация в Quake 4 совершенно иная. Здесь ATi Radeon X1900 XTX и nVidia GeForce 8800 GTS начинают вполне нормально работать на скорости x4 PCI Express, а при переходе на x8 или x16 выигрывают незначительно.
3DMark06
Графический 3D-тест 3DMark06 от Futuremark очень сильно нагружает GPU, поскольку он с самого начала разрабатывался для подобной цели. Поэтому требования к интерфейсу у него невелики. nVidia GeForce 8800 GTS сильнее реагирует на снижение пропускной способности интерфейса PCI Express по сравнению с ATi Radeon X1900 XTX, который работает близко к максимуму уже на скорости x4 PCI Express.
SPECviewperf 9.03
Профессиональный графический OpenGL-тест SPECviewperf 9.03 очень сильно нагружает центральный процессор и графическую подсистему. Как видим, результаты заметно зависят от скорости интерфейса. Было весьма любопытно отметить, как масштабируется производительность при переходе от x1 к x4 и к x8 PCI Express. Переход к x16 PCI Express даёт прирост производительности, но уже не такой существенный. В любом случае, можно совершенно определённо сказать, что профессиональные графические приложения требуют интерфейса с высокой пропускной способностью. Поэтому, если вы хотите работать с 3DSMax, Catia, Ensight, Lightscape, Maya, Pro Engineer или SolidWorks, то без x16 PCI Express не обойтись.
Заключение
Заключение нашего
Но в наше время ситуация изменилась. Как видим, четырёх линий PCI Express для получения максимальной производительности уже недостаточно. Хотя мы наблюдаем различия как между ATi/AMD и nVidia, так и между играми и профессиональными приложениями, в большинстве случаев максимальная производительность достигается только с интерфейсом x16 PCI Express. Мы тестировали две 3D-игры, Quake 4 и Call of Duty 2, которые сегодня нельзя назвать самыми требовательными, но они определённо выигрывают от более быстрого интерфейса. Но самые любопытные результаты мы получили в тесте SPECviewperf 9.03, поскольку он показал существенное падение производительности при снижении скорости интерфейса PCI Express ниже x16.
Результаты производительности наглядно показывают, что сегодня материнские платы и чипсеты должны поддерживать все видеокарты на полной скорости x16 PCI Express. Если вы установите высокопроизводительные видеокарты на “слабый” интерфейс, такой, как PCI Express x8, то придётся пожертвовать производительностью.