Введение
В нашем недавнем анализе работы трёх GPU в режиме CrossFireX на материнских платах на основе P55 мы отметили, что снижение пропускной способности третьего слота PCIe x4 версии v1.1 является наиболее вероятной причиной значительного уменьшения производительности в некоторых играх по сравнению с идентичной (кроме как по количеству GPU) конфигурацией с двумя видеокартами. Интерфейс LGA-1156 обладает “родной” поддержкой только шестнадцати линий PCIe 2.0 5,0 Гбит/с по, максимум, двум устройствам, что оставляет для подключения другой периферии медленные линии чипсета P55 на 2,5 Гбит/с. Многие наши читатели с недоумением отнеслись к попыткам некоторых производителей добавить третий слот полной длины x16 к материнским платам на LGA-1156.
Но что если третий слот не будет зависеть от чипсета для получения данных? Ведь никто не мешает использовать какой-либо коммутатор для разделения шестнадцати линий процессора на три канала – то есть мы получим своего рода эквивалент пропускной способности пяти линий 5,0 Гбит/с на каждую видеокарту. Конечно, карты не могут работать в таком режиме, но дополнительный контроллер, если он достаточно “умный” может распределить эту пропускную способность по восьми линиям. Поскольку контроллер PCIe процессоров LGA-1156 может работать только с двумя устройствам, дополнительный контроллер должен выглядеть для процессора как один компонент, управляя передачей данных к любым подключённым видеокартам через свою собственную логику.
К счастью, устройства подобного типа под названием “мосты PCI-Express” уже существуют. nVidia уже давно использует собственный мост nForce 200 для трансформации чипсета 680i SLI с поддержкой PCIe 1.1 в полноценную версию 780i с PCIe 2.0. Конечно, многие критики 780i указывают на то, что северный мост является “узким местом”, но мост NF200 всё же смог успешно сгладить неравенство по пропускной способности.
Наши последние тесты масштабируемости CrossFire начались с анализа PCIe, который показал 4% падение по производительности при переходе со слота x16 PCIe 2.0 на x8 PCI-Express 2.0. Приведёт ли снижение пропускной способности до приблизительно пяти линий на карту к ещё более сильному падению производительности? Две материнские платы, которые мы протестировали в недавней статье, посвящённой топовым моделям на Intel P55, позволили найти ответ на этот вопрос.
Аппаратная конфигурация
В нашей лаборатории осталось две материнские платы на чипсете Intel P55 с мостом NF200 – EVGA P55 Classified 200 и MSI Big Bang Trinergy.
Нажмите на картинку для увеличения.
Нажмите на картинку для увеличения.
Аппаратная конфигурация | |
LGA-1156 CPU | Intel Core i7-860 (2,93 ГГц, кэш 8,0 Мбайт), разгон до 4,00 ГГц (20x 200 МГц), 1,388 В/1,367 В |
Материнская плата P55 | EVGA P55 SLI E655, P55 Express PCH, BIOS A39 (10/23/2009) |
Материнские платы P55+NF200 | EVGA P55 Classified 200, BIOS A51 (29 дек 2009) MSI Big Bang-Trinergy, BIOS V1.1 (24 ноя 2009) |
Процессор LGA-1366 | Intel Core i7-920 (2,66 ГГц, кэш 8,0 Мбайт), разгон до 4,00 ГГц (20x 200 МГц), 1,434 В |
Материнская плата X58 | EVGA X58 SLI E758, X58 Express IOH, ICH10R, BIOS SZ2Z (11/30/2009) |
Кулер CPU | Thermalright MUX-120 с вентилятором на 2500 об/мин |
Память | Kingston KHX2133C9D3T1K2/4GX (4,0 Гбайт), DDR3-2133 в режиме DDR3-1600 CAS 8-8-8-24 |
Видеокарта | 3x Diamond HD 5870 1,0 Гбайт, 850 МГц GPU, GDDR5-4800 |
Жёсткий диск | Western Digital Velociraptor WD3000HLFS, 300 Гбайт, 10 000 об/мин, SATA 3 Гбит/с, кэш 16 Мбайт |
Звуковая карта | Встроенная HD Audio |
Сеть | Встроенная 1 Гбит/с |
Блок питания | Corsair CMPSU-850HX 850W Modular, ATX12V v2.2, EPS12V, 80-Plus Gold |
Программное обеспечение | |
ОС | Microsoft Windows 7 Ultimate x64 |
Видеокарта | ATI Catalyst 9.11 |
Чипсет | Intel INF 9.1.1.1015 |
Мы планировали нынешние тесты только для проверки теории, что мост NF200 является приемлемым решением для трёх GPU в режиме CrossFireX с последними процессорами Intel LGA-1156. Для этого было бы вполне достаточно одной материнской платы P55 + NF200. Проблема же заключается в том, что подключение моста nForce 200 можно сделать по-разному.
У материнской платы MSI Trinergy используется “стандартный” метод для увеличения числа линий PCIe через мост NF200. Все шестнадцать линий процессора PCIe 2.0 подключаются к мосту, который затем может снабжать данными до двух видеокарт в режиме x16 или до четырёх в режиме x8. MSI вывела на первый слот шестнадцать линий из 32 у моста NF200, а на второй слот – восемь фиксированных и восемь переключаемых линий. Третий слот MSI отнимает восемь линий у второго слота с помощью автоматического переключения при установке видеокарты – переключая конфигурацию из режима x16/x16/x0 в x16/x8/x8
Материнская плата Asus P7P55 WS Supercomputer использует то же самое подключение 16 линий к NF200, что и в случае MSI, но даёт четыре слота с помощью двух наборов переключателей. Первый и второй слоты P7P55 WS Supercomputer могут делиться пропускной способностью таким же образом, что и второй и третий слоты MSI, позволяя установить конфигурацию x16/x0/x16/x0, x16/x0/x8/x8 или x8/x8/x8/x8 в зависимости от того, заняты или нет второй и/или четвёртый слоты. Нам нужно было протестировать материнскую плату Asus или MSI, чтобы проверить эффективность работы всех шестнадцати линий PCIe 2.0 процессора через мост NF200, и материнская плата MSI для этой задачи оказалась удобнее.
EVGA P55 Classified 200 подключает к мосту NF200 только восемь из 16 линий интерфейса LGA-1156 , позволяя эксклюзивно использовать другие восемь линий для верхнего слота PCIe x16 материнской платы. Эта конфигурация увеличивает максимальное количество поддерживаемых видеокарт на одну, но заставляет четыре видеокарты, поддерживаемые мостом NF200, совместно использовать пропускную способность всего восьми линий процессора.
Тесты и настройки
3D-игры | |
Crysis | Patch 1.2.1, DirectX 10, 64-bit executable, benchmark tool Test Set 1: Very High Details, No AA Test Set 2: Very High Details, 4x AA |
Far Cry 2 | Patch 1.03, DirectX 10, in-game benchmark Test Set 1: Ultra High Quality, No AA Test Set 2: Ultra High Quality, 4x AA |
Tom Clancy’s H.A.W.X | Patch 1.02, DirectX 10.1, in-game benchmark Test Set 1: Highest Settings, No AA Test Set 2: Highest Settings, 4x AA |
S.T.A.L.K.E.R. Clear Sky | Clear Sky Benchmark version Test Set 1: Ultra Preset, DX10 EFDL, No AA Test Set 2: Ultra Preset, DX10 EFDL, 4x MSAA |
World in Conflict | Patch 1009, DirectX 10, timedemo Test 1: Very High Details, No AA / No AF Test 2: Very High Details 4x AA / 16x AF |
Синтетические тесты | |
3DMark Vantage | Version: 1.0.1, GPU and CPU scores |
Crysis
В нашем распоряжении были три разных конфигурации на каждой материнской плате, но мы решили упростить диаграммы производительности в играх, используя только один результат на каждое разрешение.
Даже одной Radeon HD 5870 достаточно, чтобы играть в Crysis с очень высокой детализацией, когда разрешение составляет всего 1680×1050 пикселей. Мост NF200 существенно помогает обеим материнским платам на Intel P55, когда дело касается поддержки трёх GPU в конфигурации CrossFireX, но только MSI Trinergy получает прирост в конфигурации с двумя видеокартами.
Две HD 5870 необходимы для плавной игры в Crysis в разрешении 1920×1200 с очень высокой детализацией, но для подобной конфигурации вполне хватает и платформы P55. Наши предыдущие наблюдения по поводу NF200 оказываются верны и здесь.
Из-за рывков и подтормаживаний играть в Crysis в разрешении 2560×1600 будет уже некомфортно, поэтому преимущество CrossFireX в данном случае больше теоретическое независимо от используемой материнской платы. MSI показывает себя удивительно близко к материнской плате X58 в конфигурациях с двумя и тремя GPU.
Включение сглаживания приводит к падению производительности на всех конфигурациях, и результаты в разрешении 1680×1050 очень похожи на разрешение 1920×1200 без сглаживания. Для плавной игры на всех платформах требуются две видеокарты.
Производительность немного падает в разрешении 1920×1200, но тест всё равно требует две видеокарты для плавной игры, а не три. NF200 продолжает обеспечивать серьёзный прирост производительности в конфигурации с тремя GPU на обеих материнских платах, но только MSI даёт схожий прирост при работе с двумя GPU.
У Crysis всегда возникали проблемы с работой нескольких GPU в разрешении 2560×1600 с активным сглаживанием AA, так что приведённые результаты смысла не имеют.
Far Cry 2
Far Cry 2 не требуется CrossFire для адекватной производительности, но мы можем видеть преимущество от добавления контроллера NF200 к чипсету P55.
В разрешении 1680×1050 чипсет P55 приводит к падению производительности после добавления третьей видеокарты, подключённой через контроллер PCIe чипсета. Установка третьей видеокарты средствами NF200 позволяет материнским платам EVGA P55 Classified 200 и MSI Big Bang Trinergy достичь такой же производительности, что и для чипсета Intel X58.
Только в разрешении 2560×1600 GPU уже требуется высокая пропускная способность, и в “родном” режиме P55 мы, наконец, видим прирост на трёх GPU. Обе материнские платы P55 с мостом NF200 продолжают конкурировать с X58 по производительности.
Добавление 4x AA даёт достаточную нагрузку на GPU, чтобы от режима CrossFireX наблюдалось преимущество даже на наименее производительной материнской плате (в “родном” режиме), обе платформы P55 с мостом NF200 продолжают давать производительность на уровне X58.
Tom Clancy’s H.A.W.X
Tom Clancy’s H.A.W.X – ещё одна игра, в которой владельцам Radeon HD 5870 можно не прибегать к конфигурации CrossFireX, поскольку одна видеокарта уже прекрасно справляется со своей работой.
Прирост производительности нельзя назвать необходимым, но NF200 всё равно увеличивает производительность платформ на Intel P55 до уровня X58 после установки трёх видеокарт.
Для запуска игры в разрешении 2560×1600 с очками с 30-Гц затворами потребуются две видеокарты. Если же вам нужен максимальный прирост производительности после установки трёх GPU в режиме CrossFireX, то потребуется либо материнская плата на X58, либо на Intel P55 с мостом NF200.
S.T.A.L.K.E.R. Clear Sky
Игра Clear Sky требует более мощной производительности GPU для высокой частоты кадров, но разница в пропускной способности становится заметной только на самых высоких настройках.
В разрешении 1920×1200 с активным сглаживанием 4x MSAA мы, наконец, достигаем момента, когда одного GPU уже недостаточно для производительности уровня 40 fps. Для этого требуются уже два графических процессора, причём неважно, на какой материнской плате мы их будем использовать.
В разрешении 2560×1600 мы, наконец, видим причину покупать более дорогую материнскую плату на Intel X58 или на Intel P55 с мостом NF200. При данной настройке требуются три видеокарты Radeon HD 5870, но только три лидирующие материнские платы могут использовать дополнительную вычислительную мощность, чтобы дать высокую частоту кадров (выше 40 fps по среднему уровню).
World in Conflict
Игра World in Conflict, похоже, упирается в CPU, когда режим CrossFire используется в низком разрешении, хотя CrossFire и не требуется для плавной частоты кадров.
Конфигурация CrossFireX на трёх GPU, наконец, обгоняет вариант на двух GPU в разрешении 2560×1600, и мы также видим, насколько хорошо NF200 помогает платформе LGA-1156, чтобы достичь производительности уровня X58.
Добавление максимального уровня сглаживания и анизотропной фильтрации позволяет отделить конфигурацию X58 CrossFireX от менее дорогих вариантов, хотя мост NF200 существенно помогает P55.
Наш максимальный режим World in Conflict, наконец, приводит к ситуации, когда одной видеокарты HD 5870 уже недостаточно для большинства игроков. Двух карт уже явно хватает, хотя разница в производительности между “родным” режимом Intel P55 и вариантом с мостом NF200 становится значительной только после установки трёх видеокарт.
3DMark Vantage
Подобно многим нашим другим тестам, прогон производительности 3DMark Vantage демонстрирует падение после добавления третьего GPU через контроллер PCIe чипсета P55 (“родной” режим).
Ситуация выглядит не особо лучше для “родного” контроллера чипсета Intel P55 в прогоне “High” 3DMark. Что больше огорчает, реализация EVGA NF200 обходит MSI – совершенно противоположно тому, что мы видели в реальных играх.
В настройке “Extreme” реализация MSI NF200 обошла даже Intel X58, и здесь нам следует признаться: обе материнские платы на NF200 показали очень неоднородные результаты между последовательными прогонами, и причину этой неоднородности мы так и не определили.
Впрочем, мы уже многие годы относимся к результатам 3DMark со значительной долей скепсиса.
Заключение по производительности
Если отбросить неоднородные результаты 3DMark, то будет интересно посмотреть на среднюю производительность во всех играх. Мы начнём сравнение с самого низкого тестового разрешения.
У “родного” контроллера PCIe чипсета Intel P55 уже наблюдаются проблемы с тремя GPU, поскольку он даёт всего на 2,6 fps более высокую производительность, чем с двумя графическими процессорами на той же материнской плате. Впечатляюще видеть, что обе платформы Intel P55 с мостом NF200 дают почти такую же хорошую производительность в режиме CrossFireX, что и в случае с более дорогим Intel X58.
Три видеокарты в режиме CrossFireX продолжают оставаться не самым лучшим решением для стандартной материнской платы Intel P55 в разрешении 1920×1200, но модели с мостом NF200 работают вполне нормально по сравнению с Intel X58.
В разрешении 2560×1600 начинается переход с “узкого места” по пропускной способности к ограниченной производительности GPU, но мост NF200 всё равно необходим платформам LGA-1156, чтобы достичь производительности X58 в конфигурации CrossFireX.
Платформы Intel P55, улучшенные мостом NF200, не дотягивают около 3% до уровня производительности X58 в самом тяжёлом тестовом режиме.
Но может ли мост помочь Intel X58?
В нашей редакции мы довольно горячо обсуждали то, является ли увеличение производительности CrossFireX после добавления моста nForce 200 к чипсету Intel P55 простым следствием получения доступа к более скоростным линиям PCIe 2.0 процессора. Кроме потенциального совместного использования тремя картами пропускной способности 80 Гбит/с у интерфейса PCIe CPU, среди возможных улучшений можно отметить возможность видеокарт связываться друг с другом с пропускной способностью до 40 Гбит/с, а также вероятность того, что все три видеокарты, подключённые к NF200, получают одни и те же данные с CPU (эквивалент производительности 120 Гбит/с от интерфейса PCIe 80 Гбит/с у CPU). Конечно, мост NF200 можно использовать для того, чтобы обеспечить чипсету X58 достаточное количество дополнительных линий для поддержки трёх видеокарт с полными шестнадцатью линиями каждая, но дадут ли эти линии разницу по производительности 4%, которую мы заметили между слотами x8 и x16 в статье “Тесты масштабируемости PCI Express и CrossFire: насколько хорош чипсет Intel P55?“?
Нам требовалось узнать, будут или нет дополнительные линии моста nForce 200 обеспечивать какое-либо преимущество по сравнению с нашей конфигурацией x16/x8/x8, которая поддерживается чипсетом Intel X58. И какую потерю по производительности мы получим, если перейдём на менее дорогую материнскую плату Intel X58 с поддержкой режима x16/x16/x4. Поддержка конфигурации X58 + NF200 появилась на материнской плате MSI Eclipse Plus с BIOS версии V1.1, а Asus P6T (BIOS 0801) представляет собой менее дорогую опцию X58 (конфигурация x16/x16/x4).
Поскольку статью нужно было уже публиковать, то у нас было немного времени для проведения нескольких дополнительных тестов, не говоря уже о полном пакете. Мы выбрали тест Far Cry 2 как “наиболее типичный” индикатор игровой производительности.
Материнская плата MSI Eclipse Plus с мостом NF200 обходит “родное ” решение X58 при среднем уровне разрешения, но производительность становится идентичной в разрешении 2560×1600. В более высоком разрешении сдаёт и конфигурация Asus x16/x16/x4, но не так сильно, чтобы оттолкнуть большинство покупателей, кто нацелился на менее дорогую материнскую плату.
Преимущество NF200 на материнских платах Intel X58 исчезает, когда мы включаем сглаживание. Поскольку материнская плата Asus P6T дешевле всех вариантов, за исключением аутсайдера EVGA P55 SLI, её вполне можно рекомендовать тем, кому требуется оптимальное по цене решение.
Заключение: P55 с тремя GPU в режиме CrossFireX
Можно ли сделать вывод, что мост Nvidia nForce 200 PCI-Express решает проблему производительности CrossFireX, которая наблюдалась у предыдущих платформ Intel P55? Совершенно верно!
MSI Big Bang Trinergy даёт производительность всего на 2% ниже старой доброй платформы Intel X58, причём эту разницу в производительности можно легко компенсировать – всё же процессоры LGA-1156 разгоняются, как правило, лучше моделей LGA-1366. Не геймеры наверняка приведут такие аргументы в пользу платформ Intel X58, как появление шестиядерных процессоров для LGA 1366, поддержку на платформе X58 устройств с высокой пропускной способностью (таких как профессиональные RAID-контроллеры) или наличие у интерфейса LGA-1366 поддержки трёх каналов памяти, которая на практике должна дать преимущество только с шестиядерными процессорами (как нам кажется). Всё это, конечно, хорошие причины для выбора более гибкой и менее разгоняемой платформы Intel X58, но все, кому требуется высокая игровая производительность, наверняка знают, как можно использовать дополнительную тактовую частоту CPU, которую обычно можно выжать у процессоров LGA-1156.
Фанаты Asus заметят, что плата P7P55 WS Supercomputer вышла раньше MSI Trinergy, и при этом она использовала тот же самый мост NF200 для поддержки четырёх, а не трёх слотов полной длиной x16. Идентичный метод подключения должен дать почти идентичный результат производительности, но раскладка слотов Asus более удобна для размещения трёх двухслотовых видеокарт в стандартном корпусе ATX.
EVGA P55 Classified 200 потеряла по производительности 0,4% (по сравнению с материнской платой MSI Big Bang Trinergy), но дала ещё один слот PCIe. Мы не знаем, когда AMD или nVidia разработают массивы из пяти GPU, но EVGA явно одной из первых к этому подготовится.
Мы также вкратце исследовали преимущество по производительности от использования того же самого принципа на чипсете Intel X58, чтобы обеспечить 48 линий для подключения видеокарт через доступные 32 линии чипсета. К сожалению, мы пока не встретили набор видеокарт и игру, которые бы требовали такую пропускную способность, что оставляет MSI Eclipse Plus в одиночестве. Впрочем, есть и хорошая новость для владельцев недорогих материнских плат Intel X58: конфигурация слотов x16/x16/x4 недорогой материнской платы Asus P6T дала падение производительности всего 4% по сравнению со своим конкурентом x16/x8/x8.