Xeon E5-2687W: заменяя лучшее
Редакция THG уже много лет публикует статьи, посвящённые технологическим новинкам, и мы можем с уверенностью сказать, что всегда рады делать обзоры по новейшему оборудованию, тестируя его различными способами, и делиться впечатлениями с нашими читателями, которые разделяют наше увлечение.
Хотя большим вниманием пользуются игровые компоненты, всё же существуют энтузиасты, которым интересно развитие более профессионального IT-оборудования. Даже если в вашей системе установлен игровой Phenom II X6, велика вероятность того, что вам, как и миллиону других читателей, тоже было очень любопытно, как выглядит компьютер за $16 000 от Puget Systems с жидкостным охлаждением.
Сегодняшняя статья тоже будет весьма любопытна энтузиастам. Мы уже проанализировали всю линейку процессоров Core i7-3000 на архитектуре Sandy Bridge-E в обзорах “Intel Core i7-3960X: Sandy Bridge-E и X79” и “Intel Core i7-3930K и Core i7-3820: доступный Sandy Bridge-E”. Мы знаем, что Intel, в какой-то степени, урезает все эти настольные процессоры либо для того, чтобы попасть в определённые рамки мощности на достойном уровне тактовой частоты, либо чтобы более ярко выделить ориентированные на серверные окружения процессоры, наверняка сказать трудно.
Но сегодня в наших руках находится самый новый процессор для серверов с одним, двумя или четырьмя сокетами, под названием Xeon E5-2687W.
Sandy Bridge-EP
Intel базирует процессоры Xeon E5 на таком же кристалле, что и CPU серии Core i7-3000. Максимум для линейки Core i7 – это шесть ядер и общий кэш L3 на 15 Мбайт. Но на этом же чипе располагаются восемь ядер и 20 Мбайт кэша.
Модульный принцип этого дизайна реализован через концепцию кольцевой шины, впервые рассмотренную нами в обзоре “Sandy Bridge: Intel Core второго поколения” (если точнее, первыми CPU с кольцевой шиной были процессоры Xeon 7500, но мы их не тестировали). У вас есть ядра, контроль над PCI Express, QPI (QuickPath Interconnect) и четырёхканальный контроллер памяти, и всё это связано с кольцевой шиной. Поскольку каждое ядро привязано к 2,5 Мбайт кэша L3, манипулировать характеристиками кристалла относительно просто, и при этом создавать больше количество моделей, производительность которых варьируется вполне предсказуемо.
Разговор THG с архитектором Intel, Кеном Крэта (Ken Creta)
Для таких процессоров, как Core i7-3960X, Intel просто обрезает два ядра и, соответственно, по 2.5 Мбайт кэша. Но кэш можно настраивать ещё тоньше. У некоторых моделей Xeon E5 представлено по 2 Мбайт на ядро, это говорит о том, что его можно настраивать блоками по 512 кбайт.
Сегодня у нас появилась возможность протестировать архитектуру Sandy Bridge-EP (EP- Efficient Performance) в её наиболее мощной форме: Xeon E5-2687W — процессор исключительно для рабочих станций мощностью 150 Вт, использующий все восемь физических ядер, кэш на 20 Мбайт, два соединения QPI 8 GT/s, 40 линий PCIe третьего поколения на кристалле и четырёхканальный контроллер памяти поддерживающий DDR3-1600. Эта высокоинтегрированная система на кристалле (SOC) с техпроцессом 32 нм, состоит из 2,27 миллиарда транзисторов, упакованных в громоздкий кристалл площадью 434 мм².
Максимальная частота Xeon E5-2687W в режиме Turbo Boost составляет 3.8 ГГц, это немного меньше, чем у Core i7-3960X, показатель которого в слабопроточных приложениях достигает 3.9 ГГц. Но благодаря двум дополнительным ядрам, при более “тяжёлых” рабочих нагрузках, базовую частоту процессора Xeon, которая составляет 3.1 ГГц, с лёгкостью можно сравнить с 3.3 ГГц у Core i7-3960X.
И хотя у данной версии Xeon больше кэша, распределение остаётся прежним: 2.5 Мбайт на ядро, впрочем, как и у всех остальных моделей Xeon E5.
Есть ещё одно заметное различие между односокетными процессорами Core i7/Xeon E5-1600 и мультисокетными платформами Intel – это наличие QPI. Когда компания Intel заменила процессоры на базе Gulftown архитектурой Sandy Bridge-E, она одновременно переключилась с платформ из трёх частей (CPU, северный мост и южный мост) на двухчиповую раскладку (CPU и PCH), при этом убирая хаб ввода/вывода, отвечающий за линии PCI Express. Соединение между процессором и северным мостом, которое обеспечивал QPI, было разорвано. С интеграцией PCIe прямо в процессор, южный мост можно привязать к CPU через интерфейс Direct Media, похожий на PCI Express. Таким образом, QPI полностью отключён в чипах Sandy Bridge-E.
Однако мультисокетовые системы по-прежнему нуждаются в QPI для межпроцессорной передачи. Процессоры Sandy Bridge-EP используют два соединения QPI. В конфигурации 2S они оба используются для транспортировки данных в обе стороны между сокетами. При работе с четырьмя процессорами они создают что-то вроде круга, передавая данные влево и вправо. Intel пытается представить скорость передачи данных QPI как дифференцирующую функцию, но тогда как максимум Xeon 5600 составляет 6.4 GT/s, что даёт 25.6 Гбит/с на соединение, более современный Xeon E5 имеет соединения по 8 GT/s и пропускная способность поднимается до 32 Гбит/с на соединение. Очевидно, что в рабочих станциях 2S, такой как наша, 64 Гбит/с агрегированной пропускной способности более чем достаточно. Но мы рады, что “узкие места” вызванные шиной убраны.
Кроме количества ядер, кэша L3 и QPI, Sandy Bridge-EP архитектурно соответствует Sandy Bridge-E. Поддержка AVX, AES-NI, Turbo Boost второго поколения, Hyper-Threading— всё это нам знакомо и присутствует в новой линейке.
Стоит отметить ещё одну особенность архитектуры Sandy Bridge-EP: её четырёхканальный контроллер памяти поддерживает зеркальное резервирование, аппаратную коррекцию ошибок и функцию lockstep. Все три функции были доступны на процессорах Xeon 5500/5600, но трёхканальная архитектура контроллера памяти требовало компромиссов. Сейчас вы можете дублировать два канала и в каждом восстановиться после сбоя.
Встречайте процессоры Xeon E5
SoC, спроектированный для масштабируемости, даёт дорогу широкому модельному ряду. Всего существует четыре отдельных семейства процессоров Xeon E5, каждое разработано для различных целей.
Предыдущая схема названий Intel не позволяла описать большую линейку моделей, поэтому компании пришлось пересмотреть терминологию. Xeon E7 уже существуют, также как и Xeon E3 начального уровня. Xeon E5 находится посередине, модели которого частично совпадают с обоих концов. Теперь нам предстоит выявить степень согласованности при присвоении модельных номеров. Давайте разбираться.
Вначале стоит название бренда, Xeon. Довольно просто. Далее идёт линейка продукции: E3, E5, или E7. Главное понимать, что E3 предназначен для односокетных рабочих станций и серверов начального уровня, E5 предлагает более широкий выбор от односокетных до четырёхсокетных систем. E7 охватывает двух, четырёх и восьмисокетные сервера.
Первая цифра, с которой вы встречаетесь, указывает на максимальное количество CPU в узле (1, 2, 4 или 8).
Вторая отвечает за тип сокета. Intel планирует и дальше использовать цифры 2, 4, 6 и 8. Однако интерфейс, соответствующий определённой цифре, может меняться. По крайней мере на данный момент существуют следующие ассоциации:
- 2 = LGA 1155
- 4 = LGA 1356
- 6 = LGA 2011
- 8 = LGA 1567
Последние две цифры являются указателями SKU, например 10, 20, 30 и так далее. Хотя определённой формулы, объясняющей почему один чип может идти под номеров 50, а другой под 70, не существует. Intel говорит, что для классификации чипа использует комбинацию количества ядер, размера кэша, тактовой частоты, передачи данных QPI и другие параметры.
Некоторые модели могут получить суффикс из одной буквы. Например, буква L в конце названия модели говорит о том, что это low-power – версия(с низким TDP). Один процессор в сегодняшнем тестировании имеет пометку W (workstation) и он предназначен для рабочих станций.
И наконец, в будущем Intel планирует использовать номер версии после названия, например, v2 или v3, для определения поколения. Впервые это будет применяться на процессорах Ivy Bridge.
Xeon E5-1600
Опираясь на вышеупомянутую информацию можно сделать вывод, что процессор Xeon E5-1600 разработан для односокетных конфигураций на базе LGA 2011. Возможно, вы будете удивлены, но три доступные модели отражают три настольных процессора Core i7 серии 3000, которые мы уже рассматривали. Характеристики в точности совпадают с моделями Core i7-3960X, -3930K и -3820.
Xeon E5-2600
Теперь поговорим о процессорах, которые уже нельзя использовать в настольной системе, поскольку линейка Xeon E5-2600 поддерживает двухсокетное расположение. Семейство процессоров Xeon E5-2600 очень большое и представлено семнадцатью моделями, ранжирующихся от двухъядерных моделей мощностью 80 Вт для рабочих станций, до восьмиядерных флагманов мощностью 150 Вт. Между ними вы найдёте четырёх и шестиядерные модели мощностью 80 и 95 Вт соответственно. А мощность SKU с суффиксом L (low-power) находится ниже уровня 60 Вт.
Ядра/потоки | Кэш | TDP | QPI | Поддерживаемая память | |
Высокопроизводительные | |||||
Xeon E5-2690 | 8/16 | 20 Мбайт | 135 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2680 | 8/16 | 20 Мбайт | 130 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2670 | 8/16 | 20 Мбайт | 115 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2665 | 8/16 | 20 Мбайт | 115 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2660 | 8/16 | 20 Мбайт | 95 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2650 | 8/16 | 20 Мбайт | 95 Вт | 8 GT/s | DDR3-1600 |
Стандартные | |||||
Xeon E5-2640 | 6/12 | 15 Мбайт | 95 Вт | 7.2 GT/s | DDR3-1333 |
Xeon E5-2630 | 6/12 | 15 Мбайт | 95 Вт | 7.2 GT/s | DDR3-1333 |
Xeon E5-2620 | 6/12 | 15 Мбайт | 95 Вт | 7.2 GT/s | DDR3-1333 |
Базовые | |||||
Xeon E5-2609 | 4/4 | 10 Мбайт | 80 Вт | 6.4 GT/s | DDR3-1066 |
Xeon E5-2603 | 4/4 | 10 Мбайт | 80 Вт | 6.4 GT/s | DDR3-1066 |
Дополнительные SKU для LGA 2011 | |||||
Xeon E5-2687W | 8/16 | 20 Мбайт | 150 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2667 | 6/12 | 15 Мбайт | 130 Вт | 7.2 GT/s | DDR3-1333 |
Xeon E5-2643 | 4/8 | 10 Мбайт | 130 Вт | 6.4 GT/s | DDR3-1066 |
Xeon E5-2637 | 2/4 | 5 Мбайт | 80 Вт | ||
С пониженным энергопотреблением | |||||
Xeon E5-2650L | 8/16 | 20 Мбайт | 70 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-2630L | 6/12 | 15 Мбайт | 60 Вт | 7.2 GT/s | DDR3-1333 |
Два восьмиядерных E5-2687W под полной нагрузкой
Нам досталась пара процессоров Xeon E5-2687W мощностью 150 Вт, специально предназначенных для рабочих станций. У данной модели восемь ядер с базовой частотой 3.1 ГГц (3.8 ГГц максимум с Turbo Boost), 20 Мбайт кэша L3 и соединения QPI 8 GT/s – это очень мощная конфигурация, требующая соответствующего охлаждения.
Xeon E5-4600
Линейки прошлого поколения, Xeon 5500 и 5600, были ограничены двухсокетными системами. Поэтому может показаться странным, что компания разработала целую линейку Xeon E5 для четырёхсокетных платформ. Но мы уже убедились на примере процессоров Xeon E7, что Intel больше не пытается сегментировать CPU для серверов, базируясь на количестве ядер. В результате мы получаем серию Xeon E5-4600.
В линейке E5-4600 представлены модели, использующие от четырёх до восьми ядер и два QPI-соединения, что делает её дешевле, чем E7, в которой используется четыре соединения и до десяти ядер на CPU. Можно сказать, что Xeon E7 даёт отличную производительность в бизнес-окружениях, расширение памяти и функциональность RAS, в то время, как E5 лидирует в HPC – окружениях, ориентированных на плотность, и по производительности на ватт.
Ядра/потоки | Кэш | TDP | QPI | Поддерживаемая память | |
Высокопроизводительные | |||||
Xeon E5-4650 | 8/16 | 20 Мбайт | 130 Вт | 8 GT/s | DDR3-1600 |
Xeon E5-4640 | 8/16 | 20 Мбайт | 95 Вт | 8 GT/s | DDR3-1600 |
Стандартные | |||||
Xeon E5-4620 | 8/16 | 16 Мбайт | 95 Вт | 7.2 GT/s | DDR3-1333 |
Xeon E5-4610 | 6/12 | 15 Мбайт | 95 Вт | 7.2 GT/s | DDR3-1333 |
Базовые | |||||
Xeon E5-4607 | 6/12 | 12 Мбайт | 95 Вт | 6.4 GT/s | DDR3-1066 |
Xeon E5-4603 | 4/8 | 10 Мбайт | 95 Вт | 6.4 GT/s | DDR3-1066 |
С пониженным энергопотреблением | |||||
Xeon E5-4650L | 8/16 | 20 Мбайт | 115 Вт | 8 GT/s | DDR3-1600 |
С оптимизированной частотой | |||||
Xeon E5-4617 | 6/12 | 15 Мбайт | 130 Вт | 7.2 GT/s | DDR3-1600 |
В серии E5-4600 вы обнаружите восемь SKU, использующих от четырёх до восьми ядер, TDP которых колеблется от 95 до 130 Вт.
Xeon E5-2400
Все процессоры Xeon E5-x600 устанавливаются в интерфейс LGA 2011, с которым мы уже знакомы. Но Intel предоставляет другой сокет для премиум-систем 1S и систем 2S начального уровня под названием LGA 1356. Хотя это прямой преемник интерфейса LGA 1366, 1356-контактный сокет с ним несовместим (в результате изменений TDP и по расположению PCI Express на кристалле). Однако, как и предшественники, процессоры LGA 1356 используют три канала памяти и одно соединение QPI link между CPU в конфигурациях 2S. Они также предлагают 24 и не 40 линий PCI Express третьего поколения.
Второй новый интерфейс будет более интересен для настольных пользователей, нежели для сферы бизнеса, поскольку там не любят тратить много времени на установку новых процессоров в стойку. В результате Xeon E5-2400 – простой способ получить больше выгоды от архитектуры и заполнить пробел между односокетными E5 и более производительными E5-x600.
Функция | Семейство Xeon E5-2600 | Семейство Xeon E5-2400 |
Интерфейс процессора | LGA 2011 | LGA 1356 |
Каналов памяти | 4 на CPU | 3 на CPU |
Макс. количество слотов DIMM | 24 | 12 |
Макс. объём памяти | 768 Гбайт | 384 Гбайт |
PCIe линий/контроллеров | 80/20 | 48/12 |
Целевая мощность | 150, 135, 130, 115, 95, 80, 70, 60 Вт | 95, 80, 70, 60 Вт |
Направленность | Сервер/рабочая станция | Сервер |
Охлаждение
Процессоры Intel Core i7-3000 – это первые модели, поставляемые без штатного кулера, что даёт пользователям возможность самим выбирать решение для охлаждения
В сфере серверов и рабочих станций ситуация иная. Некоторые из этих чипов могут оказаться в маленьких, отдельно стоящих боксах, в то время как другие могут попасть в узкие стойки. Проще выбирать систему охлаждения для процессоров Xeon E5 по отдельности, в зависимости от приложений.
Три типа радиаторов обеспечивают охлаждение всех 37-ми представленных моделей. Два из них: STS200P и STS200PNRW толщиной 25,5 мм предназначены для установки в стойки. Первый имеет квадратную форму размером 91.5 x 91.5 мм, длина второго составляет 70 мм, а ширина 106 мм, он подходит для более узких сокетов, типичных для среды HPC. Оба решения пассивные и у них одинаковый TDP 130 Вт. Третий кулер, STS200C, включает съёмный вентилятор и может справиться с тепловым пределом в 150 Вт.
Чипсет линейки С600 от Intel
До этого момента мы имели дело только с PCH Patsburg чипсета X79 Express. Однако такой же чип используется в качестве основы для чипсетов линейки C600.
Мы давно знали, что в чипсете X79 представлена не вся функциональность логики. В нём не используется модуль контроллера накопителей (Storage Controller Unit (SCU)). На самом деле это не совсем так. Недавно в обзоре семи материнских плат на X79 Express по цене $260-$320 мы видели, как ECS X79R-AX предоставляла четыре порта SAS.
PCH, который использует ECS, соответствует варианту –B чипсета C600. В остальном идентичная чипсету X79 (включая 14 портов USB 2.0, встроенный Gigabit Ethernet MAC, восемь линий PCIe второго поколения и HD Audio) модель –B официально добавляет четыре порта SAS 6 Гбит/с для трёх коннекторов SATA 3 Гбит/с и двух SATA 6 Гбит/с. Корпоративный драйвер Intel Rapid Storage Technology обеспечивает поддержку RAID 0, 1, 10 и, с дополнительными обновлениями BIOS, RAID 5 с аппаратным XOR на всех портах SATA. SAS ограничены конфигурациями RAID 0, 1 и 10, но через обновление можно добавить поддержку RAID 5.
Чипсет Intel C600 | ||||
-A | -B | -D | -T | |
Порты SATA 3 Гбит/с на базе PCH | 4 | 4 | 4 | 4 |
Порты SATA 6 Гбит/с на базе PCH | 2 | 2 | 2 | 2 |
Порты на базе SCU | 4 x SATA | 4 x SAS | 8 x SAS | 8 x SAS |
Поддержка RSTe SATA RAID | RAID 0/1/10/5 | RAID 0/1/10/5 | RAID 0/1/10/5 | RAID 0/1/10/5 |
Поддержка RSTe SAS RAID | нет | RAID 0/1/10 | RAID 0/1/10 | RAID 0/1/10 |
Поддержка RST3 SAS RAID 5 | нет | нет | нет | есть |
RAID 5 XOR | есть | есть | есть | есть |
Канал связи PCI Express 3.0 x4 | нет | нет | есть | есть |
В варианте –D количество портов SAS увеличено до восьми. Если прибавить к этому ещё и SATA, в итоге получится 10 портов 6 Гбит/с и четыре 3 Гбит/с. Учтите, что C600 присоединяется к одному процессору Xeon E5 через DMI 2.0—соединение соответствует четырёхлинейному PCIe 2.0 с 20 Гбит/с пропускной способности в обе стороны. Это потенциальное узкое место. Поэтому Intel присоединяет SCU хаба PCH прямо к четырём линиям PCIe, взятым у одного из процессоров, облегчая нагрузку на контроллер накопителей.
Флагманская версия –Т функционально идентична модели –D (включает восемь портов SAS и четырёхлинейный канал связи) и также включает поддержку RAID 5 для портов SATA и SAS. Пока не ясно, сколько придётся доплатить за функционал C600, по сравнению с готовыми материнскими платами Xeon E5. Но если вы планируете покупать дополнительные адаптеры или RAID-контроллер, опция, почти полностью заменяющая их, покажется довольно удобной.
Если всё вышеперечисленное вам не нужно, то существует базовая модель –A с четырьмя портами SATA 3 Гбит/с и шестью SATA 6 Гбит/с, четыре их которых привязаны к SCU. Она по-прежнему поддерживает RAID 0, 1, 10 и 5, и тоже включает аппаратный XOR. У неё просто нет подключений SAS.
Конфигурация и тесты
Для тестов компания Intel прислала нам один из корпусов P4000 и материнские платы W2600CR. Просторный корпус оказался гораздо тише тех, которые мы тестировали в прошлом.
Команда Crucial тоже решила помочь нам с данным обзором, прислав 96 Гбайт труднодоступных регистровых модулей памяти DDR3-1600 для установки на платформы Xeon E5 и 5500/5600. Память DDR3-1333 более распространена, но она не способна предоставить максимальную поддерживаемую Xeon E5 пропускную способность с одним модулем на канал. Хотя регистровые модули по природе медленнее, чем не буферизированная память, нам, по сути, удалось получить большую пропускную способность памяти с наборами Crucial, чем с четырёхканальными наборами на 32 Гбайт, которые мы использовали при настройке этих рабочих станций.
Тестовая конфигурация | |
CPU | 2 x Intel Xeon E5-2687W (Sandy Bridge-EP) 3.1 ГГц, восемь ядер, LGA 2011, 8 GT/s QPI, 20 Мбайт общего кэша L3, Hyper-Threading вкл., Power-savings вкл.
2 x Intel Xeon X5680 (Westmere-EP) 3.33 ГГц, шесть ядер, LGA 1366, 6.4 GT/s QPI, 12 Мбайт общего кэша L3, Hyper-Threading вкл., Power-savings вкл. 2 x Intel Xeon W5580 (Nehalem-EP) 3.2 ГГц, четыре ядра, LGA 1366, 6.4 GT/s QPI, 8 Мбайт общего кэша L3, Hyper-Threading вкл., Power-savings вкл. 1 x Intel Core i7-3960X (Sandy Bridge-E) 3.3 ГГц, шесть ядер, LGA 2011, 15 Мбайт общего кэша L3, Hyper-Threading вкл., Power-savings вкл. |
Материнская плата | Intel W2600CR (LGA 2011) Intel 5520/ICH10R, BIOS 50;53;28;112
Intel S5520SCR (LGA 1366) Intel 5520/ICH10R, BIOS 50;53;28;112 Gigabyte X79-UD5 (LGA 2011) Intel X79 Express, BIOS F9 |
Память | Crucial 64 Гбайт (8 x 8 Гбайт) DDR3-1600 Registered ECC, MT36KSF1G72PZ-1G6M1HF
G.Skill 32 Гбайт (4 x 8 Гбайт) DDR3-1600 Unbuffered, F3-12800CL9Q2-32GBZL |
Накопитель | Intel SSDSA2BZ200G3 200 Гбайт SATA 3 Гбит/с (SSD 710) |
Видеокарта | AMD FirePro V5900 |
Питание | Intel DPS-750XB A 750 W
Chicony CPB09-003A 1000 W |
ПО и драйверы | |
Операционная система | Windows 7 x64 Ultimate |
DirectX | DirectX 11 |
Графический драйвер | FirePro Driver 8.911.3.1 |
Хотя мы видели, как доля продукции AMD на рынке CPU для рабочих станций выросла на пять процентов (в 2006 году, согласно Jon Peddie Research), теперь этот показатель равен нулю. Мы снова пригласили AMD для участия в данном обзоре, но компании признала, что на этом рынке она больше не игрок.
В прошлый раз, когда мы рассматривали процессоры Xeon, у AMD был подходящий чипсет для рабочей станций под названием SR5690, поэтому мы хотим, чтобы компания уделяла больше внимания профессиональным клиентам (особенно если учесть карты FirePro, которые она продаёт…). У нас есть четыре конфигурации, охватывающие три поколения процессоров Intel.
Тесты и настройки | |
Аудио/видео кодирование | |
Lame MP3 | Версия 3.98.3 Audio CD “Terminator II SE”, 53 мин., конвертация WAV в MP3, Комманда: -b 160 –nores (160 кбит/с) |
HandBrake CLI | Версия: 0.94 Видео: Big Buck Bunny (720×480, 23.972 кадров) 5 минут, Аудио: Dolby Digital, 48 000 Гц, шесть каналов, Английский, в Видео: AVC Audio: AC3 Audio2: AAC (High Profile) |
MainConcept v2.2 | Версия: 2.0.0.5440 MPEG-2 в H.264, MainConcept H.264/AVC Кодек, 28 с HDTV 1920×1080 (MPEG-2), Audio: MPEG-2 (44.1 кГц, 2 канала, 16 бит, 224 кбит/с), Кодек: H.264 Pro, Mode: PAL 50i (25 FPS), Профиль: H.264 BD HDMV |
Тесты – приложения | |
WinRAR | Версия 4.11 RAR, Syntax “winrar a -r -m3”, Benchmark: 2010-THG-Workload |
WinZip | Версия 16.0 Pro WinZip CLI, Benchmark: 2010-THG-Workload |
7-Zip | Версия 9.22 beta LZMA2, Syntax “a -t7z -r -m0=LZMA2 -mx=5”, Benchmark: 2010-THG-Workload |
Adobe Premiere Pro | Версия: CS5.5 Paladin Workload, максимальное качесвто изображения, профиль H.264 Blu-ray |
Adobe After Effects | Версия: CS5.5 Tom’s Hardware Workload, SD проект с тремя рамками картинка-в-картинке, видео источник на 720p, Render Multiple Frames Simultaneously |
Blender | Версия: 2.62 Syntax blender -b thg.blend -f 1, Разрешение: 1920?1080, Сглаживание: 8x, Render: THG.blend frame 1 |
SolidWorks 2010 | PhotoView 360 Render 01-Lighter Explode.SLDASM (SolidMuse.com)Image Output Resolution: 1920×1080, Render: Preview Quality “Good”, Final Render Quality “Best” |
Adobe Photoshop CS | Версия: CS5 Tom’s Hardware Workload, Radial Blur, Shape Blur, Median, Polar Coordinates filters |
ABBYY FineReader 10 | Версия: 10 Professional Build (10.0.102.82) Чтение PDF сохранение в Doc, Источник: Political Economy (J. Broadhurst 1842) 111 страниц |
e-on Software Vue 8 PLE | 1920×1080 рендер ландшафта, Global Illumination включено |
3ds Max 2012 | Версия: 10 x64 Rendering Space Flyby Mentalray (SPECapc_3dsmax9) Кадр: 248 Разрешение: 1440 x 1080 |
Visual Studio 2010 | Компиляция проекта Chrome (1/31/2012) с devenv.com /build Release |
Euler3D | CFD simulation over NACA 445.6 aeroelastic test wing at Mach .5 |
Синтетичесике тесты | |
3DMark 11 | Версия 1.0.2 |
SiSoftware Sandra 2012 SP2 | CPU Test=CPU Arithmetic/Multimedia, Memory Test=Bandwidth Benchmark, Cryptography, Cache Performance |
Sandra 2012
Теоретический прирост производительности при переходе Xeon 5600 на пару Xeon E5 впечатляет, также как и переход с Xeon 5500 на Xeon 5600.
Процессор Core i7-3960X в одиночку справился великолепно, по сравнению с парой процессоров Xeon W5580. Однако, процессоры Xeon E5-2687W на базе той же архитектуры Sandy Bridge, сильно выигрывают от четырёх дополнительных ядер в целом.
Мультимедиа компонент набора Sandra 2011 тоже демонстрирует доминирование процессоров Xeon E5. Чтобы сделать результаты более сопоставимыми, мы даже отключили инструкции AVX. Приложения, оптимизированные под расширения x86, получат ещё большую пропускную способность.
В этот раз мы не тестировали показатели AVX по отдельности, поскольку тестируемая архитектура идентична настольной версии. Если вы хотите сравнить реализацию AVX у Intel и AMD, ознакомьтесь с обзором “AMD FX-8150: от Bulldozer к Zambezi и FX”, где главный технический директор компании Cakewalk, Ноел Бортвик (Noel Borthwick), рассказал нам о работе его компании по оптимизации Sonar X1 под AVX.
Трое из этих процессоров должны поддерживать AES-NI. Однако при написании статьи “Тесты линейки Intel Xeon 5600: 32 нм, два сокета, 12 ядер и 24 потока” выяснилось, что образцы Xeon 5600 пока не поддерживают эту функцию. В результате только Core i7-3960X и процессоры Xeon E5 имеют преимущество.
Но почему мы видим такой большой разрыв в производительности? Два новых процессора сильно обгоняют старые модели. А что можно ожидать от устаревших процессоров Xeon 5600 в этом тесте? Почти наверняка более низкий уровень производительности, чем у новой линейки E5. Аппаратные функции, как например AES-NI, невероятно легко выполнять, и, как нам известно из тестов обзора “Intel Core i7-3960X: Sandy Bridge-E и X79”, при измерениях производительности AES256 узким местом выступает пропускная способность памяти. Таким образом, четырёхканальный контроллер памяти с поддержкой DDR3-1600 изначально имеет преимущество перед трёхканальным котроллером, ограниченным DDR3-1333.
А вот и прекрасная иллюстрация. Несмотря на то, что регистровые модули DDR3-1600 найти довольно тяжело, компания Crucial прислала нам 64 Гбайт (8 x 8 Гбайт) памяти PC-12800 для нашей рабочей станции на базе E5, и эффективность пропускной способности увеличилась в два раза, по сравнению с Xeon 5600.
Интересно, что процессор Core i7-3960X, вооружённый не буферизированной памятью DDR3-1600, закончил вторым, даже учитывая, что четыре канала памяти, теоритически, медленнее, чем двойная трёхканальная память DDR3-1333 у процессоров Xeon.
После электронной переписки с Адрианом Силаси (Adrian Silasi) из SiSoftware, мы всё равно не смогли выяснить, почему результаты производительности кэша процессоров Xeon 5600 оказались такими низкими (особенно пропускная способность кэша L2, которая должна была быть намного выше). Есть подозрение, что замедление производительности вызвано повторным использованием кэша и резким ростом температуры, однако инженеры Intel утверждают, что у процессоров Xeon 5500 и 5600 нет такого механизма.
Несмотря на это, становится очевидным, что в архитектуре Sandy Bridge-E и Sandy Bridge-EP сильно увеличена пропускная способность кэша L3 благодаря кольцевым шинам.
Adobe Creative Suite CS5.5
Рабочая нагрузка Premiere Pro относится к набору Adobe Creative Suite. Мы используем трейлер сериала профессионального уровня, на визуализацию которого уходит от минуты до часа. В основном разница зависит от аппаратной поддержки Mercury Playback Engine, включенную исключительно через nVidia CUDA. Поэтому для всех тестов мы выбрали карту FirePro, которая позволяет поближе взглянуть на производительность CPU без вмешательства GPU.
Результаты довольно интересные. Для этой задачи можно использовать один Core i7-3960X, но времени понадобится в два раза больше, чем с двумя Xeon E5-2687W. И даже Xeon 5500 не смогли справиться достаточно быстро, хотя эти процессоры, по словам Пэта Гелсингера (Pat Gelsinger), в 2009 году называли самыми быстрыми серверными моделям в истории.
Конечно, контекст имеет решающее значение. Посмотрите на процессоры, которые мы тестировали в обзоре “Intel Core i7-3930K и Core i7-3820: доступный Sandy Bridge-E”. Если использовать видеокарту типа nVidia GeForce GTX 580, то даже Phenom II X6 1100T справится с этой нагрузкой в два раза быстрее, чем дорогие Xeon E5. И мы более чем уверены, что профессиональные пользователи CS5 выберут видеокарту с архитектурой CUDA.
Нагрузка на процессор во время работы After Effects
Результаты в тесте After Effects совсем не похожи на результаты Premiere Pro. Core i7-3960X с двенадцатью потоками и доступом к 32 Гбайт памяти справился быстрее всех. Архитектуры Nehalem и Westmere с 16 и 24 потоками соответственно и 48 Гбайт памяти показали одинаковое время. Процессоры Xeon E5 остановились посередине.
Результаты в Photoshop оказались такими, как мы ожидали. И хотя Xeon 5600 и 5500 справились почти одинаково, они оба обогнали Core i7-3960X. Новые процессоры Xeon E5-2687W закончили заметно быстрее платформ предыдущего поколения.
Кодирование медиа-файлов
Нагрузка на процессор во время работы MainConcept
Несмотря на то, что обычно мы рассматриваем кодирование медиа файлов, как идеальную нагрузку для демонстрации выгоды многоядерных процессоров, у параллелизма этого настольного приложения есть предел. MainConcept пользуется преимуществом физических ядер платформ Xeon 5500 и 5600, но всё же нагружает не все из них. В результате наблюдается не очень агрессивное масштабирование. Более того, улучшенная архитектура Core i7-3960X позволяет ему обогнать два процессора Xeon W5580.
Нагрузка на процессор во время работы HandBrake
Похожая ситуация происходит в тесте HandBrake, только теперь Core i7-3960X обгоняет и два процессора Xeon X5680. По крайней мере для такого типа задач, двухпроцессорной рабочей станции более чем достаточно.
Почему мы запускаем Lame? Ведь это однопоточный тест (если конечно запускать только одну копию программы). В данном случае мы хотели продемонстрировать производительность одного ядра на такт и влияние технологии Turbo Boost на эти флагманские процессоры.
С одним активным ядром Core i7-3960X разгоняется до 3.9 ГГц. Не удивительно, что он финиширует первым, поскольку в нём соединена высокая частота и архитектура Sandy Bridge. Восьмиядерный Xeon E5-2687W, мощностью 150 Вт, работает на частоте 3.8 ГГц при одном активном ядре. Как и ожидалось, он немного отстал от настольного процессора. Максимальная частота Xeon X5680 с функцией Turbo Boost составляет 3.6 ГГц, и эта модель финиширует на третьем месте.
Рендеринг
Хотя обычно мы не применяем графический тест Cinebench на базе OpenGL приятно видеть, как CPU-компонент данного теста способен использовать до 64 потоков.
Примерно 2000 объектов, состоящие из 300 000 полигонов очень быстро визуализируются на паре процессоров Xeon E5-2687W, которые выполняют 32 потока одновременно. Процессоры Xeon X5680 заметно отстают. Благодаря более высокой частоте и эффективной архитектуре Sandy Bridge, один Core i7-3960X почти догнал два процессора Xeon W5580.
Нагрузка на процессор во время работы SolidWorks
Тест SolidWorks PhotoView 360 застал нас врасплох. Эта визуализация полностью нагружает любую конфигурацию, независимо от количества ядер и объёма памяти. И хотя модели Xeon E5 лидируют, разница, по сравнению с двумя Xeon X5680, практически незаметна.
Процессоры Xeon W5580 идут далеко позади, и даже Core i7-3960X обгоняет их. Опираясь на предыдущие обзоры можно сказать, что SolidWorks хорошо реагирует на разгон, но, похоже, не в этом случае.
Нагрузка на процессор во время работы 3ds Max
Autodesk 3ds Max тоже нагружает все возможные ресурсы системы. Тем не менее, он демонстрирует значительное преимущество при переходе с Xeon 5500 на 5600 и, наконец, на E5. Core i7-3960X снова практически догнал два Xeon 5500, что служит доказательством преимущества архитектуры Sandy Bridge, по сравнению с Nehalem.
Хотя компонент iray предоставляет действительно лучшую производительность, когда использует ресурсы GPU, наш тест ограничен визуализацией на базе CPU. Разница между результатами действительно поражает. Core i7-3960 на частоте 3.3 ГГц справляется с нагрузкой больше, чем за 10 минут. А двум восьмиядерным Xeon E5-2687W на частоте 3.1 ГГц потребовалось всего четыре с половиной минуты. Процессоры 5600 и 5500 находятся между ними.
Нагрузка на процессор во время работы Blender
Движок рендеринга циклов, представленный в Blender 2.61, основан на лучевой трассировке (ray tracing) и поддерживает интерактивной рендеринг, новую систему ретуширования узла (shading node), новую обработку текстур (texture workflow) и, конечно, GPU-ускорение. Наши циклические тесты сейчас ограничены процессорным рендерингом, но будут развиваться для использования OpenCL.
Результаты весьма необычные, но и не противоречивые. Нагрузка на CPU всегда будет выше с новым рендерингом, чем со старым плиточным, однако процессорам Xeon 5600 удалось обойти Xeon E5. По неизвестным причинам Core i7-3960X оказался лучше Xeon.
Наш более старый тест рендеринга в Blender, по умолчанию, настроен на плитки 4×4 и, похоже, он не до конца нагружает ядра (это можно увидеть в диспетчере задач Windows, где загрузка ЦП постепенно падает). Один из наших читателей сообщил, что мы можем потенциально получить существенный прирост, добавив больше плиток, и, тем самым, сохранить ядра активными до конца теста. Настройка 10×10 дала незначительный прирост, однако уровень использования процессора так и не достиг 100% даже в начале теста, когда все ядра должны быть активными.
Программа Vue предназначена для создания, анимации и визуализации трёхмерных окружений. Наш собственный сюжет полностью загружает даже двухпроцессорную систему на Xeon E5 с 32-мя потоками.
В результате производительность существенно растёт при переходе 12-ти поточного Core i7, к 16-ти поточным Xeon 5500, 24-х поточным 5600 и, наконец, к новым процессорам Xeon E5.
Поскольку данная нагрузка использует процессор на 100%, мы также будем использовать её для анализа энергопотребления.
Продуктивность
В преддверии сегодняшнего обзора мы сделали большие изменения в тесте Visual Studio 2010. Вместо компиляции клиента Miranda IM мы добавили компиляцию Google Chrome. С шестнадцатью ядрами, работающими на 100%, на выполнение задачи потребовалось более десяти минут.
Как и в некоторых тестах выше, наибольшее увеличение производительности наблюдается между процессорами Xeon 5500 и 5600. Но быстрее всех справились два процессора Xeon E5.
Тест Euler3D базируется на программе расчёта гидродинамики STARS Euler3D.
Euler3D сообщает, что он распознаёт и использует все 32 доступных потока системы Xeon E5, в результате новые процессоры значительно обгоняют два Xeon X5680. Тот факт, что Core i7-3960X обошёл два процессора Xeon 5500 и приблизился к платформе 5600, говорит о внушительном преимуществе архитектуры Sandy Bridge.
Нагрузка на процессор во время работы ABBYY
Остальные тесты продуктивности не очень характерны для рабочих станций, однако приложение ABBYY FineReader 10 OCR сильнее нагружает два процессора Xeon E5, чем тесты обработки видео, как, например, Adobe After Effects.
FineReader 10 показывает, что Core i7-3960X находится почти на одном уровне с двумя Xeon W5580. Пара процессоров Xeon X5680 быстрее линейки 5500 на 29%, в то время, как Xeon E5 обгоняет X5680 только на 21%.
Нагрузка на процессор во время работы WinRAR
Нагрузка на процессор во время работы WinZip
Ни один из тестов сжатия не смог полностью использовать сегодняшние конфигурации. 7-Zip был ближе всех к тому, что дало процессорам Xeon E5 преимущество над моделями 5600 и 5500. Но даже скорости шестиядерного Core i7 хватило, чтобы обойти два процессора Xeon 5500.
Поскольку WinRAR использует меньше потоков, чем предлагает Core i7-3960X, избыток остаётся неиспользованным, в результате диаграмма производительности определяется архитектурой и тактовой частотой. Очевидно, что архитектура Sandy Bridge более совершенна, чем Nehalem, поэтому два процессора Xeon E5 и один Core i7 лидируют.
Core i7 зарабатывает победу в WinZip 16. В прошлом мы критиковали однопоточную версию этого архиватора, которая всегда занимала намного больше времени, чем похожие задачи в WinRAR или 7-Zip. 64-битная версия WinZip 16 показывает активность на четырёх ядрах. Но она всё равно медленнее, чем другие тесты архивации. Слабое использование многоядерности позволяет процессору Core i7, который пользуется более высоким множителем Turbo Boost, быстрее всех справиться с задачей.
Xeon E5-2687W против Xeon X5680: разница в процентах
Когда мы сводим результаты всех наших тестов и сравниваем два Xeon E5-2687W с двумя Xeon X5680, мы видим, что E5, в среднем на 21 % быстрее.
Однако, некоторые из тестов не очень хорошо отражают то, чем занимаются профессионалы на рабочих станциях. Например, Lame показывает разницу между процессорами с одним активным ядром. Тесты сжатия довольно легки, а тесты транскодирования вообще не нуждаются в двухпроцессорной машине. Так, что давайте выкинем их и посмотрим, что получится.
Теперь мы приблизились к разнице в 23%. Euler3D немного портит результаты для процессоров E5, также, как низкие показатели в Blender и SolidWorks 2010.
Но в целом 20% – это существенный прирост для приложений, на которых делают деньги.
Энергопотребление и эффективность
e-on Vue 8 оказался лучшим кандидатом для измерения энергопотребления системы, поскольку это длительная нагрузка, полностью нагружающая наши системы.
Мы уже знаем порядок мест в тестах производительности. Теперь, благодаря регистратору Extech, можно добавить туда результаты потребления энергии с течением времени.
Согласно диаграмме, Xeon E5-2687W в среднем потребляет больше всего энергии в этой рабочей нагрузке (не трудно догадаться, что в этом виноваты два процессора по 150 Вт каждый).
Нас удивила конфигурация с процессорами Xeon W5580, которая оказалась на втором месте по энергопотреблению. Не забывайте, что при разработке процессоров серии Xeon 5600, Intel переключилась на техпроцесс 32 нм, поэтому даже с двумя дополнительными ядрами эти CPU могут обогнать модели линейки Xeon 5500 в многопоточных приложениях, используя меньше электричества.
Естественно, один Core i7-3960X, в среднем, потребляет гораздо меньше энергии, хотя и с худшей производительностью.
Умножьте среднюю мощность на время, затраченное каждой платформой на выполнение рендеринга, и вы получите энергию в ватт-часах.
Высокое энергопотребление и посредственная производительность навредили процессорам Xeon 5500. Линейка Xeon 5600 предлагает более привлекательные решения (хотя они потребляют значительно больше энергии, чем один Core i7-3960X).
Однако, настоящим победителем сегодня выходит Intel Xeon E5. Несмотря на самый высокий показатель потребления, великолепная производительность при полной нагрузке даёт самый высокий уровень эффективности.
Xeon E5: значительный прирост производительности, высокий уровень эффективности
Архитектура Sandy Bridge наделала много шума в сфере настольных процессоров. Прошло больше годы после выхода, но мы по-прежнему рекомендуем для покупки процессор Core i5-2500K. И хотя компании Intel потребовалось немало времени, чтобы ввести архитектуру Sandy Bridge в сферу рабочих станций, результат себя оправдал, и с новой линейкой конкурировать может только Xeon E7.
Существует 37 различных моделей Xeon E5. К нам в лабораторию попала только одна. Но Xeon E5-2687W – это самая быстрая модель и нам удалось протестировать его против трёх флагманов из других линеек: Xeon W5580, Xeon X5680 и Core i7-3960X. Понятно, что производительность двухпроцессорной платформы полностью зависит от выполняемой задачи. Наш набор тестов преимущественно ориентирован на рабочую станцию. Но даже в малопоточных приложениях процессоры Xeon E5 в среднем были на 21% быстрее, чем две модели Xeon 5600. После отсеивания нехарактерных для рабочей станции тестов, преимущество выросло до 23%.
Но интереснее всего было рассчитывать эффективность конфигураций на Xeon E5 и Xeon 5600. Используя такой же узел с техпроцессом 32 нм, Xeon E5-2687W оказался впереди. Этот процессор больше. TDP каждого процессора выше на 20 Вт. И на самом деле видно, как при полной нагрузке Xeon E5-2687W потребляет больше энергии, чем Xeon X5680. Но скорость и два дополнительных ядра на сокет у архитектуры Intel Sandy Bridge перевешивают этот скачок мощности, что даёт более высокий уровень эффективности.
Также стоит учитывать, что новая линейка E5 охватывает больше сегментов рынка. Теперь есть восьмиядерные процессоры для двухсокетных систем начального уровня, представленные в семействе Xeon E5-2400. Линейка Xeon E5-1600 для односокетных рабочих станций предлагает функциональность уровня Core i7-3000, но с дополнительными функциями RAS, которые важны для некоторых пользователей. Процессоры Xeon E5-2600 охватывают широкий спектр серверов и рабочих станций 2S. А линейка процессоров Xeon E5-4600 реализует идею массовых четырёхсокетных конфигураций, максимизируя производительность на ватт в PCH-окружениях.
Если вы профессионал, работающий в центре обработки данных, перспектива увеличения эффективности вас, безусловно, порадует. Также инженеры и художники, которые ищут рабочую станцию следующего поколения, наверняка оценят 20% прирост производительности. Но даже если вы просто энтузиаст и у вас нет веских причин покупать любое из этих решений, всё же будет довольно “круто”, открыть диспетчер задач Windows и увидеть, как происходит рендеринг в 32 потока.