Intel Silvermont | Сможет ли новая архитектура превратить процессоры Atom из “Золушки” в “Принцессу”?
Первый процессор Atom, хотя и послужил основным толчком в развитии сегмента нетбуков, был несколько противоречив. Первые чипы Atom на архитектуре Silverthorne представляли собой компактные одноядерные CPU, потреблявшие менее 1 Вт, но им требовался чипсет, с которым общий расход энергии приближался к 5 Вт. Более продвинутые версии серии Diamondville ещё больше увеличили энергопотребление. В результате мы увидели противоестественный союз процессора Atom и чипсета 945GC, который потреблял более 22 Вт. Неудивительно, что мы не публиковали много лестных отзывов об Atom (последний раз мы обратили внимание на настольный ПК на базе Atom в статье “Intel Atom D510 и NM10 Express: тесты новой платформы Pine Trail” в 2009 году).
Последовательное совершенствование Atom заставило нас переосмыслить усилия Intel в прошлом году. Шесть месяцев назад мы сделали смелый прогноз: Intel опередит Qualcomm в течение трёх лет. И это было, когда Intel не предложила ни одного коммерчески успешного смартфона. Анализ был основан на способности Intel обеспечить на тот момент соизмеримый уровень производительности при 32-нм техпроцессе и старом дизайне с очередным исполнением команд (in-order), учитывая планы по переходу на более тонкий техпроцесс и внеочередное исполнение команд (out-of-order).
Кроме того, прошлогодний выход Intel на рынок смартфонов (в России с моделью Megafon Mint SP-A20i), сердцем которых был SoC Intel Atom Medfield, стал первым “звонком”, после которого можно ждать много положительных вестей.
Встречаем Silvermont – предшественника Airmont
Что ж, подробности новой архитектуры, ныне известной как Intel Silvermont, стали известны в ходе презентации Intel в начале мая. Если процессоры Atom на архитектуре Intel Silvermont воплотят всё то, что обещала Intel, то нам даже не потребуются тесты, вроде тех, что мы делали в обзоре “ARM против x86: секрет эффективности процессоров Atom”, чтобы констатировать преимущество по эффективности SoC Intel относительно конкурентов на ARM.
Если вы наблюдали за эволюцией семейства Atom, то должны знать, что Intel не меняла кардинальным образом свою архитектуру за прошедшие пять лет. Да, она перешла с 45-нм на 32-нм техпроцесс. Но сама архитектура была прежней – 32-нм ядро с кодовым именем Saltwell основано на оригинальном дизайне Bonnell и по-прежнему эксплуатирует принцип с последовательным исполнением команд, явно делая ставку на низкий расход энергии за счёт производительности.
С приходом Intel Silvermont всё меняется. Теперь мы видим внеочередное исполнение команд (out-of-order), дополненное переходом на 22-нм техпроцесс. Перед нами явно не очередная вселяющая надежды попытка Intel с оговоркой “встретимся снова через 5 лет”. Intel направляет значительные ресурсы, чтобы добиться коммерческого успеха Atom, обещая ежегодное обновление архитектуры (первым таким обновлением станет архитектура Airmont на базе 14-нм техпроцесса, призванная закрепить технологическое превосходство Intel).
Фактически все шаги Intel относительно дальнейшего развития процессоров Atom можно подразделить на три категории: повышение производительности, обеспечение лучшей эффективности и специфические оптимизации техпроцесса.
Intel Silvermont | Новая архитектура
Повторимся, что Intel Silvermont основан на внеочередном исполнении команд, и одно это имеет далеко идущие последствия с точки зрения производительности относительно Saltwell (напомним, что именно Saltwell в данный момент конкурирует с другими однокристальными системами, доступными на рынке). Intel, однако, по-прежнему опирается на принцип объединения определённых инструкций в единую внутреннюю инструкцию-микрооперацию (micro-op). Этот подход повышает эффективность обработки соответствующих команд x86.
Вычислительный конвейер Saltwell
Вычислительный конвейер 32-нм процессора Saltwell имеет длину 16 ступеней, а так как данный процессор имеет in-order дизайн, микрооперации должны пройти весь цикл конвейера, даже если не нуждаются в ступенях доступа к кэшу. В результате ветка с ошибкой предсказания перехода впустую тратит 13 циклов. В Intel Silvermont операции могут обходить ступени доступа к кэшу и исполняться сразу, если кэш не задействован. Ошибочное предсказание, следовательно, “расходует” только 10 циклов.
Вычислительный конвейер Silvermont
Каждое ядро Intel Silvermont получило ряд внутренних оптимизаций: от лучшего предсказания перехода до переработанных вычислительных блоков и большего кэша. Много усилий ушло на выявление инструкций, которые медленно исполнялись на дизайне Intel Bonnell. В Intel Silvermont многие из них были изменены для снижения латентности и увеличения пропускной способности. Вычисления с плавающей точкой сократились на несколько тактов, парные вычисления SIMD теперь исполняются за четыре такта вместо девяти, одиночные SIMD выполняются заметно быстрее. Учитывая вышесказанное, по словам Intel, количество выполняемых инструкций за такт увеличилось примерно на 50%. Рассматривая переход от Sandy Bridge к Ivy Bridge, мы обратили внимание на возрастание числа инструкций, выполняемых за такт, сравнивая два процессора, работающих на одинаковой частоте. В случае Intel Silvermont, 50% ускорение архитектуры красноречиво укажет на то, что Atom стал значительно быстрее.
Блок-схема Silvermont
Конечно, обычно Atom встречается в многоядерных конфигурациях. Когда семейство Atom было впервые анонсировано, это был одноядерный процессор. Вскоре Intel представила двухъядерные CPU, которые также производились по 45-нм техпроцессу. Когда пришло время переходить на 32-нм техпроцесс, на плаву остались только двухъядерные версии Atom. А поскольку компания совершенствует техпроцесс, актуальным стало дальнейшее увеличение количества ядер. Фактически архитектура Intel Silvermont позволяет масштабировать процессор до 8 физических ядер.
Теперь кэш L2 тесно интегрирован с ядрами, что обеспечивает низкую латентность и высокую пропускную способность. Инженеры Intel не хотели, чтобы кэш был общим для более, чем двух ядер. В связи с этим был реализован модульный подход. Каждый “кирпичик” нового процессора включает пару ядер с общим кэшем L2 размером 1 Мбайт (предыдущие процессоры Atom имели кэш L2 по 512 Кбайт на ядро). Отдельные ядра, кэш L2 и интерфейс между ядрами и кэшем могут получать питание независимо друг от друга. Ядра в модуле даже могут работать с разной частотой, но по умолчанию работают симметрично.
Модульная архитектура Silvermont
Модули связаны между собой реализованным на самом чипе интерфейсом (in-die interface – IDI), имеющим независимые каналы чтения/записи и пришедшем на смену шине Front Side Bus (FSB). Кстати, Intel определяет IDI как одну из ключевых особенностей модульной архитектуры процессоров поколения Nehalem/Westmere, и, судя по всему, значительная часть данной работы с ядром влияет на нынешнее развитие процессоров Atom.
Инженеры Intel взглянули на архитектуру ядра, оптимизированную для однопоточной производительности наряду с его модульным подходом к масштабируемости, и предпочли отказаться от технологии Hyper-Threading. Включение данной технологии могло привести к повышению расхода энергии в однопоточных приложениях. Таким образом, компания отказалась от ветвления потоков заданий, предпочитая увеличить количество физических ядер с целью повышения производительности в многопоточных приложениях.
В то же время инженеры Intel увеличили набор инструкций, доведя его до уровня архитектуры Westmere 2010 года – то есть он на четыре года опережает набор инструкций оригинального процессора Atom, основанный на архитектуре Merom. SSE4.1, SSE4.2 и POPCNT, работающий с целочисленными инструкциями, являются частью данного обновления набора инструкций, призванного повысить уровень производительности Atom. Также появилось ускорение шифрования AES-NI и Secure Key (включающее поддержку инструкции RDRAND и аппаратный генератор случайных чисел).
Аппаратная поддержка виртуализации основана на технологии VT-x второго поколения, представленной в архитектуре Nehalem. Процессор поддерживает набор функций Extended Page Tables, включая адресацию Virtual Processor ID в TLB-буфере и режим Unrestricted Guest, позволяющий KVM-пользователям получать неограниченный доступ к исполняемому коду.
Intel Silvermont | Управление питанием – ключ к успеху мобильной архитектуры
Для управления тактовой частотой в 32-нм ядре Saltwell использовались дополнительные P-states – комбинации напряжения питания и тактовой частоты, которые выбираются в зависимости от доступного теплового запаса процессора. Данный подход ориентирован на достижение максимальной частоты и реализован на уровне драйвера ОС. В Intel Silvermont механизм управления частотой близок к Turbo Boost: частота регулируется на аппаратном уровне в соответствии с температурой, напряжением и уровнем потребления энергии. В данном случае важнее не прирост производительности, который вы можете получить в Boost-режиме, а возможная экономия энергии, если избыточная производительность не нужна.
В настоящий момент существуют мобильные устройства, которые работают на полной скорости до тех пор, пока не наступает перегрев, после чего резко сбрасывают частоту для восстановления температуры. Таких скачков достаточно, чтобы негативно сказаться на уровне комфорта при практическом использовании устройства. Intel утверждает, что Intel Silvermont будет отрабатывать такие ситуации изящнее, плавно понижая тактовую частоту и не допуская перегрева процессора.
Температурный “бюджет” SoC может быть распределён между несколькими ядрами либо другими блоками на кристалле (включая сторонние модули). Вероятно, наиболее заметным таким блоком является встроенная графика. Механизм контроля легко объяснить с помощью приведённой выше иллюстрации: ядра могут иметь общий бюджет по расходу энергии, а также заимствовать тепловой запас у встроенной графики (которая начинает работать на пониженной частоте), но при этом допускается резкое повышение производительности даже при работающей на полную мощность графике, если температура чипа это позволяет. Intel утверждает, что эта концепция основана на Turbo Boost, но имеет иные алгоритмы и механизмы реализации управления питанием.
С другой стороны, Intel также включила множество функций управления питанием, знакомых по технологии P-states, с тем отличием, что ядра могут переходить в энергосберегающий режим C6 самостоятельно, чего ранее не могли. И, поскольку архитектура Intel Silvermont основана на модульном принципе, Intel представила дополнительные подуровни P-state, что позволяет управляющему ПО осуществлять контроль содержимого кэша L2. На основе режима “активного простоя” S0ix, впервые появившегося в платформе Moorsetown в 2010 году, ядро Intel Silvermont может сохранять своё состояние при переходе в режим ожидания. Это значит, что выход из состояния ожидания будет осуществляться быстрее, хотя Intel пока не поясняет, насколько.
Intel Silvermont | Собираем всё воедино
Основываясь на внутренних изменениях архитектуры ядра и модульном дизайне нового процессора, можно сделать вывод, что следующее поколение Atom будет в состоянии изменить наше представление о производительности процессоров данного семейства. И это здорово. Но в рамках конкуренции с однокристальными системами на архитектуре ARM производительность является не главной проблемой Atom – всё упирается в расход энергии. Мы видели, что 32-нм процессор Z2760 держится на уровне Qualcomm и NVIDIA, но, чтобы реально потеснить конкурентов на архитектуре ARM, Intel пришлось серьёзно поработать над энергоэффективностью своего процессора. Основным шагом в этом является переход на 22-нм техпроцесс. Фактически, поскольку Atom является однокристальной системой на чипе, Intel может использовать разные версии 22-нм процесса, чтобы максимизировать производительность либо уменьшить размер чипа. Усовершенствование техпроцесса, изменения архитектуры и оптимизации, направленные на повышение эффективности, – всё это в совокупности составляет широкий фронт действий, предпринятых Intel. В чём выражаются эти усовершенствования? Взглянем на следующую диаграмму:
Не стоит рассматривать эти графики как финальное сравнение производительности: чип Intel и “безымянный процессор с ассиметричными ядрами”, вероятно, никогда не окажутся в том же самом месте на графиках с реальными данными. Однако подход Intel понятен. Архитектура Intel Silvermont призвана обеспечить очень низкое потребление энергии и очень высокую производительность, используя тот же симметричный дизайн, что реализован в Saltwell. Но здесь всё значительно лучше: соединяются в одно целое 22-нм производственный процесс, усовершенствования самого ядра, лучшая масштабируемость и оптимизации, призванные обеспечить минимальное потребление энергии.
Между тем, в случае ассиметричного дизайна мы видим переход между посредственной производительностью при выполнении задач, не требующих серьёзных вычислительных ресурсов, к посредственной эффективности при задействовании быстрых ядер. Именно здесь кроется ключевое достоинство подхода Intel. Низкий расход энергии на максимальной загрузке процессора и лучшая производительность относительно конкурентов при низком расходе энергии – именно то, что может принести Intel Silvermont успех, если прогнозы Intel сбудутся.
Изменит ли Silvermont расстановку сил?
В ходе подробного анонса новой архитектуры Atom Intel продемонстрировала ряд слайдов, отражающих производительность и уровень потребления энергии. Некоторые из них основаны на сравнении процессоров Saltwell и Intel Silvermont и отражают значительный отрыв новых процессоров Atom относительно предшественников. На других показано, как двухъядерные Intel Silvermont процессоры опережают двух- и четырёхъядерные решения конкурентов с точки зрения потребления энергии, типичного для смартфона. Наконец, третья часть презентации иллюстрировала превосходство Intel Silvermont в производительности при фиксированном потреблении энергии, а также экономию энергии по сравнению с конкурентами при пиковой загрузке.
В каждом графике доминирует одно и то же послание. Вы можете сравнивать данные конкурирующие решения при заданном уровне потребления энергии, и Intel Silvermont окажется быстрее с достаточно существенным отрывом. Или можете заострить внимание на производительности – и в этом случае новая архитектура Intel будет впереди с точки зрения потребления энергии, так же заметно опережая конкурентов.
Конечно, на рынке мобильных устройств пока отсутствуют продукты, основанные на архитектуре Intel Silvermont. Поэтому мы не можем привести в качестве примера планшеты и смартфоны, где используются новые SoC. Получается, что Intel сравнивает новые однокристальные системы с “железом”, уже представленным на рынке. Тем не менее, грядущее обновление Atom – это именно тот закономерный шаг, что мы предсказали в статье “Мобильные процессоры: Intel против Qualcomm”, и он позволяет сохранить прежнюю точку зрения на будущее мобильных процессоров.
Мы с нетерпением ждём новых подробностей о конкретных процессорах на архитектуре Intel Silvermont и подробностей относительно встроенной графики (если верить слухам, это будет собственная графика Intel, аналогичная той, что оснащаются процессоры Ivy Bridge). Комбинация Atom Z2760 и Windows 8 продемонстрировала, что планшеты могут обеспечить такую же гибкость, как обычные ПК. Этой комбинации, в конечном счёте, недоставало лишь производительности и качества исполнения. Intel Silvermont почти наверняка решит первую проблему. Теперь Intel необходимо, чтобы производители планшетов создали на базе новых Atom действительно качественные устройства. В этом случае им, без сомнения, удастся потеснить устройства на базе процессоров ARM, которые имеют серьёзные ограничение в плане экосистемы относительно x86/Windows.