Информация об огромном спросе на оборудование Nvidia в Китае раскрыла производительность загадочной Nvidia A800, созданной для китайского рынка. Согласно MyDrivers, A800 работает на 70% скорости графических процессоров A100, соблюдая при этом строгие экспортные санкции США, которые ограничивают объем вычислительной мощности, которую Nvidia может продавать в Китае.
Будучи уже трехлетним, Nvidia A100 довольно эффективен: он обеспечивает 9,7 FP64/19,5 FP64 Tensor TFLOPS для высокопроизводительных вычислений и до 624 BF16/FP16 TFLOPS (с разрежением) для рабочих нагрузок. Даже сократившись примерно на 30%, эти цифры все равно будут выглядеть внушительно: 6,8 FP64/13,7 FP64 Tensor TFLOPS, а также 437 BF16/FP16 (с разрежением).
Несмотря на ограничение производительности, как выразился MyDrivers, Nvidia A800 вполне может конкурировать с полноценными китайскими вычислительными графическими процессорами Biren BR104 и BR100 с точки зрения вычислительных возможностей. Между тем, архитектура CUDA широко поддерживается приложениями, в то время как у Biren все еще не настолько гладко с повсеместной поддержкой. И даже Biren не может поставлять свои полноценные вычислительные графические процессоры в Китай из-за последних правил.
Правила экспорта, введенные Соединенными Штатами в октябре 2021 года, запрещают экспорт американских технологий, позволяющих создавать суперкомпьютеры с производительностью более 100 FP64 петафлопс или 200 FP32 петафлопс на пространстве 41 600 кубических футов (1178 кубических метров) или меньше в Китай. Хотя экспортные ограничения конкретно не ограничивают производительность каждого вычислительного графического процессора, проданного китайской компании, они ограничивают их пропускную способность и масштабируемость.
После того, как новые правила вступили в силу, Nvidia потеряла возможность продавать свои высокопроизводительные вычислительные графические процессоры A100 и H100 китайским клиентам без экспортной лицензии, которую трудно получить. Стремясь удовлетворить спрос на производительность, требуемую китайскими гиперскейлерами, компания представила урезанную версию своего графического процессора A100, получившую название A800. До сих пор было неясно, на что способен этот графический процессор.
Поскольку использование искусственного интеллекта растет как среди потребителей, так и среди предприятий, растет популярность высокопроизводительного оборудования, способного справляться с соответствующими рабочими нагрузками. Nvidia является одним из основных бенефициаров этого тренда, поэтому ее графические процессоры пользуются таким высоким спросом, что даже урезанный A800 был быстро распродан в Китае. Biren BR100 будет доступен в форм-факторе OAM и потребляет до 550 Вт. Чип поддерживает запатентованную компанией технологию 8-way BLink, которая позволяет устанавливать до восьми графических процессоров BR100 на систему. В отличие от этого, 300-ваттный BR104 будет поставляться в форм-факторе FHFL с двумя широкими картами PCIe и поддерживать до 3-процессорных конфигураций с несколькими графическими процессорами. Оба чипа используют интерфейс PCIe 5.0 x16 с протоколом CXL для ускорителей, сообщает EETrend.
Оба чипа Biren производятся с использованием 7-нанометрового производственного процесса TSMC (без уточнения, использует ли он N7, N7+ или N7P). Более крупная BR100 содержит 77 миллиардов транзисторов, что больше, чем 54,2 миллиарда у Nvidia A100, которая также сделана с использованием одного из узлов TSMC N7. Компания также заявляет, что для преодоления ограничений, налагаемых размером сетки TSMC, ей пришлось использовать чипсетную конструкцию и технологию CoWoS 2.5D.
Чтобы коммерциализировать свой ускоритель BR100 OAM, Biren работала с Inspur над 8-процессорным сервером искусственного интеллекта. Baidu и China Mobile будут одними из первых клиентов, которые будут использовать вычислительные графические процессоры Biren.
Ранее редакция THG.ru опубликовала обзор лучших видеокарт для игр. Выбрать лучшую видеокарту для игр непросто – для кого-то лучшей может быть самая доступная видеокарта, для других самая производительная. Мы стараемся учитывать все факторы и публикуем ежемесячно обновляемый материал, в котором стараемся рекомендовать действительно лучшую видеокарту для игр в любой ценовой категории – от дешевле $100 до топового сегмента. Подробнее об этом читайте в статье “Лучшая видеокарта для игр: текущий анализ рынка”.