Facebook/Meta запустила в работу массивный суперкомпьютер AI Research SuperCluster (RSC) на базе NVIDIA DGX A100. Он стал крупнейшей на сегодняшний день клиентской установкой систем NVIDIA DGX A100. Новый вычислительный кластер RSC уже запущен в работу и занят обучением нейромоделей, продолжая совершенствовать применяемые алгоритмы ИИ.
Разработкой кластера RSC занимались специалисты Meta, головной компании Facebook, а техническим проектированием и инсталляцией – специалисты NVIDIA. От момента начала разработки эскизного проекта до появления работающего суперкомпьютера для ИИ прошло всего 18 месяцев.
Согласно оценкам, его вычислительная производительность оценивается в пять экзафлопс и использует передовые вычислительные системы NVIDIA, сетевые технологии InfiniBand и программное обеспечение для оптимизации работы тысяч видеокарт.
«Мы надеемся, что кластер RSC поможет нам создать совершенно новые системы искусственного интеллекта, которые смогут, например, обеспечивать голосовой перевод в реальном времени больших групп людей, говорящих на разных языках, чтобы они могли совместно работать над исследовательскими проектами или играть в игры с дополненной реальностью», – говорится в сообщении компании Meta в блоге.
В настоящее время строительство суперкомпьютера продолжается. Его полное завершение планируется в этом году. Meta собирается использовать его для обучения моделей ИИ с более чем триллионом параметров. А в качестве возможных областей применения называют задачи обработки естественного языка, выявление вредоносного контента в режиме реального времени и т.д.
В качестве вычислительных узлов в новом суперкомпьютере для ИИ используется 760 систем NVIDIA DGX A100. В общей сложности кластер содержат 6080 графических процессоров NVIDIA A100, объединенных в сеть с помощью NVIDIA Quantum 200 Гбит/с InfiniBand. Производительность в операциях TF32 оценивается в 1895 petaFLOPS.
Хранилище данных состоит из 175 петабайт на базе массивов Pure Storage FlashArray, 46 петабайт кэш-памяти в системах Penguin Computing Atlus и 10 петабайт данных на базе СХД Pure Storage FlashBlade. После завершения строительства RSC его сетевая структура Infiniband соединит 16 000 графических процессоров. Согласно данным Meta, система кэширования и хранения будет использовать обучающие данные, доступные на скоростях 16 Тбайт/с с возможностью масштабирования массива до 1 эксабайта.
Ранее редакция THG.ru опубликовала обзор лучшей материнской платы. Выбрать лучшую материнскую плату непросто – для кого-то лучшей может быть самая доступная материнская плата, для других – самая функциональная. Мы стараемся учитывать все факторы и публикуем регулярно обновляемый материал, в котором стараемся рекомендовать действительно лучшую материнскую плату любой функциональности, под любой процессорный разъём, в любой ценовой категории – от самых дешёвых до топового сегмента. Подробнее об этом в статье “Лучшая материнская плата: текущий анализ рынка”.