Microsoft подала заявку на регистрацию торговой марки DeepSpeed – библиотеки оптимизации глубокого обучения, которая позволяет сделать распределенное обучение более простым, эффективным и действенным процессом. Благодаря созданному ИИ-инструменту, можно обучать крупномасштабные модели ИИ на достаточно скромном по своим вычислительным возможностям оборудовании.
Заявка была подана 8 декабря 2020 года. В ней указывается, что торговая марка будет применяться для «предоставления во временное пользование программного обеспечения для обработки искусственного интеллекта и глубокого обучения без права его онлайн-загрузки». По всей видимости, в Microsoft собираются в будущем открыть доступ через облако к онлайн-сервису под названием DeepSpeed и соответствующим инструментальным ИИ-наборам.
Библиотека DeepSpeed была выпущена в феврале этого года. Она представляет собой библиотеку, написанную на Python, которая позволяет создавать модели глубокого обучения. Суммарная мощность создаваемой модели оценивается в один триллион параметров контроля. Это более чем в пять раз больше самой большой из существующих на сегодняшний день в мире модели, которая была построена на базе 800 видеокарт Nvidia V100.
Масштабы DeepSpeed можно оценить по требуемой мощности на реализацию аналогичной модели без ее использования. Для выполнения аналогичной задачи потребовалось бы 4000 видеокарт Nvidia A100, которые в 2,5 раза производительнее V100; общее время их работы над решением задачи составило бы 100 дней.
Ранее редакция THG.ru опубликовала статью об искусственном интеллекте. Искусственный интеллект уже давно занял важное место в научно-фантастической литературе и голливудских блокбастерах. Именно они формируют мнение большинства людей о том, что из себя представляет ИИ, и чего от него следует ожидать. Но насколько это мнение соответствует реальному положению вещей? Давайте разбираться. Подробнее об этом читайте в статье “Искусственный интеллект: правда и вымысел”.