![]() |
01:10 [Ольга Шкляева]
Intel заставляет компьютер читать по губам
Компания Intel представила программное обеспечение Audio Visual Speech Recognition (AVSR) – шаг в будущее, позволяющее компьютеру читать по губам. AVSR отслеживает изменения в лице говорящего, в частности, его губ, а затем, сопоставляет эти движения с речью. В результате машина обладает достаточной информацией для ответа на голосовые команды, даже если они были даны в шумной обстановке. Программа является частью библиотеки “машинного зрения” OpenCV, коллекции приложений и инструментов, помогающих компьютерам воспринимать визуальные данные.
Компьютерные компании в течение многих лет пытались популяризовать программы разпознавания речи, но их усилия были ограничены производительностью процессора, не слишкой высокой до недавнего времени, и несовершенством ПО. Однако, времена изменились, и в настоящее время средние процессоры имеют тактовую частоту около 1,5 ГГц, а топовые модели – 3 ГГц и несколько выше. Кроме этого, исследователи набираются опыта, учатся на ошибках и совершенствуют приложения, работающие с голосовыми командами. Один из способов модернизировать такие программы – поместить визуальный сигнал в схему распознования голоса, как и сделала Intel.
Компания же Microsoft Research разработала прототип такой программы – GWindows, позволяющий выполнять нетрудоемкие и несложные операции в ответ на голосовые команды и жесты.
Введите ключевые слова для поиска и нажмите Enter. |