UA

Искусственный интеллект Google научится распознавать невнятную речь

Google планирует сделать систему распознавания речи доступными для всех. В том числе, это касается и тех людей, которые страдают от нарушений дикции или плохо говорят по-английски. Соответствующую модель обучения уже удалось дополнить речью больных боковым амиотрофическим склерозом (БАС) и людей с сильным акцентом. Информация об этом появилась на сайте Cornell University, сообщает Информатор Tech. У людей с БАС часто есть проблемы с дикцией. Это осложняет не только общение, но и использование систем распознавания речи. Последние, как правило, обучаются на данных здоровых людей. Аналогичные трудности испытывают люди, которые говорят по-английски с сильным акцентом. Чтобы решить эту проблему, Google разрабатывает сервис Project Euphonia. Таким образом, чтобы настроить стандартный алгоритм на работу с «проблемными» пользователями, ученые дополнили наборы данных небольшой выборкой, представляющей людей с БАС и акцентами. Так, выборка для людей с БАС состояла из 36 часов аудиозаписей, полученных от 67 пациентов. Выборку с акцентами составляли 20 часов записей. Также ученые заявили, что этого было достаточно, чтобы преодолеть дефицит данных. Дополненные модели распознавали речь людей с БАС и сильным акцентом на 62% и 35% соответственно. В дальнейшем Google планирует расширить тренировочные наборы данных, чтобы алгоритм был доведен до совершенства. Ранее сообщалось, что биометрические данные и пароли миллионов пользователей попали в открытый доступ. Также читайте, что говорят критики о фильме «Дора и затерянный город». Узнать еще больше актуальных новостей из мира технологий и игр можно в нашем Telegram-канале и на Facebook.

Мы используем файлы cookie, чтобы обеспечить должную работу сайта, а контент и реклама отвечали Вашим интересам.