Отличительной особенностью новой технологии являются фокусировка на русской речи, возможность работы без подключения к Интернету и компактность. «Лингурус» со словарем порядка 35 тысяч слов весит всего 80 Мб. Словарь сравнимого объема используется в русско-английском переводчике, его достаточно для общения в чатах и социальных сетях, навигации в крупных городах, голосового управления вспомогательными функциями автомобиля или «умным домом».
«Лингурус» учитывает особенности русского произношения, связанные с замещением или поглощением фонем при естественном произношении слов и предложений. Точность распознавания в настоящее время достигает 90 % на общем словаре и 95 % на геозависимом, как, например, для карты Москвы. Скорость распознавания сравнима с реальной скоростью произношения. «Лингурус» умеет работать с большими словарями (до 1.5 млн слов) с учетом всех словоформ.
В качестве примера использования «Лингуруса» на конференции выступит робот-диджей. Он умеет распознавать тысячу слов и занимает около 10 Мб. Такое приложение можно установить на мобильный телефон или планшет. «Демонстрация «Лингуруса» будет похожа на караоке: человек произносит название песни, робот его распознает и ставит композицию в эфир. В нашей демонстрационной фонотеке около пятисот треков отечественных исполнителей. Мы надеемся, музыка поднимет настроение посетителям стенда», — делится руководитель проекта Дмитрий Козин.
Редактор раздела: Алена Журавлева (info@mskit.ru)