софт | Знания, мысли, новости — radnews.ru


Записи с меткой софт

Причины снижения качества автоматического распознавания речи

В настоящее время активно ведутся разработки в области распознавания речи. Системы и программы работают на высоком, качественном уровне, но достигнутые результаты не позволяют говорить о том, что машина может распознавать речь так же, как человек. Существует ряд причин, снижающих качество распознавания. В данной исследовательской работе рассмотрены такие причины, как физические (неречевые) помехи, речевые сбои и акцентная речь (речевые помехи). Одной из целей современных разработчиков систем распознавания речи является создание программы, которая бы давала высокие показатели в условиях физических помех, а также при распознавании акцентной речи и спонтанной речи с речевыми сбоями. В процессе проведения исследования было выдвинуто следующее предположение: если современные технологии не имеют трудностей с распознаванием отдельных команд и даже слитных заранее подготовленных текстов, а физические помехи при этомустраняются с помощью технологий шумоочистки, то присутствие в записи речевых сбоев (оговорок, хезитаций, самокоррекций), свойственных спонтанной речи, или акцентной речи,может являться причиной большого количества сбоев. Анализ теоретического материала в сочетании с собственными наблюдениями позволили сформулировать задачи практического исследования в данной работе. Для выработки рекомендаций по совершенствованию программ распознавания речи был проведён анализ работы приложений S Voice от компании Samsung и DragonDictation от компании Nuance. Новизна исследования состоит в использовании акцентной (не эталонной) речи для тестирования указанных речевых систем, при этом некоторые записи содержат также признаки речевых сбоев и фи зические помехи.

(далее…)

Яндекс.Метрика