Читайте также:
|
|
Средства мультимедиа этой группы делятся на системы раздельной диктовав и системы распознавания связной речи.
Системы раздельной диктовки проще в разработке и технической реализации но они требуют от пользователя не совсем естественного произнесения фраз
с короткой паузой перед каждым следующим словом. К таким системам относятся, например, Via Voice корпорации IBM, Dragon Dictate фирмы Dragon System. Последняя система позволяет, наряду с прочим, непосредственно надиктовывать текст в программы Word, Word Perfect, Internet Explorer, Netscape Navigator и т. д. Активный словарь системы насчитывает десятки тысяч слов и может пополняться пользователем, скажем, по его профессиональной тематике. В системе дополнительно анализируются спектральные (частотные) характеристики каждой буквы, выделяются и хранятся ее отдельные фонемы (элементы спектра). На основе этого анализа создаются фонетические модели букв и формируемых из них слов. Точность распознавания достигает 90%, а после проверки по словарю еще значительно повышается.
Наиболее сложные проблемы возникают при распознавании связной речи. При произнесении связной речи больше сказывается эмоциональная составляющая вводимой информации, и при слитном произношении слов несколько изменяется их звучание — все это, безусловно, затрудняет распознавание.
Наиболее совершенными системами распознавания слитных текстов можно считать системы распознавания речи: Dragon Naturally Speaking компании Dragon Systems, ViaVoice корпорации IBM и Wildfire фирмы Wildfire Communications, Voice Xpress фирмы Lernout8iHauspie Speech Products. Названные системы позволяют обычно после длительной «тренировки» программы надиктовывать «своим» ПК тексты и отдельные команды, иногда даже разным операторам. Так, система ViaVoice позволяет многие виды работ на компьютере выполнять в речевом режиме. Можно надиктовывать текст (письма, отчеты, статьи) непосредственно в Windows-приложения, открывать и закрывать. компьютерные файлы, ориентироваться в пределах рабочего стола. Такие речевые команды, как file save, file print, scroll up, scroll down безошибочно выполняются компьютером. Скорость ввода текста достигает 140 слов в минуту, что намного больше средней скорости ввода информации с клавиатуры.
Дата добавления: 2015-08-02; просмотров: 54 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Системы, ориентированные на распознавание отдельных слов, команд и вопросов | | | Системы синтеза речи |