Читайте также: |
|
Речевой сигнал, как средство передачи информации, используется для создания естественных интерфейсов связи с машиной, что упрощает решение многочисленных задач в разнообразных приложениях. Основная задача систем обработки речевого сигнала заключается в распознавании произнесенной фразы и извлечении смысла принятого сообщения.
Первичной процедурой в задаче обработки речевого сигнала является акустическая обработка, которая заключается в сопоставлении каждому фрагменту сигнала некоторого набора признаков, в которых закодирована фонетическая информация, содержащаяся в данном фрагменте сигнала.
Большинство существующих систем обработки речевых данных построены по модульному принципу, поэтому получаемая с помощью процедуры акустического кодирования информация в том или ином виде используется всеми остальными процедурами, и ошибки, допущенные на начальном этапе обработки, приводят к снижению эффективности работы системы в целом. Результат работы методов акустического кодирования определяет качество работы всей системы, поэтому особое внимание уделяется разработке методов, чувствительных к изменениям фонетической структуры, и в то же время устойчивых к шумовым искажениям сигнала.
Устойчивость к шумовым искажениям означает, что изменение уровня помех не приводит к существенному изменению вычисляемых признаков. В случаях, когда в структуре помехи наблюдается некоторая закономерность, достаточно легко подобрать метод компенсации такой помехи в сигнале и отфильтровать ее на этапе предобработки сигнала. В случаях, когда данные о помехе отсутствуют, и компенсирующий алгоритм подобрать затруднительно, фильтрация сводится к отбрасыванию всех данных кроме тех, которые соответствуют полезному сигналу. Фильтрация помех также является задачей акустической обработки.
Известно, что необходимая фонетическая информация в речевом сигнале в значительной степени представлена его вокализованной частью. Таким образом, важной задачей алгоритмов акустической обработки является кодирование фонетической информации для вокализованных фрагментов. речевого сигнала, устойчивое к наличию в нем вариаций произношения, а также помех.
Современные методы обработки вокализованных сигналов подразумевают использование линейных параметрических моделей, позволяющих эффективно моделировать гармоническую структуру сигнала. В данном случае параметры модели рассматриваются как акустические признаки. С параметрическими моделями тесно связана задача определения порядка модели. Неверные значения порядка приводят к потере полезной либо к внесению паразитной информации в оценки параметров, что отрицательно сказывается как на оценках вычисленных признаков, так и на качестве работы использующих их методов в целом. Существующие в настоящее время методы определения порядка модели дают, как правило, заниженные значения и не обеспечивают требуемой точности решения, поэтому в большинстве существующих систем используются некоторые усредненные значения порядков, установленные экспериментально.
Таким образом, важной задачей акустической обработки сигнала является формирование устойчивых акустических признаков на основе линейной параметрической модели.
Дата добавления: 2015-08-17; просмотров: 77 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Приведение квадратичных форм к каноническому | | | Фонемные словари украинского языка |