Читайте также:
|
|
Данилов В.В
Для измерения характеристик речевого сигнала используется звуковой редактор СооlEdit.
Речевой сигнал – это нестационарный случайный процесс. Искусственное воспроизведение (синтез) речевого сигнала требует предварительного его анализа с целью с целью вычисления признаков на основе которых
происходит воспроизведение сигнала.
В первую очередь следует записать исходный сигнал и фоновый шум. Для этого необходимо с помощью программы Cool Edit 2000:
· создать волновую форму с параметрами, указанными на рис.1,
· записать исходный речевой сигнал с помощью панели контроля (рис.2), как можно более монотонно произнеся требующуюся фонему,
· создать новую волновую форму с такими же параметрами
· записать 1-2 секунды фонового шума
Фильтрование исходного сигнала от фонового шума
Чтобы произвести фильтрование требуется выделить спектр фонового шума с целью удаления его составляющих из исходного сигнала. С помощью окна Noise Reduction (Transform/Noise Reduction/Noise Reduction) (рис.3). посредством функции Get Profile from Selection вычисляется спектр фонового шума. Для того, чтобы сохранить вычисленные параметры используется функция Save Profile.
Далее производится урезание волновой формы исходного сигнала до одного периода с целью получения «чистого» тона требующейся фонемы. Обычно наиболее монотонна средняя часть записанного звука.
Следующее что необходимо сделать – это очистить полученный период волны от фонового шума. Для этого используется окно Noise Reduction и функция Load Profile (которая позволит загрузить параметры фонового шума). При нажатии кнопки OK производится очистка исходного сигнала от шума, параметры которого были заданы. В результате произведенных операций получается относительно «чистое» звучание исходной фонемы.
Анализ исходного сигнала
Все операции с исходным сигналом были совершены для того, чтобы максимально упростить процесс его спектрального анализа.
Спектральный анализ проводится посредством окна Frequency Analysis (Analyze/Frequency Analysis) (рис.4). Указанные на рисунке наиболее оптимальны при анализе исходного сигнала (FFT Size – 1024, Hamming, отключенный Linear View).
Использование функции Scan приводит к обновлению информации о спектре в окне. По этому спектру определяется несколько важнейших параметров сигнала для правильного синтеза звука. Это – частота основного тона, частоты обертонов, а также их амплитуды (громкость) в децибелах (рис.5).
В данном случае производилась запись фонемы «м» и соответствующие параметры измерялись для нее (таблица 1).
Для улучшения качества звучания можно также провести анализ общей формы огибающей (определить остальные обертоны и их амплитуды).
Для данного случая все параметры сведены в таблицу 2.
Таблица 1.Таблица 2.
Частота | Амплитуда |
657 Гц | -52 дБ |
752 Гц | -49 дБ |
838 Гц | -61 дБ |
985 Гц | -59 дБ |
1325 Гц | -58 дБ |
1437-2336 Гц | -62 дБ |
2899 Гц | -55 дБ |
3848 Гц | -59 дБ |
4404-6089 Гц | -76 дБ |
6426-7763 Гц | -83 дБ |
8417-10730 Гц | -90 дБ |
Частота | Амплитуда | Примечание |
108 Гц | -25 дБ | Основной тон |
217 Гц | -25 дБ | Первый обертон |
325 Гц | -35 дБ | Второй обертон |
432 Гц | -46 дБ | Третий обертон |
582 Гц | -44 дБ | Четвертый обертон |
Дата добавления: 2015-10-29; просмотров: 163 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Because we are losing our ability and knowledge and experience and tradition regarding self-sufficiency; how to grow organic food and how to care for cows. | | | Фильтрация и повышение качественности сигнала |