Читайте также:
|
|
Речевой аппарат человека имеет сложное устройство. Его голо-
совые связки под воздействием потока воздуха, идущего из легких,
создают периодические колебания звуковой частоты. Увеличивая
или уменьшая напряженность, длину и толщину связок, человек
может влиять на частоту возбуждаемых колебаний. Так созданные
колебания, проходя через изменяющиеся по фэрме и размерам по-
лости рта, носа, носоглотки, преобразуются в элементарные сигна-
лы.,
В русском, язык0 имеется несколько десятков простейших рече-
вых сигналов — фонем, из которых складывается множество звуков,
слогов, слов и фраз, определяющих все многообразие языка. Одни
звуки речи, обозначаемые гласными и согласными буквами (э, у,
ш, г и др.), состоят из одной, другие (е, ё, ю, я) —из двух фонем
(йэ, ив», йу, йа).,.
Встречаемость различных звуков в русской речи очень неодина-
кова. Из гласных чаще всего встречаются а, и, о, из согласных — и,
ту с. При этом вероятность появления в речи гласных а, и в 6-г-
10 раз больше, чем гласных у, э, а согласных тут*-—в Ю-г-70 раз
больше, чем ч или- ф.
Таким образом, речевой аппарат является акустической систе-
мой, состоящей из звукообразующего элемента (голосовых связок)
и ряда резонаторов с изменяющимися параметрами. Его упрощен-
> ная модель показана на рис. 2.1.
Речь же, воспроизводимая этой
системой, представляет собой
Крайне сложное явление. Речевые»
сигналы являются нерегулярны-
Ряс. 2.1. Механическая (а) и электриче- ская (б) модели речевого аппарата |
ми, и их особенности выражаются
тремя видами характеристик. Фо-
нетические характеристики опре-
деляют звуковой состав. речи.
Главная из них — частость встре-
чаемости различных звуков и их.
сочетаний. Фонетическая организация речи зависит также от удар-
ных и безударных звуков, мелодических интонаций, временных и
динамических характеристик речи. Акустические характеристики
определяют такие чисто физические параметры речевых сигналов,
как их мощность^ динамический и частотный диапазоны, формант-
ный состав, направленные свойства, длительность и др. Информаци-
онные характеристики позволяют разделить речевую информацию
на сигнальную, семантическую и эстетическую. Сигнальная инфор^
мация дает возможность опознать источник звука или определить
направление на него (выкрик) .Семантическая (смысловая) — пере-
дает содержание речи, заложенную в нее мысль. Эстетическая—
отражает эмоциональные переживания говорящего человека.
Использование электрического тракта для передачи, речевых
сигналов часто приводит к заметной трансформации их акустичес-
ких характеристик. Это не только снижает общее качество зву-
чания, но и сказывается на фонетических характеристиках речи,
изменяя характер мелодических интонаций и даже лексическое
значение звука. Изменение акустических характеристик сигнала
влияет и на информативные показатели речи, делая ее недостаточ-
но разборчивой и мало выразительной. Все это заставляет прежде
всего рассмотреть акустические характеристики речевых сигналов.
Мощность, динамический диапазон. Измерения показывают,
что звуки речи очень отличаются по мощности. Так, для гласных
звуков средняя мощность составляет 700 мкВт, т'огда как для со-
гласных она приближается к 0,7 мкВт. Такое^ большое различие в
мощностях гласных и согласных (30 дБ) приводит к снижению раз-
борчивости речи. Снижению способствует еще и то, что наибольшую
смысловую информацию в речи несут слабые согласные звуки. На-
пример, в слове «ракета» звуки р, к, т дают большее представление
о его смысле, чем звуки а\ е, а.
Средние мощности шепота, нормальной речи (при уровне интен-
сивности 50 дБ),-крика и пения соответственно близки к 0,01;
10; 1000 и 5000 мкВт. Отсюда предельный динамический диапазон
голоса составит 57 дБ, а диапазон нормальной речи — 30 дБ. Одна-
ко, учитывая практически редкие использование шепота, этот диа-
пазон для нормальной речи составляет. 25—30 дБ, а при пении (по-
прано) около 45 дБ.
Спектры и частотный диапазон. Звучание человеческого голоса
представляется в виде сигнала пилообразной формы, который кро^е
основной частоты содержит ряд гармонических составляющих. Наж-
низшая из основных частот/у отдельных людей лежит в пределах
70—450 Гц, другие располагаются выше, в связи с чем основные
частоты различных по типу голосов лежат в пределах: для баса
70-^400 Гц, баритона 110ч-440 Гц, тенора 130-^590 Гц, контраль-
то 175^780 Гц, меццо-сопрано 220-f-1050 Гц и сопрано 350-^-
1320 Гц.,
При формировании звуков речи и пения, осуществляемом си-
стемой резонаторов речевого аппарата, подчеркиваются те или иные
группы их гармонических составляющих. Таких спектральных мак-
симумов в звуке может быть четыре и больше, однако распознава-
ние каждого звука связано с одним, двумя первыми усиленными
участками спектра, которые называются формантами. На рис. 2.2
заштрихованными полосками показано частотное размещение фор-
мантных областей ряда звуков. Кривая 1 показывает относительное
Слоги соединяются в слова при помощи словесных ударений..
Единство слов в фразе достигается также ударением, сделанным на
последнем слове. Эти факторы, а также наличие пауз между слова-
ми и фразами определяют временную структуру речевых сигналов.
Рис. 2.2. Формантный состав "некоторых
звуков речи
Рис. 2.3. Спектральные кривые для
мужского (!,'8) и женского (2, 4)
голосов в нормальном (l, S) и уси-
ленном (3, 4) режимах
Рис. 2.4. Распределение динамических
уровней голоса в режимах дикторской
речи (1) и пения (2)
Рис. 2.5. Характеристики направлен-
ности речевого' аппарата
содержание формант (А %) в различных областях частотного диа-
пазона. Как видно из рис. 2.2, форманты лежат в области частот от
100 до 8000 Гц, концентрируясь в пределах 200-т-ЗООО Гц. Для глас-
ных звуков характерны форманты с дискретным спектром для со-
гласных, и особенно глухих с, ш, х — форманты со сплошным спект-
ром. Большую роль играет певческая форманта (2200-:-3200 Гц) #
характерная для хорошо натренированного голоса. Размещение
этой форманты в области наивысшей чувствительности слуха обес-
печивает повышенную громкость или «носкость» голоса.
Основные тона вместе с гармоническими составляющими, фор-
мантными и неформантными областями усиления создают полный
спектр речевого сигнала. Такие с^пектры для мужского и женского
голосов показаны "на-рис. 2.3 (кривые 1, 2). Максимальные мощнос-
ти для обоих голосов сосредоточены соответственно вблизи частоты
300 и 500 Гц, причем содержание низких частот в спектре:мужеко-
. го. больше, чем в спектре женского голоса. При усилении этих
голосов на 15 дБ (кривые 3, 4) содержание низкочастотных состав-
ляющих в спектрах заметно понижается при одновременном увели-
чении высокочастотных составляющих. С учетом такого изменения
спектра частотный диапазон для мужского голоса лежит в границах
70-ЬбООО Гц, а для женского — в границах 1504-9000 Гц.
. Временные характеристики. Длительность формант гласных зву-
ков и таких согласных, как л, м, н, р, больше, чем у согласных звон-
ких и глухих. Средняя длительность гласных составляет 150 мс с
колебанием в пределах от 120 мс (для неударных) до 210 мс (для
ударных звуков). Для согласных пределы изменения длительности
звуков еще больше и составляют 140-т-ЗОО мс.
Темп произношения слов и длительность пауз зависят от особен-
ностей языка, типа передачи и индивидуальных данных исполните-
ля. На общем темпе сказывается и то, что в помещении каждая
пауза сопровождается затуханием одного сигнала и нарастанием
следующего. Семантические паузы в программе Центрального ра-
диовещания занимают около 5% общего времени передачи. Дли-
тельность же их очень неодинакова. Паузы в 50-7-150 мс составля-
ют 44%, а до 300 мс — 15% от их общей долготы.
• Р (t\
Зависимости уровня текущей мощности N (t) = 10 lg ——
. * макс
от доли времени J!t, которая приходится на звучание данного уров-
- to ' •.
ня для дикторской речи и пения (кривые 1, 2 на рис. 2.4), показы-
,вают, что при дикторском чтении доля времени, приходящаяся на
тихие звучания, например с,уровнем 15 дБ, в 4-г-5 раз меньше^
:чем при пении. Это означает, что речевые сигналы в режиме пения
во времени более динамичны.
Пространственные характеристики. Дифракция звука вокруг
головы заметно сказывается на характеристиках, направленности
человеческого голоса. Это подтверждается кривыми, построенными
в горизонтальной и вертикальной плоскостях (рис. 2.5, а и б). Изме-
нение горизонтального угла приема в пределах^ ±45° и дальше'
до ±90° приводит к относительному уменьшению уровня высокочас-
тотных составляющих сигнала соответственно на З-т-5 и 6-ь8 дБ^
Несколько меньше на передачу высокочастотных-составляющих ре-
чевого сигнала влияет изменение угла в вертикальной плоскости*
_ (рис. 2.5, б). Кроме того, в этом случае относительное изменение-
уровней высокочастотных сигналов при одинаковом изменении уг-
да в положительном направлении заметно больше, чем в отрица-
тельном. Частотный спектр сигнала в различных направлениях от
его источника претерпевает изменение, связанное со все более за-
метным уменьшением уровня гармонических составляющих по ме-
ре повышения их частоты.
Таким образом, речевой аппарат, будучи сложной системой, опре-
деляет не только громкость, тональность, тембр речевого звучания,
но и сильно влияет на фонетические и информационные его пока-
затели.
Дата добавления: 2015-11-16; просмотров: 75 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Общие характеристики натуральных звучаний | | | Акустические характеристики струнных музыкальных инструментов |