Читайте также:
|
|
При передаче речи, на передающем конце тракта звуковые колебания от рта говорящего воздействуют на микрофон, а на приемном конце тракта звуковые колебания, создаваемые телефоном, воздействуют на ухо слушающего. В воздушных пространствах между преобразователями и органами речи и слуха человека образуются звуковые поля, которые также являются звеньями тракта. Поэтому прежде чем перейти к изучению преобразователей, необходимо рассмотреть основные характеристики звукового поля, свойства звуков речи и слуха человека.
Энергетическими характеристиками звукового поля являются звуковое давление и интенсивность звука J.
Для звукового поля с плоскими волнами акустическое сопротивление измеряется в килограммах, деленных на метр квадратный в секунду (кг/мІс), и определяется по формуле:
(2.1)
откуда
(2.2)
где – действующее значение акустической скорости; r – плотность воздуха; с – скорость звука.
Поскольку по определению интенсивность звука является удельной мощностью, можно записать:
(2.3)
Подставив в(2.3) выражение (2.2), получим:
(2.4)
При нормальном атмосферном давлении и температуре 20°С плотность воздуха r=1,205 кг/м и скорость звука c =344 м/с. Для этих условий получены выражения для J и P, имеющие практическое значение:
; (2.5)
. (2.6)
Для расчетов и количественного анализа акустических явлений удобнее пользоваться не абсолютными характеристиками звукового поля, а их уровнями, выраженными в относительных логарифмических единицах, децибелах (дБ), и соответствующими определенным физиологическими ощущениями.
Ощущение прироста громкости звука с увеличением его интенсивности подчиняется психофизиологическому закону Вебера – Фехнера, по которому прирост ощущения пропорционален логарифму отношения раздражений. Для получения прироста ощущения в децибелах коэффициент пропорциональности принимают равным десяти.
Для определения уровней интенсивности и звукового давления на любой частоте приняты интенсивность нулевого уровня Вт/мІ и звуковое давление нулевого уровня Па. Величины и приблизительно соответствуют минимальной интенсивности и минимальному звуковому давлению, воспринимаемыми человеческим ухом в области частоты 1000 Гц. Таким образом, уровни интенсивности и звукового давления, измеряемые в децибелах, вычисляются по формуле:
(2.7)
При определении уровней сложных звуков, например звуков речи или шумов, используется понятие спектральных уровней , т. е. Уровней энергии, приходящейся на полосу частот шириной 1 Гц. Если суммарная интенсивность сложного звука или шума в полосе частот ∆f равна , то спектральная интенсивность будет , а спектральный уровень интенсивности:
, (2.8)
где – уровень интенсивности звука, просуммированной в полосе частот ∆f.
Звуковое ощущение у человека возникает вследствие воздействия на барабанную перепонку уха упругих колебаний среды. Ухо человека может улавливать только те звуковые колебания, интенсивность звука которых больше некоторой минимальной величины, называемой порогом слышимости (ПС). Кривая, соединяющая точки, соответствующие порогу слышимости каждой из частот, называется кривой порога слышимости. Для каждой частоты звукового диапазона с увеличением интенсивности звука возрастает громкость звука данной частоты до тех пор, пока в ухе не возникает ощущение боли. Эта величина интенсивности звука называется порогом болевого ощущения (ПБО). Кривая, соединяющая точки, соответствующие порогу болевого ощущения каждой из частот, называется кривой порога болевого ощущения. Указанными кривыми, как по частоте, так и по интенсивности ограничена область слухового ощущения (рис.2.4): Между пороговыми кривыми находится множество кривых слухового восприятия равной громкости. Каждая из этих кривых является геометрическим местом точек, соответствующих тонам разных частот и имеющих равную громкость.
Кривые равной громкости говорят о широких возможностях и об исключительном совершенстве уха как индикаторе звуковых колебаний. Например, при частоте 1000 Гц человеческое ухо способно воспринимать звуковые колебания интенсивностью от 1 до 10‾№І Вт/мІ, т. е. интенсивность слышимого на этой частоте звука лежит в пределах, относящихся друг к другу как 10№І. Это отношение называется динамическим диапазоном слуха и выражается в децибелах:
дБ. (2.9)
Рис. 2.4. Область слухового восприятия и кривые равной громкости.
Уровень ощущения является разностью уровня интенсивности звука определенной частоты и уровня интенсивности звука той же частоты на пороге слышимости и определяется:
, (2.10), (2.11)
где – интенсивность звука с частотой f на пороге слышимости; – уровень интенсивности звука на пороге слышимости (пороговый уровень).
Мерой громкости звука является уровень громкости. Звуковые колебания с разными частотами и одинаковыми интенсивностями воспринимаются органом слуха с разной громкостью. Колебания с разными частотами и интенсивностями могут восприниматься с одинаковой громкостью, если точки, соответствующие этим интенсивностям, лежат на одной кривой равной громкости. Например, громкость звука Гц и Вт/мІ будет равна громкости звука кГц и Вт/мІ (см. рис. 2.4). Такие звуки называются равногромкими. Уровень громкости звука любой частоты определяют уровнем интенсивности звука с частотой 1000 Гц равногромкого с этим звуком. Уровень громкости измеряется в фонах (фон). Уровень громкости звука определенной частоты определяется по кривым равной громкости или рассчитывается по формуле:
, (2.14)
где – интенсивность звука f= 1000 Гц, равногромкого с заданным звуком.
Человеческое ухо обладает свойством изменять свою чувствительность, приспосабливаясь к громкости воспринимаемого звука вследствие изменения порога слышимости. Это свойство называется адаптацией слуха. Процесс адаптации происходит не мгновенно, а с некоторым запаздыванием во времени (3…5 с). С этим явлением приходится считаться при разработке схем телефонных аппаратов.
Если орган слуха находится под воздействием двух звуков с давлением и то более громкий звук, даже при значительной разнице в частотах, заглушает слабый звук и ухо воспринимает не два, а один звук. Это явление называется маскировкой звука.
Эффект маскировки проявляется не только в области частот, близких к основному маскирующему тону, но и в области его гармоник. Маскирующие действия могут оказать шумы и переходные разговоры с соседних телефонных трактов. Количественной оценкой маскировки М является разность между уровнем интенсивности на новом пороге слышимости ПС′ полезного звука при наличии маскирующего звука и уровнем интенсивности на пороге слышимости ПС этого же звука при отсутствии маскирующего звука:
, (2.15)
Звуки речи образуются в результате работы голосового аппарата человека. В процессе разговора легкие через бронхи и трахею создают поток воздуха, поступающий через вибрирующие голосовые связки. Голосовые связки то, сжимая, то открывая голосовую щель, пропускают воздух импульса (рис. 2.5), частота следования которых постоянна для данного человека и равна частоте свободных колебаний голосовых связок. Частотный спектр получающегося при этом звукового давления (рис. 2.6) содержит большое число гармонических составляющих, амплитуда которых уменьшается с ростом частоты. Частота характеризует тон голоса говорящего: бас – 80…320 Гц; сопрано – 250…1200 Гц. Основной тон в большинстве случаев почти не играет роли для распознавания звуков речи. При этом 65% мощности приходится на звуковые колебания с частотой до 500 Гц. Воздушная струя проходит через систему резонаторов, которые образуются воздушными объемами полостей рта и носоглотки, видоизменяющихся в процессе произнесения различных звуков положением языка, зубов и губ.
Рис. 2.5. Временная характеристика первичного звука.
Рис. 2.6. Амплитудно-частотный спектр импульсов звукового давления.
Наличие этой системы резонаторов обуславливает изменение гармонических составляющих: амплитуды одних усиливаются, других ослабляются. Характерные для разных звуков речи усиленные области частот называются формантными областями или просто формантами (рис. 2.7). Форманта характеризуется либо занимаемой ею частотной полосой, либо средней частотой, соответствующей максимуму амплитуды звукового давления в формантной полосе, и средним уровнем энергии в этой полосе.
Звуки речи различаются друг от друга по числу формант и их расположению в частотном спектре. Разборчивость передаваемой речи зависит от того, какая часть формант дошла до уха слушающего без искажений, а какая исказилась. Менее мощные составляющие, лежащие между формантами, определяют индивидуальные способности голосового аппарата человека, тембр речи и вместе с основным тоном позволяют узнавать говорящего по голосу.
Представленный вид спектральной характеристики (см. рис. 2.7) соответствует гласному звуку, обладающему периодичностью. Согласные звуки образуются без участия голосовых связок вследствие трения струи воздуха при прохождении его через отверстие между зубами и твердым нёбом. Согласные звуки не периодичные, их частотные спектры полностью сплошные или содержат в своем составе участки сплошного спектра. Они также различаются формантами. Речевой сигнал несет в себе информацию смысловую и информационную, информацию о типе голоса и его индивидуальной окраске. При разговоре средней громкости суммарная действующая величина звукового давления на расстоянии 1 м от рта говорящего р авна приблизительно 0,1 Н/мІ.
Рис. 2.7. Амплитудно-частотный спектр сформированного звука.
На основании исследования звуков русской речи можно указать основные их спектральные и временные характеристики.
К спектральным характеристикам относятся:
диапазон частот звуков русской речи, занимающий полосу частот 80 …12000 Гц;
диапазон основных тонов, занимающий полосу 80 … 300 Гц, причем частота основного тона при разговоре составляет для мужчины 150 Гц, для женщин 250 Гц;
диапазон формант, занимающий полосу частот 200 …8600 Гц;
число формант в звуках, достигающее в отдельных звуках шести. Однако определяющими для каждого звука являются одна или две из них. Большая часть формант находится в диапазоне частот 300 …400 Гц, поэтому этот диапазон частот рекомендован МCКТТ для передачи речи по телефонному тракту.
К временным характеристикам относятся:
длительность звуков речи, лежащая в пределах 20 … 260 мс, причем гласные звуки длительнее согласных;
длительность пауз в непрерывном разговоре, составляющая 16% суммарного времени разговора.
Мощность звуковых колебаний речи весьма мала. Средняя мощность при шепоте 0,01 Вт, нормальном разговоре 10 мкВт, при крике отдельные пиковые значения составляют 5000 мкВт. Диапазон изменения мощности звуков речи выражают в логарифмическом масштабе, измеряют в децибелах и называют динамическим диапазоном речи:
,дБ (2.16)
По телефонным трактам обеспечивается передача более узкого динамического диапазона речи, составляющего 30 …40 дБ.
Дата добавления: 2015-07-10; просмотров: 220 | Нарушение авторских прав