Читайте также:
|
|
Для стандарта GSM 06.10 выбран речевой кодек с регулярным импульсным возбуждением/долговременным предсказанием и линейным предикативным кодированием с предсказанием (RPE/LTP - LTP-кодек - Regular Pulse Excitation - Long-Term Prediction - Linear Predictive Coder), что позволило снизить скорость передачи до 13 Кбит/сек. В литературе часто используется другое, упрощенное название кодека: RPE-LTP (Regular-Pulse Excitation/Linear Predicative Coding - кодек с регулярным импульсным возбуждением и линейным кодированием с предсказанием).
В нескольких словах, алгоритм, применяемый в GSM, заключается в следующем: несколько фрагментов речи, которые изменяются не очень быстро, используются, чтобы определить актуальный фрагмент; коэффициенты линейной комбинации предыдущих фрагментов вместе с кодированной разницей (отличиями между определенным и актуальным фрагментами) представляют собой сигнал. Речь разбивается на 20 миллисекундные фрагменты, каждый из которых кодируется в 260 битов, давая суммарную скорость передачи 13 кбит/с, т.е. для каждой порции сигнала с помощью специального алгоритма определяются основные параметры сигнала (параметры модели речевого тракта диктора), которые кодируются и в сжатом виде передаются в канал связи корреспонденту. Однако и здесь происходит изъятие из сигнала его частей.
Результирующее кодирование с малой скоростью достигается в три этапа:
- линейным кодированием с предсказанием;
- долговременным предсказанием;
- регулярным импульсным возбуждением.
В декодере на приемном телефоне речевой сигнал восстанавливается (как принято говорить, "синтезируется") по переданным параметрам, по откликам последовательности регулярного импульсного возбуждения (RPE) двухступенчатым синтезирующим фильтром.
Речевой сигнал на приемном конце вычисляется (точнее, синтезируется) по переданным параметрам. При этом структура восстановленного сигнала сильно упрощена по отношению к исходном звуковому сигналу (объем информации о речевом сигнале сокращен примерно в 5 - 10 раз), а общее качество речевого сигнала в канале стандарта GSM и узнаваемость диктора по отношению к стандартному телефонному каналу ухудшаются.
Исторически первым был алгоритм полномасштабного кодирования (Full Rate, FR). Затем появились алгоритмы расширенного полномасштабного кодирования (Enchanced Full Rate, EFR) и кодирования половинного масштаба (Half Rate, HR).
В настоящее время в сетях GSM применяют следующие стандартизованные узкополосные кодеки, стандартизованные ETSI (European Telecommunications Standards Institute) - GSM 06.10, GSM 06.20 (GSM-HR), GSM 06.60 (GSM-EFR), AMR. Другие используемые кодеки, например, MS-GSM, носят частный случай указанных выше. Кодек AMR (Adaptive Multi Rate, ETSI 06.90) - адаптивное кодирование речи с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую емкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети. Всего существует 14 режимов AMR кодека, 8 из них доступно в полноскоростном канале (Full Rate, FR) и 6 в полускоростном канале (Half Rate, HR), т.е.: 4,75 - 2,2 кбит/сек.
Линейное предсказание (LPC - ЛП, см. выше) является одним из наиболее эффективных методов анализа речевого сигнала. Этот метод чаще используют при оценке основных параметров речевого сигнала, таких как период основного тона, форманты, спектр, позволяя достаточно точно и надежно оценить параметры линейной системы с переменными коэффициентами. Кодирование речи на основе метода линейного предсказания заключается в том, что по линии связи передается не речевой сигнал как таковой, а параметры некоторого фильтра, эквивалентного голосовому тракту, и параметры сигнала возбуждения этого фильтра.
В линейном предсказателе с возбуждением от кода CELP (Code Excited Linear Predictive) сигнал возбуждения представляется в виде вектора, которому присваивается определенный индекс, т.е. код.
Выбор оптимального вектора осуществляется с большого множества векторов-кандидатов, которые составляют кодовую книгу. Определение размера кодовой книги возбуждения имеет определяющее значение для создания необходимого качества восстановления синтезированного языка. Скорость речевого сигнала на выходе составляет 12,2 кб/сек.
Суммируя, можно заключить, что осуществляется передача ненативного сигнала, а страницы в виртуальной книге, по которой на оконечном телефоне восстанавливается (синтезируется) сигнал.
Следовательно, никакого сигнала по мобильной связи не передается, а передаются параметры некоей кодовой книги. Современные телефоны могут работать как в сетях GSM-900, так и в GSM-1800 МГц. Если мобильный телефон при работе в сети GSM-900 находит сеть GSM-1800, то он переключается (автоматически или вручную) на работу в данной сети. При этом сеть GSM-1800 имеет большую "проникающую способность", и поэтому, например, в центре Москвы провайдеры осуществляют роуминг по сети GSM-1800. Кроме того, большинство мобильных телефонов поддерживают все описанные выше кодеки.
Речевой сигнал на выходе процедуры кодирования/декодирования по алгоритму GSM всегда имеет участки разрыва непрерывности передачи речевого сигнала в паузах между репликами абонентов и заполнение этих участков прекращения передачи полезного сигнала однородным искусственным сигналом "комфортного шума". Данная специфика речевого сигнала переговоров с использованием сети GSM вводит новые проблемы при обнаружении следов монтажа фонограмм.
"Если кто-либо выполняет монтаж новой фонограммы на основе одной или нескольких фонограмм переговоров абонентов, ведущих разговоры по сотовой телефонной сети GSM, то при размещении монтажных переходов в паузах между репликами разговора обнаружение таких точек монтажного перехода является сложной экспертной задачей, требующей особых методов исследования. Причем выполнить такой монтаж несложно как с помощью компьютерных комплексов цифрового монтажа фонограмм, так и с помощью современных высококачественных аналоговых магнитофонов, применяя режим временной остановки записи" <1>. Еще более эта задача может осложниться, если смонтированная фонограмма была вторично пропущена через телефонную сеть, что может добавить в нее естественный непрерывный шум телефонного канала.
--------------------------------
<1> Иванов И.Л. Экспертное исследование формата GSM // Режим доступа: http://www/illidiy.orel.ru/pub/publ6.htm.
На участках речевых пауз по природе цифрового кодирования по алгоритму GSM имеется не реальный звуковой сигнал, а искусственный сигнал "комфортного шума". В случае использования для монтажа фонограмм, в которых переговоры велись абонентами в одной и той же относительно тихой окружающей звуковой обстановке с одних и тех телефонных аппаратов, обнаружить на участках монтажных переходов признаки монтажа обычно не представляется возможным, так как между репликами в GSM-канале имеются участки вставки искусственного шума. Отличить участки, вставленные самим алгоритмом кодирования GSM при передаче, от искусственно вставленных в процессе монтажа фонограммы участков шума вместе с последующими репликами довольно трудно. Во всяком случае в местах таких монтажных переходов отсутствуют щелчки, скачки уровня и частотного диапазона шумов, импульсы включения/выключения аппаратуры записи, обрывки слов или фраз, нарушения логического единства разговора, т.е. все те признаки, поиск которых обычно осуществляют эксперты при исследовании на предмет выявления признаков монтажа фонограмм.
Во избежание ошибок при производстве судебных фоноскопических экспертиз необходимо прежде всего диагностировать речевую фонограмму на предмет использования каких-либо средств сжатия, что позволит правильно оценить в дальнейшем установленные параметры речи.
Считается, что речевой сигнал может быть пригодным для идентификации диктора при обработке его алгоритмами сжатия с определенной нижней границей скорости цифрового потока, а именно:
- 32 кбит/с для ADPCM;
- 9,6 кбит/с для линейных предсказателей.
Речевой материал может быть признан условно пригодным для идентификации диктора, когда эти значения могут составлять:
- 16 кбит/с для ADPCM;
- 8 кбит/с для линейных предсказателей.
Во всех остальных описанных случаях обработанный речевой сигнал должен быть признан непригодным для достоверной экспертной идентификации диктора как физическими методами, так и лингвистическими, поскольку фонетическая структура языка, прошедшего такую обработку, существенно отличается от оригинала.
Использование таких фонограмм в уголовном судопроизводстве в качестве вещественных доказательств видится проблематичным, поскольку смысловое содержание речевого сообщения в таких фонограммах может не соответствовать оригиналу.
Однако в каждом конкретном случае определение пригодности речевого материала для идентификации диктора или установления смыслового содержания требует более детального теоретического и экспериментального его анализа <1>.
--------------------------------
<1> Желудков Р.Н., Тимко Е.В., Усков К.Ю. О влиянии сжатия речи на допустимость речевой фонограммы в уголовное судопроизводство. Материалы 2-й Всероссийской конференции "Теория и практика речевых исследований" (АРСО-2001). М., 2001. С. 110 - 116. Режим доступа: http://expert.com.ua/kniise/articles/zhel1201_2.htm.
Для того чтобы оценить, какой компрессии подвергся оцифрованный сигнал, поступивший на экспертное исследование, необходимо знать: тип и марку мобильного телефона, используемого абонентами при разговорах, в какой сети GSM они (разговоры) происходили и какой кодек и с какой скоростью передачи речевого сигнала использовался в конкретном мобильном телефоне.
Без такой информации эксперт не сможет не только провести всестороннее и полное исследование речи, но даже достоверно оценить пригодность фонограмм для идентификационного исследования.
Поскольку эксперту информация об условиях и средствах звукозаписи не предоставлялась, о достоверности сделанных им выводов говорить не приходится.
При отсутствии достоверной информации о технологической цепочке записи представленных фонограмм эксперт должен был отказаться от решения вопросов по идентификации дикторов, так как в его распоряжение поступили спорные фонограммы, объединенные путем перезаписи на одном носителе (микрокассете). При этом нельзя исключить возможность того, что эти фонограммы были переписаны с заранее смонтированных фонограмм или заранее подготовленного макета на монтажном пульте или в цифровом звуковом редакторе. При этом разговоры велись по мобильной связи, при которой записана не нативная речь человека, а синтезированный сигнал, подвергшийся модификации по неизвестному эксперту алгоритму, кодированию и сжатию.
Особенность исследованных экспертом спорных фонограмм заключается в том, что это - фонограммы на микрокассете - со всей очевидностью копии, верность оригиналам которых не была надлежаще удостоверена.
Ошибкой эксперта явилось то, что сравнение при идентификационных исследованиях проводилось по синтезированной речи без сравнения речи каждого неустановленного лица на спорных фонограммах с нативными экспериментальными образцами А., что методически не допускается, так как приводит к ошибочным и недостоверным результатам сравнения. Вывод по такой идентификации нельзя признать обоснованным и достоверным.
Обоснованность заключения эксперта предполагает научную, логическую и методическую грамотность проведенного исследования и изложения его результатов, а также подтверждение выводов эксперта соответствующими фактами и аргументами.
В качестве таких аргументов, имеющих объективный характер, служит развернутая характеристика примененных методов и выявленных признаков, а также детальное описание хода и результатов проведенных исследований, наличие числовых и графических иллюстраций <1>. В анализируемом заключении эксперта таких аргументов, не вызывающих сомнений в их достоверности и объективности, не содержится.
--------------------------------
<1> Россинская Е.Р. Комментарий к Федеральному закону "О государственной судебно-экспертной деятельности". М.: Право и закон, 2002.
Заключение эксперта от "18" июля 2008 года N 02/08.
Объектами исследования явились: 1) аудиокассета "TDK" с шифром "2-75-21-06-77" с фонограммами телефонных переговоров Струкова В.В. с неустановленным лицом; 2) компакт-диск Oxion CDR-700 mb N 500334 шифр 2-4206-07 с фонограммами образцов речи А., полученными при проведении оперативно-розыскных мероприятий.
Согласно заключению эксперта (стр. 12 - 13) на стороне А аудиокассета "TDK" с шифром "2-75-21-06-77" записано девять фонограмм (спорные фонограммы 1 - 9). Скорость записи 4,76 см/сек.
Исследование на предмет того, является ли представленные на экспертизу 9 фонограмм оригиналами или копиями, эксперт не провел.
Возможность изготовления записи на представленной кассете путем перезаписи заранее подготовленного на монтажном пульте или звуковом редакторе макета из подборки девяти фонограмм, которые могли подвергаться различным изменениям, в том числе и модификации речевого сигнала по заданному определенному алгоритму с целью придания голоса неизвестного лица внешнего подобия голосу А., эксперт не проверял.
При описании спорных фонограмм 1 - 9 на стр. 16 - 24 эксперт говорит о том, что не обнаружено в звучащем сигнале на фонограммах 1 - 9 посторонних сигналов (дополнительных, неоригинальных звуковых событий, так называемых артефактов) и искажений звучания, неадекватных обстоятельствам записи и условиям коммуникативного акта.
Полоса частот полезного сигнала, записанного на спорных фонограммах, - около 4000 Гц, что соответствует записи разговора, ведущегося по сотовой сети мобильной связи.
На приведенной экспертом на рис. 8 динамической спектрограмме явно просматриваются следы оцифровки речевого сигнала, которые не были описаны и учтены экспертом.
Так, хорошо видно, что в области высоких частот присутствуют нелинейные искажения в виде повторения части спектральной структуры речевого сигнала либо зеркального повторения части формантной структуры речевого сигнала.
Указанное обстоятельство позволяет сделать заключение, что на данной кассете записаны фонограммы, которые фиксировались в цифровом виде, а затем были переписаны на компакт-кассету. Уже только на этом основании можно говорить о том, что фонограммы на данной кассете являются копиями, верность которых оригиналам не была надлежаще удостоверена.
На рис. 10 анализируемого заключения экспертам приведена иллюстрация, указывающая на присутствие на спорных фонограммах 50 Гц составляющей, свидетельствующей об использовании сети переменного тока питания звукозаписывающего устройства.
На рис. 11 также явно просматриваются следы оцифровки звукового сигнала, указывающие на то, что спорные фонограммы на данной кассете были записаны при помощи цифрового звукозаписывающего устройства с последующим объединением путем переписи на аналоговую кассету. При этом нельзя исключить, что в цифровые фонограммы могли вноситься изменения и модификации речевых сигналов по определенному алгоритму.
Кроме того, на стр. 27 заключения эксперт указывает, что в исходную, оригинальную информацию при ведении переговоров по сети телефонной связи стандарта GSM в исходный речевой сигнал неминуемо привносятся изменения, связанные с работой речевого кодека. Эти изменения не затрагивают лишь лексико-семантическое и просодическое содержание речевых сообщений, передаваемых в канале связи.
Таким образом, по сведениям, изложенным в заключении эксперта от 18 июля 2008 г. N 02/08, видно, что спорные фонограммы телефонных переговоров В. с неустановленным лицом на аудиокассете TDK с шифром 2-75-21-06-77, со всей очевидностью оригиналами не являются.
Девять цифровых фонограмм были объединены на компакт-кассете путем перезаписи без стоповых пауз между ними. При этом нельзя исключить, что в исходный речевой сигнал, записанный в цифровом виде на компьютере, могли вноситься изменения с модификацией параметров голоса и речи неустановленного лица по определенному алгоритму с уподоблением голоса и речи образцам голоса и речи А.
При этом запись на данной кассете была произведена при помощи устройства, питающегося от сети переменного тока, что противоречит обстоятельствам дела.
Эксперт факт предоставления ей фонограмм-копий со следами цифровой обработки не проверил, следов модификации речевого сигнала при помощи синтезаторов речи и иных устройств цифровой обработки речевых сигналов не выявил. А потому нельзя исключить возможность того, что перед записью на кассету каждая цифровая фонограмма подверглась предварительной обработке с целью модификации параметров голоса и речи неустановленного лица, ведущего переговоры с В., для придания голосу неизвестного внешнего подобия и схожести с образцами голоса А.
Из материалов дела видно, что потерпевшие были ознакомлены с выводами эксперта о принадлежности голоса и речи А. до предъявления им фонограмм телефонных переговоров для опознания. Данный подход следует признать методически порочным, так как он наводит опознающего на определенный вывод, настраивает внимание опознающего при внешнем подобии на поиск только сходных черт, без учета имевшихся различий голоса и речи.
В связи с этим говорить о достоверности проведенного идентификационного исследования не приходится, так как модифицированная по специальному алгоритму речь неизвестного лица могла быть искусственно уподоблена речи А. либо технически искажена так, что достигла уровня сходства их до степени смешения. Указанные экспертом совпадения признаков полностью копируют признаки из заключения эксперта от 8 июля 2008 г. N 01-08 и носят характер выборки отдельных разовых примеров, демонстрируя совпадения на уровне случайного угадывания и внешнего фонетического подобия, вызванного влиянием кодека, работающего в сети мобильной сети сотовой связи GSM, или вследствие искусственного уподобления спектрально-временной структуры сигнала на сравниваемых фонограммах.
В связи с этим то обстоятельство, что фонограммы были переписаны на аналоговый носитель, а не представлены в виде идентичных оригиналам цифровых копиях, настораживает, так как при копировании на аналоговый носитель маскируются и уничтожаются не только следы монтажа, но и те модификации, которые претерпевал исходный речевой сигнал при его синтезе.
При выполнении акустического анализа спорных фонограмм, судя по тексту заключения, эксперт грубо нарушил требования методики и применил для исследования необоснованные и не описанные в методике процедуры. В частности, перед экспертом стояли вопросы о выполнении идентификационного исследования для 9 спорных фонограмм. Поскольку каждая фонограмма получена независимо одна от другой, на каждой фонограмме зафиксирована речь лиц, тождество или отличие которых для разных фонограмм из материалов дела не следует, то перед экспертом и стоит задача определить это тождество и отличие для каждой фонограммы, независимо для каждого отдельного случая. То есть перед экспертом стоит 9 независимых идентификационных задач: имеется ли на спорных фонограммах 1-9 голос и речь А. Необходимо было выполнить как минимум 9 пар независимых идентификационных исследований для 9 фонограмм.
Однако эксперт произвольно объединил все 9 спорных фонограмм в один идентификационный массив, сравнив его с образцами речи А.
Аудитивный анализ выполнялся экспертом небрежно, а лингвистический анализ на уровне слова и фразы вообще не проводился.
Экспертное идентификационное исследование в анализируемом заключении не является объективным, полным и всесторонним, не соответствует современному уровню достижений науки и техники (в нем отсутствует полный и всесторонний акустический и лингвистический анализ речевых сигналов на фонограммах), оно выполнено с грубыми нарушениями требований примененной экспертом методики идентификации лиц по фонограммам русской речи на автоматизированной системе "Диалект".
При сравнении спорных фонограмм эксперт, не проводя предписанных методикой исследований, произвольно принял решение о том, что неустановленные дикторы на всех спорных фонограммах являются одним и тем же лицом. Далее он проводил исследование всего спорного речевого материала, произвольно выбирая фрагменты для исследований и необоснованно распространяя выводы по результатам исследований на все спорные фонограммы. При сравнении акустических признаков микроанализа звуков речи эксперт получил ошибочные выводы, а приведенная в тексте заключения их иллюстрация позволяет прийти к прямо противоположным идентификационным выводам - о различии сравниваемых дикторов.
Заключение эксперта N 05/08 от "27" октября 2008 года.
Заключение эксперта не содержит сравнения каждой спорной фонограммы с образцами голоса и речи А. Исследование не проведено по всем группам признаков акустической и лингвистической природы. Индивидуальные особенности лексико-семантического и семантико-синтаксического уровней речи, присущие А. на экспериментальных образцах, в заключении эксперта не описаны, а потому не дают возможности судить об индивидуальных навыках его речемыслительной деятельности, стилистике его речи, языковой и коммуникативной компетенции.
В связи с этим повторение списка только фонетических особенностей, которые могут модифицироваться под влиянием цифровой обработки, кодирования и сжатия речевого сигнала, не являются устойчивыми к аппаратурным искажениям, недостаточно для установления индивидуально-конкретного тождества сравниваемых лиц.
Заключение эксперта должно быть ясным, объективным, обоснованным, полным, содержать исчерпывающие ответы на поставленные вопросы, полученные на основе объективных, всесторонних и полных исследований, проведенных в пределах специальности эксперта, на строго научной и практической основе с использованием современных достижений науки и техники.
"Всесторонность и полнота" идентификационного исследования подразумевают анализ экспертом рассматриваемого объекта во всех важных для его идентификации аспектах, изучение всех его свойств, определяющих индивидуальность.
Методика идентификации говорящего по голосу и речи требует в качестве обязательного направления идентификационных исследований выполнения полного и всестороннего лингвистического анализа на всех языковых уровнях, а не только на уровне отдельных звуков. Только при наличии результатов лингвистического анализа высших лингвистических уровней методика позволяет принять обоснованное решение о тождестве или отличии сравниваемых дикторов. В силу этого экспертное исследование устной речи, результаты которого изложены в указанном заключении, не является полным и всесторонним, не соответствует современному уровню достижений науки и техники, нарушает положения примененной экспертом методики "Диалект", т.е. не может быть объективным и не может служить источником информации о событиях и обстоятельствах, связанных с расследуемым преступлением.
Заключение специалиста:
1. С научной и методической точек зрения выводы эксперта о принадлежности голоса и речи неизвестных лиц на спорных фонограммах гр-ну А. не обоснован.
2. Признаки, характеризующие голос и речь неизвестного, идентифицированного как "А.", указанные в анализируемых экспертных заключениях, носят общегрупповой характер. Сходство могло быть обусловлено искажениями речевого сигнала при его кодировании и синтезе, сжатии и иной модификации. Выявленные экспертами совпадающие признаки не составляют неповторимую уникальную индивидуальную совокупность, не встречающуюся в речи других людей, недостаточны для установления индивидуально-конкретного тождества, а потому не исключают принадлежность голоса неизвестного лица на спорных фонограммах другому лицу, а не А.
3. Из текста экспертных заключений видно, что представленные на экспертизы спорные фонограммы на микрокассетах, компакт-кассетах, на которых идентифицирован голос неустановленного лица как голос А., оригиналами не являются, а были получены путем перезаписи фонограмм, подвергавшихся цифровой обработке, искажениям и модификации. При этом нельзя исключить, что искажениям подвергался также речевой сигнал фонограмм, записанных при проведении оперативно-розыскных мероприятий и представленных в качестве образцов голоса А. в цифровом виде.
4. Исходя из текста экспертных заключений и требований паспортизованной и общепринятой методики идентификации лиц по голосу и речи "Диалект" имеются обоснованные сомнения, что все спорные фонограммы, на которых идентифицирован голос неустановленного лица как голос А., объективно пригодны для достоверной идентификации по голосу и речи.
5. Особенности сотовой связи могли повлечь ошибочность выводов экспертов об идентификации неустановленного лица и вывода, что признаков монтажа не обнаружено.
6. Для установления доброкачественности фонограммы и исключения возможности подделки, фальсификации в обязательном порядке на экспертизу необходимо предоставить фонограмму-оригинал, устройство, использованные для ее записи. Фонограмма-оригинал, устройства, с помощью которых записывался оригинал и перезаписывалась копия, а также другие сведения, необходимы экспертам для научно обоснованного решения вопроса об идентификации говорящего, а также для выявления признаков монтажа и иных изменений фонограмм, которые могли быть произведены в ходе их цифровой обработки или иных манипуляций с речевым сигналом. Из заключений эксперта видно, что эксперту не было сообщено, как были получены исходные цифровые фонограммы, переписанные на представленный на экспертизы носители (какой вид сотовой связь использовался, какой кодек использовался для сжатия сигнала и степень сжатия, какие манипуляции осуществлялись с речевым сигналом при компиляции макетов звуковых файлов, которые перезаписывались на съемный носитель). В данной ситуации невозможно достоверно установить причины искажений речевых сигналов на фонограмме. Вследствие наличия на фонограмме признаков цифровой обработки речевых сигналов и искажений, являющихся следствием как кодирования при передаче через каналы сотовой связи, так и возможного их появления при перезаписи либо иных манипуляций с оцифрованным сигналом, оценить степень и характер искажения исходного нативного речевого сигнала не представляется возможным. Идентификационному исследованию по сути подвергался не нативный, т.е. исходный, естественный сигнал, естественная человеческая речь, со всеми индивидуальными свойствами, присущими конкретному диктору, а искусственно синтезированный сигнал, из которого алгоритмами кодирования (или сжатия, цифровой обработкой ACELP и др.) физически исключены существенные для индивидуализации диктора особенности. При данном способе кодирования по сотовой связи передается не сам сигнал, а его математическая модель - страница кодовой книги и эксперты, очевидно, сравнили синтезированную (машинную) речь, идентифицировав не человека, а кодек. Говорить о качестве такого сравнения не приходится. Соответственно и попытка привязать неизвестно как полученную аналоговую копию цифровой синтезированной речи к конкретному человеку непродуктивна.
7. В ГОСТ 13699-91 "Запись и воспроизведение информации. Термины и определения" дано понятие монтажа. Монтаж - соединение в необходимом порядке частей одной или нескольких ранее записанных фонограмм путем перезаписи, при котором могут вноситься изменения в записываемую информацию и может изменяться очередность фрагментов. Из чего следует, что решить вопрос о наличии или отсутствии признаков монтажа или изменений, произведенных в процессе записи или после нее, можно только после того, как установлено, является ли фонограмма оригиналом или перезаписью. Эксперты такого исследования не проводили. Поэтому исключить факт изменения и модификации речевого сигнала, следы которого были скрыты при перезаписи на аналоговые кассеты, нельзя.
Голоса двух заведомо разных людей при разговоре по сотовой связи могут быть ошибочно идентифицированы как принадлежащие одному лицу, что может быть обусловлено как объективными (искажениями и модификациями речевого сигнала), так и субъективными причинами (неполнотой и невсесторонностью экспертного исследования, проведенного без учета всех особенностей представленных на экспертизу объектов - копий фонограмм цифровой синтезированной речи, подвергшихся цифровой обработке). Для того чтобы оценить, какой компрессии подвергся оцифрованный сигнал, поступивший на экспертное исследование, необходимо знать: тип и марку мобильного телефона, используемого абонентами при разговорах, в какой сети GSM они (разговоры) происходили и какой кодек и с какой скоростью передачи речевого сигнала использовался в конкретном мобильном телефоне. Также эксперту необходимо знать, какой тип многоканального регистратора использовался, его основные параметры работы, вид и параметры сжатия сигнала, а также условия копирования информации с регистратора на кассеты. Без такой информации эксперт не сможет не только провести полное и всестороннее исследование речи, но даже оценить пригодность фонограмм для идентификационного исследования. Поскольку экспертам информация об условиях и средствах звукозаписи не предоставлялась, то о достоверности сделанных ими выводов говорить не приходится. Ошибка экспертов могла быть вызвана тем, что они исследовали аналоговые копии цифровых фонограмм, полученных по сотовой связи и являющихся по своей природе синтезированной речью.
Поскольку на экспертизу оригиналы фонограмм не направлялись, нельзя исключить возможность копирования на компакт-кассеты и микрокассеты, приобщенные к материалам уголовного дела в качестве вещественных доказательств, фальсифицированных цифровых фонограмм, содержащих искусственно модифицированную на компьютере голос и речь неизвестного лица, уподобленную по определенному алгоритму голосу и речи А. по представленному образцу.
Часто в заключении отсутствуют данные и результаты предварительной оценки представляемых образцов по степени их сопоставимости со спорной фонограммой. В экспертном заключении в обязательном порядке должна употребляться единообразная терминология, не допускающая неоднозначного толкования. Если эксперт употребляет не общепризнанный термин, он должен в обязательном порядке его пояснить или привести то определение, в котором он употребляет термин. "Опорные фрагменты, эталонные и спорные образцы, похожая формантная структура, близкие длительности и характер спектральных изменений, стабильные участки, фонообъекты, следы" - такая терминология без дополнительных пояснений или определений может ввести в заблуждение и привести к неадекватной оценке экспертного заключения и вызовет сомнения в квалификации и компетенции эксперта.
В текстах экспертного заключения встречаются и ошибки методического плана. Так, некоторые эксперты при исследовании большого количества спорных фонограмм проводят так называемую предварительную дифференциацию участников разговора и установление принадлежности реплик только на слух. Учитывая субъективный характер аудитивного восприятия каждым экспертом и высокую вероятность ошибки, использование только аудитивного анализа, не подтвержденного инструментальными методами, может привести к серьезнейшим ошибкам в выводах эксперта.
Эксперт должен тщательно подходить к решению вопросов дифференциации количества говорящих и установления принадлежности реплик каждому участнику разговора. То есть при отборе реплик лица, подлежащего идентификации на спорной фонограмме без комплексного анализа может быть ошибочно, чисто на слух выбрана реплика другого лица. Точно так же не допускается только на основе аудитивного анализа (только субъективного слухового восприятия эксперта) проводить дифференциацию голосов или утверждать об их сходстве на различных спорных фонограммах. Строго говоря, для установления принадлежности реплик одному говорящему в пределах одной фонограммы следует проводить исследование реплик по интегральным перцептивным и акустическим параметрам.
Как показывает анализ экспертных заключений, эксперты часто допускают ошибки в сегментации и проводимых вычислениях, позволяющих, например, привлекаемому судом специалисту-консультанту по экспериментальной фонетике усомниться в достоверности полученных числовых данных. При этом один и тот же эксперт проводит сегментацию и измерения значений длительностей звуковых сегментов и формантных значений два раза подряд на одном и том же речевом отрезке в одной и той же экспертизе и получает разные значения для одних и тех же сегментов с разбросом до 60 мсек для параметров длительности и 1000 Гц для формант.
Эксперты при микроакустическом анализе аллофонов звуков "о" или "э" в один звукотип объединяются все звуки, которые в орфографии обозначаются как "о", "е" и т.д., как в ударной, так и в безударной позициях. Или предварительно не доказав, что на разных спорных фонограммах записан голос одного и того же лица, неправомерно выбирают для параметрического микроанализа из одной спорной фонограммы одно слово, из другой второе и т.д., все это усредняют, перемешивают, получают средние параметры, потом сравнивают с образцами, пытаясь доказать, что все эти речевые сигналы принадлежат одному и тому же человеку.
Выявление подобных ошибок специалистом в ходе состязательного уголовного процесса может поставить под сомнение правильность всего экспертного исследования и сделанных экспертом выводов.
В заключение надо отметить, что в общем виде причинами экспертных ошибок чаще являются субъективные факторы: отступление от методологии производства экспертизы, незнание специфики или сущности исследуемого криминалистического объекта или его однобокая интерпретация, применение неапробированных или непроверенных методик, несертифицированных технических средств, недостаточная разработанность методической базы, превышение собственной компетенции.
Дата добавления: 2015-07-15; просмотров: 405 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
СУДЕБНЫХ ФОНОСКОПИЧЕСКИХ ЭКСПЕРТИЗ | | | СУДЕБНОЙ ПСИХОЛОГИЧЕСКОЙ ЭКСПЕРТИЗЫ 1 страница |