|
Ошибки идєнтификации связанн с неправильним отождествлением обгектов и его свойств. Пользователь начинает работать с информацией, не имеющей ника-кого отношения к рассматриваемой проблеме, что ста-новится, как правило, причиной наиболее серьезньїх ошибок при принятии решений.
Создание трудностей в идєнтификации обьектов является наиболее частьім приемом при проведений мероприятий по «дезинформации»: в боевьіх условиях, при «недобросовестной» рекламе и при проведений вьіборньїх компаний.
Ошибки идєнтификации начинается уже на зтапе поиска информации.
Исследования, связанньїе с изучением докумен-тальньїх источников информации, свидетельствуют, что значительньїе искажения возникают за счет ошибок в написаний имен авторов (коллективньїх и индивиду-альньїх), а также найменований обьектов.
Например:
— Создавая в течение 10 лет сводную картотеку коллективньїх авторов на основе фондов государственной библио-теки «Прусский культурний фонд» (Западини Берлин), немецкой библиотеки во Франкфурте-на-Майне и Бо-варской библиотеке в Мюнхене, виявили 207 тис. авторов и 402 тис. вариантов написаний их фамилий [РЖ 6И202,1985],
— Фамилия венгерского математика Сеогді Роїіа в различ-ньк изданиях имеет следующие форми представлення [56]: Дж. Пойа, Георг Полиа (немецкий вариант), Дьердь Пойа (венгерский вариант), Д.Пойя.
ппп — По данньїм [ЗИ Информатика, № 9,1984, Исследование до-
268оверности библиографических ссьілок] в опубликован-
ннх журнальних статьях от 10 до 13 % библиографических ссилок содержат ошибки. Анализ 2 500 сснлок на одну из работ за 1976— 1981 гг. показал: 180 авторов одновремен-но сослались и на статью о книге и книгу; из них в 148 указано заглавие статьи, причем 114 — верно, а в 34 случа-ях (23 %) с той же ошибкой, что в книге. Более подробннй анализ показал (в данном примере), что лишь малое число авторов может бить обвинено в некорректном цитирова-нии (4. — 5 %). Значительная часть ошибок относится к тем данним, которие задают номера томов, страниц, что су-щественно затрудняет поиск требуемнх источников и, соответственно, контроль приведенной в источниках информации. — Ошибки, связаннне с ложннм отождествлением однофа-мильцев в качестве одного и того же лица. Последствия различньї: от неправильной идєнтификации уровня дове-рия к информации и области деятельности и уровня ква-лификации, до неправильной оценки достоверности и на-дежности источника информации.
Особо следует рассмотреть вопросьі, связанньїе с идентификацией марок изделий и найменований фирм и предприятий.
В ряде технических заданий на разработку баз данньїх по изделиям и организационньїм единицам обьічно используются следующие посьілки:
Марки изделий являются в сущности не лекси-ческими единицами естественного язьїка, а однозначно заданньїми (для каждого изделия) условньїми обо-значениями. В связи с зтим неоднозначность их написання и интерпретации в системе маловероятна(?!). Необходимо только не допускать отклонений от обо-значений, установленньїх производителями изделий. Какая-либо дополнительная нормализация употребле-ний марок изделий является излишней*
Предприятия и фирмьі также могут бьіть однозначно идентифицированьї по их официальньїм назва-ниям, установленньїм самими фирмами и используе-мьім в научно-технической литературе. Как и другие наименования, зти названия не переводятся на другие язьїки. Возможно, правда, применение транслите-рации.
ПрИВедеННЬїе уТВерЖДЄНИЯ НеКОрреКТНЬІ. В ДЄЙ- ппп
ствительности идентификация изделий, фирм и пред- 269
приятий по их наименованиям является достаточно сложной проблемой. Зто обусловлено следующими причинами:
—многие обьектьі имеют несколько имен, каждое из кото-рьіх используется в конкретних условиях;
—существуют родовьіе имена, под которнми группируется некоторое подмножество однородньїх, но не тождествен-ньіх по своєму назначению, свойствам, функциям и характеристикам обьектов;
—одни и те же имена могут принадлежать принципиально различньїм обьектам;
—перенос найменований в иную язьїковую среду ведет, как правило, к появленню имен заменителей, которне после прохождения через несколько язикових преобра-зований порождают имена идентификаторн, которне не могут бнть однозначно идентифицированьї с исходньш именем обьекта, что ведет к появленню «обьектов-фан-томов».
Трудности идентификации обьектов по их наименованиям пьітаются обойти с помощью использования «записи их имен на язьіке оригинала».,
Но такой подход реально осуществить далеко не просто, т.к. он не может бьіть реализован без наличия в системах полного алфавита ВСЕХ язьїков, на кото-рьіх ведется обработка информации.
Но и зто не избавит от ложньїх отождествлений обьектов. Ибо абсолютно идентичное по написанню имя собственное, может принадлежать принципиально различньїм об-ьектам.
Позтому утверждения типа: в настоящее время в информационньїх изданиях (например, ВИНИТИ, система МОСФИтракторостроения (одна из подсистем бьшшего МІДНТИ стран-членов СЗВ) сложилась тра-диция записи названий предприятий и фирм на язьіке оригинала, — необходимо рассматривать как прием, используемьш в действующих системах.
Но одновременно необходимо понимать, что данньїй прием. в действительности не дает решения проблеми однозначной идентификации обьектов по их именам.
„ Одним из методов повьішения качества идентифи-
270 ции имен собственньїх (принадлежащих самьім раз-
личньїм обьектам: фамилий, географических найменований, найменований фирм) является транслитерация.
Именно зтим вьізвана разработка систем и правил транслитерации различньїх имен (географических найменований, найменований фирм, предприятий, имен собственньїх), представленньїх на различньїх язьїках, использующих различньїе алфавитьі на основе лати-ницьі, кириллицьі и других графических систем.
Создание правил, соответствующих зачастую противоречивьім, сложившимся под воздействием различньїх факторов, традиций передачи иноязьічньїх имен собственньїх в русских текстах, крайнє затруд-нительно. В нашей стране зтой проблеме не уделя-лось должного виймання, что существенно затрудня-ло (и затрудняет) обработку данньїх в полиязьічньїх (и особенно, полиалфавитньїх) информационньїх системах.
Проведенньїе в 80-х гг. работьі по разработке стан-дартов по транслитерации латиницьі в кириллицу со-здавали определенную базу нормирования представлення латинизированньїх текстов русским алфавитом. Однако процессьі суверенизации республик разруши-ли достигнутьіе договоренности, а их переход на наци-ональньїе язьїки еще более осложнил вопросьі однозначной идентификации имен обьектов.
Сложность идентификации усиливается рядом дополнительньїх факторов:
— смена алфавита, проведенная в ряде республик, влечет из-менение норм написання как на язьіке оригинала, так и на язьїках перевода. Например: Киргизстан, Башкаркостан;
— массовнм переименованием обьектов учета (фамилий, географических найменований и др.);
— разрушением сложившихся норм перевода на другие язики;
— появлением значительного числа нових слов в базових язьїках. Данная ситуация будет особенно характерна для всех нових государственннх образований на территории бьшшего СССР.
В принципе, перед разработчиками информационньїх систем республик возникла еще более сложная проблема создания многоязьічньїх и многоалфавитньїх перечней найменований изделий, фирм, предприятий и других имен собственньїх, и каждая республика те-перь будет решать зти проблеми самостоятельно и 271
далеко не всегда успешно, что существенно осложнит проблеми идентификации обтьектов по их именам.
Тем, кто сомневается в том, что идентификация имени (наименования) обьекта является доетаточно сложной проблемой предлагаем ознакомиться с при-водимой ниже подборкой.
А. Расхождения в написаний имен и гєографичес-ких найменований:
— Чивилихин [80] приводит множество вариантов имени одного из полководцев Чингизхана и Батьія. Под зтими именами подразумевается один и тот же чело-век в различньїх монгольских, китайских, персидских и латинских исследованиях: Субудай, Субздай-бахадур, Субезтай, Субздзй, Субуздай, Субзтзй, Судудзй, Субу-гздай, Субу-бей, Субутай, Субудз, Субу, Су-бу-тхай, Су-бутли, Субеетай, Сибедей, Себедяй.
— Примерьі написання одних и тех же имен собствен-ньіх и географических найменований [1. Секретине мис-сии. Перевод с английского,— М.: 1964, с. 468 — 499]; [2. Михайлов С. Тридцать серебреников майора Ярдли]; [3. Яковлев Н.Н. Загадка Пирл-Харбора]; [4. Военно-исто-рическийжурнал. № 12, 1991]; [5. Пастухов М.П., Плотнй-ков СЕ. Рассказьі о стрелковом оружии. — М.: ДСААФ СССР, 1983]; [6. Мавродин В.В., Мавродин Вал.В. Из исто-рии отечественного оружия. Русская винтовка]:
1. Имена одной и той же группьі людей:
— Зллис Захариас [1,2];
— Джон Маккларан, капитан 3-го ранга [ 1 ]; Джон У. Макклзрен, капитан-лейтенант [2];
— Ионаи, капитан 2-го ранга [1]; Мицумаси Йо-найи, капитан 3-го ранга [2];
— Катисабуро Номура, капитан 1 -го ранга [ 1 ]; Ка-сисабуро Комура, капитан 1-го ранга [2];
— Киммель X., адмирал [1, 3], Киммел [4].
2. Географическое наименование дается одним и тем же автором в разньїх изданиях [3]: Пирл-Харбор, Перл-Харбор.
3. Написание изобретателей оружия на немецком и английском язьїках одинаково: Нігат Махіт, Нігат Вегсіап. Но представление зтих имен в различньїх отечественньїх изданиях различно и имеет вид:
„-.„ Хайрем Максим, но Хирам Бердан [5]; Хирам
272 ксим, но Хайрам Бердан [6].
4. Передача имени города Ьоз Апдеіез (США): Лось-Анджелест. (см. Анджелесь) [Мальїй знциклопеди-ческий словарь: т. 1/Репринтное воспроизведение издания Брокгауза-Ефрона. — М.: Терра, 1994]; Лос-Анжелос [Знциклопедический словарь. Т.2, — М.: Советская знциклопедия, 1954]; Лос-Анджелес [СЗС. — М.: Советская знциклопедия, 1980]. £. Примерьі найменований образцов военной тех-ники:
Примерьі перевода найменований образцов военной техники, сделанньїе разньїми переводчиками и одного и того же оригинала:
— 90 мм пушка СоскегШ Магк 111,90 мм бортовая пушка «Кокерил», 90 мм пушка «Кокериль».
— Бронетранспортер ЕЕ-11 «Уруту» фирмьі «Зн-гесса», Боевая машина ЕЕ-ІІ ОкитО фирмьі Епдеза.
— Боевая машина САТОР фирмьі Сгеизої-Ьоіге, Колесная бронированная машина УАВ САТОР фирмьі Репаиіі-Сгеизоі-Ьоіге.
— Колесная БМП «Кадиллак-Гейдж» У-300, БМП «Кадиллак-Гейдж» У-300, Бронемашина фирмьі СасШас-Саде У-300.
— Танк «Взлиент», Танк «Взлиант», Танк «Взли-знт».
— Танк огневой полдержки РІКА1ЧНА 6x6, воору-женньїй 90 мм пушкой СоскегШ МкШ, Машина огневой поддержки «Пиранья» (6x6) с 75 мм пушкой «Кокерил».
— Бронетранспортер «Пиранья»(8x8) с 75 мм пушкой, Бронемашина Рігаппа (8x8), вооружен-ная 75 мм бортовой автоматической пушкой.
— Наименование Соїї применительно к стрелко-вому оружию (США) передается «Кольт», а учебно-тренировочному самолету «Коулт».
— Общеизвестная аббревиатура МА5А часто в русской литерации передается как НАСА, но в США имется (или имелась) организация, име-ющая латинскую литерацию НАСА, которую ни в коем случае нельзя отождествлять с ЙА5А, позтому в русских текстах всегда возможна путаница указанньїх аббревиатур.
— Наименование Международнаой организации П10 по стандартизации (ІЗО) у нас в стране пере-
дается двумя аббревиатурами: ИСО и МОС. Но если с крупними международньши организа-циями ещє разобраться можно, то при переходе на национальньїй уровень «шабаш» предла-гаемьіх разньїми переводчиками аббревиатур, используемьіх в одних и тех документах и, осо-бенно, в разньїх документах превращается в не-разрешимне ребусьі, особенно в тех случаях, когда нужно восстановить истинное наимено-вание организации на язьіке первоисточника.
— Любителям истории Великой отечественной войньї предлагается угадать, что стоит за аббревиатурами: Р2КРРУУІ, СгоззІгакіогІІ, ЬКАІІ, РгВеПУедШіВ, ЬаЗЮОК, 8ІШ2І41, УзКг2б22, 1/ 2Ш.
— Занимающиеся информационной безопаснос-тью, не раз ломали голову над другой группой аббревиатур: АВА, АСА, ВІТ5, ТЛ, ТЛА, СІІ, N01, ЗМІ. Получив машинний перевод текста в ко-тором имелись зти аббревиатурьі, с очень боль-шим трудом удалось определить как соотнести переведеними текст с оригиналом, т.к. «авто-матический переводчик» не имел соответству-ющих процедур настройки на глоссарий исход-ного текста. Ответа не приводится. Пусть пос-ледних два примера будут «информацией для размншления» для тех, кто считает, что вос-пользовавшись именем на язьіке оргигинала он «легко и просто» проведет идентификацию обьекта-оригинала.
В. Найменований веществ:
— Взрьівчатое вещество (ВВ) тринитротолуол полу-чило разньїе названия: толит (Франция); трилит (Испания); тринол (Италия); тротил (Германия). В России за ним закрепилось два названия: тротил— в Артиллерийском ведомстве и тол— в Инженерном ведомстве [Гейман Л.Г. Взрьів: исто-рия, практика, перспективи. — М.: Наука, 1978].
— ВВ мелинит имеет названия: мелинит (Франция); лиддит (Англия); шимоза (Япония) [Гейман Л.Г. Взрьів: история, практика, перспективи. — М.: Наука, 1978].
«,. — В базе данних по пищевнм добавка ООН пи-
274 вая добавка имеет до 20 — ЗО различних най-
менований. Нет ни одной добавки с единствен-
ннм именем. В заключение вопросов идентификации предлагается пример из реальной жизни, которнй свидетель-ствует о том, что фамилия человека в течение очень короткого времени, может претерпеть «удивительнне» метаморфози, позволяющие стать «поручиком Киже» во Бремена всеобщей «латинизации», автоматизации и стандартизации, для лиц, имеющих в фамилии кирил-лические символьї: Ч, Ж, Ю, Ц, Щ, Ш, И, Ь, Ь, З, ЬІ, Ю, Я, Ф, Е.
Нетривиальность данной проблеми можно проде-монстрировать на примере собственной фамилии:
— всю жизнь бьіл — Веревченко.
— с внедрением автоматизированньїх систем уче-та стал Веревченко.
— предьявив паспорт в кассн Азрофлота, полу-чил билет на фамилию — Уегеуспепко (Азро-флот).
— предьявив зтот же паспорт в ОВИР, получил паспорт на фамилию — Уегеуіспепко (ОВИР).
Со мной ничего не случилось. Но как по базе данних Азрофлота, узнать внлетелли гражданин —Уегеу-іспепко (ОВИР) из странн? «Машина — дура». Она не даст идентификации указанннх латинизированннх кодов. Меня не разьіскивали, но как бить тем службам, которне ведут учет и контроль и у которнх «приход и расход» должен совпадать? Да и случай не самий слож-ннй: только одна буква и та в середине слова, а если єе в начало слова Чюшущейко.
При создании каталогов (рєгистров) организации, товаров, географических найменований и проч. могут возникнуть более чем интересние ситуации. Например, используя 8 различних схем траслитерации кирили-ческого алфавита стандартной латиницей, било транс-литерировано ограниченное множество найменований, содержащих букви русского алфавита: Ц, Ч, Ш, Я, Є, Ь, Ь, Ж, З, Й.
Получилась интереснейшая «мозаика». Но еще
большая абракадабра возникла: когда «мозаику» вер
нули в исходную форму лица, знавшие ту или иную
систему транслитерации, но не знавшие какос найме- „^
нование по какой системе преобразовнвалось. 275
5.7. Перевод ____________________
Предьідущая группа ошибок является частньїм случаем болєе общей причини искажений информа-ции, вьіраженной на разньїх язиках.
В принципе любой перевод информации с язьїка на язьік и особенно последовательньш перевод на не-сколько язьїков (например, японский => английский => немецкий => русский => и т.д.) создает предпоснлки для существенньїх искажений исходной информации, представленной на язьіке-первоисточнике.
Перевод информации неизбежно сопровождается искажениями. Зто вьізьівается многими причинами. Особое место занимает процесе непрерьівного уста-ревания словарей в бьістроразвивающихся и нових отраслях науки и техники. Зто визвано тем, что боль-шинство терминов несет специфическую нагрузку, но они используютея в мировом масштабе с очень раз-личннми значеннями.
В одной из публикаций (конца 80-х гг.) отмечалось, что по проблематике вьічислительной техники и про-граммированию существует около 20 тис. только анґ-лийских терминов, не имеющих соответствующих зк-вивалентов на русеком язнке, что существенно снижает качество перевода документации с язика на язик. Аналогичнне єитуации существуют и при переводе с других язьїков. Недаром сложности перевода с япон-ского язьїка на любой европейский язик расематрива-етея в ряде работ как дополнительное ередство зашити японских научно-технических и промьішленннх секретов.
Проблема перевода особенно сложна при исполь-
зовании полиязнчннх баз данньїх. Зтим обьясняетея
создание международних баз данних нормированной
многоязнчной лексики. Например, международной
бази терминологических данньїх, международних
специализированннх тезаурусов различной нап-
равленности: по атомной знергии (тезаурус ШІ5), по
медицине, сельскому хозяйству (тезаурус АСРЛ5),
80-ти язичний словарь географических найменова
ний и др.
При международном обмене информацией часто в
качестве основного язьїка используетея английский, в
мках стран-членов СЗВ в качестве язнка-поередни-ка широко использовалея русский язик.
Данная проблема осложнитея на территории рес-публик, входивших в состав СССР. Происходящий в них процесе сменьї алфавитов, обвальний переход на ис-пользование национальннх язиков в качестве государ-ственннх, приведет к значительннм отрицательннм последствиям, наносящим существенньш ущерб в со-здании зффективних и достоверних информационннх ресурсов. Как зто не «консервативно» и «шовинистич-но», но многие из них резко снизят научно-техничес-кий потенциал своих республик. Вместо «националь-ного возрождения» происходит потеря информацион-ного суверенитета зтих республик в большинстве научних областей, существенно усложнятея вопросн использования международних баз данньїх.
Более того, многие республики будут вннуждени в качестве язика науки и ередства межнационального общения использовать язьік какой-либо третьей стра-ньі, на освоение которого основной части населення потребуетея значительное время.
Дата добавления: 2015-08-02; просмотров: 70 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
И 5.5. Нскаженне модем описання решта | | | Искажение информации |