Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

В. ОшнОкн ндентнфшцин___

Ценность | Полезность | З.Б.Б. Доступності | Способ фнксацнн информации | Язьік может вьшолнять как интегрирующую роль в обмене информации, так и виступать в роли мощ-ного барьера, сравнимого с мощной криптографичес-кой системой. | Р- Стоимость_______________ | І Количество Рі Стоимость в Ц5< 21 | Ннформацией______________ | ИзОшвчная ндеаднзяцня оОьекта | Подмена обьекта___________ |


Ошибки идєнтификации связанн с неправильним отождествлением обгектов и его свойств. Пользователь начинает работать с информацией, не имеющей ника-кого отношения к рассматриваемой проблеме, что ста-новится, как правило, причиной наиболее серьезньїх ошибок при принятии решений.

Создание трудностей в идєнтификации обьектов является наиболее частьім приемом при проведений мероприятий по «дезинформации»: в боевьіх условиях, при «недобросовестной» рекламе и при проведений вьіборньїх компаний.

Ошибки идєнтификации начинается уже на зтапе поиска информации.

Исследования, связанньїе с изучением докумен-тальньїх источников информации, свидетельствуют, что значительньїе искажения возникают за счет ошибок в написаний имен авторов (коллективньїх и индивиду-альньїх), а также найменований обьектов.

Например:

— Создавая в течение 10 лет сводную картотеку коллективньїх авторов на основе фондов государственной библио-теки «Прусский культурний фонд» (Западини Берлин), немецкой библиотеки во Франкфурте-на-Майне и Бо-варской библиотеке в Мюнхене, виявили 207 тис. авторов и 402 тис. вариантов написаний их фамилий [РЖ 6И202,1985],

— Фамилия венгерского математика Сеогді Роїіа в различ-ньк изданиях имеет следующие форми представлення [56]: Дж. Пойа, Георг Полиа (немецкий вариант), Дьердь Пойа (венгерский вариант), Д.Пойя.

ппп — По данньїм [ЗИ Информатика, № 9,1984, Исследование до-
268оверности библиографических ссьілок] в опубликован-


ннх журнальних статьях от 10 до 13 % библиографических ссилок содержат ошибки. Анализ 2 500 сснлок на одну из работ за 1976— 1981 гг. показал: 180 авторов одновремен-но сослались и на статью о книге и книгу; из них в 148 указано заглавие статьи, причем 114 — верно, а в 34 случа-ях (23 %) с той же ошибкой, что в книге. Более подробннй анализ показал (в данном примере), что лишь малое число авторов может бить обвинено в некорректном цитирова-нии (4. — 5 %). Значительная часть ошибок относится к тем данним, которие задают номера томов, страниц, что су-щественно затрудняет поиск требуемнх источников и, соответственно, контроль приведенной в источниках информации. — Ошибки, связаннне с ложннм отождествлением однофа-мильцев в качестве одного и того же лица. Последствия различньї: от неправильной идєнтификации уровня дове-рия к информации и области деятельности и уровня ква-лификации, до неправильной оценки достоверности и на-дежности источника информации.

Особо следует рассмотреть вопросьі, связанньїе с идентификацией марок изделий и найменований фирм и предприятий.

В ряде технических заданий на разработку баз данньїх по изделиям и организационньїм единицам обьічно используются следующие посьілки:

Марки изделий являются в сущности не лекси-ческими единицами естественного язьїка, а однозначно заданньїми (для каждого изделия) условньїми обо-значениями. В связи с зтим неоднозначность их написання и интерпретации в системе маловероятна(?!). Необходимо только не допускать отклонений от обо-значений, установленньїх производителями изделий. Какая-либо дополнительная нормализация употребле-ний марок изделий является излишней*

Предприятия и фирмьі также могут бьіть однозначно идентифицированьї по их официальньїм назва-ниям, установленньїм самими фирмами и используе-мьім в научно-технической литературе. Как и другие наименования, зти названия не переводятся на другие язьїки. Возможно, правда, применение транслите-рации.

ПрИВедеННЬїе уТВерЖДЄНИЯ НеКОрреКТНЬІ. В ДЄЙ- ппп

ствительности идентификация изделий, фирм и пред- 269


приятий по их наименованиям является достаточно сложной проблемой. Зто обусловлено следующими причинами:

—многие обьектьі имеют несколько имен, каждое из кото-рьіх используется в конкретних условиях;

—существуют родовьіе имена, под которнми группируется некоторое подмножество однородньїх, но не тождествен-ньіх по своєму назначению, свойствам, функциям и характеристикам обьектов;

—одни и те же имена могут принадлежать принципиально различньїм обьектам;

—перенос найменований в иную язьїковую среду ведет, как правило, к появленню имен заменителей, которне после прохождения через несколько язикових преобра-зований порождают имена идентификаторн, которне не могут бнть однозначно идентифицированьї с исходньш именем обьекта, что ведет к появленню «обьектов-фан-томов».

Трудности идентификации обьектов по их наименованиям пьітаются обойти с помощью использования «записи их имен на язьіке оригинала».,

Но такой подход реально осуществить далеко не просто, т.к. он не может бьіть реализован без наличия в системах полного алфавита ВСЕХ язьїков, на кото-рьіх ведется обработка информации.

Но и зто не избавит от ложньїх отождествлений обьектов. Ибо абсолютно идентичное по написанню имя собственное, может принадлежать принципиально различньїм об-ьектам.

Позтому утверждения типа: в настоящее время в информационньїх изданиях (например, ВИНИТИ, система МОСФИтракторостроения (одна из подсистем бьшшего МІДНТИ стран-членов СЗВ) сложилась тра-диция записи названий предприятий и фирм на язьіке оригинала, — необходимо рассматривать как прием, используемьш в действующих системах.

Но одновременно необходимо понимать, что данньїй прием. в действительности не дает решения проблеми однозначной идентификации обьектов по их именам.

„ Одним из методов повьішения качества идентифи-

270 ции имен собственньїх (принадлежащих самьім раз-


личньїм обьектам: фамилий, географических найменований, найменований фирм) является транслитерация.

Именно зтим вьізвана разработка систем и правил транслитерации различньїх имен (географических найменований, найменований фирм, предприятий, имен собственньїх), представленньїх на различньїх язьїках, использующих различньїе алфавитьі на основе лати-ницьі, кириллицьі и других графических систем.

Создание правил, соответствующих зачастую противоречивьім, сложившимся под воздействием различньїх факторов, традиций передачи иноязьічньїх имен собственньїх в русских текстах, крайнє затруд-нительно. В нашей стране зтой проблеме не уделя-лось должного виймання, что существенно затрудня-ло (и затрудняет) обработку данньїх в полиязьічньїх (и особенно, полиалфавитньїх) информационньїх системах.

Проведенньїе в 80-х гг. работьі по разработке стан-дартов по транслитерации латиницьі в кириллицу со-здавали определенную базу нормирования представлення латинизированньїх текстов русским алфавитом. Однако процессьі суверенизации республик разруши-ли достигнутьіе договоренности, а их переход на наци-ональньїе язьїки еще более осложнил вопросьі однозначной идентификации имен обьектов.

Сложность идентификации усиливается рядом дополнительньїх факторов:

— смена алфавита, проведенная в ряде республик, влечет из-менение норм написання как на язьіке оригинала, так и на язьїках перевода. Например: Киргизстан, Башкаркостан;

— массовнм переименованием обьектов учета (фамилий, географических найменований и др.);

— разрушением сложившихся норм перевода на другие язики;

— появлением значительного числа нових слов в базових язьїках. Данная ситуация будет особенно характерна для всех нових государственннх образований на территории бьшшего СССР.

В принципе, перед разработчиками информационньїх систем республик возникла еще более сложная проблема создания многоязьічньїх и многоалфавитньїх перечней найменований изделий, фирм, предприятий и других имен собственньїх, и каждая республика те-перь будет решать зти проблеми самостоятельно и 271


далеко не всегда успешно, что существенно осложнит проблеми идентификации обтьектов по их именам.

Тем, кто сомневается в том, что идентификация имени (наименования) обьекта является доетаточно сложной проблемой предлагаем ознакомиться с при-водимой ниже подборкой.

А. Расхождения в написаний имен и гєографичес-ких найменований:

— Чивилихин [80] приводит множество вариантов имени одного из полководцев Чингизхана и Батьія. Под зтими именами подразумевается один и тот же чело-век в различньїх монгольских, китайских, персидских и латинских исследованиях: Субудай, Субздай-бахадур, Субезтай, Субздзй, Субуздай, Субзтзй, Судудзй, Субу-гздай, Субу-бей, Субутай, Субудз, Субу, Су-бу-тхай, Су-бутли, Субеетай, Сибедей, Себедяй.

— Примерьі написання одних и тех же имен собствен-ньіх и географических найменований [1. Секретине мис-сии. Перевод с английского,— М.: 1964, с. 468 — 499]; [2. Михайлов С. Тридцать серебреников майора Ярдли]; [3. Яковлев Н.Н. Загадка Пирл-Харбора]; [4. Военно-исто-рическийжурнал. № 12, 1991]; [5. Пастухов М.П., Плотнй-ков СЕ. Рассказьі о стрелковом оружии. — М.: ДСААФ СССР, 1983]; [6. Мавродин В.В., Мавродин Вал.В. Из исто-рии отечественного оружия. Русская винтовка]:

1. Имена одной и той же группьі людей:

— Зллис Захариас [1,2];

— Джон Маккларан, капитан 3-го ранга [ 1 ]; Джон У. Макклзрен, капитан-лейтенант [2];

— Ионаи, капитан 2-го ранга [1]; Мицумаси Йо-найи, капитан 3-го ранга [2];

— Катисабуро Номура, капитан 1 -го ранга [ 1 ]; Ка-сисабуро Комура, капитан 1-го ранга [2];

— Киммель X., адмирал [1, 3], Киммел [4].

 

2. Географическое наименование дается одним и тем же автором в разньїх изданиях [3]: Пирл-Харбор, Перл-Харбор.

3. Написание изобретателей оружия на немецком и английском язьїках одинаково: Нігат Махіт, Нігат Вегсіап. Но представление зтих имен в различньїх отечественньїх изданиях различно и имеет вид:

„-.„ Хайрем Максим, но Хирам Бердан [5]; Хирам

272 ксим, но Хайрам Бердан [6].


4. Передача имени города Ьоз Апдеіез (США): Лось-Анджелест. (см. Анджелесь) [Мальїй знциклопеди-ческий словарь: т. 1/Репринтное воспроизведение издания Брокгауза-Ефрона. — М.: Терра, 1994]; Лос-Анжелос [Знциклопедический словарь. Т.2, — М.: Советская знциклопедия, 1954]; Лос-Анджелес [СЗС. — М.: Советская знциклопедия, 1980]. £. Примерьі найменований образцов военной тех-ники:

Примерьі перевода найменований образцов военной техники, сделанньїе разньїми переводчиками и одного и того же оригинала:

— 90 мм пушка СоскегШ Магк 111,90 мм бортовая пушка «Кокерил», 90 мм пушка «Кокериль».

— Бронетранспортер ЕЕ-11 «Уруту» фирмьі «Зн-гесса», Боевая машина ЕЕ-ІІ ОкитО фирмьі Епдеза.

— Боевая машина САТОР фирмьі Сгеизої-Ьоіге, Колесная бронированная машина УАВ САТОР фирмьі Репаиіі-Сгеизоі-Ьоіге.

— Колесная БМП «Кадиллак-Гейдж» У-300, БМП «Кадиллак-Гейдж» У-300, Бронемашина фирмьі СасШас-Саде У-300.

— Танк «Взлиент», Танк «Взлиант», Танк «Взли-знт».

— Танк огневой полдержки РІКА1ЧНА 6x6, воору-женньїй 90 мм пушкой СоскегШ МкШ, Машина огневой поддержки «Пиранья» (6x6) с 75 мм пушкой «Кокерил».

— Бронетранспортер «Пиранья»(8x8) с 75 мм пушкой, Бронемашина Рігаппа (8x8), вооружен-ная 75 мм бортовой автоматической пушкой.

— Наименование Соїї применительно к стрелко-вому оружию (США) передается «Кольт», а учебно-тренировочному самолету «Коулт».

— Общеизвестная аббревиатура МА5А часто в русской литерации передается как НАСА, но в США имется (или имелась) организация, име-ющая латинскую литерацию НАСА, которую ни в коем случае нельзя отождествлять с ЙА5А, позтому в русских текстах всегда возможна путаница указанньїх аббревиатур.

— Наименование Международнаой организации П10 по стандартизации (ІЗО) у нас в стране пере-

 


дается двумя аббревиатурами: ИСО и МОС. Но если с крупними международньши организа-циями ещє разобраться можно, то при переходе на национальньїй уровень «шабаш» предла-гаемьіх разньїми переводчиками аббревиатур, используемьіх в одних и тех документах и, осо-бенно, в разньїх документах превращается в не-разрешимне ребусьі, особенно в тех случаях, когда нужно восстановить истинное наимено-вание организации на язьіке первоисточника.

— Любителям истории Великой отечественной войньї предлагается угадать, что стоит за аббревиатурами: Р2КРРУУІ, СгоззІгакіогІІ, ЬКАІІ, РгВеПУедШіВ, ЬаЗЮОК, 8ІШ2І41, УзКг2б22, 1/ 2Ш.

— Занимающиеся информационной безопаснос-тью, не раз ломали голову над другой группой аббревиатур: АВА, АСА, ВІТ5, ТЛ, ТЛА, СІІ, N01, ЗМІ. Получив машинний перевод текста в ко-тором имелись зти аббревиатурьі, с очень боль-шим трудом удалось определить как соотнести переведеними текст с оригиналом, т.к. «авто-матический переводчик» не имел соответству-ющих процедур настройки на глоссарий исход-ного текста. Ответа не приводится. Пусть пос-ледних два примера будут «информацией для размншления» для тех, кто считает, что вос-пользовавшись именем на язьіке оргигинала он «легко и просто» проведет идентификацию обьекта-оригинала.

В. Найменований веществ:

— Взрьівчатое вещество (ВВ) тринитротолуол полу-чило разньїе названия: толит (Франция); трилит (Испания); тринол (Италия); тротил (Германия). В России за ним закрепилось два названия: тротил— в Артиллерийском ведомстве и тол— в Инженерном ведомстве [Гейман Л.Г. Взрьів: исто-рия, практика, перспективи. — М.: Наука, 1978].

— ВВ мелинит имеет названия: мелинит (Франция); лиддит (Англия); шимоза (Япония) [Гейман Л.Г. Взрьів: история, практика, перспективи. — М.: Наука, 1978].

«,. — В базе данних по пищевнм добавка ООН пи-

274 вая добавка имеет до 20 — ЗО различних най-


менований. Нет ни одной добавки с единствен-

ннм именем. В заключение вопросов идентификации предлагается пример из реальной жизни, которнй свидетель-ствует о том, что фамилия человека в течение очень короткого времени, может претерпеть «удивительнне» метаморфози, позволяющие стать «поручиком Киже» во Бремена всеобщей «латинизации», автоматизации и стандартизации, для лиц, имеющих в фамилии кирил-лические символьї: Ч, Ж, Ю, Ц, Щ, Ш, И, Ь, Ь, З, ЬІ, Ю, Я, Ф, Е.

Нетривиальность данной проблеми можно проде-монстрировать на примере собственной фамилии:

— всю жизнь бьіл — Веревченко.

— с внедрением автоматизированньїх систем уче-та стал Веревченко.

— предьявив паспорт в кассн Азрофлота, полу-чил билет на фамилию — Уегеуспепко (Азро-флот).

— предьявив зтот же паспорт в ОВИР, получил паспорт на фамилию — Уегеуіспепко (ОВИР).

Со мной ничего не случилось. Но как по базе данних Азрофлота, узнать внлетелли гражданин —Уегеу-іспепко (ОВИР) из странн? «Машина — дура». Она не даст идентификации указанннх латинизированннх кодов. Меня не разьіскивали, но как бить тем службам, которне ведут учет и контроль и у которнх «приход и расход» должен совпадать? Да и случай не самий слож-ннй: только одна буква и та в середине слова, а если єе в начало слова Чюшущейко.

При создании каталогов (рєгистров) организации, товаров, географических найменований и проч. могут возникнуть более чем интересние ситуации. Например, используя 8 различних схем траслитерации кирили-ческого алфавита стандартной латиницей, било транс-литерировано ограниченное множество найменований, содержащих букви русского алфавита: Ц, Ч, Ш, Я, Є, Ь, Ь, Ж, З, Й.

Получилась интереснейшая «мозаика». Но еще
большая абракадабра возникла: когда «мозаику» вер
нули в исходную форму лица, знавшие ту или иную
систему транслитерации, но не знавшие какос найме- „^
нование по какой системе преобразовнвалось. 275


5.7. Перевод ____________________

Предьідущая группа ошибок является частньїм случаем болєе общей причини искажений информа-ции, вьіраженной на разньїх язиках.

В принципе любой перевод информации с язьїка на язьік и особенно последовательньш перевод на не-сколько язьїков (например, японский => английский => немецкий => русский => и т.д.) создает предпоснлки для существенньїх искажений исходной информации, представленной на язьіке-первоисточнике.

Перевод информации неизбежно сопровождается искажениями. Зто вьізьівается многими причинами. Особое место занимает процесе непрерьівного уста-ревания словарей в бьістроразвивающихся и нових отраслях науки и техники. Зто визвано тем, что боль-шинство терминов несет специфическую нагрузку, но они используютея в мировом масштабе с очень раз-личннми значеннями.

В одной из публикаций (конца 80-х гг.) отмечалось, что по проблематике вьічислительной техники и про-граммированию существует около 20 тис. только анґ-лийских терминов, не имеющих соответствующих зк-вивалентов на русеком язнке, что существенно снижает качество перевода документации с язика на язик. Аналогичнне єитуации существуют и при переводе с других язьїков. Недаром сложности перевода с япон-ского язьїка на любой европейский язик расематрива-етея в ряде работ как дополнительное ередство зашити японских научно-технических и промьішленннх секретов.

Проблема перевода особенно сложна при исполь-
зовании полиязнчннх баз данньїх. Зтим обьясняетея
создание международних баз данних нормированной
многоязнчной лексики. Например, международной
бази терминологических данньїх, международних
специализированннх тезаурусов различной нап-
равленности: по атомной знергии (тезаурус ШІ5), по
медицине, сельскому хозяйству (тезаурус АСРЛ5),
80-ти язичний словарь географических найменова
ний и др.
При международном обмене информацией часто в

качестве основного язьїка используетея английский, в

 

 

мках стран-членов СЗВ в качестве язнка-поередни-ка широко использовалея русский язик.

Данная проблема осложнитея на территории рес-публик, входивших в состав СССР. Происходящий в них процесе сменьї алфавитов, обвальний переход на ис-пользование национальннх язиков в качестве государ-ственннх, приведет к значительннм отрицательннм последствиям, наносящим существенньш ущерб в со-здании зффективних и достоверних информационннх ресурсов. Как зто не «консервативно» и «шовинистич-но», но многие из них резко снизят научно-техничес-кий потенциал своих республик. Вместо «националь-ного возрождения» происходит потеря информацион-ного суверенитета зтих республик в большинстве научних областей, существенно усложнятея вопросн использования международних баз данньїх.

Более того, многие республики будут вннуждени в качестве язика науки и ередства межнационального общения использовать язьік какой-либо третьей стра-ньі, на освоение которого основной части населення потребуетея значительное время.


Дата добавления: 2015-08-02; просмотров: 70 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
И 5.5. Нскаженне модем описання решта| Искажение информации

mybiblioteka.su - 2015-2024 год. (0.016 сек.)