Применение компонентного анализа

Читайте также:

«Целью компонентного анализа является не выделение всех мыслимых компонентов» (по которым происходит деление семантических классов), «а лишь тех, которые, по словам И. И. Мещанинова, не описываются при помощи языка, а выявляются в нем самом, в его лексике и грамматическом строе».

Таким образом, в языке якобы существуют «фундаментальные» единицы языка наряду с фундаментальными определениями, их невозможно описать средствами языка кроме как через понятия, для которых они сами составляли определения. В работе высказывается предположение о существовании только одной фундаментальной единицы языка – кванта семантического смысла. «Компонентный анализ – метод исследования содержательной стороны только так называемых значимых единиц языка, имеющих целью разложение значения на минимальные семантические составляющие» [64]. Этот метод впервые был использован при исследовании лексического материала как техника описания узкого круга единиц (терминов родства) в различных языках в 50-е годы XX века. Он основан на гипотезе о том, что значение каждой единицы языка состоит из семантических компонентов (сем) и что словарный состав языка может быть описан с помощью ограниченного сравнительно небольшого числа семантических признаков. Метод компонентного анализа тесно связан с системно парадигматическими представлениями о языке, в частности, с теорией семантического поля, и может рассматриваться как расширение и углубление ее теоретической и инструментальной базы».

Членение лексики на семантические поля и отличия этих классов слов основаны на выделении дифференцирующего компонента. Последнее же легко осуществить при помощи метода компонентного анализа [64].

Компонентный анализ может использоваться не только для исследования лексики языка, но и речи. «Применение компонентного анализа в семантике обнаруживает ряд закономерностей функционирования слов в речи. На основе работ Дж. Кац, Дж. Фодор, Ю. Д. Апресяна, В. Г. Гак устанавливается, в частности, условия правильного выбора слов в словосочетаниях. При этом повтор сем выступает как важное конструктивное средство построения речи» [67].

В аспекте построения ЕЯ интерфейса необходимо перейти от оперирования отдельными словами языка и их объединения в синтагмы к оперированию большими массивами однотипной информации и операциям над ними. Например, фразу «я сижу на стуле и ем бутерброд» можно представить в форме соотнесения очень больших семантических пластов, которые могут быть представлены в форме подстановочных таблиц

Таблица 1.1

Порождение фраз типа «Я лежал на кровати и жевал бутерброд» при помощи подстановочной таблицы

Существо	Действие над опорой	Опора	Действие над пищей	Пища
Я	Сидеть на	Стул	И есть	Бутерброд
Ты	Лежать на	Кресло	И жевать	Мясо
Мой брат	Качаться на	Кровать	И готовить	Свинина
Лесничий	Упасть с	Скамья	И разогревать	Рыба

Путем обобщения множества возможных высказываний в форме подстановочных таблиц можно визуализировать структуру языка в частности в приложении к созданию естественно-языковых интерфейсов.

Лексико-семантические варианты в языке и речи

В синхроническом плане слово в лексико-семантической системе представлено несколькими ЛСВ (лексико-семантическими вариантами) в речи - случаями, модификациями его системных значений [92]. Слово само по себе не имеет, как правило, одного конкретного значения. Слово получает каждое конкретное значение только под влиянием других слов, т е. в контексте [81]. По выражению Шехтмана Н. А.: «в тексте всегда есть знаки, функция которых состоит в том, чтобы указывать на элементы значения других знаков».

Новые значения формируются только в контексте, контекст обладает порождающей способностью. Контекст «вытягивает на поверхность один важный семантический компонент». Между тем различные лексико-семантические варианты слова являются во многом однородными и связанными друг с другом элементами одного значения с общим семантическим ядром. Если значения одинакового по форме слова не имеют ничего общего, то они являются не различными лексико-семантическими вариантами, а омонимами, для синонимов же характерен общий признак, элемент всех лексико-семантических вариантов:

Рассмотрим следующие предложения.

«Loos of blood killed the victim». (J. Dillon) – (буквально) «Потеря крови убила жертву».

«One poisoned beast could kill five others». (J. Aldridge) – (буквально) «Один зараженный зверь может убить пять других».

«I was driving a car and killed a little girl». (A. Hailey) – (буквально) «Я вел машину и убил маленькую девочку».

Здесь оттенки значений, так же как и перевод слова «kill», различны: «задавить, отравить, обескровить». Но при этом существует понятие, связывающее оттенки этих значений в одно понятие «стать причиной смерти».

Значения различных лексико-семантических вариантов слова связаны и могут пересекаться. Слово «cup» в английском языке может означать. в частности, приз или особый сосуд (кубок), при этом приз может быть представлен подобной чашей, а может и не быть, в последнем случае разные лексико-семантические варианты слова пересекутся. Существуют, кроме того, различные виды лексико-семантических вариантов. Так структура слова включает прямые (собственные) и переносные (вторичные) значения, например, «сон» в значении «смерть» и «песок» в значении «время».

Значения слова могут реализовываться как узуальные (принятые) и оказиальные (не принятые):

A car purred along the street. Здесь «мурлыкать» означает «двигаться» [64] Однако далее в работе показывается, что проблема семантического шума в речи объясняет многие явления речи, не прибегая к интерпретациям из области лексико-семантических вариантов. Например, употребление, казалось бы, разных значений в следующих предложениях может рассматриваться как проявление семантического шума на фоне одного базового значения слова «kill».

«The victim died because of loss of blood» – «Жертва умерла от потери крови».

«Five beasts could die because they poisoned one beast». – «Пять зверей могут умереть, потому что один зверь был отравлен».

«I ran over a little girl by my car. She died». – «Я сбил маленькую девочку на моей машине. Она умерла».

Эти предложения ассоциируются с подстановочными таблицами.

Таблица 1.2

Порождение предложений вида «Он умер в результате болезни» при помощи подстановочной таблицы

Существо	Отношение, выраженное глаголом (существование)	Предлог причины или времени	Действие над телом
Я	Жить	После	Травмы
Он	Умирать	В результате	Ушиба
Звери	Выживать	Из-за	Потери крови
Жертва	Спасаться	Ввиду	Болезни

В таблице 1.2 показано, как предложенные фразы могут быть описаны при помощи подстановочных таблиц.

Таблица 1.3

Порождение фраз вида «Лесничий сбил девочку на грузовике» при помощи подстановочной таблицы

Существо	Представление транспорта	Существо	На транспорте
Я	Подвезти	Ребенка	На машине
Ты	Сбить	Девочку	На трамвая
Мой брат	Переехать (покалечить, / убить)	Мальчика	На грузовике
Лесничий	Заехать за	Босса	На велосипеде

В подстановочной таблице 1.3. задается множество предложений, описывающих структуры, которые часто интерпретируют как особые лексико-семантические варианты слов.

Чтобы воспользоваться подстановочными таблицами, необходимо взять по одному слову из каждой колонки, что позволяет сформировать связное предложение.

1.5. Единство формальных и смысловых характеристик слова
в искусственных языках для машинного перевода

1.5.1. Системы типа «Интерлингво» и машинный перевод

В последнее время в области систем машинного перевода господствует идея о необходимости создания систем Интерлингво. То есть все существующие языки должны переводиться на Интерлингво и обратно с Интерлингво.
В результате можно было бы получать перевод с любого языка A на язык B, применяя цепочку A-I-B, где I есть язык Интерлингво. «Один из наиболее известных проектов interlingua-системы разрабатывается в Голландии под названием Distributed Language Translation (DLT, infoweb.magi.com /~mfettes /DLT.html). Эта разработка началась в 1979 году и была свернута к 1992 году. Но не успела она завершиться, как запустился новый Интерлингво-проект UNL или Universal Network Language. На этот раз (в 1997 году) инициаторами выступили японцы. Возникновение этого проекта непосредственно связано с потребностью перевода документов в Интернете. [27] Последний проект состоит в идее сопоставления словам неких атрибутов, отличающих их различные лексико-семантические варианты.

Дата добавления: 2015-07-08; просмотров: 216 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Внутренняя структура слова, ядро и периферия	\|	Проблемы создания языка описания семантики

mybiblioteka.su - 2015-2026 год. (0.07 сек.)