Основные модели лингвистических систем.

Читайте также:

Модель концептуальной зависимости была теоретически разработана в 1968-75 годах в Йельском университете группой, руководимой Робертом Шенком, и представляла новую теорию описания семантики языка. Отрицалось влияние синтаксиса и морфологии на семантику. Семантическая модель представлялась в виде так называемой сети концептуализаций. Основная единица семантики в этом подходе – т.н. концептуализация, - представляет из себя совокупность действия, его атрибутов (концептуальные или, они же, семантические падежи), участников действия и их характеристики.
Понятие концептуализации примерно соответствует в русском языке понятию «событие». Сеть концептуализаций – это граф, вершины которого могут относиться к одному из семи классов (типы вершин):
1) PP - имена физических объектов (существительные),
2) ACT - имена действий (глаголы),
3) PA - характеристики объекта (прилагательные),
4) AA - характеристики действий (наречия).
5) State – состояние.
6) LOCK – место
7) T – время.

Дуги могут быть помечены более чем одним символом. Существует следующие типы дуг:

1. Дуги первого типа - определяют роли участников действия (АСТ). Подразделяются на:
Дуга, соединяющая действие (оно же - предикат) с актором (агентом), выполняющим действие. Эта дуга на графе соответствует самому понятию концептуализации (события). Если есть действие, но нет актора, эта дуга все же должна присутствовать и соединяться одним концом с действием (ACT), другой конец не должен быть присоединен ни к чему.
Дуга, соединяющая действие (предикат) с объектом действия.
Дуга R, соединяющая действие (предикат) с лицом-адресатом (новым владельцем) и лицом-источником (первоначальным владельцем) объекта
Дуга D, соединяющая действие (предикат) с первоначальным и последующим местом объекта.
Дуга I, связывающее действие (предикат) с инструментом, выражаемым как другая концептуализация (то есть не как предмет, а как событие).

2. Дуги второго типа могут присоединяться как к действию, так и к самой концептуализации. Включают в себя:
Дуга, связывающая действие (концептуализацию) ACT с характеристикой действия AA (то есть с обстоятельством в форме наречия).
Дуга, связывающая действие (концептуализацию) с местом (LOCK).
Дуга, связывающая действие (концептуализацию) с временем (T).

3. Дуги третьего типа – это дуги, выражающие причинные взаимосвязи между двумя действиями или между действием и состоянием.
Дуга R связывает одно событие (действие) A с другим событием (действием) B, если A является причиной B. Отношение такого типа называется причинной каузацией (reason causation).
Дуга E связывает событие (действие) A с событием (действием) B, если A делает возможным B. Такое отношение называется каузацией возможности.
Дуга r связывает событие (действие) A c B, если B является следствием завершения A. Это так называемая результирующая каузация.

Все действия в модели концептуальных зависимостей рассматриваются как комбинации 11 примитивных действий:
1). PROPEL – «применить силу к»
2). MOVE – «двигать часть тела»
3). INGEST – «ввести что-либо внутрь кого-либо (актора)»
4). EXPREL – «вывести что-либо наружу из кого-либо (актора)»
5). GRASP – «схватить физический объект»
6). PTRANS – «переместить что-либо»
7). ATRANS – «изменить какое-либо отношение»
8). SPEAK –«произвести звук»
9). ATTEND – «направить внимание или другие чувства на некоторый стимул»
10). MBUILD – «создать или объединить мысли»
11). MTRANS – «передать информацию».

Модель семантики предпочтения разрабатывалась в 1964-1972 в Стэнфордском университете под руководством Уилкса. Элементами семантики здесь являются:

смыслы слов (word senses), представляемые семантическими формулами;
сообщения (messages), представляемые шаблонами (образцами);
фрагменты текста;
семантическая сочетаемость предложений(semantic compatibility), представляемая правилами следования;

Семантические формулы представляют из себя последовательности заключенных в скобки семантических элементов-атомов смысла, называемых в этой модели классификаторами.
В разных работах этого направления вводится различное число классификаторов (80-100), объединяемых в 15-20 классов, обозначаемых звездочкой. Например, к числу классификаторов класса *ЖИВОЕ относятся классификаторы ЭТО, ЧЕЛОВЕК, НАРОД, ЗВЕРЬ, класс *ЧЕЛОВЕК; к классификаторам класса *МЕСТО относятся ЭТО, ТОЧКА, ПРОСТРАНСТВО, ЧАСТЬ;
Таким образом, классификаторы объединены в иерархию с множественным наследованием. Например, для слова СТРЕЛЯТЬ Уилксом строится формула:
((*ЧЕЛОВЕК СУБЪЕКТ) ((*ЖИВОЕ ОБЪЕКТ)
((ПОРАЗИТЬ ЦЕЛЬ) ((ОРУЖИЕ ИНСТРУМЕНТ)
((ПУЛЯ ПЕРЕМЕЩАТЬ) ПРИЧИНА)))))
означающая, что это действие совершается человеком, который для поражения живого существа использует инструмент, вызывающий движение пули. Стоит отметить, что в формулу входят не слова естественного языка, а именно атомы смысла (классификаторы).
Образцы (шаблоны), как уже было сказано, служат для представления сообщений. Они разделяются у Уилкса на простые и полные образцы. Простой образец представляет тройку определенных ранее семантическими формулами элементов. Такой обрзец несет обобщенную информацию о многих конкретных высказываниях. Например тройка ЖИВОТНОЕ+БЫТЬ+ВИД может означать и «Васька - (есть) кот» и «Шарик – (есть) пес».
Существуют определенные правила получения полных образцов. Два образца, выделенные в предложении, с помощью правил следования, отражающих их смысловую совместимость, объединяются в один образец.
Процесс анализа текста построен следующим образом. С помощью специальных маркеров выполняется фрагментация текста. Далее анализируются отдельные фрагменты текста. Для этого всем словам фрагмента сопоставляются их значения из словаря. Далее на фрагмент текста делается попытка наложения каждого из простых образцов, известных системе. Образец считается совпавшим, если каждый из его элементов совпадает по смыслу с элементами данного фрагмента текста. Далее из простых образцов строятся полные образцы после анализа и добавления тех слов предложения, которые не вошли в простой образец. Таким образом обрабатываются все предложения во фрагменте текста.
Далее определяется семантическая близость предложений внутри текста. Для этого в системе вводится понятие семантической близости двух полных образцов. С этой целью для каждых двух полных образцов подсчитывается число классификаторов, входящих в оба образца и входящих только в какой-то один из них.

Модель Смысл<->Текст.
Родоначальником этой модели принято считать советского ученого Жолковского. Для описания существа и степени семантического сходства разных слов вводится язык семантических множителей, особенностью которого являются «атомное» строение смысла, высокая структурированность значения вместо представления его в виде множества семантических множителей и наличие правил преобразования. Принимаются следующие уровни представления языковой информации: фонетическо-фонологический, морфологический, синтаксический, семантический.
Фонетическо-фонологический в модели подробно не описывается.

Морфологический уровень состоит из двух подуровней: поверхностной морфологии и глубинной морфологии.
Поверхностно-морфологическое представление (ПМП) фразы состоит из цепочки (т.е. линейно упорядоченной последовательности) морфем, супраморфем (семейств морфологически значимых просодический явлений) и аналогичных морфемам морфологических операций (чередований, конверсий и т.п.).
Глубинно-морфологическое представление (ГМП) фразы состоит из цепочки ГМП всех словоформ фразы и сведений о просодических характеристиках фразы (интонация, паузы, фразовые ударения и т.д.).

Синтаксический уровень также состоит из двух подуровней: глубинного синтаксиса и поверхностного синтаксиса.
Поверхностно-синтаксическое представление (ПСП) фразы состоит из пяти компонент:

Поверхностно-синтаксическая структура (ПСС) - дерево зависимостей, узлами которого являются все словоформы фразы, точнее их упрощенные морфологические представления., а дугами – поверхностно-синтаксические отношения (ПСО) естественного языка (для русского языка их выделено порядка 50).
Информация о коммуникативной организации фразы.
Информация о тождестве именных групп, входящих в ПСС (необходимо вследствие того, что ПСС представлен в виде дерева, а не графа).
Сведения о группировках слов, невыразимые в виде дерева зависимостей.

Глубинно-синтаксическое представление (ГСП) состоит из тех же компонентов, что и ПСП, но узлами дерева глубинно-синтаксической структуры являются только словоформы знаменательных частей речи в виде абстрактных или обобщенных лексем с некоторой морфологической информацией (время, вид, наклонение для глаголов, число для существительных).

Семантический уровень выражается семантическим представлением (СЕМП), понимаемого как запись смысла. и отображающего содержание связного фрагмента без деления на фразы и слова. СЕМП состоит из семантического графа (СГ) и сведений о коммуникативной организации смысла. СГ – связанный ориентированный граф, вершины которого помечены символами сем («атомов» смысла). Семы бывают двух типов: предикатные переменные (предикаты) и предметные переменные (объекты и классы объектов). К предикатам относятся и логические связки и кванторы. Дуги СГ отражают связь сем-предикатов с их аргументами (стрелки направлены от предиката к аргументам). Стрелки пронумерованы.
Сведения о коммуникативной организации состоят из:

Дата добавления: 2015-07-15; просмотров: 108 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Семантический анализ.	\|	Стратегия разбора и синтеза текстов в зависимости от типа языка.

mybiblioteka.su - 2015-2025 год. (0.012 сек.)