Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Лингвистический процессор Ю.Д. Апресяна, И.М. Богуславского и Л.Л. Иомдина.

Читайте также:
  1. Host BusПредназначена для скоростной передачи данных (64 разряда) и сигналов управления между процессором и остальными компонентами системы.
  2. Интерфейсы связи с процессором.
  3. Лингвистический материал
  4. Микропроцессорные средства управления электропривода
  5. Модуль главного процессора
  6. Параметры FSB у некоторых микропроцессоров

основан на модели языка «СМЫСЛ-ТЕКСТ». Процессор позиционируется как система пригодная для применения как минимум для всех индоевропейских языков.
Блок-схема синтаксического анализа в этом процессоре выглядит так:

Пример морфологической структуры, описывающей предложение «Укажите соединения натрия.» выглядит следующим образом:

  1. УКАЗЫВАТЬ – глаг., сов., пов., мн.
  2. СОЕДИНЕНИЕ - сущ., сред, неод., ед., род.
  3. СОЕДИНЕНИЕ - сущ., сред, неод., мн., им.
  4. СОЕДИНЕНИЕ - сущ., сред, неод., мн., вин.
  5. НАТРИЙ - сущ., муж, неод., ед., род.

Как видно, даже в таком простом предложении налицо морфологическая омонимия слова «соединения».
Синтаксической структура – результат работы блока синтаксического анализа, представляет собой дерево, вершинами которого являются слова с набором их морфологических признаков, а ветвями – типы синтаксических связей между ними.
Этап предсинтаксического анализа в этой модели подразумевает устранение морфологической омонимии и предварительную постройку синтаксических связей между словами. На этапе собственно синтаксического анализа строится окончательный вариант синтаксической структуры.
Комбинаторный словарь представляет из себя совокупность команд на специальном языке. Эта совокупность представляет из себя некий набор правил. Каждое правило начинается с заголовка вида
REG ИМЯ N
где ИМЯ – имя совокупности правил, N – номер правила.
Правила бывают двух видов: элементарные и обобщенные (альтернативные).
Элементарное правило состоит из двух частей: зоны CHEK (проверить), содержащей список действий (инструкций). Если условия выполняются, то выполняются действия описанные в третьей части правила – зоне DO.
Обобщенное правило состоит из зоны общих условий и нескольких элементарных подусловий. Если выполняются общие условия, то происходит проверка подусловий, являющихся альтернативными по отношению друг к другу. Если какое-то из условий выполняется, осуществляется выполнение действий из зоны DO этого подусловия.
Все условия в зоне CHECK представляют собой выражения логики предикатов. Действия из зоны DO записываются в виде операторов.
Предикаты делятся на элементарные и составные. Список элементарных предикатов можно разбить на 5 групп:

1) предикаты идентификации;
Пример:

=(Z,t1,…,tn) или EQU(Z,t1,…,tn)

означает «словоформа Z обладает всеми характеристиками t1,…,tn (например, мужской род, единственное число, родительный падеж, прошедшее время и т.п.)

2) предикаты линейного порядка;
Пример:

M(Z,Z1,n)

означает «слово Z отстоит от Z1 не более чем на n слов (влево или вправо)»

R(Z,Z1,n)

Означает «слово Z расположено правее Z1 и между ними находится не более чем n слов»

3) предикаты доминации;
Пример:

DOM(Z,Z1,r)

Означает «узел Z является непосредственным родителем узла Z1 по отношению r».

DEP(Z,Z1,r)

Означает «узел Z является непосредственным ребенком узла Z1 по отношению r».

4) предикаты согласования;
Пример:

COCAS(Z1,Z2)

Означает «обе словоформы Z1 и Z2» имеют характеристики падежа и эти характеристики совпадают

CONMB(Z1,Z2)

Означает «обе словоформы Z1 и Z2» имеют характеристики числа и эти характеристики совпадают


Дата добавления: 2015-07-15; просмотров: 66 | Нарушение авторских прав


Читайте в этой же книге: Понятие о логическом программировании | Экспертные системы | Сущность проблемы обработки естественного языка | Распознавание языка | Семантический анализ. | Основные модели лингвистических систем. | Стратегия разбора и синтеза текстов в зависимости от типа языка. | Морфологический (лексико-грамматический) анализ. | Синтаксический анализ. | Модели, основанные на Link Grammar. |
<== предыдущая страница | следующая страница ==>
Модели, использующие структуры уровня именных и глагольных групп.| Предикаты моделей управления;

mybiblioteka.su - 2015-2024 год. (0.008 сек.)