Читайте также:
|
|
основан на модели языка «СМЫСЛ-ТЕКСТ». Процессор позиционируется как система пригодная для применения как минимум для всех индоевропейских языков.
Блок-схема синтаксического анализа в этом процессоре выглядит так:
Пример морфологической структуры, описывающей предложение «Укажите соединения натрия.» выглядит следующим образом:
Как видно, даже в таком простом предложении налицо морфологическая омонимия слова «соединения».
Синтаксической структура – результат работы блока синтаксического анализа, представляет собой дерево, вершинами которого являются слова с набором их морфологических признаков, а ветвями – типы синтаксических связей между ними.
Этап предсинтаксического анализа в этой модели подразумевает устранение морфологической омонимии и предварительную постройку синтаксических связей между словами. На этапе собственно синтаксического анализа строится окончательный вариант синтаксической структуры.
Комбинаторный словарь представляет из себя совокупность команд на специальном языке. Эта совокупность представляет из себя некий набор правил. Каждое правило начинается с заголовка вида
REG ИМЯ N
где ИМЯ – имя совокупности правил, N – номер правила.
Правила бывают двух видов: элементарные и обобщенные (альтернативные).
Элементарное правило состоит из двух частей: зоны CHEK (проверить), содержащей список действий (инструкций). Если условия выполняются, то выполняются действия описанные в третьей части правила – зоне DO.
Обобщенное правило состоит из зоны общих условий и нескольких элементарных подусловий. Если выполняются общие условия, то происходит проверка подусловий, являющихся альтернативными по отношению друг к другу. Если какое-то из условий выполняется, осуществляется выполнение действий из зоны DO этого подусловия.
Все условия в зоне CHECK представляют собой выражения логики предикатов. Действия из зоны DO записываются в виде операторов.
Предикаты делятся на элементарные и составные. Список элементарных предикатов можно разбить на 5 групп:
1) предикаты идентификации;
Пример:
=(Z,t1,…,tn) или EQU(Z,t1,…,tn)
означает «словоформа Z обладает всеми характеристиками t1,…,tn (например, мужской род, единственное число, родительный падеж, прошедшее время и т.п.)
2) предикаты линейного порядка;
Пример:
M(Z,Z1,n)
означает «слово Z отстоит от Z1 не более чем на n слов (влево или вправо)»
R(Z,Z1,n)
Означает «слово Z расположено правее Z1 и между ними находится не более чем n слов»
3) предикаты доминации;
Пример:
DOM(Z,Z1,r)
Означает «узел Z является непосредственным родителем узла Z1 по отношению r».
DEP(Z,Z1,r)
Означает «узел Z является непосредственным ребенком узла Z1 по отношению r».
4) предикаты согласования;
Пример:
COCAS(Z1,Z2)
Означает «обе словоформы Z1 и Z2» имеют характеристики падежа и эти характеристики совпадают
CONMB(Z1,Z2)
Означает «обе словоформы Z1 и Z2» имеют характеристики числа и эти характеристики совпадают
Дата добавления: 2015-07-15; просмотров: 66 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Модели, использующие структуры уровня именных и глагольных групп. | | | Предикаты моделей управления; |