Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Естественно-языковые интерфейсы

Читайте также:
  1. Архитектура и интерфейсы GSM (мобильная станция, подсистема базовых станций, центр коммутации,, домашний и визитный регистры).
  2. Архитектура и интерфейсы сети GSM(регистры защиты и аутентификации, оборудование эксплуатации и технического обслуживания)
  3. Внешние интерфейсы МПС: основные параметры, последовательные и параллельные, синхронные и асинхронные, способы соединения устройств.
  4. Интерфейсы RS-422 и RS-485: назначение, основные технические характеристики, принципы передачи данных.
  5. Интерфейсы МПС: понятие и характеристики. Стандартные интерфейсы МПС.
  6. Интерфейсы мыши

 

Повышение уровня интеллекта компьютера – процесс бесконечный. В процессе создания антропоморфной (подобной человеку) искусственной интеллектуальной системы разработчики стремятся заложить в нее то, на что способен человек [16]:

* способность выделять существенное в накопленных знаниях;

* способность извлекать следствия из накопленных знаний, т.е. способность к рассуждению;

* способность к оценке знаний и действий;

* способность к аргументированному принятию решений, использующему результаты рассуждений;

* способность к рационализации идей;

* способность к целеполаганию и планированию;

* потребность и способность находить объяснения как ответ на вопрос «почему?»;

* способность к адаптации в условиях изменения жизненной ситуации;

* способность к созданию целостной картины относительно предмета мышления;

* способность к обучению.

В настоящее время наиболее интенсивные исследования проводятся в направлениях:

- внешняя интеллектуализация систем - совершенствование диалоговых интерфейсов;

- внутренняя интеллектуализация систем - создание компиляторов новой архитектуры;

- моделирование отдельных функций творческих процессов (игра в шахматы, доказательство теорем);

- целенаправленное поведение роботов, способных автономно совершать операции по достижению целей.

В рамках первого направления разрабатываются естественно-языковые (ЕЯ) интерфейсы «человек – компьютер», предполагающие применение БЗ.

Эксплицитные (осознанные) знания основываются на вербальных формах репрезентации (представления), а имплицитные (бессознательные) базируются на вербальных и невербальных формах репрезентации (рис.12.1).

Под экспликацией понимается процедура уточнения знания терминов в рамках данной научной теории. Эксплицитные знания всегда
дискретны, вербальны и структурированы. Второй формой эксплицитных вербальных знаний являются ассоциации, которые должны обладать всеми

 

признаками формальных языков (входной алфавит, правила преобразований и образования выражений, правила
интерпретации). Экспликация содержания ассоциаций предполагает,
как и структурированные вербальные знания, наличие ролевых
эталонных семантических структур, представляющих собой фреймы, в слотах которых находятся маркеры ролей элементов, составляющих сценарий. Подстановка ролей в слоты осуществляется во время
обучения системы.


Вербальные знания структуриро-ванные Вербальные ассоциации структуриро-ванные, распознава- емые Вербальные ассоциации структуриро-ванные, нераспознава- емые Вербальные ассоциации неструктури-рованные, нераспознава- емые Невербальные ассоциации, образные
Эксплицитные знания Имплицитные знания
           

База эксплицитных знаний База вербальных знаний (активных) База невербальных имплицитных знаний (пассивных)
База ролевых эталонных семантических структур Невербальная ассоциативная (коннекционистская) сеть
Вербальная семантическая сеть Вербальная ассоциативная сеть

 

Рис.12.1. Связь между видами знаний и формами их репрезентации

 

Имплицитные знания могут быть как вербальными, так и невербальными. Имплицитность выражается в смутном представлении каких-либо объектов, их свойств или состояний и отличается отрывочностью, хаотичностью бессвязных нагромождений вербальных ассоциаций или невербальных образов. С формальной точки зрения

 


имплицитность характеризуется отсутствием одного или нескольких признаков формальных систем.

По своей природе имплицитные знания делят на активные и пассивные. Активные – дискретные знания, форма представления которых позволяет обрабатывать их непосредственно формальными правилами комбинаторной семантики. Пассивные – недискретные и невербальные знания.

Первый уровень машинного понимания предполагает использование при ответе на вопросы содержания, отражаемого текстом. Модели, с помощью которых воссоздаются знания экспертов, характеризуются различным уровнем синтаксичности. Высокий уровень синтаксичности приводит к ошибочной автоматической интерпретации модели.

Естественно-языковое общение с ИИС предполагает выполнение следующих функций (рис.12.2):

* ведение диалога – определение его структуры и той роли, которую система и пользователь выполняют на текущем шаге диалога;

* понимание – преобразование поступающих от пользователя высказываний на ЕЯ в высказываниях на языке внутреннего представления;

* обработка высказываний – формирование или определение знаний для решения задач на данном шаге диалога;

* генерация – формирование выходных высказываний на ЕЯ.

 


Рис.12.2. Обобщенная схема ЕЯ-системы

 

Ведение диалога состоит в том, чтобы обеспечить целесообразные действия системы на текущем шаге. При этом диалог может вести пользователь или система. Вторая задача диалогового компонента вызвана тем, что реакция одного участника может не соответствовать ожиданиям другого. В зависимости от того, кто осуществляет перехват инициативы, система либо формирует перехват, либо обрабатывает его.

Компонент понимания высказываний предназначен для выделения смысла входного высказывания и выражения этого смысла на внутреннем языке системы. Под смыслом системы понимается семантико-прагматическая информация, которую пользователь хотел передать системе. На этапе анализа выделяются описания сущностей, упомянутых во входном высказывании, выявляются свойства этих сущностей и отношения между ними. Анализ обычно выполняется отдельным блоком – анализатором. Интерпретация заключается в отображении входного высказывания на знания системы. Основными задачами данного этапа являются буквальная интерпретация высказывания в контексте диалога и интерпретация высказывания на намерения говорящего. Буквальная интерпретация состоит в том, чтобы, учитывая контекст диалога, идентифицировать образы тех сущностей области интерпретации, которые имел в виду говорящий. Вторая задача интерпретации состоит в том, чтобы, применяя имеющиеся у системы методы вывода, определить, как обрабатываемое высказывание соотносится с целями и планами участников диалога.

Компонент генерации высказываний решает в соответствии с результатами, полученными остальными компонентами системы, две основные задачи: генерация смысла, т.е. определение типа и смысла выходного высказывания системы во внутреннем представлении; синтез высказывания – преобладание смысла в высказывании на ЕЯ.

Диалог можно рассматривать на трех уровнях: общая структура, характеризующая тип диалога и класс решаемых задач; тематическая структура, отражающая структуру конкретной задачи; структура шага диалога, отражающая взаимодействие участников в элементном акте диалога. На уровне глобальной структуры действия системы обычно задаются в виде последовательности этапов, определяемых в зависимости от класса решаемых задач. В случае общения с ЭС глобальная структура включает этапы: инструктаж, определение задачи, решение задачи, объяснение в ходе решения задачи, выдача результатов и их оценка, объяснение после решения задачи, определение причин неудачи. Глобальная структура задается декларативно с помощью правил-продукций.

Тематическая структура диалога обычно представляется в виде сценария, в рамках которого определяется структура задачи (разбиение на подзадачи); распределение подзадач между участниками общения; языковые средства. Для задания сценария диалога используются два основных класса: сценарий встроен в систему; сценарий генерируется системой. Готовый сценарий может быть задан в виде частично упорядоченного множества правил с параметрами, значения которых устанавливаются в процессе решения конкретной задачи. Использование готовых сценариев целесообразно в тех случаях, когда к системе предъявляются жесткие требования по быстродействию.

Если сценарий генерируется системой, то в диалоговый компонент включается специальный механизм вывода. Генерация сценариев диалога целесообразна в тех случаях, когда структура задачи зависит от контекста ситуации, в которой происходит ее решение, а полный перечень ситуаций не может быть определен заранее.

При задании локальной структуры шага диалог состоит из действия, реакции и характеризуется параметрами: тип инициирования, способ влияния действия на реакцию, способ спецификации подзадачи, решаемой на данном шаге.

Понимание высказываний включает анализ и интерпретацию. В методах анализа обычно выделяют анализ слов, предложений и текстов. Анализ слов сводится к морфологическому анализу, обнаружению и исправлению орфографических ошибок. Цель морфологического анализа состоит в получении основ (словоформ с отсеченным окончанием) со значениями грамматических категорий для каждой из словоформ ЕЯ- высказывания. Методы обнаружения и исправления орфографических ошибок подразделяются на методы, не использующие словари и использующие их. К методам, не использующим словари, относятся частотные и полиграммные. Частотные основаны на сортировке слов по частоте их встречаемости в текстах. Предполагается, что частота встречаемости слов, содержащих ошибки, низкая. В полиграммных методах для поиска ошибок применяют списки возможных сочетаний букв в словах. Методы, в которых используются словари, разделяются в зависимости от типа применяемой стратегии на абсолютные и относительные. К абсолютным относится «исторический» метод, основанный на словаре встречаемых ранее ошибок. Эффективность его зависит от размера проанализированных текстов. Относительный метод состоит в нахождении в словаре таких слов, которые наиболее похожи на искаженное слово, и выборе среди них правильного.

Анализ предложений обычно сводится к синтаксическому и семантическому анализу, выполняемому функциональным блоком-анализатором.

Существует несколько типов анализаторов: традиционные (не допускают отклонений от грамматических норм); концептуальные (позволяют анализировать ЕЯ-предложения в условиях пропуска и повтора слов); использующие сопоставление по образцам (позволяют анализировать предложения, отклоняющиеся от традиционной грамматики в произвольной степени).

Методы анализа связного текста (дискурса). Связность текста достигается как лингвистическими средствами, имеющими языковое выражение, так и экстралингвистическими (ситуационными) средствами-«умолчаниями», не имеющими языкового выражения и основанными на общности знаний участников общения о цели общения и проблемной области. На этапе анализа связного текста решается задача выявления связей между предложениями, выражаемых лингвистическими средствами, а на этапе интерпретации - ситуационными.

К основным лингвистическим средствам связи предложений относятся ссылки и эллипсис. В проблеме установления ссылок могут быть выделены две задачи: поиск в предыдущих предложениях (контексте) сущности (референта), обозначаемой данной ссылкой; определение соответствия между референтом и ссылкой.

Под эллипсисом понимается сжатая форма высказывания, смысл которой определяется либо предыдущими высказываниями (текстовый эллипсис), либо ситуацией, имеющей место в проблемной области (ситуативный эллипсис).

На этапе интерпретации решаются две основные задачи: буквальная интерпретация высказываний в контексте диалога; интерпретация целей участников общения. Для решения обеих задач в рамках фрейм-представлений используется единый механизм присвоения имени фреймов, при этом структура целей участников общения определяется структурой фрейма, описывающего данную задачу, а подцели состоят в заполнении слотов.

Процесс генерации высказываний состоит из генерации смысла высказывания и синтеза высказывания на ЕЯ. Первый этап называется внелингвистическим (концептуальным) синтезом, а второй - лингвистическим синтезом. Результатом выполнения первого этапа является внутреннее представление смысла генерируемого высказывания (определение информации, которая должна быть сообщена пользователю, определение уровня общности информации, включаемой в высказывания, разбиение сообщаемой информации на части и др.). На втором этапе определяется последовательность построения синтаксической структуры отдельных предложений, морфологического синтеза словоформ. Наиболее простым методом генерации высказываний является метод, который основан на использовании заранее заготовленных шаблонов, содержащих текст на ЕЯ и переменные, вместо которых подставляются конкретные данные (описание сущностей). При методе шаблонов генерация высказываний осуществляется совместно с диалоговым компонентом, который идентифицирует стандартную ситуацию и определяет, какая информация должна быть включена в высказывание. Генерация высказываний, которые не могут быть описаны с помощью шаблонов, представляет собой более сложную задачу. К таким высказываниям, в частности, относятся объяснения, генерируемые в качестве ответов на вопросы, областью интерпретации которых являются абстрактные знания и метазнания системы. Для генерации объяснений требуется достаточно тонкая классификация целей создания ЕЯ-текстов. Организация текста определяется дискурсными целями, например, дать определение, описать, сравнить, уточнить и прочее. Каждой дискурсной цели может быть сопоставлен определенный способ организации текста, называемый дискурсной стратегией. Предполагается, что, выявив дискурсные стратегии и выразив их подходящим формальным представлением, можно получить достаточно надежный и эффективный механизм генерации смыслопорождаемых текстов.

 


Дата добавления: 2015-12-07; просмотров: 66 | Нарушение авторских прав



mybiblioteka.su - 2015-2024 год. (0.009 сек.)