Читайте также: |
|
E = <{oi: iÎI}, {rj: jÎJ}>,
где {oi: iÎI} – множество понятий предметной области;
{rj: jÎJ} – множество отношений предметной области.
Пусть предметная область на некотором уровне описания состоит из элементов ei. Тогда каждое понятие предметной области будет составляться из ее элементов и представляться как oi(e1, …, em), а каждое отношение будет определяться тем множеством элементов, которые в него вошли: {e1, …, em}Îrj.
Гомоморфизмом системы E в систему E’:
E’ = <{o’i: iÎI}, {r’j: jÎJ}>
называется отображение
F: EèE’
такое, что
F(oi(e1, …, em)) = o’i(F(e1), …, F(em))
{e1, …, em}Îrjè{F(e1), …, F(em)}Îr’j
В соответствии с введенными обозначениями уровни пирамиды знаний есть гомоморфизмы моделей предметной области:
F: MèM’
M = <A, R, S>,
где A – множество понятий;
R – множество отношений;
S – множество стратегий.
По отношений к модели некоторого уровня модель более высокого уровня будет метамоделью, состоящей из системы метапонятий, метаотношений и метастратегий.
3.1.5. Теоретические аспекты приобретения знаний
3.1.5.1. Особенности приобретения знаний
Проблемы приобретения (извлечения) знаний:
- организационные неувязки;
- неудачный метод извлечения, не совпадающий со струткурой знаний в данной области;
- неадекватная модель (язык) представления знаний.
Причины нежелательности выполнения функций аналитика (инженера по знаниям) экспертом:
1) Неполнота рассуждений эксперта в силу его склонности опираться не эмпирику, а не на теорию.
2) Возможность вербализировать в процессе диалога эксперта и аналитика невербальные знания эксперта.
3) Невладение экспертом методологией формирования моделей знаний.
Большинство инструментальных средств приобретения знаний ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными.
3.1.5.2. Психологический аспект приобретения знаний
Основные уровни общения:
1. Уровень манипулирования, когда один субъект рассматривает другого как средство или помеху по отношению к своей деятельности.
2. Уровень «рефлексивной игры», когда в процессе своей деятельности субъект учитывает «контрпроект» другого субъекта, но не рассматривает его самоценность и стремится к реализации своего проекта.
3. Уровень правового общения, когда субъекты пытаются согласовать проекты своей деятельности.
4. Уровень нравственного общения, когда субъекты принимают общий проект совместной деятельности.
В ходе общения велики потери информации:
Задумано 100%
Приобрело словесную форму 90%
Высказано 80%
Выслушано 70%
Понято 60%
Осталось в памяти 24%
Структурные компоненты модели общения в процессе извлечения знаний:
- участники общения (партнеры);
- средства общения (процедура);
- предмет общения (знания).
Слои психологических проблем извлечения знаний:
- контактный (S11);
- процедурный (S12);
- когнитивный (S13).
Контактный слой
В коллективе разработчиков должны складываться кооперативные, а не конкурентные отношения. Для кооперации характерна заинтересованность в успехах друг друга.
Значения параметров пола (S11_1) и возраста (S11_2) влияют на эффективность контакта но не являются критичными. Наилучшие результаты дают гетерогенные пары с разницей в возрасте 5-20 лет.
Личность (S11_3) – устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые компоненты S11_3:
- доброжелательность;
- аналитичность;
- хорошая память;
- внимание;
- наблюдательность;
- воображение;
- впечатлительность;
- собранность;
- настойчивость;
- общительность;
- находчивость.
Темперамент (S11_4) имеет 4 основных разновидности: холерик, сангвиник, меланхолик, флегматик. Наиболее контактными являются холерики и сангвиники.
Важен также учет мотивации (S11_5).
Процедурный слой
Ситуация общения (S12_1) определяется следующими компонентами:
- место проведения сеансов (S12_1_1) – в небольшом помещении наедине, наиболее благоприятная дистанция общения – 1.2-3м (минимальнрое комфортное расстояние 0.7-0.8м);
- продолжительность проведения сеансов (S12_1_2) – 1.5-2 часа, с паузами через каждые 20-30 мин;
- время проведения сеансов (S12_1_3) – первая половина дня.
Оборудование (S12_2) включает:
- вспомогательные средства (S12_2_1) для повышения эффективности процесса извлечения знаний (наглядный материал: рисунки, графики диаграммы для контактера художественного типа и формулы, текст для контактера мыслительного типа) и для протоколирования результатов (запись на бумагу, магнитофонная запись, запоминание);
- освещенность (S12_2_2);
- мебель (S12_2_3).
Профессиональные приемы аналитика (S12_3) включают:
- темп (S12_3_1) – обязательно учитывается индивидуальный темп эксперта;
- стиль (S12_3_2) – сокращение потерь информации за счет сокращения длительности фраз – оптимальная длительность 7±2 слова (число Ингве-Миллера), обязателен учет невербальных средств передачи информации – мимики, жестов, интонаций;
- методы (S12_3_3).
Когнитивный слой
Когнитивный стиль (S13_1) – совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого человека.
Характеристики когнитивного стиля:
- полезависимость – поленезависимость (S13_1_1);
- импульсивность – рефлексивность (S13_1_2);
- ригидность – гибкость (S13_1_3);
- когнитивная эквивалентность (S13_1_4).
Поленезависимость – способность акцентировать внимание только на тех аспектах проблемы, которые необходимы для решения конкретной задачи и уметь отбрасывать все лишнее, т.е. не зависеть от окружающего задачу шумового поля. Поленезависимость важна и для эксперта, и для аналитика, т.к. сопровождается высокой способностью к пониманию, однако полезависимые люди более контактны.
Особенно полезны для общения гетерогенные пары.
Поленезависимость является характерной профессиональной чертой квалифицированных инженеров по знаниям. По некоторым данным, мужчины более поленезависимы, чем женщины.
Импульсивность – способность к быстрому принятию решений. Рефлексивность – склонность к рассудительности. Рефлексивность связана со способностью формирования понятий и продуктивностью решения логических задач. Рефлексивностью желательно обладать и эксперту, и аналитику.
Эксперт может себе позволить ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), инженеру по знаниям эта характеристика противопоказана.
Когнитивная эквивалентность характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен производить индивид, тем большее количество признаков понятий он может выделтиь. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Семантическая репрезентативность (S13_2) исключает навязывание эксперту некой модели представлений и заставляет аналитика последовательно воссоздавать модель мира эксперта, используя как неформальные методы, так и математический аппарат, например, многомерное шкалирование.
3.1.5.3. Лингвистический аспект приобретения знаний
Слои лингвистических проблем извлечения знаний:
- «общий код» (S21);
- понятийная структура (S22);
- словарь пользователя (S23).
«Общий код»
«Общий код» решает проблему языковых «ножниц» между профессиональной терминологией эксперта и обыденной литературной речью аналитика. Грубо говоря, «общий код» – это тот язык, который должны получить эксперт и аналитик путем последовательного покомпонентного сближения их языков. Языки аналитика и эксперта состоят приблизительно из одних и тех же компонентов:
- общенаучная терминология (S21_1) (для аналитика – из теоретической литературы);
- специальная терминология предметной области (S21_2) (для аналитика – из специальной литературы, для эксперта – принятая ранее);
- бытовой язык (S21_3);
- неологизмы и профессиональный жаргон (S21_4) (у аналитика на момент начала общения отсутствует).
Выработка общего кода начинается с составления словаря предметной области. Затем следует группирование терминов и выбор синонимов. Разработка общего кода заканчивается группировкой терминов по понятийной близости.
Понятийная структура
Понятийная структура – это модель взаимосвязей понятий предметной области, которая рассматривается в рамках семиотического подхода (см. выше). Таким образом, при формировании понятийной структуры выстраиваются отношения функциональных зависимостей, структуризации, иерархии между понятиями предметной области.
Словарь пользователя
Имеется в виду отдельный словарь для создания дружественного интерфейса с пользователем ЭС. Необходимы специальные приемы, увеличивающие «прозрачность» и «доступность» системы. В качестве основы пользовательского словаря используется словарь общего кода.
3.1.5.4. Гносеологический аспект приобретения знаний
Процесс приобретения знаний аналитиком является познавательным процессом, и особенностями этого процесса являются:
1) Необходимость наиболее полного и точного познания знаний эксперта.
2) Возможность выявления новых закономерностей, не формулируемых экспертом в явном виде или вообще ему неизвестных.
Высокая точность, высокая полнота знаний, перемещение знаний от уровня эмпирик на уровень теорий повышают эффективность формируемой БЗ. В процессе приобретения знаний идеальным случаем является прохождение по т.наз. гносеологической цепочке: фактàобобщенный фактàэмпирический законàтеоретический закон.
Знание имеет два уровня:
1. Эмпирический (наблюдения, явления).
2. Теоретический (законы, абстракции, обобщения).
«Научность» знания, сформированного аналитиком в процессе приобретения знаний, оценивается в соответствии со следующими критериями:
- внутренняя согласованность (S31);
- системность (S32);
- объективность (S33);
- историзм (S34).
Внутренняя согласованность заключается в минимизации отрицательных свойств экспертного знания: модальности, противоречивости, неполноты.
Модальность знания означает возможность его существования в различных конструкциях существования и долженствования: эксперт знает, что …; эксперт думает, что … и т.п.
Системность ориентирует аналитика на рассмотрение любой предметной области с позиций закономерностей системного целого и взаимодействия составляющих его частей.
Объективность основывается на глубине описания знания.
Требование историзма: структура поля знаний и БЗ должны допускать под стройку и коррекцию как в период разработки, так и во время эксплуатации ЭС.
3.1.6. Практические аспекты приобретения знаний
3.1.6.1. Режимы приобретения знаний
Возможны три режима взаимодействия аналитика с экспертом:
- протокольный анализ,
- интервью,
- игровая имитация профессиональной деятельности.
В режиме интервью аналитик ведет с экспертом активный диалог, направляя его в нужную сторону.
Протокольный анализ заключается в фиксации (например, путем записи на магнитную ленту) «мыслей вслух» эксперта во время решения проблемы и в последующем анализе полученной информации. Основные проблемы при протокольном анализе:
1. Неочевидность селектирования понятий важных и обязательных для включения в словарь предметной области от понятий, появившихся при "мыслях вслух" случайно.
2. Пробелы в протоколах (непрокомментированность экспертом некоторых шагов вывода). Заполнение пробелов возможно лишь в режиме интервью.
При игровой имитации эксперт помещается в ситуации, похожие на те, в которых протекает его профессиональная деятельность. Наблюдая за его действиями в различных ситуациях, аналитик формирует свои соображения об экспертных знаниях, которые впоследствии могут быть уточнены с экспертом в режиме интервью.
Таким образом, во всех трех подходах к извлечению знаний из экспертов необходим этап интервью, что делает его одним из важнейших методов приобретения знаний.
3.1.6.2. Стратегии интервьюирования
Существует не менее двух десятков стратегий интервьюирования. Наиболее известны стратегии, использующие следующие приемы:
- выявление отношений структуризации между объектами предметной области;
- выявление отличительных признаков объектов предметной области;
- выявление общих свойств (отношений сходства) между объектами предметной области.
Охарактеризуем три наиболее известные стратегии интервьюирования, использующие эти приемы.
В ходе реализации стратегии разбиения на ступени эксперту предлагается назвать наиболее важные, по его мнению, понятия предметной области и указать между ними отношения структуризации, т. е. отношения типа «род — вид», «элемент — класс», «целое — часть» и т. п. Эти понятия используются на следующем шаге опроса как базовые. Стратегия нацелена на создание иерархии понятий предметной области, выделение в понятиях тесно связанных между собой групп— таксонов (кластеров).
Стратегия репертуарной решетки направлена на выявление характеристических свойств понятий, позволяющих отделять одни понятия от других. Методика состоит в предъявлении эксперту троек понятий с предложением назвать признаки для каждых двух понятий, которые отделяли бы их от третьего. Так как каждое понятие входит в несколько троек, то на основании такой процедуры происходит уточнение объемов понятий и формируются «симптокомплексы» понятий, с помощью которых эти понятия могут идентифицироваться в БЗ.
Стратегия подтверждения сходства состоит в том, что эксперту предлагается установить принадлежность каждой пары понятий из предметной области к некоторому отношению сходства (толерантности). Для этого эксперту задается последовательность достаточно простых вопросов, цель которых заключается в уточнении того понимания сходства, которое вкладывает эксперт в утверждение о сходстве двух понятий предметной области.
3.1.6.3. Этапы приобретения знаний
Процесс взаимодействия аналитика с экспертом включает три основных этапа.
I. Подготовительный этап.
1) Определение задач проектируемой системы (сужение поля знаний). Определение входов и выходов системы. Определение режима работ - консультации, обучение и т.д.
2) Выбор экспертов: их количества и уровня компетентности. Тестирование экспертов. Важно протестировать не только уровень компетентности эксперта, но и его социальные качества: заинтересованность в совместной работе, способность работать в коллективе. Аналитик, будучи центральной организующей фигурой в процессе приобретения знаний, должен приложить усилия к тому, чтобы повысить заинтересованность эксперта. Причем, когда эксперт является вполне состоявшимся специалистом в своей области, первостепенное значение имеют факторы нематериальной заинтересованности: нетривиальность решаемых задач и т.п. С другой стороны, возможность заинтересовать эксперта в работе зависит от его личностных человеческих качеств. Важно, чтобы эксперт был доброжелателен, обладал способностью и желанием объяснять. Привлечение высококвалифицированных экспертов на начальном этапе работы по приобретению знаний во многих случаях не является обязательным, поскольку слишком сильный разрыв в компетенциях аналитика и эксперта может повредить налаживанию взаимодействия между ними.
3) Знакомство аналитика со специальной литературой в предметной области. Аналитик должен ознакомиться с предметной литературой в той степени, в которой это необходимо для минимизации вышеупомянутого разрыва компетенций. Нормальной является такой уровень владения предметом, когда аналитик имеет представление об основных понятиях и основных процессах в предметной области и при этом накопил несколько содержательных вопросов, касающихся особенностей предметной области и внутренних причин наблюдаемых в ней закономерностей и явлений.
4) Знакомство аналитика с экспертами (экспертом). На этом этапе первостепенное значение приобретает психологический аспект приобретения знаний.
5) Знакомство эксперта с популярной литературой по ИИ. Эта стадия необязательна, но желательна для создания у эксперта объективного представления о работе аналитика и для ликвидации почвы для перечисленных коллизий и конфликтов.
II. Установление «общего кода».
Попытка аналитика сформировать поле знаний в первом приближении на основании априорных знаний из литературы. Необходимо определить главные понятия, т. е. выработать словарную основу БЗ, уровень детализации, взаимосвязи между понятиями. Участники взаимодействия должны попытаться сократить «расстояние» между объектом (т. е. исследуемой предметной областью) и аналитиком.
III. Гносеологический (основной) этап.
На этом этапе происходит выяснение закономерностей, присущих предметной области, условий достоверности и истинности утверждений, структурирование за счет введения отношений и т. п. Этот этап является определяющим во взаимодействии аналитика и эксперта. Этап состоит из ряда итераций совместной и раздельной работы аналитика и эксперта, повышающих содержательность понимания предметной области в представлении аналитика.
1) "Накачка" поля знаний. Протоколирование рассуждений эксперта с минимальным вмешательством аналитика, выбор способа интервьюирования.
2) "Домашняя работа".
Аналитик выделяет причинно-следственные связи в рассуждениях эксперта, строит словарь предметной области и готовит вопросы для нового этапа взаимодействия.
В процессе анализа игры или диалога вербализуется и формализуется знание эксперта и зачастую порождается новое знание. Репрезентация внешнего мира в его памяти получает материальное воплощение в форме поля знаний.
3) "Подкачка" поля знаний.
В процессе извлечения знаний сначала желательно получить от эксперта поверхностные знания (такие, например, как репрезентация признаков), постепенно переходя к глубинным структурам и более абстрактным понятиям. Должны быть обсуждены результаты домашней работы и сформированный аналитиком прототип поля знаний.
4) Формализация концептуальной модели.
При формировании поля знаний учитываются особенности эмпирического знания: модальность, противоречивость, неполнота и т. д.
Аналитик должен за частным всегда видеть общее, т. е. строить цепочки "факт — обобщенный факт — эмпирический закон — теоретический закон". Центральное звено цепочки — формализация эмпирики. Эксперты не всегда опираются на логические рассуждения. В их представлениях о предметной области и методах решения задач, характерных для нее, широкое применение находят:
· закономерности, подтверждаемые не теорией, а большим количеством экспериментального материала;
· ассоциативные рассуждения;
· рассуждения правдоподобия.
Искусство аналитика состоит в стремлении к созданию ясной и понятной модели проблемной области. В идеале должны быть обозначены и обоснованы все связи между понятиями предметной области.
5) Построение поля знаний второго приближения.
6) В случае необходимости - повторение гносеологического этапа
Одним из основных препятствий на пути приобретения знаний у экспертов психологи называют когнитивную защиту. Когнитивная защита - нежелание экспертов достичь четкого и осознанного ими истолкования основных понятий, отношений между понятиями и приемов решения задач (явление типа "знаю, понимаю, объяснить не могу"). Методы преодоления когнитивной защиты основаны на теории "персональных конструктов". "Персональными конструктами" называют сущности, организуемые человеком в своем сознании и применяемые к реалиям окружающего мира.
3.1.6.4. Примеры систем приобретения знаний
TEIRESIAS. Эта система основана на применении различных стратегий интервьюирования (8 основных).
MORE и ИДИС. Используется техника интервьюирования, направленная на выяснение следующих сущностей: гипотез, симптомов, условий, связей и путей. Гипотеза — событие, идентификация которого имеет своим результатом диагноз. Симптом — событие, являющееся следствием существования гипотезы, наблюдение которого приближает последующее принятие гипотезы. Условие — событие или некоторое множество событий, которое не является непосредственно симптоматическим для какой-либо гипотезы, но которое может иметь диагностическое значение для некоторых других событий. Связи— соединения сущностей (в том числе, других связей). Путь — выделенный тип связи, который соединяет гипотезы с симптомами. Используются следующие основные стратегии интервью: дифференциация гипотез, различение симптомов, симптомная обусловленность, деление пути.
Дифференциация гипотез направлена на поиск симптомов, которые обеспечивают более точное различение гипотез. Различение симптомов выявляет специфические характеристики симптома, которые, с одной стороны, идентифицируют его как следствие некоторой гипотезы, с другой — противопоставляют другим. Симптомная обусловленность направлена на выявление негативных симптомов, т.е. симптомов, отсутствие которых имеет больший диагностический вес, чем их присутствие. Деление пути обеспечивает нахождение симптоматических событий, которые лежат на пути к уже найденному симптому.
KRITON. Реализовано приобретение и экспертных, и объективизированных знаний. Для извлечения экспертных знаний применена техника интервью, использующая стратегии репертуарной решетки и разбиения на ступени. При этом применяется прием переключения стратегий: если при предъявлении тройки семантически связанных понятий эксперт не в состоянии назвать признак, отличающий два из них от третьего, система запускает стратегию разбиения на ступени и предпринимает попытку выяснения таксономической структуры этих понятий с целью выявления признаков, их различающих.
Для выявления процедурных знаний эксперта применен метод протокольного анализа. Он осуществляется в пять шагов.
1) Деление протокола на сегменты на основании пауз, которые делает эксперт в процессе записи.
2) Семантический анализ сегментов, формирование высказываний для каждого сегмента.
3) Выделение из текста операторов и аргументов.
4) Поиск по образцу в БЗ для обнаружения переменных в высказываниях (переменная вставляется в высказывание, если соответствующая ссылка в тексте не обнаружена).
5) Упорядочивание утверждений в соответствии с их появлением в протоколе.
SIMER и ДИАПС. Основным методом приобретения знаний является автоматизированное интервьюирование эксперта, которое управляется знаниями, приобретенными системой. Предварительная модель области не выявляется. Предполагается только, что на множестве объектов могут быть заданы ряд отношений из известного (конечного) множества: «элемент—множество», «часть — целое:», «пример — прототип», отношения структурного сходства объектов, структурной иерархии и некоторые другие.
Основные этапы реализации системы приобретения знаний.
1. Интервью для определения актуальной области, в которой происходит процесс решения интересующей проблемы, и расчленение ее на автономные области.
2. Автоматизированное интервью для выявления и формирования декларативной модели предметной области.
3. Протокольный анализ выявленных на предыдущем этапе понятий и отношений предметной области для пополнения модели процедурными знаниями
(этапы 2 и 3 можно использовать попеременно до тех пор, пока модель не достигнет нужной полноты).
4. Протокольный анализ для пополнения декларативных знаний модели.
5. Проверка полноты модели. Обычно протокольный анализ выявляет пустоты в модели. Имеется в виду случай, когда понятия, использованные в «мыслях вслух», недостаточно описаны. В этом случае интервью и протокольный анализ повторяются.
3.1.7. Текстологические методы приобретения знаний
Формально специальный текст описывается набором:
T = <a, b, g, d, q>L
где a – материал наблюдений автора за предметной областью;
b – система научных понятий в момент создания текста;
g – субъективные взгляды автора;
d – общие места («вода»);
q – заимствования;
L – языковая среда, в которой вербализованы все компоненты.
В ходе анализа текста следует вычленять перечисленные компоненты для повышения эффективности выделения нужной информации. Кроме того, любой текст погружен в контекст (окружение текста).
Микроконтекст – ближайшее окружение единицы текста. Предложение приобретает значение в контексте абзаца, абзац – в контексте главы и т.д.
Макроконтекст – вся система знаний о предметной области. В макроконтекст входят, таким образом, связи и понятия, не упоминаемые явно в тексте.
Шаги понимания текста:
1) Выдвижение предварительной гипотезы о смысле всего текста (предугадывание).
2) Определение значений непонятных слов (специальных терминов).
3) Возникновение общей гипотезы о содержании текста.
4) Уточнение значения терминов и интерпретация отдельных фрагментов текста под влиянием общей гипотезы (дедуктивный путь).
5) Формирование некоторой смысловой структуры текста за счет установления внутренних связей между отдельными важными (ключевыми) словами и фрагментами, а также за счет образования абстрактных понятий, обобщающих фрагменты знаний.
6) Корректировка общей гипотезы относительно содержащихся в тексте фрагментов знаний (индуктивный путь).
7) Принятие основной гипотезы.
При анализе текста важно выявление внутренних связей между отдельными элементами текста и понятиями. Виды связей в тексте:
- эксплицитные (явные) – выражаются во внешнем дроблении текста;
- имплицитные (скрытые).
Эксплицитные связи делят текст на структурные единицы (параграфы, абзацы и т.п.), используют перечисления, вводные слова (коннекторы) типа «во-первых», «во-вторых», «однако» и т.п.
Модель, которую строит аналитик на базе текста, определяется как
M2 = <a, b, g, q, w, e, j>,
где a, b, g, q – получаются (экстрагируются) из текста T;
w – предварительные знания аналитика о предметной области;
e – общенаучная эрудиция аналитика;
j – личный опыт аналитика.
Алгоритм извлечения знаний из текста:
1. Составление базового списка литературы по предметной области и ознакомление с литературой по списку.
2. Выбор текста для извлечения знаний.
3. Первое знакомство с текстом (беглое прочтение). Для работы с незнакомыми словами привлекаются специалисты или справочная литература.
4. Формирование первой гипотезы о макроструктуре текста.
5. Внимательное прочтение текста с выделением ключевых слов и выражений («смысловых вех»), компрессия текста.
6. Определение связей между ключевыми словами, представление макроструктуры теста в виде графа или реферата.
7. Формирование поля знаний на основании макроструктуры текста.
3.1.8. Структурирование (формирование поля знаний)
Простейший алгоритм структурирования:
1. Определение входных {X} и выходных {Y} данных.
2. Составление словаря терминов и набора ключевых слов N. Проводится текстуальный анализ всех протоколов сеансов извлечения знаний и выписываются все значимые слова, обозначающие понятия. Важен уровень осмысления значения терминов.
3. Выявление объектов и понятий {A}. «Просеивание» словаря N и выбор значимых для принятия решений понятий и их признаков.
4. Выявление связей между понятиями. Начало построение ассоциативной сети.
5. Выявление метапонятий и детализация понятий.
6. Построение пирамиды знаний.
7. Определение отношений {RA} как внутри каждого из уровней пирамиды, так и между уровнями. Даются имена тем связям, которые обнаруживаются на шагах 4 и 5, а также обозначаются причинно-следственные, лингвистические, временные и другие виды отношений.
8. Определение стратегий принятия решений (Sf).Выявление цепочек рассуждений, связывание всех сформированных ранее понятий и отношений в динамическую систему поля знаний.
3.1.9. Формализация качественных знаний
Основной проблемой при формализации знаний является проблема преодоления т.наз. лингвистической неопределенности, которой называется неопределенность количественного выражения качественных оценок различных величин, даваемых экспертами. Лингвистическая неопределенность формализуется при помощи лингвистических моделей, основанных на теории лингвистических переменных и теории приближенных рассуждений. Эти теории опираются на понятие нечеткого множества и методы построения функций принадлежности.
Одним из основных понятий, используемых в лингвистических моделях, является понятие лингвистической переменной. Значениями лингвистической переменной являются не числа, а слова или предложения некоторого искусственного языка. Например, числовая переменная "возраст" может принимать значения от 0 до 150, а лингвистическая переменная "возраст" - значения "молодой", "старый", и т.д. Значения лингвистической переменной есть термы., а их множество называется терм-множеством. Лингвистическая переменная задается набором из пяти компонентов:
{A, T(A), U, G, M},
где A - имя лингвистической переменной;
T(A) - ее терм-множество;
U - область, на которой определены значения числовой переменной, соответствующей лингвистической;
G - множество операций по порождению производных значений лингвистической переменной на основе значений, входящих в ее терм-множество;
M - набор семантических правил отображения значений лингвистической переменной в нечеткие множества значений соответствующей числовой переменной.
Рис. 3.1 |
Каждому значению a лингвистической переменной A соответствует нечеткое множество Xa, являющееся подмножеством U. Правила M описывают отображение a в Xa и наоборот. Синтаксические правила (по аналогии с формальными M-системами (разд. 2.3)) G предназначены для расширения терм-множества.
На рис. 3.1 показаны все компоненты, определяющие лингвистическую переменную «возраст». В качестве терм-множества использовано множество, состоящее из трех значений: очень молодой (ом), пожилой (п) и старый (с), задаваемых функциями принадлежности на области U = (0, 150), которую называют носителем лингвистических значений. В качестве семантических правил выступают отображения, задаваемые функциями принадлежности 0<mа(u)<1 к нечетким множествам Xом, Xп, Xс. Как видно из рис. 3.1, человек, возраст которого равен 60 годам, принадлежит к Xом со значением 0 (т. к. человек в 60 лет не является очень молодым), к Xпсо значением 0,8 и к Xс со значением 0,4.
Существуют прямые и косвенные методы построения функций принадлежности. В прямых методах эксперт непосредственно задает правила определения значений функции принадлежности mа(u). Эти значения согласуются с его предпочтениями на множестве объектов следующим образом: для любых u1,u2ÎU имеет место mа(u1)<mа(u2) тогда и только тогда, когда u2 предпочтительнее u1, т. е. в большей степени определяется понятием а; для любых u1,u2ÎU имеет место mа(u1)=mа(u2) тогда и только тогда, когда u2 и u1 не различаются по отношению к понятию а.
В косвенных методах значения функций принадлежности выбираются аналитиком таким образом, чтобы удовлетворялись условия, сформулированные ранее экспертом. Примеры возможных формулировок условий: близость значения к эталону, попадание значения в заданное окно, при попарном сравнении объектов один объект оценивается в k раз сильнее другого.
Функции принадлежности задаются таблицей или формулой. Формульное задание функции принадлежности синтезируется путем выбора аналитического выражения, наиболее полно аппроксимирующего заданный график. Например, функция принадлежности множеству "Очень молодой" может выглядеть так:
При прямом задании функций принадлежности необходимо учитывать возможные искажения оценочной шкалы, в первую очередь, склонность человеческой психологии сдвигать оценки к концам оценочной шкалы. Косвенные методы более трудоемки для аналитика, но обладают большей устойчивостью к искажениям шкалы, поскольку аналитик имеет возможность корректировать оценки экспертов в силу своего понимания особенностей формирования БЗ.
Пример формализации качественных знаний приведен в [7]. Там же приведен список известных методов формализации нечеткости и ссылки на их источники.
3.1.10. Автоматизированное приобретение знаний
3.1.10.1. Эволюция систем приобретения знаний (СПЗ)
I поколение – начало-середина 80-х г.г.: TEIRESIAS (Дэвис), SIMER+MIR (Осипов), АРИАДНА (Моргоев).
Основной принцип – прямой диалог эксперта с компьютером через СПЗ.
Недостатки ПСЗ I поколения:
1) Слабая проработка методов извлечения и структурирования знаний.
2) Жесткость модели представления знаний.
3) Ограничения на предметную область.
Схема разработки и использования СПЗ I поколения:
Создание конкретной ЭС à Опустошение БЗ à Разработка СПЗ à Формирование новой БЗ
Для промышленного применения эта схема оказалась несостоятельной.
СПЗ II поколения (конец 80-х) ориентировалось на более широкий модельный подход, основанный на детальном анализе предметной области. В рамках этого подхода появилась методология KADS (Knowledge Acquisition and Documentation Structuring). В основе методологии лежит понятие интерпретационной модели, позволяющей процессы извлечения, структурирования и формализации знаний рассматривать как интерпретацию лингвистических (вербальных) знаний в другие представления и структуры.
3.1.10.2. KADS-методология
Результатом анализа в соответствии с KADS-методологией является концептуальная модель экспертизы, состоящая из уровней:
- области (концепции, отношения, структуры);
- вывода (метаклассы, источники знаний);
- задачи (цели, задачи);
- стратегического (планы, метаправила).
KADS использует библиотеку интерпретационных моделей, описывающих общие экспертные задачи (диагностика, мониторинг и пр.). Интерпретационная модель представляет собой концептуальную модель без уровня области. Формирование уровня области производится в результате лингвистического анализа.
Пример: Системы программной поддержки KADS-методологии KADS power Tools. В нее входят: редактор протоколов PED (Protocol Editor); редактор системы понятий (Concept Editor); редактор концептуальных моделей CME (Conceptual Model Editor); библиотекарь интерпретационной модели (ИМ-библиотекарь) IML (Interpretation Model Librarian).
Редактор протоколов – программное средство анализа знаний о предметной области на лингвистическом уровне, для которого исходным материалом являются тексты. Редактор протоколов реализован как гипертекстовая система, обеспечивающая выделение фрагментов в анализируемом тексте, установление связей между фрагментами, группирование фрагментов, аннотирование фрагментов.
Типы связей между фрагментами:
- аннотация (связь между фрагментом протокола и введенным текстом);
- член группы (связь между фрагментом и названием – именем группы фрагментов);
- поименованная связь (связь между двумя фрагментами);
- понятийная связь (поименованная связь между фрагментом и понятием).
Редактор понятий позволяет организовывать предметные знаний в виде набора понятий с атрибутами и связывающих их отношений.
ИМ-библиотекарь позволяет проводить анализ предметных знаний на эпистемологическом уровне (уровне обоснованности). Основное назначение библиотекаря – помочь аналитику выбрать одну или более ИМ, наиболее подходящих для проблемной области. Для этого библиотекарь демонстрирует пользователю иерархию типов задач, для которых в библиотеке имеются ИМ. По каждой ИМ отображаются ее атрибуты: определение, краткое описание, структура задачи, стратегии, знания о предметной области.
3.1.10.3. Психосемантика
На разработку СПЗ II поколения наибольшее влияние оказали методы смежных наук, в частности психосемантики. Психосемантика позволяет реконструировать семантическое пространство памяти и моделировать глубинные структуры знаний эксперта. Развитие методов психосемантики шло по линии разработки пакетов прикладных программ, основанных на методах многомерного шкалирования, факторного анализа, обработки репертуарных решеток. Примеры: KELLY, MADONNA, MEDIS. Параллельно развивались системы, основанные на нечисленном логическом выводе: ETS, AQUINAS.
3.1.10.4. СПЗ III поколения
Недостатки СПЗ II поколения:
1) Несовершенство пользовательского интерфейса и неприменимость для неподготовленных экспертов.
2) Сложность настройки на конкретную профессиональную языковую среду.
3) Необходимость разработки дорогостоящих лингвистических процессоров для анализа текстов.
СПЗ III поколения – это гибкие, сложные программные средства для аналитика, использующие графические возможности производительных ЭВМ и достижения CASE-технологии. Эти системы, в отличие от СПЗ II поколения, позволяют не задавать заранее интерпретационную модель, а формировать структуру БЗ динамически.
Примеры: MACAO, KEATS, NEXPERT-OBJECT.
Проблемы современных СПЗ:
1. Методологические. Причина – отсутствие теоретического базиса процесса извлечения и структурирования знаний. Даже предельно формализованная KADS-методология страдает громоздкостью и избыточностью.
1.1) Размытость критерия выбора подходящей задачи.
1.2) Несогласованность теоретических вопросов (разброс терминологии, отсутствие обоснованной классификации методов извлечения знаний, слабая проработанность ряда теоретических вопросов).
1.3) Отсутствие единой теории структурирования знаний.
1.4) Жесткость моделей представления знаний.
1.5) Эмпиричность процедуры выбора программного инструментария.
2. Технологические (в основном являются следствием методологических).
2.1) Отсутствие согласованности между отдельными методами инженерии знаний.
2.2) Недостаток квалифицированных специалистов в области инженерии знаний.
2.3) Недостаток технико-экономических показателей оценки эффективности ЭС.
2.4) Недоступность методических материалов по практике проведения сеансов извлечения знаний.
2.5) Неполнота и недостаточность имеющихся методов структурирования знаний; отсутствие рекомендация по выбору подходящего метода.
2.6) Разрыв между языками представления знаний и языками, встроенными в оболочку ЭС.
2.7) Низкая адаптивность существующих программных средств к пользователю и предметной области.
3.1.10.5. Примеры систем приобретения знаний
Автоматизированное структурированное интервью
TEIRESIAS
Основные принципы. В случае неудачи в режиме консультации система предлагает эксперту выделить причины неудачи. Контекст, полученный в результате этого, позволяет системе сформировать некоторые «ожидания», характеризующие содержание нового правила, которое будет вводиться экспертом для устранения неудачи.
MOLE
Два этапа приобретения знаний:
1. Структурированное интервью, в ходе которого эксперту или аналитику предлагается ввести список событий предметной области и определить связи между ними.
2. Контекстное приобретение знаний аналогично TEIRESIAS.
Система состоит из двух частей: интерпретатора базы предметных знаний и подсистемы приобретения знаний, которая поддерживает как процесс первоначального заполнения БЗ, так и процесс отладки и уточнения БЗ. Интерпретатор БЗ ориентирован на класс диагностических задач и осуществляет вывод решения путем сопоставления заранее отобранного множества гипотез с совокупностью наблюдений. Таким образом осуществляется некоторый вариант метода эвристической классификации.
В БЗ MOLE первоначально существуют знания о том, какие типы когнитивных структур необходимы для осуществления вывода и как распознать знания того или иного типа в информации, сообщаемой экспертом. Эксперт сообщает MOLE список гипотез и наблюдений и указывает связанные пары «наблюдение-гипотеза» и «гипотеза-гипотеза».
Результатом этого этапа извлечения знаний является сеть объектов. Затем MOLE пытается получить дополнительную информацию: о типе объекта; о природе ассоциативной связи, ее направлении и численной оценке ее силы.
На этапе начального формирования БЗ назначаются численные веса связей по умолчанию на основании следующих соображений:
1) Каждое наблюдение должно быть объяснено некоторой гипотезой;
2) Только одна из гипотез, объясняющих данное наблюдение, является в каждом конкретном случае наиболее вероятной;
3) Сумма оценок для связей данного наблюдения с объясняющими его гипотезами равна единице.
SALT (университет Карнеги-Меллоуна)
SALT – система приобретения знаний для задач конструирования методом пошагового распространения ограничений.
Для решения задач необходимы знания следующих типов:
1) Процедуры установления значений параметров.
2) Процедуры проверки ограничений.
3) Процедуры коррекции значений параметров с указанием цены каждого корректирующего действия.
OPAL (Стэнфордский университет)
Обеспечивает формирование и наращивание БЗ для ЭС ONCOCIN.лечения онкологических больных. Основана на детально проработанной модели медицинских знаний. Системой используются следующие типы знаний:
- схема лечения (порядок и длительность режимов лечения);
- критерий выбора протокола;
- химиотерапия (описание комбинаций лекарств, назначаемых в том или ином режиме, дозировка);
- радиотерапия (локализация и дозировка терапии);
- изменения в составе крови, требующие модификации дозировки;
- негативные реакции на лечение;
- другие отрицательные последствия лечения, требующие изменения дозировки лекарств;
- перерыв или прекращение лечения;
- лабораторные исследования.
Эти типы знаний связываются в иерархическую структуру. В системе реализованы специализированные графические интерфейсы, ориентированные на ввод знаний определенных типов.
Схемы протоколов и заполненные формы транслируются системой во внутреннее представление БЗ ЭС ONCOCIN. По схемам протоколов порождаются диаграммы переходов, называемые генераторами.
KNACK (университет Карнеги-Меллоуна, 1989 г.)
Единственными знаниями, встроенными в систему являются знания об оценке проектов вообще, независимо от их содержания. Остальные знания приобретаются экспертами на основе диалога и анализа документов, называемых отчетами.
Приобретение знаний, необходимых для оценки проектов определенного класса, система осуществляет в два этапа:
1. Настройка на класс проектов. Создание предварительной модели.
2. Трансляция модели предметной области в программу на языке OPS-5.
Имитация консультаций
АРИАДНА
Основана на многократном решении экспертом проблемы классификации в режиме последовательной вопросно-ответной консультации «клиент-эксперт».
ЭСКИЗ
Реализован набор игр, являющихся той или иной модификацией принципа репертуарных решеток.
Интегрированные среды приобретения знаний
AQUINAS
Состав:
- система Dialog Manager для помощи начинающим пользователям;
- система ETS для извлечения и анализа репертуарных решеток с последующим преобразованием их в базу продукционных правил;
- средства конструирования различных иерархических структур знаний;
- средства извлечения, представления и использования неточных знаний;
- средства тестирования и коррекции БЗ;
- средства, позволяющие эксперту оценивать конструкторы (?) по наиболее подходящим шкалам;
- средства работы с несколькими экспертами;
- средства автоматического пополнения и коррекции БЗ.
Dialog Manager представляет собой ЭС, специально созданную для того, чтобы консультировать эксперта о возможностях, предоставляемых AQUINAS. Режимы взаимодействия с Dialog Manager:
- автоматический – Dialog Manager полностью управляет процессом извлечения знаний;
- ассистирующий – выдача рекомендаций эксперту по его дальнейшим действиям;
- режим наблюдения.
В БЗ Dialog Manager имеются эвристики, позволяющие системе переходить от автоматического режима к ассистирующему при приобретении экспертом достаточного опыта.
KITTEN (Knowledge Initiation and transfer Tools for Experts and Novices)
Основана на построении и анализе репертуарных решеток. Обеспечивается извлечение элементов и конструкторов из текста, имеются процедуры, анализирующие примеры решения задач экспертом и генерирующие по ним продукционные правила. Эти правила могут быть загружены в БЗ оболочки NEXPERT, с помощью которой далее проводится тестирование БЗ.
Проблемы, которые не решаются методами приобретения знаний:
1) Наличие посредника (аналитика) между экспертом и системой.
2) Отсутствие системного решения проблем пробелов в знаниях, выявления глубинных знаний.
3) Отсутствие связи приобретения знаний с остальными направлениями инженерии знаний.
Приобретение знаний из текстов
Системы, основанные на моделях понимания текста на лингвистическом уровне, состоят из двух частей:
- морфологический и синтаксический анализ;
- семантический анализ, использующий результаты работы первой части и словарно-справочную информацию для построения формализованного образа текста.
Особенности систем текстового приобретения знаний:
1) Отсутствие эксплицитного (явного) соотнесения элементов текста с элементами модели.
2) Необходимость предварительного формирования словаря предметной области для выполнения морфологического анализа.
Понимание теста на семантическом уровне требует выявления не только лингвистических, но и логических отношений между языковыми объектами. Среди моделей понимания текста наиболее известны:
- модель семантик предпочтения (Уилкс);
- модель концептуальной зависимости (Хайес-Рот);
- модель «смысл-текст» (Мельчук).
Все они так или иначе основываются на семантическом графе и описании коммуникативной структуры текста.
KRITON
Выявляются хорошо структурированные знания из текстовых источников. Основанный на контент-анализе метод протокольного анализа используется для выявления процедурных знаний. Он осуществляется в пять шагов (см. выше).
TAKT (Tool for Acquisition of Knowledge from Text)
Требует предварительной подготовки предложений текста (разметки посредством введения явной скобочной структуры). В результате анализа выделяются объекты, процессы и отношения каузального характера.
Инструментарий прямого приобретения знаний SIMER+MIR
Система разработка в ИПС РАН под руководством Г.С. Осипова. Представляет собой совокупность программных средств для формирования модели и БЗ предметной области. Система ориентирована на области с неясной структурой объектов, с неполным множеством свойств объектов и множеством разнородных и неравносильных связей между объектами.
Использование системы на заключительном этапе не предполагает участия специалистов-разработчиков экспертных систем.
Система включает в себя:
- модуль прямого приобретения знаний SIMER;
- систему моделирования рассуждений типа аргументации MIR;
- программу + адаптации системы MIR к БЗ, сформированной при помощи SIMER;
- программной среды поддержки БЗ;
- интерфейса инженера по знаниям, основанного на языке FORTE.
Одним из наиболее распространенных видов экспертизы являются высказывания эксперта об объектах. Эти высказывания (формы сообщений) имеют вид:
<Объект><Отношение><Объект>
Характерные формы сообщений
Номер формы | Имя формы | Номер формы | Имя формы |
Ф1 | a характерно для b | Ф13 | a иногда сопровождается b |
Ф2 | a наблюдается при b | Ф14 | a часто сопровождается b |
Ф3 | a отмечается при b | Ф15 | a исключает b |
Ф4 | a есть проявление b | Ф16 | a приводит к b |
Ф5 | a есть признак b | Ф17 | При a возникает b |
Ф6 | a сопровождает b | Ф18 | a может привести к b |
Ф7 | a нередко сопровождается b | Ф19 | a может развиваться в b |
Ф8 | При a нередко присутствует b | Ф20 | С a начинается b |
Ф9 | a может наблюдаться при b | Ф21 | b развивается при a |
Ф10 | a обычно сопровождается b | Ф22 | b может развиваться при a |
Ф11 | При a как правило b | Ф23 | b может начаться с a |
Ф12 | При a обычно b |
Остальные сообщения, называемые типами сообщений, строятся на основе форм сообщений.
Возможные типы сообщений
Тип | Сообщение |
Т1 | a есть проявление b, и b может сопровождать a |
Т2 | a есть проявление b, и b сопровождается a |
Т3 | a может увеличивать возможность b, и b увеличивает возможность a |
Т4 | a может сопровождаться b, и b может быть проявлением a |
Т5 | a сопровождается b, и b может быть проявлением a |
Т6 | a есть проявление b, и b есть проявление a |
Т7 | a может увеличивать возможность b, и b может увеличивать возможность a |
Т8 | a может протекать с b, и b может протекать с a |
Т9 | a увеличивает возможность b, и b увеличивает возможность a |
Т10 | a сопровождается b, и b может сопровождать a |
Т11 | a сопровождается b, и b сопровождается a |
Т12 | a исключает b, и b исключает a |
Т13 | a приводит к b |
Т14 | a может привести к b |
Т15 | a увеличивает возможность развития b |
Т16 | a может увеличить возможность развития b |
Т17 | a исключает возможность развития b |
Для приобретения знаний в системе SIMER используются стратегии разбиения на ступени и репертуарных решеток.
Сценарии стратегии разбиения на ступени:
- «Имя – свойство»;
- «Множество имен – свойство».
Сценарий «Имя – свойство»:
1. Вопрос системы об имени события.
2. Сообщение эксперта об имени события.
3. Вопрос системы об имени свойства.
4. Сообщение эксперта об имени свойства.
5. Вопрос системы о существовании множества значений свойства.
6. Ответ эксперта (да/нет).
7. В случае отрицательного ответа имя свойства воспринимается как имя события.
8. Если имя события, образованного на шаге 3, отсутствует в БЗ, то это событие рассматривается как новое, и для него выполняются шаги 2 – 7.
9. Вопрос системы о типе множества значений свойства (непрерывное/дискретное).
10. Ответ эксперта.
11. Вопрос системы о единице измерений свойства.
12. Сообщение эксперта о единице измерения.
13. Вопрос системы о множестве значений свойства.
14. Сообщения эксперта о множестве значений свойства.
15. В процессе выполнения шагов 2 – 6 создается глобальный объект «имя свойства» и область его значений. Совокупность таких объектов будем называть базисом свойств области.
16. Вопрос системы о подмножестве значений свойства, характерного для описываемого события.
17. Сообщение эксперта о подмножестве значений свойства.
В результате шага 7 один из элементов базиса свойств связывается с описываемым событием (с указанием подмножества области значений элемента базиса, характеризующего описываемое событие).
Для сценария «Множество имен – свойство» шаг 1 многократно повторяется, а затем выполняются шаги 2 – 7 для каждого имени события.
Стратегия репертуарных решеток направлена на преодоление когнитивной защиты эксперта. Механизм преодоления основан на выявлении его личностных (персональных) конструктов. Каждый конструкт описывается некоторой совокупностью шкал, а каждая шкала образуется оппозицией свойств.
Для описания моделирования рассуждений в системе MIR введем следующие обозначения:
О – опрос признаков из множества S;
П – порождение множества гипотез Г;
И – исключение множества гипотез Г.
Этапы работы системы MIR:
1) Формирование множества признаков S при помощи модуля О.
2) Порождение и итеративное пополнение множества гипотез Г при помощи модуля П, итеративное пополнение множества признаков S. Выполняются операции вида:
Г ß ГÈГ1
S ß SÈS1
Этот процесс продолжается до стабилизации Г и S.
3) Выполняется исключение гипотез из Г на основе анализа отрицательных связей и положительных связей для обусловленных признаков (признаков, отсутствие которых имеет больший диагностический вес, чем их присутствие).
3.2. Пополнение знаний
3.2.1. Общие сведения
К результатам решения задач пополнения знаний относят как вынесение выводов об истинности фактов, так и получение новых знаний (связей между сущностями в семантической сети, продукционных правил и т.п.) в результате обработки имеющихся фактов и знаний.
Задача пополнения знаний возникла при решении задач понимания естественного языка, обучения, анализа ситуаций, сцен и др. Знания могут быть представлены в виде фактов, хранящихся в базе знаний, или в виде описаний ситуаций, поступающих на вход ИС.
Существуют различные подходы к пополнению знаний. Выбор подхода осуществляется в зависимости от специфики предметной области, из соображений эффективности и целесообразности организации и обработки знаний.
Система продукций отражает закономерности, присущие заданной проблемной области (аксиоматику). Например, для ситуаций, описывающих статические пространственные отношения между объектами, можно выбрать следующие продукции:
x <содержится в> y, y <содержится в> z è x <содержится в> z (свойство вложенности);
x <находится на> y, z <находится на> x è z <находится над> y.
При этом большинство подходов использует идею продукционных правил. Процедуры пополнения знаний отличаются друг от друга структурой продукционных правил и стратегиями управления в системе продукций.
3.2.2. Использование различных моделей знаний
3.2.2.1. Модели псевдофизических логик
Общие сведения о псевдофизических логиках (ПФЛ) см. в п. 2.3. Рассмотрим конкретные примеры пополнения знаний на ПФЛ.
Логика времени
Введем множество моментов времени T = {t1, t2,...}, и множество событий P={p1, p2,,..., pп}. Событие рj происходит в момент времени tj. Если для рj существует лишь один момент времени, в который оно происходит, то событие рj называется точечным, если оно сопоставляется с некоторой непрерывной последовательностью моментов, то оно называется интервальным.
На множестве P1 точечных событий зададим шесть временных отношений трех типов: неметрические (r0 — одновременно, r1 —быть раньше, r2 — быть позже); метрические (r3n,L — быть раньше на п единиц (n = 1, 2, 3,...) по шкале L, r4Lt —происходить в момент t на шкале L); и частотные (r5Lp — происходить с частотой p на шкале L, где L принадлежит множеству шкал).
На множестве P2 интервальных событий зададим следующие отношения: R1 — строго предшествовать во времени; R2 — строго следовать; R3 — пересекаться и др.
Выбранная базовая система временных отношений не является минимальной и единственно возможной. Стремление к минимальности не всегда оправданно. Чем меньше отношений, тем более громоздко представление ситуаций и тем -больше длина вывода.
Приведем примеры схем аксиом в логике времени:
(pi r3n,L pj), (pj r3m,L pk) ├ (pi r3n+m,L pk), (1)
(pi r4Lt), (pi r3n,L pj) ├ (pj r4L(t+n)), (2)
(pi r3n,L pj) ├ (pi r1 pj), (3)
(pi r1 pj), (pj r1 pk) ├ (pi r1 pk). (4)
Пусть на вход ИС поступает следующее описание ситуации в виде текста на естественном языке: «Самолет совершил посадку в аэропорту в 15 ч 20 мин. Через 10 мин был подан трап. Затем прибыл автобус. Пассажиры покинули самолет. Через 3 мин автобус доставил их в здание аэровокзала». Для простоты будем считать, что события данного текста точечные. Выделим их: р1 — «посадка самолета», p2 — «подача трапа», рз—«прибытие автобуса», р4 — «выход пассажиров из самолета», p5 — «доставка пассажиров в здание аэровокзала». Формализованное описание ситуации выглядит так:
TS = (p1 r4L t)&(p1 r310,L p2)&(p2 r1 p3)&(p4r33,L p5),
где t==15 ч 20 мин на шкале L с единицей измерения «минута».
Формальное представление событий текста обрабатывается процедурой пополнения, которая выведет следующие факты:
(p1 r4Lt), (p1 r310,L p2) ├ (p2 r4L t*) (по схеме 2),
где t* = l5 ч 30 мин на шкале L;
(p1 r310,L p2) ├ (p1 r1 p2) (по схеме 3);
(p1 r1 p2), (p2 r1 p3) ├ (p1 r1 p3) (по схеме 4);
(p4 r33,L p5) ├ (p4 r1 p5) (по схеме 3).
Логика действий
Псевдофизическая логика действий (ПФЛД) представляет собой логическую систему, описывающую семантические и прагматические свойства физических действий, условия их протекания во времени и пространстве, их взаимодействие, а также цели и мотивы действующих лиц. Основные разновидности связей между действиями: временная, пространственная, посредством одного и того же исполнителя, одного объекта, на который направлено действие. Возможны и более сложные зависимости. Например, каузальная.
Различаются следующие типы каузальных отношений между действиями:
p1 - необходимая и достаточная причина. Действия d1, d2 связаны отношением p1, если реализация d1 всегда вызывает реализацию d2, и, наоборот, появление d2 всегда вызывается d1; чаще всего p1 отражает различные физические законы реального мира (например, сверкнула молния — грянул гром).
p2 - достаточная причина, которая означает, что реализация d1 всегда вызывает d2, однако из появления d2 не всегда следует появление d1 (например, «нырнул в реку, оказался в воде»).
p3 - обусловливающая причина. Действия d1, d2 связаны отношением p3, если реализация d1 обеспечивает необходимые условия для реализации d2, которое, однако, может и не произойти (например, «вошел в комнату, включил свет»).
Опишем действия в виде предикатов di (S, О, I, t, 1), где
S - субъект,
О - объект,
I - инструмент,
t - время реализации действия,
1 - его локализация.
Введем следующие множества: множество действий D= { di }; множество объектов О ={ Oi }; множество инструментов I ={ Ii }, множество моментов времени T ={ ti }, множество локализаций L =={ li }.
Дата добавления: 2015-07-11; просмотров: 53 | Нарушение авторских прав