Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Глава 4. Программное обеспечение естественно-языковых интерфейсов

Читайте также:
  1. Amt VII Versorge-Fursorgeamt (Социальное обеспечение; создано 15.8.1940).
  2. Amt XI (Социальное обеспечение и снабжение).
  3. IV.МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕОБЕСПЕЧЕНИЕ УЧЕБНОЙ ДИСЦИПЛИНЫ
  4. IX. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ
  5. Security - Обеспечение безопасности
  6. V. Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины и учебно-методическое обеспечение самостоятельной работы студентов
  7. VI. Учебно-методическое и информационное обеспечение дисциплины

4.1. Системы «Электронный словарь» и «Электронный разговорник»

На основе алгоритмов порождения естественного языка при помощи подстановочных таблиц выполнена программная реализация систем «Электронный словарь» и «Электронный разговорник». Эти системы предназначены для:

автоматической генерации фраз и текстов на естественном языке;

полуавтоматического построения шаблонов для последующей генерации фраз и текстов.

Разработанные системы заключают в себе алгоритмическое и программное ядро для построения естественно-языковых интерфейсов.

Системы прошли апробацию на задачах обучения иностранным языкам. Системы с одинаковой эффективностью функционирует на различных естественных языках – английском, немецком, испанском, русском. На этих языках были полуавтоматически сгенерированы подстановочные таблицы, достаточные для последующей генерации семантически и грамматически осмысленной речи.

Данный комплекс программных систем реализует следующую схему порождения фраз естественного языка для естественно-языкового интерфейса.

Полуавтоматическое построение шаблонов для последующей генерации естественного языка.

Выбор грамматических шапок для каждой колонки таблицы.

Выбор лексических групп для каждой колонки таблицы.

Копирование таблицы в особый файл.

При необходимости возможен просмотр и постредактирование полученного файла в программе Microsoft Word, или любом другом редакторе, поддерживающем формат html.

2. Создание базы данных для генерации осмысленных фраз на основе полученных таблиц – шаблонов.

Создание иерархии названий файлов, содержащих таблицы генерации высказываний. Последовательности подстановочных таблиц связаны синтагматическими комбинаторными отношениями, то есть генерируемые при их помощи предложения объединяются в ассоциативно или логически связный текст.

Подсоединение в полученную иерархию сгенерированных файлов подстановочных таблиц.

Автоматическая генерация осмысленных фраз и текстов естественного языка.

Цикл:

Выбор нужного шаблона – файла с подстановочной таблицей из иерархии шаблонов.

Выбор одного из двух вариантов генерации фраз:

Либо автоматическая генерация одного из множества осмысленных высказываний на основе подстановочной таблицы шаблона.

Либо выбор одного из множества осмысленных высказываний шаблона.

Сохранение полученной информации в виде текстов.

Использование полученных текстов, например, для отправки их в виде писем по сети Internet.

Создание базы когнитивных функций на основе сгенерированных и присоединенных к иерархии таблиц шаблонов.

Цикл:

Выбор нужного шаблона – файла с подстановочной таблицей из иерархии шаблонов.

Выбор одного из двух вариантов генерации фраз:

Либо автоматическая генерация одного из множества осмысленных высказываний на основе подстановочной таблицы шаблона.

Либо выбор одного из множества осмысленных высказываний шаблона.

Сохранение полученной информации в виде базы когнитивных функций – обучающей таблицы.

Использование полученных обучающих таблиц, например, для обмена информацией приведенного вида или процесса обучения.

Генерация фраз естественного языка на основе базы истинных когнитивных функций (пока программно не реализована).

Выбор одного из вариантов развития мысли в иерархии подстановочных таблиц.

Выбор одного из истинных высказываний в соответствующей обучающей таблице.

Последовательное умножение этого высказывания или подфрагмента таблицы на ряд таблиц семантического шума из фиксированного множества таблиц семантического шума для получения текста на основе истинной информации приведенного вида.

 

Данная алгоритмическая схема может служить основой для построения естественно-языкового интерфейса и большей частью реализована в программах «Электронный словарь» и «Электронный разговорник», которые апробированы на задачах обучения иностранным языкам [94].

 

 

4.2. Назначение системы «Электронный словарь»

На основе изложенных выше теоретических принципов разработана электронная версия словаря-классификации слов английского и русского языка, позволяющая составлять подстановочные таблицы. Это единственный на сегодня словарь подстановочных таблиц. Разработка системы имело целью решение двух основных практических задач:

Унификация базы данных, в частности, по правилам, структурам и вокабуляру (словарному запасу) английского языка и автоматическая генерация учебников по иностранному языку для конкретной группы населения.

Генерация в самое короткое время индивидуальных учебных пособий для отдельных учащихся с учетом их конкретных пробелов в знаниях, потребностях в тех или иных группах слов, работе над теми или иными аспектами языка: разделами фонетики, грамматики, навыками письма, чтения, говорения и аудирования (восприятия речи на слух).

Подобная унификация и классификация учебного материала, очевидно, должна повысить эффективность обучения иностранному языку.

Предполагается, что для представления материалов в унифицированном виде необходимо использовать принцип понятийного пространства, то есть схожая по смыслу информация должна находиться в структурах данных, «расположенных» близко друг к другу. На этом принципе основаны следующие разделы Электронного словаря:

Словарь-классификация слов английского и русского языков.

Тематический словарь ссылок на словарь-классификацию.

Древесная классификация грамматических, фонетических и прочих теоретических материалов, описывающих правила английского языка.

Алфавитный словарь в виде поисковой системы слов и его синонимов, антонимов и оппозиций.

Данный словарь содержит также ряд других разделов, функции которых описаны далее. В основу словаря положена методика «Открой и говори», позволяющая ученику говорить на английском языке в рамках некоторой темы-ситуации при помощи подстановочных таблиц, генерируемых в словаре. Основу словаря составляет наиболее употребительная лексика на бытовые и общепрофессиональные темы, научная лексика. Он также содержит специальные темы из ряда областей: компьютеры, дизайн, музыка, биология, парикмахерское искусство, математика и др.

Наличие гибкой системы подбора лексики и подстановочных таблиц позволяет, добавив в словарь от нескольких десятков до нескольких сотен слов по какой-либо дополнительной тематике, иметь возможность подбора материалов к урокам английского языка в рамках более чем 1000 единиц универсальной лексики и вновь добавленных слов. По нашим данным на сегодняшний день не получила сколько-нибудь широкого распространения ни одна программа, позволяющая профессиональному преподавателю гибко и оперативно подбирать материалы к урокам английского языка. Все существующие электронные учебники ориентированны, в первую очередь, на изучение материалов непосредственно учеником, некоторые из них позволяют распечатывать рисунки или иную информацию в ограниченном объеме и без должной гибкости в подборе учебных материалов. Программа «Электронный словарь» позволяет использовать авторский метод «Открой и говори» в работе с учениками. Этот метод дает возможность говорить на незнакомом языке без знания слов и правил на основе подстановочных таблиц, генерируемых при помощи электронного словаря.

Отличительными особенностями словаря являются следующие характеристики. Словарь составлен на основе принципов, описанных в главах 2-3, место каждого слова в словаре раскрывает его внутреннюю семантическую структуру. Словарь использует существующие частотные методики в подборе лексики (лексиколизации).

Деление слов в словаре по группам имеет следующие преимущества. Заучивание слов в логических группах более эффективно, чем заучивание слов вразброс или даже просто по темам. Кроме того, если пользователь ощутил нехватку известных ему слов в какой-либо области, он может направленно выбрать из классификации нужные ему группы слов и компенсировать пробел в этой области. Использование словаря способствует развитию «комплексного мышления»: ученик учится оперировать не отдельными словами, а целыми классами слов в речи. В словаре проведено сопоставление слов в синонимических, антонимических и оппозиционных группах, например, «лежать на – сидеть на – стоять на; ползти по – шагать по». Словарь поддерживает функции нахождения слов по семантическому признаку, используя родовидовые отношения на каждом уровне классификации

Пользователь программы может использовать как алфавитный, так и семантический, как англо-русский, так и русско-английский словарь (а также транскрипционно-английский и транскрипционно-русский словари).

Поиск отдельного нужного слова в словаре может проходить по следующим критериям:

по форме слова английского языка

по форме слова русского языка

по произношению слова в английском языке

Пользователь может ограничить словарь наиболее употребительными словами языка. Темы в словаре разбиты на повседневные (для начала обучения) и специальные (для специалистов или профессионалов).

уровень starter

уровень beginner

уровень intermediate

уровень advanced

уровень professional

В словаре предусмотрен также уровень minus intermediate, в котором отброшены наиболее простые и известные слова английского языка.

Электронный словарь представляет собой набор программ, целью которых является изучение и использование английского языка русскоязычным пользователем. Он также является средством составления преподавателем эксклюзивных материалов для каждого отдельно взятого ученика. Он предназначен также для подбора материалов к урокам английского языка, а также словарей, учебников и разговорников по обучению иностранным языкам в целом. Словарь представляет средство подбора и копирования различных методических материалов для уроков английского языка не только преподавателем, но и конкретными пользователями.

Пользователь имеет возможность ознакомиться с классификацией слов английского языка. В основе этой классификации лежит иерархия понятий, более общие понятия находятся на вершине, более частные на более низких узлах. При составлении классификации была учтена возможность добавления любых понятий внутрь классификации, без расширения ее вовне. Принципы построения этой классификации подробно изложены в 1-3 главах. Реализация принципов классификации слов и понятий языка в системе «Электронный словарь» выражается в построении классификации слов языка на основе фиксированного вектора признаков.

Данный словарь содержит более чем 10000 слов и конструкций английского языка. Применение подстановочных таблиц при подборе лексики резко повышает количество запоминаемых учениками слов за урок. Пример такой подстановочной таблицы приводится ниже:

 

 

Таблица 4.1

Пример подстановочной таблицы из электронного словаря

    THE … Зэ … этот …   THE … Зэ … этот …  
I Ай я scan скАЕн просматривать rough_copy_of рА:ф_кОпи черновой_вариант book бУк книга
we ВИ мы read рИ:д читать draft_of дрАфт черновик newspaper нйуспЕйпэ газета
you йУ: вы write рАйт писать manuscript_of мАЕнйускрипт рукопись paper пЕйпэ газета
they Зей они scrawl скрО:л писать_(плохо) typescript_of тАйпскрипт машинописная_копия magazine мэгэзИ:н журнал
  scribble скрИбл писать_(плохо) copy_of кОпи копия journal джЭ:нэл журнал
  print прИнт напечатать edition_of Едишн издание cutting кАтиН вырезка
  publish пАблиш опубликовать column_in кОлэм колонка letter лЕтэ письмо
  understand андэстЕнд понимать page_of пЕйдж страница post-card пОуст-кА:д почтовая_карточка
  acquaint_with экВЕинт_ВИЗ ознакомиться double_page_of дАбл_пЕйдж разворот telegram тЕлэгрэм телеграмма
  tear тИэ рвать volume_of Волйум том report рипО:т доклад
  type тАйп печатать chapter_of чАЕптэ глава announcement энАунсмэнт объявление__заявление
  correct корЕкт исправлять part_of пА:т часть advertisement эдвЭ:тисмэнт реклама
  edit Едит редактировать paragraph_of пАЕрэгрэф параграф__абзац piece_of_writing пИсэврАйтиН произведение
    headline_of хЕдлайн заголовок article А:тикл статья
    contents_of кОнтентс содержание story стОри рассказ
    abstract_of АЕбстраект краткий_обзор literature лИтричэ литература
    introduction_of интрэдАкшн введение novel нОвел роман
    conclusion_of конклУ:жн вывод poetry пОуэтри поэзия
    item_of Айтэм пункт verse вЭ:с стих
    article_of А:тикл пункт detective..story дитЕктивстОри детектив
    conclusion_of кэнклУ:жн вывод adventure..story эдвЕнчэстОри приключенческий_роман
    date-line_of дЕйт-лАйн выходные_данные fairy..tale фЕэритЕйл сказка
    line_in лАйн строка spy..thriller спАйСрИлэ книга_про_шпионов
    indented_line_in индЕнтид_лАйн красная_строка contemporary..novel контЕмпэрэринОвл современный_роман
    break_line_in брЕйк_лайн красная_строка fiction фИкшн художественное_произведение
    capital_letter_in кАЕпитл_лЕтэ большая_буква science..fiction сАйэнсфИкшн научная_фантастика
    argument_in А:гйумэнт аргумент non-fiction нонфИкшн документальное_произведение
    reason_from рИзн довод biography бАйогрэфи биография
    idea_of айдИэ идея memoir мемВА: мемуары
    statement_from стЕйтмэнт утверждение travel..book трАЕвлбУк книга_о_путешествиях
    main_idea_of мЕйн_айдИэ главная_мысль classics клАЕсикс классика
    theme_of СИ:м тема chronicle крОникл хроника


В таблице 4.1 приводится пример подстановочной таблицы, генерируемой
при помощи программы «Электронный словарь».

Для построения предложения на основе подстановочных таблиц необходимо взять по одному слову из каждой колонки, и если выше выбранного слова стоит знак типа: «the …», «I have to … a(n)» и т.п. нужно подставить выбранное слово вместо многоточия. Получаемые предложения отличаются как грамматической, так и смысловой корректностью. Электронный словарь, позволяет подбирать любые подстановочные таблицы за очень короткое время, порядка одной таблицы в минуту. Также он позволяет копировать теоретические объяснения и задания в специальном формате, доступном для программы «Комбинаторный разговорник».

В личном письме автор одних из самых известных Кембриджских курсов английского языка Michel Swan указал на достоинства метода подстановочных таблиц, который, по его словам, пока не нашел места в современных методиках обучения иностранному языку.

Данный метод используется непосредственно автором. С первых же дней ученики изучают несколько десятков новых слов в семантических группах и овладевают школьным курсом английского языка за несколько месяцев.

Метод используется также другими преподавателями из различных школ и вузов города Красноярска.

 

4.3. Функции системы «Электронный словарь»

Электронный словарь может обеспечить просмотр, подбор слов и материалов, а также печать полученных материалов в файл. Для реализации этих функций следует использовать закладку «классы». Если пользователь еще не освоил принципы расположения слов в классификации, он может найти любое слово и соответствующий класс слов, используя закладку «Алфавитный словарь».

Пользователь может получить доступ одновременно к ряду классов, относящихся к одной теме, используя закладку «темы», опцию «последовательность обучения».

Чтобы распечатать материалы к уроку в виде файла или файлов необходимо использовать опцию главного меню «файл».

Чтобы заучить слова по какой-либо теме, необходимо использовать закладку «запоминание» и всплывающее меню окошек «1», «2», «3» и т.д.

Если пользователю необходимо выучить материалы по теории языка, он может использовать краткий самоучитель на закладке «самоучитель».

Если пользователю необходимы специальные задания к изучаемым темам, он может использовать закладку «Темы». Далее в форме таблицы приводится список основных функций словаря.

Таблица 4.2

Функции электронного словаря порождения высказываний

  Название операции Назначение операции
  Копирование файлов из словаря в подстановочную таблицу Для создания и последующего копирования подстановочных таблиц
  Редактирование подстановочных таблиц Исключение ненужных слов из подстановочных таблиц
  Копирование таблиц в урок Добавление таблицы в материалы урока
  Копирование теории в урок Добавление текстов, заданий и теории в материалы урока
  Поиск слова в словаре по английскому написанию Нахождение перевода слова и схожих по смыслу слов, если известно не значение, а написание этого слова на английском языке  
  Поиск слова в словаре по английской транскрипции Нахождение перевода слова и схожих по смыслу слов, если известно не значение, а произношение этого слова на английском языке  
  Поиск слова в словаре по русскому написанию Нахождение перевода слова и схожих по смыслу слов, если известно не значение, а написание этого слова на русском языке
  Проверка запоминания слов Повторение и оценка степени усвоения слов
  Создание пользовательских словарей Создание пользователем своего словаря для введения новых слов.

 

В таблице 4.2. приведены основные функции программы «Электронный словарь», в первой колонке приведены функции словаря, во второй колонке указывается назначение выполняемой операции.

 

4.4. Состав и структура системы «Электронный словарь»

Программа «Электронный словарь» содержит следующие компоненты

подстановочную таблицу

базы данных: словари, грамматические справочники, рисунки

подпрограммы по контролю усвоения материалов

алфавитный и пользовательский словарь

окно сообщений и статистики

Рассмотрим далее приведенные компоненты программы подробнее.

Подстановочная таблица представляет собой 10 закладок с полями для деревьев. Деревья слов могут копироваться из поддеревьев соответствующих словарей. Любой крупный класс слов ниже 3-го уровня классификации может быть скопирован в подстановочную таблицу. Предусмотрено редактирование этих поддеревьев при помощи всплывающего меню, которое содержит следующие разделы, отвечающие за соответствующие функции:

Таблица 4.3

Основные составляющие компоненты программы «Электронный словарь»

Название раздела Местоположение раздела Функция
Файл Главное меню Запись информации в файлы
Вид печати Главное меню Настройка вида печати информации в файлы, например, количества столбцов в подстановочной таблице
Настройка Главное меню Вид и режим копирования поддеревьев в подстановочные таблицы, вид и расположение окон и настроек
Опции Главное меню Изменение шрифта и вида копирования поддеревьев – поверх или после предыдущих
Помощь Главное меню Информация о том, как пользоваться программой
Копировать словарь Главное меню/Файл Копирование всего словаря в файл
Копировать тему Главное меню/Файл Копирование подстановочной таблицы или отдельных слов из закладок 1-10 в файл.
Выход Главное меню/Файл Выход, завершение работы программы
3 столбика Главное меню/Вид печати Распечатка слов в три столбика
3 подряд Главное меню/Вид печати Распечатка слов в одну строчку
Расклад 1-10 Главное меню/Вид печати Распечатка слов в виде подстановочной таблицы
2 колонки Главное меню/Вид печати/Расклад 1-10 Распечатка двух колонок подстановочной таблицы
3 колонки и т. д. Главное меню/Вид печати/Расклад 1-10 Распечатка трех колонок подстановочной таблицы  
По русскому алфавиту Главное меню/Вид печати Упорядочение слов в колонках по алфавиту русского языка  
По английскому алфавиту Главное меню/Вид печати Упорядочение слов в колонках по алфавиту английского языка  
По транскрипции Главное меню/Вид печати Упорядочение слов в колонках по транскрипционному алфавиту
С транскрипцией Главное меню/Вид печати Печать слов с транскрипцией
Без транскрипции Главное меню/Вид печати Печать слов без транскрипции
Файл txt Главное меню/Вид печати Распечатка таблицы материалов в виде текстового файла с псевдографикой
Начать подрезать Главное меню/Вид печати Способ пустить нижнюю часть таблицы не в 1, а в N столбцов
С 1-ой колонки Главное меню/Вид печати Задает число N = 1
Со 2-ой колонки Главное меню/Вид печати Задает число N = 2
Подрезать Главное меню/Вид печати Перераспределить нижнюю часть таблицы по N столбцам
Минимум Главное меню/Настройка Оставить только слова на уровне starter
Новичок Главное меню/Настройка Оставить только слова на уровне beginner
Профессионал Главное меню/Настройка Оставить только слова на уровне professional
Минус новичок Главное меню/Настройка Оставить все слова кроме слов на уровне beginner
Англо-русский Главное меню/Настройка Назначить верхние узлы дерева отвечающими за английские слова, а нижние – за транскрипцию и русские слова
Русско-английский Главное меню/Настройка Назначить верхние узлы дерева отвечающими за русские слова, а нижние за английские и транскрипцию слова
Подсчет ряда тем Главное меню/Настройка Отображение в окне сообщений количества всех скопированных тем, включая копирование поверх предыдущих  
Подсчет 1-й темы Главное меню/Настройка Отображение в окне сообщений количества всех скопированных тем, не включая копирование поверх предыдущих
Без транскрипции Главное меню/Настройка Отображать транскрипцию
С транскрипцией Главное меню/Настройка Не отображать транскрипцию
Увеличить окно сообщений Главное меню/Настройка Увеличить размер закладки сообщений так, что последнее закрывает закладки 1-10
Уменьшить окно сообщений Главное меню/Настройка Уменьшить закладку сообщений до стандартных размеров
Без определений Главное меню/Настройка Не писать определения слов рядом с словоформами
С определениями Главное меню/Настройка Писать определения слов рядом со словоформами
Настроить пользовательский словарь Главное меню/Настройка Привести все настройки программы в соответствие с последующей работой с пользовательским словарем
Шрифт Главное меню/Опции Изменить шрифт до F пунктов
8-ой Главное меню/Опции F = 8
10-ый Главное меню/Опции F = 10
12-ый Главное меню/Опции F = 12
Стирать предыдущие Главное меню/Опции Записывать далее новые поддеревья поверх старых
Добавлять к предыдущим Главное меню/Опции Записывать далее новые поддеревья вслед за старыми
Что с этим делать Главное меню/Помощь Отобразить помощь на закладке «Инфо»
  Закладки внизу справа Первая колонка подстановочной таблицы или первый список слов  
2 и т. д. Закладки внизу справа Вторая колонка подстановочной таблицы или второй список слов
Словарь Закладки слева Основной словарь-классификация
Курс Закладки слева Словарь ссылок на основной словарь, группы слов в этом словаре расположены в другом порядке, также на этой закладке находится классификация упражнений для обучения
Теория Закладки слева Словарь-классификация теоретических материалов по фонетике, грамматике и т.д.
Опоры Закладки слева Подборка грамматических опор в виде рисунков
Урок Закладки слева Опция для составления уроков, включающих таблицы, задания, теорию и, в перспективе, рисунки
Запоминание Закладки слева Опция, позволяющая проверить усвоение материала, а именно, знание перевода слов
Ваш словарь Закладки слева Опция для составления собственных словарей пользователем
Инфо Закладки слева Опция показа помощи и вывода информационных сообщений
Сообщения Закладки вверху справа Опция показа помощи и вывода информационных сообщений
Алфавитный словарь Закладки вверху справа Опция поиска значения слова и его места в классификации по форме этого слова
Ваш словарь Закладки вверху справа Поле ввода слов для пользовательского словаря

 

В таблице 4.3 приведены основные компоненты программы «Электронный словарь», в первой колонке указан раздел словаря, во второй колонке указывается, на какой части главной формы программы располагается соответствующий раздел, а в третьей колонке указывается его функция и назначение.

 


Дата добавления: 2015-07-08; просмотров: 229 | Нарушение авторских прав


Читайте в этой же книге: Представление языка | Множество классификаций | Семантический и другие аспекты языка | Семы классификации | Факты классификации | Понятийное пространство и его наполнение | Вектор классификации слов и понятий | Валентностный уровень классификации | Уровень свойств | Кодировка сочетаний групп слов |
<== предыдущая страница | следующая страница ==>
Кодировка стилистики языка| Входные и выходные данные

mybiblioteka.su - 2015-2024 год. (0.016 сек.)