Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Применение программ-экстракторов.

Читайте также:
  1. Американские стандарты шифрования DES, тройной DES, AES. Принципы работы, основные характеристики и применение.
  2. Возникновение, развитие и первоначальное применение лыж
  3. Глава 2. Назначение и применение региональных нормативов
  4. Глава 27. Применение мер обеспечения производства по делам об административных правонарушениях
  5. Глава 9. Кислотный разрыва пласта / ГРП с применением проппанта
  6. ГЛАВА I. ПОНЯТИЕ И ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ
  7. Глава IV. ЛЕЧЕБНОЕ ПРИМЕНЕНИЕ ЭПИДУРАЛЬНОЙ АНАЛГЕЗИИ

Выделение метаинформации и ключевых слов из изданий может быть выполнено с помощью специальных программ-экстракторов. Одна из первых таких программ – это Extractor. Extractor в качестве исходных данных использует текстовый документ, генерируя на выходе совокупность ключевых слов. Он обрабатывает тексты на английском, французском, японском, немецком, испанском и корейском языках. К сожалению, к русскому языку он пока не адаптирован. Алгоритм работы программы использует метод обучения на примерах. Алгоритм изначально предназначен для моделирования человеческого подхода к выбору ключевых слов. На большинстве платформа время работы программы с 10-страничным документом не превышает секунды.

Разработанная фирмой «Научно-производственный инновационный центр «Микросистемы» отечественная программа-экстрактор Text-Analyst 1.5 позволяет на первых же этапах работы с текстами ответить на естественные вопросы, возникающие по ходу анализа.

Применение программы резко сокращает время, необходимое эксперту для погружения в тематику, и дает множество подсказок и наводящих соображений для тонкого и углубленного анализа как всей информации в совокупности, так и отдельных ее фрагментов. Первые успехи эксперта при работе с анализаторами текстов, как правило, служат основой для постановки более сложных задач анализа и структурирования. И с ними TextAnalyst успешно справляется.

В настоящее время распространяется новая версия TextAnalyst 2.01, которая разработана в качестве инструмента для анализа содержания текстов, смыслового поиска информации, формирования электронных архивов, и предоставляет пользователю следующие основные возможности:

1. анализа содержания текста с автоматическим формированием семантической сети с гиперссылками - получения смыслового портрета текста в терминах основных понятий и их смысловых связей;

2. анализа содержания текста с автоматическим формированием тематического древа с гиперссылками - выявления семантической стру ктуры текста в виде иерархии тем и подтем;

3. смыслового поиска с учетом скрытых смысловых связей слов запро са со словами текста;

4. автоматического реферирования текста - формирования его смы слового портрета в терминах наиболее информативных фраз;

5. кластеризации информации - анализа распределения материала текстов по тематическим классам;

6. автоматической индексации текста с преобразованием в гипертекст;

7. ранжирования всех видов информации о семантике текста по «степени значимости» с возможностью варьирования детальности ее исследования; автоматического/автоматизированного формирования полнотекстовой базы знаний с гипертекстовой структурой и возможностями ассоциативного доступа к информации.

8. Результаты работы программы TextAnalyst 2.01. представлены:

В тексте выделены цветом и подчеркнуты термины, которые TextAnalyst 2.01 предлагает использовать в качестве ключевых слов, терминов, отражающих смысловое содержание работы. Пользователь может исключить часть этих слов или добавить другие, что будет учтено программой в дальнейшей работе. По нашему мнению, эта программа может успешно использоваться для автоматизации извлечения метаинформации из загружаемых в хранилище изданий.

 


Дата добавления: 2015-10-30; просмотров: 97 | Нарушение авторских прав


Читайте в этой же книге: Способы представления звука в цифровом виде. Импульсно-кодовая модуляция | Формат MPEG Layer 3. Его основные характеристики. | Видеоинформация. Композитное видео. | Основные характеристики цифрового видео. | Формат MPEG Layer 4. Его основные характеристики. | Описание работы презентационных программ. Примеры. | Методы организации поиска в электронном издании. Основные отличия | Требования к информационному хранилищу издательства. | Проектирование структуры хранилища электронных изданий. | Структурные особенности серверной части мультимедийного интернет-ресурса. |
<== предыдущая страница | следующая страница ==>
Электронных изданий.| Публикация динамических Web-страниц

mybiblioteka.su - 2015-2024 год. (0.007 сек.)