Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Средства Data Mining (DM)

Читайте также:
  1. A. М-Холиноблокирующие средства
  2. An Overview of the Mining Industry
  3. III. Предоставление транспортных средств и контейнеров, предъявление и прием груза для перевозки, погрузка грузов в транспортные средства и контейнеры
  4. Mining Education in Great Britain
  5. Mining Schools
  6. Mining Thick Seams
  7. Ore Mining

Средства DM подразумевают извлечение («раскопку», «добычу») данных и направлены на выявление отношений между информацией, хранящейся в цифровых базах данных предприятия, которые аналитик может использовать для построения моделей, позволяющих количественно оценить степень влияния интересующих его факторов. Кроме этого, такие средства могут быть полезны для построения гипотез о возможном характере отношений информации в цифровых базах данных предприятия.


8.3. Аналитическая обработка данных 219

Технология добычи текстовых данных (Text Mining — ТМ) представляет собой набор инструментов, позволяющий анализировать большие наборы информации в поисках тенденций, шаблонов и взаимосвязей, способные помочь в принятии стратегических решений.

Технология Image Mining (IM), содержит средства для распознавания и классификации различных визуальных образов, хранящихся в базах данных предприятия или полученных в результате оперативного поиска из внешних информационных источников.

Для решения проблем по обработке и хранению всех данных используют следующие подходы:

1) создание нескольких систем резервного копирования или одной си
стемы распределенного документооборота, которые позволяют сохранять
данные, но обладают медленным доступом к сохраненной информации по
запросу пользователя;

2) построение интернет-систем, обладающих высокой гибкостью, но
не приспособленных для реализации поиска и хранения текстовых до
кументов;

3) внедрение интернет-порталов, которые хорошо ориентированны
на запросы пользователей, но не обладают описательной информацией
относительно загружаемых в них текстовых данных.

Системы обработки текстовой информации, свободные от перечисленных выше проблем, можно разделить на две категории: системы лингвистического анализа и системы анализа текстовых данных.

Основными элементами технологии Text Mining являются:

• суммаризация (summarization);

• тематический поиск (feature extraction);

• кластеризация (clustering);

• классификация (classification);

• ответ на запросы (question answering);

• тематическое индексирование (thematic indexing);

• поиск по ключевым словам (keyword searching);

• создание и поддержка офтаксономии (oftaxonomies) и тезаурусов
(thesauri).

К программным продуктам, реализующим технологию Text Mining, относятся:

IBM Intelligent Miner for Text — набор отдельных утилит, запускаемых из командной строки, или скиптов, независимых друг от друга (основной упор делается на механизмы добычи данных — information retrieval);

Oracle InterMedia Text — набор, интегрированный в СУБД, позволяющий наиболее эффективно работать с запросами пользователей (позволяет работать с современными реляционными СУБД в контексте сложного многоцелевого поиска и анализа текстовых данных);


220 Глава 8. Компьютерные технологии интеллектуальной поддержки...

Megaputer Text Analyst — набор встраиваемых в программу СОМ -объектов, предназначенных для решения задач Text Mining.


Дата добавления: 2015-10-16; просмотров: 107 | Нарушение авторских прав


Читайте в этой же книге: Методические принципы совершенствования управления предприятием на основе информационных технологий | Разработка информационного обеспечения систем управления предприятием | Глава 6 | Организация электронной системы управления документооборотом | Общие свойства КИС | Типовой состав функциональных модулей КИС | Корпоративная сеть Интранет | Два типа систем отработки данных в КИС | Базы данных | Хранилища данных |
<== предыдущая страница | следующая страница ==>
Средства On-Line Analytical Processing (OLAP)| Интеллектуальные информационные технологии

mybiblioteka.su - 2015-2024 год. (0.009 сек.)