Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Knowledgestudio

KnowledgeSTUDIO є новою версією дейтамайнінгу кор­порації з профамного забезпечення «ANGOSS» (http://www.angoss. com/). Система впроваджує найрозвинутіші методи ДМ у корпора­тивне середовище з тим, щоб підприємства могли досягати мак-


симальної вигоди від своїх інвестицій у дані. Вона забезпечує ви­соку продуктивність користувачів щодо розв'язання ділових про­блем без суттєвих зусиль на навчання, як це, наприклад, потрібно для освоєння статистичного програмного забезпечення. Крім то­го, це також потужний інструментальний засіб для аналітиків.

KnowledgeSTUDIO сумісна з основними статистичними паке­тами програм. Наприклад, ця система не тільки читає і записує файли даних, але також і генерує коди статистичного пакета SAS. Із такими властивостями стосовно статистики моделюваль-ники можуть швидко й легко адаптувати успадковані статистичні аналізи.

Система KnowledgeSTUDIO тісно інтегрується зі сховищами і вітринами даних. У такому разі дані можуть добуватися в ре­жимі In-place Mining, тобто коли вони залишаються у вітрині або сховищі даних «на місці», автоматично використовуючи для цьо­го «хвилі запитів», тобто серію тверджень SQL. Завдяки тому, що дані отримуються безпосередньо від джерела, дублювання не по­требується. Альтернативно, з метою оптимізації ДМ дані можна вибирати з їх форматом зберігання, а потім дейтамайнінг викону­ється сервером високої продуктивності, який орієнтований на формат файлів KnowledgeSTUDIO.

Технологія ДМ ANGOSS ActiveX інтегрує моделі для прогно­зування з Web-базовими додатками і бізнесовими клієнт/сер-верними додатками. Дослідження даних за допомогою викорис­тання дерев рішень і графіки може бути розширене через Інтранет і Інтернет. Можна також застосовувати Java-розв'язування для розгортання моделей. Для виконання алгоритмів обчислення в проекті KnowledgeSTUDIO передбачено використання або відда­леного «обчислювального» сервера, або локальної робочої станції.

У KnowledgeSTUDIO реалізована велика кількість методів дейтамайнінгу. Пропонується п'ять алгоритмів дерев рішень, три алгоритми нейромереж і алгоритм кластеризації «неконтрольова-ного навчання» (unsupervised). Має місце повне інтегрування з Додатками і бізнесовими процесами. Можна створювати нові до­датки або вставляти дейтамайнінг у наявні додатки. Програмова­ний комплекс KnowledgeSTUDIOSoftware (SDK) надає можли­вість розроблення додатків, наприклад створення моделей для прогнозування, з можливим використанням Visual Basic, Power­Builder, Delphi, C-H-, або Java. Формування, випробування і оціню­вання нових моделей може бути також автоматизованим. Know­ledgeSTUDIO забезпечує різні шляхи, щоб візуально виразити і до­слідити у великих базах даних зразки прихованих закономірностей.


9.3.3. Характеристика процесів і активностей дейтамайнінгу. Процеси дейтамайнінгу

Традиційно мали місце два типи статистичних аналі­зів: підтверджуючий (confirmatory analysis) і дослідницький аналіз (exploratory analysis). У підтверджуючому аналізі будь-хто має конкретну гіпотезу і в результаті аналізу або підтвер­джує, або спростовує її. Однак недоліком підтверджуючого ана­лізу є недостатня кількість гіпотез у аналітика. За дослідницько­го аналізу виявляють, підтверджуються чи спростовуються підхожі гіпотези. Тут система, а не користувач, бере ініціативу за аналізу даних.

Здебільшого термін «дейтамайнінг» використовується для описання автоматизованого процесу аналізу даних, в якому сис­тема сама бере ініціативу щодо генерування взірців, тобто дейта­майнінг належить до інструментальних засобів дослідницького аналізу.


З погляду орієнтації на процес є три типи процесів дейтамайнін-РУ (рис. 9.7): відкриття (добування) (discovery,); моделювання пе­редбачень (predictive modeling,); аналіз аномалій (forensic analysis).

Відкриття є процесом перегляду бази даних для знахо­дження невидимих взірців (pattern) без наперед визначеної ідеї або гіпотези взагалі про те, що вони можуть бути. Інакше ка­жучи, програма бере ініціативу без попередніх міркувань сто­совно того, що взірці (шаблони), які цікавлять користувачів, мають насправді місце і можуть подаватися у формі доречних запитів. У великих базах даних є так багато інформаційних ас­пектів, про які користувач практично може ніколи й не думати і не робити правильних запитів стосовно відповідних їм взір­ців. Ключовим питанням тут може бути кількість взірців, які можуть бути виражені й відкриті та якість інформації, що до­бувається. Саме цим і визначається потужність засобів від­криття (discovery) інформації.

У разі моделювання передбачень добуваються взірці з бази даних для їх використання, щоб передбачити майбутнє. Моделю­вання передбачень дає змогу користувачеві створювати записи з деякими невідомими дослідницькими значеннями, і система ви­значає ці невідомі значення, які ґрунтуються на попередніх шаб­лонах, що відкриваються з бази даних. У той час як відкриття знаходить взірці в даних, за прогнозуючого моделювання взірці застосовуються для того, щоб підібрати значення для нових еле­ментів даних, і в цьому полягає істотна відмінність між цими ви­дами процесів дейтамайнінгу.

Аналіз аномалій (forensic analysis) є процесом застосування вибраних взірців (шаблонів) для виявлення аномалій або незви­чайних елементів даних. Щоб виокремити незвичайні елементи, спершу потрібно знайти те, що є нормою, а вже потім виявляти за Допомогою заданих порогових величин ті елементи, які відхиля­ються від звичайних. Зокрема, сюди відноситься виявлення деві-тації, тобто відхилення від правильного курсу.

Кожний із цих процесів може бути далі охарактеризований виділенням відповідних прийомів. Наприклад, є кілька методів відкриття взірців: правило «ЯКЩО..., ТО», асоціації, афін-ність (суміжність) тощо. У той час, коли правило «ЯКЩО..., ТО» для людини звичне, то асоціативні правила є новими. Во­ни стосуються групування елементів даних (наприклад, коли хтось купує один продукт, то за звичкою чи збігом обставин він може купити інший продукт у той самий час; такий процес, зазвичай, пов'язаний з аналізом ринкового кошика покупця).


Потужність системи відкриття вимірюється кількістю типів і загальністю взірців, які можна знайти і виразити придатною для використання мовою.


Дата добавления: 2015-08-13; просмотров: 97 | Нарушение авторских прав


Читайте в этой же книге: Підходи до аналізу вимог | Залучення користувачів | Управління змінами | Загальна характеристика експертних систем | Компоненти технології експертних систем, які застосовуються в орієнтованих на знання СППР | Пряме доведення | МАТРИЦЯ ПРАВИЛ ОРІЄНТОВАНОЇ НА ПРАВИЛА СППР | ПОДІБНІСТЬ МОДУЛІВ СППР І ЕС | Фактори успіху для здійснення інтелектуальної підтримки управління | Машини правил |
<== предыдущая страница | следующая страница ==>
PolyAnalyst| Користувачі і дії дейтамайнінгу

mybiblioteka.su - 2015-2025 год. (0.007 сек.)