Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Визначення фактів і вимірів

Читайте также:
  1. A. Визначення свідомості.
  2. I. Визначення
  3. Аналіз існуючих виробів та визначення завдань проекту
  4. Визначення
  5. Визначення
  6. Визначення
  7. Визначення

Для проектування сховищ і вітрин даних потрібно ви­значити таблицю фактів і перелік вимірів, установити, факти яко­го типу найефективніші і чим їх відрізнити від вимірів. Факти — це елементи, які можуть бути виміряні й проаналізовані. Кращи­ми фактами вважаються числові, адитивні дані, що можуть бути подані послідовною низкою значень.

Числові факти — це реквізити основи, які відображають кіль­кісні величини. Над числовими фактами допускається виконання різних математичних операцій; їх легко вимірювати. Характер­ною ознакою таких фактів є те, що вони часто змінюються. Змін­ність конкретних значень фактів є дуже важливою їх ознакою з погляду аналізу, оскільки досліджувати величини, що не зміню­ються в часі, немає сенсу.

Адитивний факт може підсумовуватися за всіма вимірами. Наприклад, кількість проданих виробів є адитивним фактом, оскільки шляхом підсумовування можна визначити, скільки виробів продано на минулому тижні (за часом); скільки виро­бів продано у регіонах; скільки продано кожному споживачу. В сховищах даних надається перевага адитивним фактам, тому Що, підсумовуючи їх, можна отримати компактні ряди резуль­татів.

Деякі факти є напівадитивними (semiadditive). їх можна корек­тно підсумовувати за певними вимірами, але не за всіма. Напри­клад, доцільно підсумовувати складські запаси за видами продук­ту або за регіонами, але не за часом. Напівадитивні факти не має сенсу підсумовувати за окремими вимірами, але їх можна оціню-вати інакше. Наприклад, має значення середня величина складсь­ких запасів у часі, а також максимальний і мінімальний рівні за­пасів та деякі інші статистичні показники.

І нарешті, мають місце неадитивні (nonadditive) факти. Ці факти неможливо підсумовувати за жодним виміром. Прикла-


дом числових неадитивних фактів є табельні номери співробіт­ників. Неадитивні факти не можна підсумовувати, але їх мож­на полічити, тому вони вимірні. Неадитивні факти частіше групуються з вимірами. Виміри — це описові, якісні атрибути, що служать умовами вибирання даних у запитах, або є заголов­ками рядів у звітах. До таблиць вимірів належать таблиці, що містять умовно-постійну інформацію. Тобто дані, що характе­ризують виміри, як правило, текстові, відносно статичні і не­адитивні.

Не завжди легко можна відрізнити факти від вимірів. Іноді в таблиці вимірів можуть міститися числові, адитивні атрибути, такі як ціна одиниці товару. А іноді статичний і неадитивний ат­рибут доцільно розмістити в таблиці фактів. Все залежить від призначення конкретної вітрини. Наприклад, стать співробітни­ка — це текстовий, статичний і неадитивний елемент. Але якидо проектується вітрина, присвячена аналізу трудових ресурсів, і аналітики часто задають запитання типу: «яке співвідношення між кількістю співробітників чоловічої і жіночої статі, що зай­мають керівні посади?», то ознаку статі краще розташувати в таблиці фактів.

Визначення ступеня деталізації даних є наступним кро­ком проектування. Найдрібніші неподільні елементи — нижчій рівень деталізації даних, що зберігаються у вітрині. Дані мо­жуть підсумовуватися на різних рівнях відповідно до вибращої єрархії вимірів. Щоденні обсяги продажу можна підсумовува­ти за тиждень, місяць або рік; продані товари можна підсумю-вувати за кожним товаром, зокрема, за їх видами чи товарними групами. Іноді застосовують кілька єрархічних систем. Мага­зини можна групувати за поштовими регіонами з однаковими тарифами на пересилання або за територіями з аналогічною структурою продажу для проведення маркетингових дослі­джень.

Користувачі вітрин можуть працювати з різними рівнями да­них, що підсумовуються. Питання полягає в тому, яка ступінь де­талізації потрібна користувачу? Завжди є вірогідність того, іщо якийсь користувач у своєму пошуку побажає дійти до базової транзакції, і на основі цього можна дійти висновку, що за проек­тування вітрини необхідно прагнути до забезпечення найнижчої го рівня деталізування. Але, зазвичай, у цьому немає необхідності, враховуючи те, що вітрини призначені для проведення бізнеїс-аналізу, метою якого є виявлення тенденцій, а не вивчення кон­кретних детальних фактів. Проте ступінь деталізації фактів, іщо


зберігаються у вітрині, передусім, визначається метою її ство­рення. Так, наприклад, керівництву роздрібного магазину, бажа­ючому відстежити зміни складських запасів, немає потреби збе­рігати у вітрині дані про кожну торговельну операцію; обсяги продажу можна підсумовувати на рівні товарів. Але якщо необ­хідно проаналізувати поведінку споживачів, то буде потрібна ін­формація про окремі торговельні операції для їх аналізу і ви­вчення уподобань споживачів.

Визначення ступеня деталізації та агрегації даних — це дуже важливий момент проектування, тому що він впливає на розмір фізичної моделі. Іноді вибір ступеня деталізаціїї визначається ін­тенсивністю змін: для відстеження заробітної плати службовців протягом тривалого періоду не потрібно мати її величини за день або тиждень, якщо, наприклад, перегляд оплат праці співробіт­ників виконується раз на рік.

Установивши ступінь деталізації, можна визначити атрибути таблиці вимірювань. У вітрині фактичних даних одним із вимірів є час, і в таблицю вимірів необхідно помістити інформацію про одиниці вимірювання часу, відповідні для таблиць фактів даної вітрини. Якщо для аналізу потрібні підсумкові значення за місяць або рік, то тоді для організації таблиці вимірювань будуть потріб­ні лише такі одиниці часу, як рік і місяць. Фінансові вітрини ба­жано доповнити таким виміром як квартал.

10.3. Система аналітичного інтерактивного оброблення (OLAP)

10.3.1. Зародження і розвиток OLAP-систем

OLAP (абревіатура від On-line Analytical Processing

інтерактивне аналітичне оброблення) фактично означає не окремі конкретні програмні продукти, а технологію багатови­мірного аналізу даних, основу якої започаткувала опублікована 1993 року праця Е. Ф. Кода (Е. F. Codd) «OLAP для користува-чів-аналітиків: яким воно має бути», у котрій він запропонував 12 правил, які виражали концепцію оперативного аналітичного оброблення даних і фактично послужили стандартом інстру­ментальних засобів оперативного аналітичного оброблення (табл. 10.5.)


Таблиця 10.5


Дата добавления: 2015-08-13; просмотров: 88 | Нарушение авторских прав


Читайте в этой же книге: Користувачі і дії дейтамайнінгу | Біологічні нейрони і нейромережі | Архітектура нейромереж | Навчання та використання нейромереж | ОСНОВНІ ВІДМІННОСТІ СИСТЕМ ОБРОБЛЕННЯ ТРАНЗАКЦІЙ (OLTP) І АНАЛІТИЧНИХ СИСТЕМ | Узагальнена схема архітектури сховища даних | Продукти інституту SAS | Висновок | Багатовимірна модель | Підходи до проектування сховищ даних |
<== предыдущая страница | следующая страница ==>
Основні завдання та способи проектування СД| ПРАВИЛА КОДА ДЛЯ OLAP

mybiblioteka.su - 2015-2025 год. (0.007 сек.)