Читайте также:
|
|
Огляд
Весь сенс алгоритму (та інтелектуального аналізу даних, в цілому) вилучення корисної інформації з великих обсягів даних. Наприклад, інформація про те, що клієнт, який купляє клавіатуру також має тенденцію до купівлі мишки в той же час отримуютчи з асоціативних правил нижче:
Підтримка: Відсоток завдань відповідних операцій даних, для яких модель вірна.
Підтримка (Клавіатура -> Мишка) =
Довіри: міра впевненості та надійності, пов'язана з кожною виявленою картинкою.
Впевненість (Клавіатура -> Мишка) =
Алгоритм прагне знайти правила, які задовольняють як мінімальний поріг підтримки і мінімальний поріг довіри (строгі правила).
Item(Товар): стаття в кошику.
Itemset(Група товарів): група товарів, придбаних разом в одній транзакції.
Як працює Apriori
1.Шукає всі набори, які часто зустрічаються:
Отримати ці набори:
Предмети виникнення яких у базі даних більше або дорівнює пороговому min.support.
Отримати всі набори, які часто зустрічаються:
Генерація кандидатів від частих предметів.
Підсумок результатів, щоб знайти набори, які часто зустрічаються.
2.Генерують сильні асоціативні правила з часто зустрічаються наборів
Правила, які задовольняють min.support і min.confidence поріг.
Дизайн високого рівня
Початок |
Отримати всі набори, які часто зустрічаються |
Генерація кандидатських наборів |
Отримати всі набори, які часто зустрічаються |
Згенерувати Set = NULL |
Згенерувати асоціативне правило |
Ні |
Так |
Приклад
База даних складається з п'яти операцій. Нехай min sup = 50% and min con f = 80%.
База Даних
Т-ID | Продукт |
ACD | |
BCE | |
ABCE | |
BE |
Рішення
Крок 1:Знайти всі набори, які часто зустрічаються
1-Група продуктів | Підтримка |
{A} | |
{B} | |
{C} | |
{E} |
База Даних
Т-ID | Продукт | |
ACD | ||
BCE | ||
| ||
BE |
Зєднання |
2-Група продуктів | Підтримка |
{A C} | |
{B C} | |
{B E} | |
{C E} |
Продукт | Підтримка |
{A B} | |
{A C} | |
{A E} | |
{B C} | |
{B E} | |
{C E} |
Зєднання |
Витягти |
L2 |
С2 |
Група продуктів |
{B C E} |
3-Група продуктів | Підтримка |
{B C E} |
L3\3 |
Витягти |
С3№3 |
Всі набори, які часто зустрічаються
{ A } { B } { C } { E } { A C } { B C } { C E } { B C E } |
Крок 2: Створення сильних асоціативних правил з наборами, які часто зустрічаються
Правило | Підтримка | Підтримка | Впевненість |
{A}à{C} | |||
{B}à{C} | 66.66666667 | ||
{B}à{E} | |||
{C}à{E} | 66.66666667 | ||
{B}à{C E} | 66.66666667 | ||
{C}à{B E} | 66.66666667 | ||
{E}à{B C} | 66.66666667 | ||
{C}à{A} | 66.66666667 | ||
{C}à{B} | |||
{E}à{B} | 66.66666667 | ||
{E}à{C} | |||
{}à{} | 66.66666667 | ||
{}à{} | |||
Решітка
Закрита Група: підтримка всіх батьків не рівні підтримкою набору елементів.
Максимальний набір елементів: всі батьки, яких набір елементів повинен бути рідкісним.
Майте на увазі:
Рідкісні |
Закриті |
Макс. |
Дата добавления: 2015-10-30; просмотров: 134 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Алгоритм Apriori | | | Брюс Кулик комментирует Alive III |