Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Функционалы качества разбиения при неизвестном числе классов

Читайте также:
  1. IV. 15.3. Волевые качества личности и их формирование
  2. IV. Сроки приема заявлений и документов, вступительных экзаменов, конкурсного отбора и зачисления на обучение
  3. Quot;Орудие классового господства
  4. V. ПОКАЗАТЕЛИ ОРГАНИЗАЦИИ И КАЧЕСТВА ОБСЛУЖИВАНИЯ БОЛЬНЫХ В ХИРУРГИЧЕСКИХ ОТДЕЛЕНИЯХ
  5. VIII. Зачисление абитуриентов на основе полного общего среднего образования, которые достигли выдающихся успехов в изучении профильных предметов
  6. X. ОБСЛЕДОВАНИЕ ПОМЕТОВ И КОНТРОЛЬ КАЧЕСТВА ИХ ВЫРАЩИВАНИЯ
  7. XI. ОБСЛЕДОВАНИЕ ПОМЕТОВ И КОНТРОЛЬ КАЧЕСТВА ИХ ВЫРАЩИВАНИЯ

Пусть исследование заранее не известно на какое число классов подразделяются многомерные наблюдения X1, X2,..., Xn. В этой ситуации функционалы качества разбиения Q (S) выбираются в виде алгебраической комбинации (суммы, произведения и т д.) двух функционалов Y1 (S) и Y2 (S), один из которых Y1 (S) является убывающей (не возрастающей) функцией числа классов К и характеризует, вообще говоря, внутриклассовой разброс наблюдений, а второй Y2 (S) является возрастающей (неубывающей) функцией числа классов К. Интерпретация функционала Y2 (S) может быть различной. Идея рассмотрения двух функционалов реализуется, например, в следующем методе, основанном на методе, предложенный А.Н.Колмогоровым. Эта схема опирается на понятие ²меры концентрации Zr(S) точек ², соответствующую разбиению S=(S1,..,Sk), и на


понятии средней меры внутриклассового расстояния Y (k)r(S).

 

 

(5.1)

V (Xi)- число элементов в кластере, содержащем Xi

r – числовой параметр, выбираемый исследователем.

 

Если XiÎSj, то V(Xi)=nj. (5.2)

В частности, можно показать, что при r =-1 из (5.1)Þ Z-1(S)=1/k, где k- число кластеров.

 
 

Действительно,

 

Тогда

 
 

 
 

Далее при r =0, для Z0 (S)=lim Zr (S) при r®0, имеем

 

- информационная мера концентрации.

 

Это следует из п.4.2, где указано, что



Поэтому в силу (5.2)


 
 

Аналогично, можно показать, что в силу п.4.2 и (5.2)

 

Отметим, что при объединении двух кластеров, т е. при переходе от разбиения S=S1Ú¼ÚSmÚSqÚ¼ÚSk (к- слогаемых) к разбиению S¢=S1Ú¼Ú(SmÚSq)Ú¼ÚSk (к-1 слогаемых), объединение кластеров Sm и Sq дает прирост меры концентрации Z1(S).

 


 

Замечание: "r мера концентрации Zr(S) задаваемая (5.1) имеет минимальное значение, равное 1/n, при разбиении множества X на n одноэлементных кластеров.

Средняя мера внутриклассного рассеяния также основывается на понятии степенного среднего

 



(5.3)

– обобщенная мера рассеяния, характеризующая класс Sl, параметр r выбирает исследователь.

Можно показать, что

 

S (Xi)- кластер, содержащий Xi

 


Экстремальная задача формулируется следующим образом: требуется найти такое разбиение S*, для которого достигала бы экстремума какая-нибудь алгебраическая комбинация Y1 (S) и Y2 (S).

Например:

 


a,b- некоторые константы (например a=b=1).

 

-задаётся формулами. (5.3) и (5.1) соответственно.

Подведя итог изложенному выше, отметим, что выбор того или иного функционала качества осуществляется весьма произвольно и опирается на эмпирические и прогрессивно-интуитивные соображения, а не на какую-либо формализованную систему.


Дата добавления: 2015-07-24; просмотров: 137 | Нарушение авторских прав


Читайте в этой же книге: Построение оптимальных процедур классификации | Методы снижения размерности | Метод главных компонент | Вычисление главных компонент. | У линейного преобразования могут отсутствовать собственные векторы | Основные числовые характеристики главных компонент и критерий информативности метода главных компонент | Сущность модели факторного анализа | Общий вид линейной модели. Ее связь с главными компонентами |
<== предыдущая страница | следующая страница ==>
Методы многомерных классификаций.| Функция потерь и вероятность неправильной классификации

mybiblioteka.su - 2015-2025 год. (0.009 сек.)