Читайте также:
|
|
Пусть исследование заранее не известно на какое число классов подразделяются многомерные наблюдения X1, X2,..., Xn. В этой ситуации функционалы качества разбиения Q (S) выбираются в виде алгебраической комбинации (суммы, произведения и т д.) двух функционалов Y1 (S) и Y2 (S), один из которых Y1 (S) является убывающей (не возрастающей) функцией числа классов К и характеризует, вообще говоря, внутриклассовой разброс наблюдений, а второй Y2 (S) является возрастающей (неубывающей) функцией числа классов К. Интерпретация функционала Y2 (S) может быть различной. Идея рассмотрения двух функционалов реализуется, например, в следующем методе, основанном на методе, предложенный А.Н.Колмогоровым. Эта схема опирается на понятие ²меры концентрации Zr(S) точек ², соответствующую разбиению S=(S1,..,Sk), и на
понятии средней меры внутриклассового расстояния Y (k)r(S).
(5.1)
V (Xi)- число элементов в кластере, содержащем Xi
r – числовой параметр, выбираемый исследователем.
Если XiÎSj, то V(Xi)=nj. (5.2)
В частности, можно показать, что при r =-1 из (5.1)Þ Z-1(S)=1/k, где k- число кластеров.
Тогда
Далее при r =0, для Z0 (S)=lim Zr (S) при r®0, имеем
- информационная мера концентрации.
Это следует из п.4.2, где указано, что
Поэтому в силу (5.2)
Аналогично, можно показать, что в силу п.4.2 и (5.2)
Отметим, что при объединении двух кластеров, т е. при переходе от разбиения S=S1Ú¼ÚSmÚSqÚ¼ÚSk (к- слогаемых) к разбиению S¢=S1Ú¼Ú(SmÚSq)Ú¼ÚSk (к-1 слогаемых), объединение кластеров Sm и Sq дает прирост меры концентрации Z1(S).
Замечание: "r мера концентрации Zr(S) задаваемая (5.1) имеет минимальное значение, равное 1/n, при разбиении множества X на n одноэлементных кластеров.
Средняя мера внутриклассного рассеяния также основывается на понятии степенного среднего
(5.3)
– обобщенная мера рассеяния, характеризующая класс Sl, параметр r выбирает исследователь.
Можно показать, что
S (Xi)- кластер, содержащий Xi
Экстремальная задача формулируется следующим образом: требуется найти такое разбиение S*, для которого достигала бы экстремума какая-нибудь алгебраическая комбинация Y1 (S) и Y2 (S).
Например:
a,b- некоторые константы (например a=b=1).
-задаётся формулами. (5.3) и (5.1) соответственно.
Подведя итог изложенному выше, отметим, что выбор того или иного функционала качества осуществляется весьма произвольно и опирается на эмпирические и прогрессивно-интуитивные соображения, а не на какую-либо формализованную систему.
Дата добавления: 2015-07-24; просмотров: 137 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Методы многомерных классификаций. | | | Функция потерь и вероятность неправильной классификации |