Читайте также:
|
|
Классифицируемые р-мерные наблюдения Х1,…..,Хn будем интерпретировать как выборку из объединенной ГС, описываемой смесью k классов (унимодальная генеральная совокупность плотностей или дискретных распределений)
k- задано,
pj априорная вероятность появления в выборке элементов j-ой генеральной совокупности
Введем понятия процедуры классификации (решающую правила дискриминантной функции d(Х).
Функция p-переменных d(Х) может принимать только натуральные значения 1,2,…,k. Те значения Хs, s=1,n для которой d(Х1)=j мы будем относить к j-классу Sj. Таким образом, функция d(Х) задает разбиение р-мерного признакового пространства П(p) на k непересекаемых областей.
где
таким образом, если Xs принадлежит Vj то относим его к j-ому классу.
Процедура классификации (дискриминантная функция d(Х) или разбиение V) называется байесовской (оптимальной), если она сопровождается минимальными потерями (7.2). Среди всех процедур классификации можно записать (7.2) как
С =С(d). Мы выбираем d таким, чтобы С(d) были минимальными:
Это означает, что наблюдения Хs, s = 1,n будет отнесено к классу j, тогда и только тогда когда средняя потеря от него отнесения именно к этому классу Sj.
Окажется минимальными по сравнению с аналогичными потерями, связанными с отнесением этого наблюдения в другой класс.
Действительно, из (7.2) можем получить что оптимальная процедура δопт или оптимальное разбиение определяется следующим образом:
(7.4)
если с(j/i)=c0=const, i≠j, то из (7.4):
(7.5)
из этого следует (7.6)
Соотношение (7.4), (7.5), (7.6), дают лишь теоретическое оптимальное правило. Для его реализации необходимо знать априорные вероятности p1,…,pk и плотности (полигоны) f1(u),…,fk(u). На практике эти величины заменяются соответствующими оценками, построенными по имеющейся у исследователя обучающим выборкам.
Пусть имеются обучающие выборки, т.е. наблюдения про которые известно, что
разбиваем X1,….,Xn соответственно О1,…,Оn на k классов
nоб=n1+…+nk тогда
Иногда вероятности рj определяются априорно самой содержательной сутью задачей. Задача оценки плотностей f1(Х),…,fk(Х) задача разделяется на два случая:
1) Параметрический дискриминантный анализ fj(X)=f(X,θj), j=1,k
θj – параметр (возможно многомерный)
θj оценивается по соответствующей выборке
2)Непараметрический дискриминантный анализ. Не предусматривает задание общего вида функций.(Использует оценки гистограммного типа)
Дата добавления: 2015-07-24; просмотров: 99 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Функция потерь и вероятность неправильной классификации | | | Методы снижения размерности |