Читайте также:
|
|
Определим величину X1:
УК |
ЯТСОр γ |
X2 = £<«£"
где и™" — фактическая (эмпирическая) частота в клетке табл., отвечающей ее г-й строке и у'-му столбцу; п]'0" — теор. частота, отвечающая той же клетке. Теор. частота отвечает ситуации, когда признаки независимы, и находится по формуле
"Г = ">• ■ "ι I ">
где и — объем выборки, щ. _ маргинальная сумма для ί-й строки, а щ _ маргинальная сумма для_/-го столбца табл. сопряженности. Известно, что если рассматриваемые признаки в генеральной совокупности независимы, то распределение вероятностей значений X (вычисляемых для разл. выборок одного и того же объема) при опред. условиях (если п™" > 5) очень близко к хорошо изученному распределению χ2 с df - (г - 1)(с -1) степенями свободы, для к-рого рассчитаны соотв. табл. вероятностей. Зададимся неким уровнем значимости σ (обычно принимается, что он равен 0,05 или 0,01) и найдем такое табл. значение Jfraeii, Для к-рого Ρ (X2 > Хп^л), вычислим значение X2 для нашей единственной выборки. Если Xl > А"тайл, то гипотеза о независимости отвергается (считаем, связь между переменными имеется, поскольку произошло событие, вероятность к-рого при справедливости гипотезы была очень мала). Если Х\ < Xis(l„, то гипотеза принимается (считаем, что связи нет, поскольку у нас нет оснований ее отвергнуть).
Величина X2 не очень подходит в кач-ве меры связи, поскольку верхняя ее граница стремится к бесконечности при росте объема выборки. Известно мн. мер связи, использующих тот же критерий, но лишенных указанного недостатка. Бее они явл. нормировкой величины X2 и базируются на использовании отношения Хг/п. Назовем нек-рые из них.
Показатель сре дней квадратичной сопряженности φ = ^Х2/п.
Коэффициент сопряженности Пирсона Ρ = (Х2/п + Χ2Ϋ:. Оба коэффициента обладают тем недостатком, что их макс, значение зависит от числа строк и столбцов табл. сопряженности. Чтобы исправить этот недостаток, было предложено еще неск. коэффициентов. Коэффициент Чупрова:
Τ=(Χ1/(η(κ-1)(€-\γψ.
Но и этот коэффициент свободен от указанного недостатка только в том случае, если г- с. Коэффициент Крамера:
С=(ДГ1/(в-шш(г-1><!-1)))-4.
2. Коэффициенты, осн. на прогнозных моделях, показывающие, насколько прогноз значений одного признака (У) улучшается при получении информации о значении др. (.V). Такие коэффициенты могут быть разными в зависимости от способа формализации понятия прогноза. Коэффициент Гуттмана:
λγ,χ = £ (max щ - max nt) / (η - max n,t)
говорит об уменьшении (при переходе от безусловного распределения Υ к условным распределениям) ошибки осуществляемого с вероятностью, равной 1, предсказания о том, что взятый из рассматриваемого распределения объект обладает модальным значением Υ, т.е. тем, к-рому соответствует макс, частота (модальный прогноз). Недостатком коэффициента Гуттмана явл. то, что равенство его нулю не говорит о стат. независимости признаков, а означает, что все модальные значения частот по всем строкам табл. сосредоточились в одном столбце.
Коэффициент Гудмена—Краскала:
n(rf - Σ η2)
говорит о сходном уменьшении прогноза. Но последний понимается по-другому: вероятность прогнозирования тех или иных значений пропорциональна наблюдаемым частотам рассматриваемых распределений (пропорциональный прогноз).
Дата добавления: 2015-07-19; просмотров: 46 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
КОЭФФИЦИЕНТ ПАРНОЙ СВЯЗИ НОМИНАЛЬНЫХ ПРИЗНАКОВ | | | КРЕСТЬЯНСТВО |