|
Коэффициент детерминации ()— это квадрат множественного коэффициента корреляции. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных.
Формула для вычисления коэффициента детерминации:
где — выборочные данные, а
— соответствующие им значения модели.
Коэффициент принимает значения из интервала . Чем ближе значение к 1 тем cвязь сильнее
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть .
Функциональная связь возникает при значении равном 1, а отсутствие связи — 0.
Коэффициент корреляции - это статистический показатель, показывающий, насколько связаны между собой колебания значений двух других показателей.
Корреляция - это степень зависимости между двумя переменными. Линейная корреляция между двумя переменными х и у определяется знаком и величиной. Между двумя переменными существует положительная корреляция, если данная сумма положительна, и отрицательная корреляция, если сумма отрицательна. Степень корреляции измеряется коэффициентом корреляции r, который меняется от +1 до –1, достигая значения +1, когда х и у полностью положительно коррелируются между собой, и –1, когда х и у полностью отрицательно коррелируются между собой; если r = 0, х и у являются независимыми переменными. r не зависит от единиц измерения х и у.
Коэффициент корреляции
• Принимает значения в диапазоне от -1 до +1
• Безразмерная величина
• Показывает силу связи между признаками
• Знак коэффициента говорит о направлении связи
Одна из характеристик связи между зависимой у и независимой переменной х. К. р. показывает, на сколько единиц увеличивается значение, принимаемое у, если переменная х изменится на единицу своего изменения. Геометрически К. р. является угловым коэффициентом наклона прямой линии у.
Коэффициент регрессии
• Может принимать любые значения
• Привязан к единицам измерения обоих признаков
• Показывает структуру связи между признаками
• Знак коэффициента говорит о направлении связи
В общем случае коэффициент регрессии k показывает, как в среднем изменится результативный признак (Y), если факторный признак (X) увеличится на единицу.
Коэффициент регрессии
В качестве нулевой гипотезы в тесте Фишера
Н0 выдвигается предположение о том, что линейной зависимости между x и y не существует.
Если нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. тестовая статистика которого при выполнении нулевой гипотезы имеет распределение Фишера (F-распределение).
1. Люди составляют выборку из более широкой (генеральной) совокупности. Нулевая гипотеза относится к этой совокупности, а не к выборке. Применительно к генеральной совокупности данная гипотеза о полном отсутствии различий является либо истинной, либо ложной.
2. Различие значимо, если вероятность его получения в выборке при условии истинности нулевой гипотезы достаточно мала.
3. Исследователь решает, будет ли результат достаточно значимым, рассматривая риск ошибки двоякого рода. Существует 4 возможных варианта такого решения: а) правильно принимается истинная гипотеза; б) ошибочно отклоняется истинная гипотеза (ошибка I рода); в) ошибочно принимается ложная гипотеза (ошибка II рода); г) правильно отклоняется ложная гипотеза. При принятии решения исследователю следует учитывать относительную важность двух этих ошибок и соотв. им вероятности, а не бездумно принимать ошибку I рода равной 0,05 или менее как значимую.
4. Нулевая гипотеза всегда яв-ся ненаправленной, тогда как исходная гипотеза может быть как ненаправленной, так и направленной. При этих условиях (направленная или ненаправленная исходная гипотеза) могут существовать нек-рые разногласия по поводу определения уровней значимости.
t-критерий Стьюдента — общее название для статистических тестов, в которых статистика критерия имеет распределение Стьюдента. Наиболее часто t-критерии применяются для проверки равенства средних значений в двух выборках. Нулевая гипотеза предполагает, что средние равны (отрицание этого предположения называют гипотезой сдвига).
Все разновидности критерия Стьюдента являются параметрическими и основаны на дополнительном предположении о нормальности выборки данных. Поэтому перед применением критерия Стьюдента рекомендуется выполнить проверку нормальности. Если гипотеза нормальности отвергается, можно проверить другие распределения, если и они не подходят, то следует воспользоваться непараметрическими статистическими тестами.
При проверке значимости коэффициента множественной корреляции критическое значение F-критерия определяется как Fкрит(a;k1;k2), где а – уровень значимости, k1=l–1 и k2=n–l – число степеней свободы, n – объём выборочной совокупности, l – число оцениваемых по выборке параметров.
При проверке основной гипотезы вида Н0:R(y,xi наблюдаемое значение F-критерия Фишера-Снедекора рассчитывается по формуле:
где R2(y,xi) – коэффициент множественный детерминации.
При проверке основной гипотезы возможны следующие ситуации.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) больше критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т. е. Fнабл>Fкрит, то с вероятностью а основная гипотеза о незначимости коэффициента множественной корреляции отвергается, и он признаётся значимым. Следовательно, модель множественной регрессии в целом также является значимой.
Если наблюдаемое значение F-критерия (вычисленное по выборочным данным) меньше или равно критического значения F-критерия (определённого по таблице распределения Фишера-Снедекора), т.е. Fнабл≤Fкрит, то основная гипотеза о незначимости коэффициента множественной корреляции принимается, и он признаётся незначимым. В этом случае модель множественной регрессии признаётся незначимой.
Дата добавления: 2015-08-29; просмотров: 52 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
4. Данные вариантов для решения задачи на проверку согласованности мнений экспертной группы | | | Коэффициент парной линейной регрессии, обозначенный Ь, имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Он измеряет среднее по |