Читайте также:
|
|
Доверительный интервал.
Доверительным называется интервал, который с заданной надежностью покрывает оцениваемый параметр.
Для оценки математического ожидания случайной величины , распределенной по нормальному закону, при известном среднем квадратическом отклонении служит доверительный интервал
где - точность оценки, - объем выборки, - выборочное среднее, - аргумент функции Лапласа, при котором
Проверка статистических гипотез.
Поскольку статистика как метод исследования имеет дело с данным, в которых закономерности искажены различными случайными факторами, большинство статистических вычислений сопровождается проверкой некоторых предположений или гипотез об источнике этих данных.
Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным.
Нулевая и альтернативная гипотезы.
Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п. Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.
Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующей или альтернативной гипотезой. Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Так как проверку производят статистическими методами, то данная проверка называется статистической.
Ошибки первого и второго уровня.
При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:
— можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода);
— можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода).
Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок. Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).
Уровень значимости.
Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы).
1. Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Доверительные интервалы оценок параметров и проверка гипотез об их значимости.
Интервальный метод оценивания параметров распределения случайных величин заключается в определении интервала (а не единичного значения), в котором с заданной степенью достоверности будет заключено значение оцениваемого параметра. Интервальные оценки являются более полными и надежными по сравнению с точечными, они применяются как для больших, так и для малых выборок.
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальная оценка позволяет установить точность и надежность оценок, а сами интервалы в этом случае называются доверительными.
Интервал, накрывающий с вероятностью γ истинное значение параметра θ,называют доверительным интервалом, а вероятность γ – надежностью оценки или доверительной вероятностью.
Y= β0 + β1x+ξ
βiє(bi ± Sbi *tкр),где Sbi-стандартная ошибка коэф bi (Sbi *tкр)-предельная ошибка
Доверительный интервал, имеющий наименьшую степень разброса говорит о большей значимости соответст коэффициента.
При проверке значимости (предположения того, что параметры отличаются от нуля) коэффициентов регрессии выдвигается основная гипотеза H0 о незначимости полученных оценок, например:
H0: β1=0
в качестве альтернативной (или обратной) выдвигается гипотеза о значимости коэффициентов регрессии, например:
H1: β1≠0
Для проверки выдвинутых гипотез используется t-критерий(t-статистика) Стьюдента. Наблюдаемое значение t-критерия, вычисленное на основе выборочных данных, сравнивают со значением t-критерия, определяемого по таблице распределения Стьюдента.
Критическое значение t-критерия зависит от двух параметров: уровня значимости и числа степеней свободы.
Уровень значимости α — величина, определяемая по формуле: α=1 − γ,, где γ — доверительная вероятность попадания оцениваемого параметра в доверительный интервал. Таким образом, α — это вероятность того, что оцениваемый параметр не попадет в доверительный интервал, равный
0,05 или 0,01.
Выдвинутые гипотезы проверяются следующим образом:
1) если модуль наблюдаемого значения t-критерия больше критического значения, т. е. |tнабл| > tкрит, то с вероятностью (1 − α) или γ основную гипотезу о незначимости параметров регрессии отвергают, т. е. параметры регрессии не равны нулю;
2) если модуль наблюдаемого значения t-критерия меньше или равен критическому значению, т. е. |tнабл| ≤tкрит,то с вероятностью α или (1 − γ) основная гипотеза о незначимости параметров регрессии принимается, т. е. параметры регрессии почти не отличаются от нуля или равны нулю.
Формула наблюдаемого значения: tнабл=bi/Sbi,где Sbi-стандартная ошибка коэф bi
Sbi=числитель:Σei^2*Σxi^2)/(знаменатель:n*(n-m-1)*Σ(xi-xсреднее)^2-все выражение под корнем(рис. 16.1)
Дата добавления: 2015-07-16; просмотров: 265 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии и его следствия. | | | Прогнозирование по регрессионной модели и его точность. Доверительные и интервалы прогноза |