Проверка статистических гипотез

Читайте также:

Установление закономерностей, которым подчинены случайные явления, основано на изучении статистических данных - результатах наблюдений.

Задачи математической статистики следующие:

1) указать способы сбора и группировки статистических сведений;

2) разработать методы анализа статистических данных, в зависимости от целей исследования.

Пусть требуется изучить совокупность однородных объектов относительно некоторого количественного признака, например, относительно размера детали. Предполагаем, что деталей много и сплошное обследование стоит слишком дорого. Необходимо решить: как путём обследования ограниченного количества деталей сделать вывод о размерном параметре всей совокупности.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных объектов. Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Выборка должна быть репрезентативной, т.е. хорошо представлять генеральную совокупность. В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если её осуществить случайно, т.е. каждый объект из генеральной совокупности достаточно большого объёма (количество объектов в указанной совокупности) отбирается случайно.

Генеральной средней называют среднее арифметическое значений рассматриваемого признака Х генеральной совокупности. Если рассматривать обследуемый признак Х генеральной совокупности как случайную величину, то генеральная средняя будет равна математическому ожиданию признака, т.е. =М(Х).

Выборочной средней называют среднее арифметическое признака выборочной совокупности. Выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам , т.е.

Дисперсия равна среднему квадратов значений признака минус квадрат общей средней, а именно:

Эта формула записана на основании теоремы, в которой доказывается, что , где - общая средняя.

Рассмотрение эмпирического ряда как выборки из генеральной совокупности является основой статистических выводов. В этом смысле эмпирические ряды (см., например, табл. 2.2 для 160-ти измерений предела текучести алюминиевых прутков) являются выборками.

Доверительный интервал. Часто возникает проблема, как на основе ограниченного числа наблюдений (измерений) сделать вывод о величине числовых характеристик генеральной совокупности (математическое ожидание, среднеквадратическое отклонение и т.д.). Так как выборочные наблюдения носят случайный характер, то вычисленные по ним статистические характеристики также колеблются от выборки к выборке. Поэтому для каждой статистической характеристики, вычисленной по данным выборки, следует определить точность оценки. Эта точность содержится в доверительном интервале.

Пусть имеется нормально распределённая генеральная совокупность с математическим ожиданием Ми средним квадратичным отклонением s. По результатам отобранной из этой совокупности выборки объёмом n вычислена средняя арифметическая . Относительно разности М - можно с вероятность, например, 95% утверждать, что она находится в интервале или

Если вместо доверительной вероятности S=95% желательна, например, вероятность S=99%, то коэффициент 1,96 следует заменить на 2,58.

Дисперсия определяется как средний квадрат отклонения отдельных значений от математического ожидания. Для выборки объёма n имеем:

Так как обычно математическое ожидание неизвестно, то вместо приведенной формулы используют соотношение:

где - частота значений .

Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определённый вид, например R, выдвигают гипотезу о законе распределения R. Задача состоит в том, как подтвердить или опровергнуть выдвинутую статистическую гипотезу.

Возможны статистические гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок. Для проверки статистических гипотез используют различные критерии. Заметим, что в се критерии не доказываю справедливость той или иной статистической гипотезы, а лишь устанавливают, на принятом уровне значимости, её согласие или несогласие с данными наблюдений.

Для оценки степени близости эмпирического распределения теоретическому существуют специально подобранные случайные величины - критерии согласия Пирсона, Колмогорова, Смирнова и др. Проверка гипотезы о нормальном распределении генеральной совокупности чаще всего осуществляется при помощи критерия согласия Пирсона ( - критерий).

Определение сходимости эмпирического и теоретического распределений с помощью критерия согласия производится следующим образом. Разбиваем всю область изменения случайной величины на m интервалов и подсчитываем количество событий . Затем сравниваем эмпирические и теоретические частоты, которые обычно несколько различаются.

Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется малым числом наблюдений, либо способом их группировки и другими причинами. Возможно, что расхождение частот не случайно (значимо) и объясняется тем, что теоретические частоты вычислены, исходя из неверной гипотезы о нормальном распределении генеральной совокупности. Критерий Пирсона отвечает на поставленный выше вопрос.

Итак, для некоторого эмпирического распределения принимаем нулевую гипотезу: генеральная совокупность распределена нормально. Для проверки гипотезы вычисляем критерий Пирсона:

,

где - число сравниваемых частот; , - эмпирические и теоретические частоты i-го интервала случайной величины.

Очевидно, что чем меньше различаются теоретические и эмпирические частоты, тем меньше величина критерия и, следовательно, он характеризует близость сравниваемых распределений.

Алгоритм вычисления теоретических частот нормального распределения. следующий:

1. Интервал наблюдаемых значений Х (выборки объёма ) делим на интервалов одинаковой длины. Находим середины каждого интервала и частоту попадания признака в i-ый интервал.

2. Вычисляем выборочные .

3. Нормируем случайную величину Х, переходя к

и вычисляем концы интервалов .

Здесь наименьшее значение Z= , а наибольшее .

4. C использованием функции Лапласа Ф(z) (табл.1, Приложение) вычисляем теоретические вероятности = попадания Х в интервалы .

5. Находим искомые теоретические частоты .

6. Вычисляем количество степеней свободы по формуле: ,

где - число параметров теоретического распределения.

7. Задаёмся малой вероятностью - уровнем значимости a. Затем ищем критическую точку исходя из требования, чтобы, при условии справедливости нулевой гипотезы (генеральная совокупность распределена нормально), вероятность того, что рассчитанный критерий примет значение, больше , была равна принятому достаточно малому уровню значимости:

.

8. Определяем значение и .

9. По табл.1 Приложения определяем критическое значение .

10. Если < , то делаем вывод: между рассматриваемыми эмпирическим и теоретическим распределением нет существенной разницы.

Необходимым условием применения критерия является наличие в каждом из интервалов по меньшей мере 5-10 наблюдений.

Дата добавления: 2015-08-10; просмотров: 73 | Нарушение авторских прав
Читайте в этой же книге: Ошибки эксперимента | Случайные величины и их числовые характеристики | Крутое восхождение по поверхности отклика | Выбор и кодирование факторов |

<== предыдущая страница | следующая страница ==>

Регрессия и корреляция | Нормальное распределение

mybiblioteka.su - 2015-2025 год. (0.009 сек.)

<== предыдущая страница	\|	следующая страница ==>
Регрессия и корреляция	\|	Нормальное распределение