Читайте также:
|
|
Для проверки гипотезы о соответствии экс- периментального закона распределения случайной величины теоретическому наиболее часто применяют критерий Пирсона или, как его иначе называют, критерий χ2 («хи-квадрат»), так как принятие и отклонение гипотезы основаны на χ - распределении.
Предположим, что имеется статистический ряд наблюдений над случайной величиной X. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый закон распределения, заданный интегральной функцией распределения F(x) или плотностью вероятностей f(x), который в дальнейшем будем называть теоретическим законом распределения.
Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины X в каждом интервале. В результате получают экспериментальный ряд частот:
|
Следует сразу оговорить, что предпосылкой применения критерия χ 2 является достаточная заполненность интервалов частотами. На практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы.
Исходя из предполагаемого теоретического закона распределения вычисляют частоты тi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах m1,m2, т3,..., mк.
Для проверки согласованности теоретического и экспериментального распределения подсчитывают меру расхождения:
(m ' - m)2
(m '
- m)2
(m '
- m)2
2 = 1 1 + 2 2 +...+ k k,
m 1 m 2 mk
или
k (m ' - m)2
2 = å i i
(10.1)
i =1 mi
и число степеней свободы ν. Число степеней свободы равно в этом случае числу интервалов k минус число ограничений f:
ν = k – f (10.2)
Число ограничений равно числу параметров в рассматриваемом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеется два параметра: [М(х) и σ ] в этом случае число ограничений равно трем.
Для распределения χ2 составлены специальные таблицы
(см. табл. П2 Приложения). Пользуясь этими таблицами, можно для каждого значения χ 2 и числа степеней свободы v определить вероятность Р того, что за счет чисто случайных причин мера расхождения теоретического и
экспериментального распределений (10.1) будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ 2.
Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины X есть F(х). Эту гипотезу следует отбросить как неправдоподобную.
Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина X распределена по закону F(x), можно считать в этом случае правдоподобной, по крайней мере не противоречащей полученным, экспериментальным данным.
В табл. П2 входами являются значение χ 2 и число
степеней свободы v. Числа, стоящие в таблице, представляют соответствующие значения вероятности Р.
Насколько должна быть мала вероятность Р для того, чтобы отбросить или пересмотреть гипотезу,— вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса.
На практике, если Р<0,1, рекомендуется проверить эксперимент, если возможно — повторить его. В случае появления повторных расхождений следует попытаться найти наиболее подходящий для описания экспериментальных данных закон распределения.
Пример. Пусть в цехе выпускаются такие электронные изделия, как источники питания с постоянным выходным напряжением 200 в. Была сделана выборка из генеральной совокупности и измерены значения параметра качества отобранных изделий. Эти значения образуют непрерывный ряд значений от 190,5 в до 209,5 в. Раз объём этот непрерывный ряд значений на 19 интервалов (см. табл. 10.1). В графе 1 этой таблицы указаны номера интервалов, в графе 2 - границы интервалов, в графе 3- значения середин интервалов, в графе 4 указана частота попадания измеренного значения параметра в
соответствующий интервал. Таким образом, значения, представленные в графах 3 и 4 таблицы 10.1, дают экспериментальное статистическое распределение случайной величины в численной форме. В графической форме это распределение показано на рис. 6.2 (пунктирная кривая).
Рассмотрим гипотезу о соответствии экспериментального закона распределения, представленного статистическим рядом в численной форме, а в графической форме на рис. 6.2 (пунктирная кривая), теоретическому (гауссовскому) закону распределения. Для этого используем критерий Пирсона.
В качестве теоретического (гауссовского) закона распределения используем распределение, представленное в численной форме в графах 3 и 5 табл. 10.1 а в графической форме на рис. 8.2 (сплошная кривая). Теоретический ряд, также как и экспериментальный статистический ряд разбиваем на 19 интервалов (табл. 10.1 и рис. 10.1).
Как указывалось выше, предпосылкой применения критерия Пирсона является достаточная заполненность интервалов частотами, т.е. на практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, то имеет смысл объединить эти интервалы. Если необходимо объединять какое-то количество интервалов экспериментального ряда, то аналогичные интервалы теоретического ряда тоже объединяются и наоборот.
В нашем случае, чтобы экспериментальные частоты получились не менее 5, необходимо сделать объединение первых четырех интервалов с номерами 1, 2, 3 и 4: (1+2+5+13)=21/4=5,25, что более 5; аналогично, делаем объединение первых четырех интервалов теоретического ряда: (2+4+8+18)=32/4=8.что тоже более 5, это означает, что объединение первых четырех интервалов достаточно.
Таблица 10.1 Интервальный ряд случайных величин для экспериментального
(графы 3 и 4) и теоретического
(графы 3 и 5) законов распределения (до объединения интервалов)
Номе р инте рвал а | Границы интервалов (классов) | Середи на интерва ла | Частота m' i эксперимента льного ряда | Частота miтеорети ческого ряда |
190,5-191,5 | ||||
191,5-192,5 | ||||
192,5-193,5 | ||||
193,5-194,5 | ||||
194,5-195,5 | ||||
195,5-196,5 | ||||
196,5-197,5 | ||||
197,5-198,5 | ||||
198,5-199,5 | ||||
199,5-200,5 | ||||
200,5-201,5 | ||||
201,5-202,5 | ||||
202,5-203,5 | ||||
203,5-204,5 | ||||
204,5-205,5 | ||||
205,5-206,5 | ||||
206,5-207,5 | ||||
207,5-208,5 | ||||
208,5-209,5 |
Проверим необходимость объединения последних интервалов экспериментального и теоретического рядов. Для экспериментального ряда попробуем объединить четыре последних интервала с номерами 16, 17, 18 и19, вычислим: (10+3+2+1)=16/4=4, т.е. величина менее 5, значит надо объединять последние пять интервалов с номерами 15, 16, 17,
18 и 19. Вычисления дают: для экспериментального ряда: (25+10+3+2+1)=41/5=8,2, т.е. величина более 5, а для теоретического ряда: (35+18+8+4+2)/5=67/5=13,4, т.е. величина также более 5. Значит, объединение последних пяти интервалов достаточно.
Таблица 10.2 Интервальный ряд случайных величин для экспериментального
(графы 3 и 4) и теоретического (графы 3 и 5) законов распределения (после объединения интервалов).
Час | |||||||
тот | |||||||
Границы интервал ов после объедине ния интервал ов | Сер еди на инт ерв ала | а экс пер име нта льн ого ряд | Част ота теорети ческого ряда mi | m’i- mi | (m’i– mi)2 | (m,- m)2 i i mi | |
а, | |||||||
m'i | |||||||
190,5- 194,5 | 192, | 5,25 | 2, | 7,6 | 0,95 | ||
194,5- 195,5 | 0,71 | ||||||
195,5- 196,5 |
Продолжение табл. 10.2
196,5- 197,5 | 0,3 | ||||||
197,5- 198,5 | 0,04 | ||||||
198,5- 199,5 | 0,01 | ||||||
199,5- 200,5 | 0,00 | ||||||
200,5- 201,5 | 0,01 | ||||||
201,5- 202,5 | 0,04 | ||||||
202,5- 203,5 | 0,3 | ||||||
203,5- 204,5 | |||||||
204,5- 209,5 | 8,2 | 13,4 | 5, | 2,02 | |||
Сумма | 4,4 |
mi
m
m10m11
m'12
|
m
m'1
60 m' m
m'1 m1
20 m
m m m
m
m'1
m
m1
0 m'm'
m'1 m'1 m'1
x
Рис. 10.1. Графики распределения случайных величин для экспериментального (пунктирная линия)
и теоретического (сплошная линия) законов распределения (до объединения интервалов)
Таким образом, после объединения число интервалов станет равным 19-3-4=12. Значения экспериментальных и теоретических частот после объединения интервалов приведены в табл. 10.2: в графах 3 и 4 для экспериментального распределения, а в графах 3 и 5- для теоретического распределения случайных величин. В табл. 10.2 приведены также значения разностей экспериментальных и теоретических частот для каждого интервала (графа 6), значения их квадратов (графа 7) и значения отношений квадрата разности к соответствующей частоте теоретического ряда (графа 8).
Подставив значения получим
m 1¢ и тi в выражение (2.23),
k (m ' - m)2
2 = å i i = 0,95+0,71+0,0+0,3+0,04+ +0,01+
i =1 mi
0,0+0,01+0,04+0,3+0,0+2,02= 4,37
Число степеней свободы в соответствии с (2.24) равно ν = k – f =12 - 3 = 9
По табл. П1 для χ 2 = 4,37 и ν = 9 находим, что Р = 0,9.
Следовательно, экспериментальное распределение значений напряжения, приведенное в табл. 10.2 и показанное на рис. 10.1 близко к гауссовскому, что означает отлаженность и стабильность технологического процесса производства.
ЛЕКЦИЯ 5
Дата добавления: 2015-07-07; просмотров: 193 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Математическое ожидание и дисперсия | | | Cемь инструментов статистического контроля качества |