Статистическая проверка гипотез. Критерий Пирсона

Читайте также:

Для проверки гипотезы о соответствии экс- периментального закона распределения случайной величины теоретическому наиболее часто применяют критерий Пирсона или, как его иначе называют, критерий χ2 («хи-квадрат»), так как принятие и отклонение гипотезы основаны на χ - распределении.

Предположим, что имеется статистический ряд наблюдений над случайной величиной X. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый закон распределения, заданный интегральной функцией распределения F(x) или плотностью вероятностей f(x), который в дальнейшем будем называть теоретическим законом распределения.

Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины X в каждом интервале. В результате получают экспериментальный ряд частот:

1 2 3 k

m ', m ', m ',, m '

Следует сразу оговорить, что предпосылкой применения критерия χ 2 является достаточная заполненность интервалов частотами. На практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы.

Исходя из предполагаемого теоретического закона распределения вычисляют частоты тi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах m1,m2, т3,..., mк.

Для проверки согласованности теоретического и экспериментального распределения подсчитывают меру расхождения:

(m ' - m)2

(m '

- m)2

(m '

- m)2

 2 = 1 1 + 2 2 +...+ k k,

m 1 m 2 mk

или

k (m ' - m)2

 2 = å i i

(10.1)

i =1 mi

и число степеней свободы ν. Число степеней свободы равно в этом случае числу интервалов k минус число ограничений f:

ν = k – f (10.2)

Число ограничений равно числу параметров в рассматриваемом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеется два параметра: [М(х) и σ ] в этом случае число ограничений равно трем.

Для распределения χ2 составлены специальные таблицы

(см. табл. П2 Приложения). Пользуясь этими таблицами, можно для каждого значения χ 2 и числа степеней свободы v определить вероятность Р того, что за счет чисто случайных причин мера расхождения теоретического и

экспериментального распределений (10.1) будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ 2.

Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины X есть F(х). Эту гипотезу следует отбросить как неправдоподобную.

Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина X распределена по закону F(x), можно считать в этом случае правдоподобной, по крайней мере не противоречащей полученным, экспериментальным данным.

В табл. П2 входами являются значение χ 2 и число

степеней свободы v. Числа, стоящие в таблице, представляют соответствующие значения вероятности Р.

Насколько должна быть мала вероятность Р для того, чтобы отбросить или пересмотреть гипотезу,— вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса.

На практике, если Р<0,1, рекомендуется проверить эксперимент, если возможно — повторить его. В случае появления повторных расхождений следует попытаться найти наиболее подходящий для описания экспериментальных данных закон распределения.

Пример. Пусть в цехе выпускаются такие электронные изделия, как источники питания с постоянным выходным напряжением 200 в. Была сделана выборка из генеральной совокупности и измерены значения параметра качества отобранных изделий. Эти значения образуют непрерывный ряд значений от 190,5 в до 209,5 в. Раз объём этот непрерывный ряд значений на 19 интервалов (см. табл. 10.1). В графе 1 этой таблицы указаны номера интервалов, в графе 2 - границы интервалов, в графе 3- значения середин интервалов, в графе 4 указана частота попадания измеренного значения параметра в

соответствующий интервал. Таким образом, значения, представленные в графах 3 и 4 таблицы 10.1, дают экспериментальное статистическое распределение случайной величины в численной форме. В графической форме это распределение показано на рис. 6.2 (пунктирная кривая).

Рассмотрим гипотезу о соответствии экспериментального закона распределения, представленного статистическим рядом в численной форме, а в графической форме на рис. 6.2 (пунктирная кривая), теоретическому (гауссовскому) закону распределения. Для этого используем критерий Пирсона.

В качестве теоретического (гауссовского) закона распределения используем распределение, представленное в численной форме в графах 3 и 5 табл. 10.1 а в графической форме на рис. 8.2 (сплошная кривая). Теоретический ряд, также как и экспериментальный статистический ряд разбиваем на 19 интервалов (табл. 10.1 и рис. 10.1).

Как указывалось выше, предпосылкой применения критерия Пирсона является достаточная заполненность интервалов частотами, т.е. на практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, то имеет смысл объединить эти интервалы. Если необходимо объединять какое-то количество интервалов экспериментального ряда, то аналогичные интервалы теоретического ряда тоже объединяются и наоборот.

В нашем случае, чтобы экспериментальные частоты получились не менее 5, необходимо сделать объединение первых четырех интервалов с номерами 1, 2, 3 и 4: (1+2+5+13)=21/4=5,25, что более 5; аналогично, делаем объединение первых четырех интервалов теоретического ряда: (2+4+8+18)=32/4=8.что тоже более 5, это означает, что объединение первых четырех интервалов достаточно.

Таблица 10.1 Интервальный ряд случайных величин для экспериментального

(графы 3 и 4) и теоретического

(графы 3 и 5) законов распределения (до объединения интервалов)

Номе р инте рвал а	Границы интервалов (классов)	Середи на интерва ла	Частота m' i эксперимента льного ряда	Частота miтеорети ческого ряда
	190,5-191,5
	191,5-192,5
	192,5-193,5
	193,5-194,5
	194,5-195,5
	195,5-196,5
	196,5-197,5
	197,5-198,5
	198,5-199,5
	199,5-200,5
	200,5-201,5
	201,5-202,5
	202,5-203,5
	203,5-204,5
	204,5-205,5
	205,5-206,5
	206,5-207,5
	207,5-208,5
	208,5-209,5

Проверим необходимость объединения последних интервалов экспериментального и теоретического рядов. Для экспериментального ряда попробуем объединить четыре последних интервала с номерами 16, 17, 18 и19, вычислим: (10+3+2+1)=16/4=4, т.е. величина менее 5, значит надо объединять последние пять интервалов с номерами 15, 16, 17,

18 и 19. Вычисления дают: для экспериментального ряда: (25+10+3+2+1)=41/5=8,2, т.е. величина более 5, а для теоретического ряда: (35+18+8+4+2)/5=67/5=13,4, т.е. величина также более 5. Значит, объединение последних пяти интервалов достаточно.

Таблица 10.2 Интервальный ряд случайных величин для экспериментального

(графы 3 и 4) и теоретического (графы 3 и 5) законов распределения (после объединения интервалов).

			Час
		тот
Границы интервал ов после объедине ния интервал ов	Сер еди на инт ерв ала	а экс пер име нта льн ого ряд	Част ота теорети ческого ряда mi	m’i- mi	(m’i– mi)2	(m,- m)2 i i mi
		а,
		m'i

	190,5- 194,5	192,	5,25		2,	7,6	0,95
	194,5- 195,5						0,71
	195,5- 196,5

Продолжение табл. 10.2

	196,5- 197,5				0,3
	197,5- 198,5				0,04
	198,5- 199,5				0,01
	199,5- 200,5				0,00
	200,5- 201,5				0,01
	201,5- 202,5				0,04
	202,5- 203,5				0,3
	203,5- 204,5
	204,5- 209,5	8,2	13,4	5,	2,02
Сумма	4,4

m10m11

m'12

m' mm'm'10m'1

m'1

60 m' m

m'1 m1

20 m

m m m

m'1

0 m'm'

m'1 m'1 m'1

Рис. 10.1. Графики распределения случайных величин для экспериментального (пунктирная линия)

и теоретического (сплошная линия) законов распределения (до объединения интервалов)

Таким образом, после объединения число интервалов станет равным 19-3-4=12. Значения экспериментальных и теоретических частот после объединения интервалов приведены в табл. 10.2: в графах 3 и 4 для экспериментального распределения, а в графах 3 и 5- для теоретического распределения случайных величин. В табл. 10.2 приведены также значения разностей экспериментальных и теоретических частот для каждого интервала (графа 6), значения их квадратов (графа 7) и значения отношений квадрата разности к соответствующей частоте теоретического ряда (графа 8).

Подставив значения получим

m 1¢ и тi в выражение (2.23),

k (m ' - m)2

 2 = å i i = 0,95+0,71+0,0+0,3+0,04+ +0,01+

i =1 mi

0,0+0,01+0,04+0,3+0,0+2,02= 4,37

Число степеней свободы в соответствии с (2.24) равно ν = k – f =12 - 3 = 9

По табл. П1 для χ 2 = 4,37 и ν = 9 находим, что Р = 0,9.

Следовательно, экспериментальное распределение значений напряжения, приведенное в табл. 10.2 и показанное на рис. 10.1 близко к гауссовскому, что означает отлаженность и стабильность технологического процесса производства.

ЛЕКЦИЯ 5

Дата добавления: 2015-07-07; просмотров: 193 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Математическое ожидание и дисперсия	\|	Cемь инструментов статистического контроля качества

mybiblioteka.su - 2015-2025 год. (0.017 сек.)