Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Статистическая проверка гипотез. Критерий Пирсона

Читайте также:
  1. Библиографическая проверка
  2. Гносеологические проблемы философии. Проблема истинного познания, практика как критерий истинности.
  3. Заключительные работы и проверка результатов цементирования
  4. ЗАКЛЮЧИТЕЛЬНЫЕ РАБОТЫ И ПРОВЕРКА РЕЗУЛЬТАТОВ ЦЕМЕНТИРОВАНИЯ.
  5. Й этап ЭКОЛОГИЧЕСКАЯ ПРОВЕРКА
  6. КРАСОТА - КРИТЕРИЙ СВОБОДНОГО РЕБЕНКА
  7. Критерий Гурвица

Для проверки гипотезы о соответствии экс- периментального закона распределения случайной величины теоретическому наиболее часто применяют критерий Пирсона или, как его иначе называют, критерий χ2 («хи-квадрат»), так как принятие и отклонение гипотезы основаны на χ - распределении.

Предположим, что имеется статистический ряд наблюдений над случайной величиной X. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина имеет предполагаемый закон распределения, заданный интегральной функцией распределения F(x) или плотностью вероятностей f(x), который в дальнейшем будем называть теоретическим законом распределения.

Первоначально статистический ряд разбивают на k интервалов и подсчитывают число значений случайной величины X в каждом интервале. В результате получают экспериментальный ряд частот:

1 2 3 k
m ', m ', m ',, m '

Следует сразу оговорить, что предпосылкой применения критерия χ 2 является достаточная заполненность интервалов частотами. На практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, имеет смысл объединить эти интервалы.


Исходя из предполагаемого теоретического закона распределения вычисляют частоты тi в тех самых интервалах, на которые разбит статистический ряд. В результате получают теоретический ряд частот в k интервалах m1,m2, т3,..., mк.

Для проверки согласованности теоретического и экспериментального распределения подсчитывают меру расхождения:

 


(m ' - m)2


(m '


- m)2


(m '


- m)2


2 = 1 1 + 2 2 +...+ k k,

m 1 m 2 mk


или


 

k (m ' - m)2


2 = å i i


(10.1)


i =1 mi

и число степеней свободы ν. Число степеней свободы равно в этом случае числу интервалов k минус число ограничений f:

 

ν = k – f (10.2)

 

Число ограничений равно числу параметров в рассматриваемом законе распределения, увеличенному на единицу. Например, для гауссовского закона имеется два параметра: [М(х) и σ ] в этом случае число ограничений равно трем.

Для распределения χ2 составлены специальные таблицы

(см. табл. П2 Приложения). Пользуясь этими таблицами, можно для каждого значения χ 2 и числа степеней свободы v определить вероятность Р того, что за счет чисто случайных причин мера расхождения теоретического и

экспериментального распределений (10.1) будет меньше, чем фактически наблюдаемое в данной серии опытов значение χ 2.

 


Если эта вероятность Р мала (настолько, что событие с такой вероятностью можно считать практически невозможным), то результат опыта следует считать противоречащим гипотезе о том, что закон распределения величины X есть F(х). Эту гипотезу следует отбросить как неправдоподобную.

Напротив, если вероятность Р сравнительно велика, можно признать расхождение между теоретическим и экспериментальным распределениями несущественным и отнести его за счет случайных причин. Гипотезу о том, что величина X распределена по закону F(x), можно считать в этом случае правдоподобной, по крайней мере не противоречащей полученным, экспериментальным данным.

В табл. П2 входами являются значение χ 2 и число

степеней свободы v. Числа, стоящие в таблице, представляют соответствующие значения вероятности Р.

Насколько должна быть мала вероятность Р для того, чтобы отбросить или пересмотреть гипотезу,— вопрос неопределенный. Он не может быть решен из математических соображений, а должен базироваться на априорных сведениях о физической сущности изучаемого процесса.

На практике, если Р<0,1, рекомендуется проверить эксперимент, если возможно — повторить его. В случае появления повторных расхождений следует попытаться найти наиболее подходящий для описания экспериментальных данных закон распределения.

Пример. Пусть в цехе выпускаются такие электронные изделия, как источники питания с постоянным выходным напряжением 200 в. Была сделана выборка из генеральной совокупности и измерены значения параметра качества отобранных изделий. Эти значения образуют непрерывный ряд значений от 190,5 в до 209,5 в. Раз объём этот непрерывный ряд значений на 19 интервалов (см. табл. 10.1). В графе 1 этой таблицы указаны номера интервалов, в графе 2 - границы интервалов, в графе 3- значения середин интервалов, в графе 4 указана частота попадания измеренного значения параметра в


соответствующий интервал. Таким образом, значения, представленные в графах 3 и 4 таблицы 10.1, дают экспериментальное статистическое распределение случайной величины в численной форме. В графической форме это распределение показано на рис. 6.2 (пунктирная кривая).

Рассмотрим гипотезу о соответствии экспериментального закона распределения, представленного статистическим рядом в численной форме, а в графической форме на рис. 6.2 (пунктирная кривая), теоретическому (гауссовскому) закону распределения. Для этого используем критерий Пирсона.

В качестве теоретического (гауссовского) закона распределения используем распределение, представленное в численной форме в графах 3 и 5 табл. 10.1 а в графической форме на рис. 8.2 (сплошная кривая). Теоретический ряд, также как и экспериментальный статистический ряд разбиваем на 19 интервалов (табл. 10.1 и рис. 10.1).

Как указывалось выше, предпосылкой применения критерия Пирсона является достаточная заполненность интервалов частотами, т.е. на практике рекомендуется иметь в каждом интервале не менее 5-10 наблюдений. Если число наблюдений в отдельных интервалах мало, то имеет смысл объединить эти интервалы. Если необходимо объединять какое-то количество интервалов экспериментального ряда, то аналогичные интервалы теоретического ряда тоже объединяются и наоборот.

В нашем случае, чтобы экспериментальные частоты получились не менее 5, необходимо сделать объединение первых четырех интервалов с номерами 1, 2, 3 и 4: (1+2+5+13)=21/4=5,25, что более 5; аналогично, делаем объединение первых четырех интервалов теоретического ряда: (2+4+8+18)=32/4=8.что тоже более 5, это означает, что объединение первых четырех интервалов достаточно.


Таблица 10.1 Интервальный ряд случайных величин для экспериментального

(графы 3 и 4) и теоретического

(графы 3 и 5) законов распределения (до объединения интервалов)

Номе р инте рвал а   Границы интервалов (классов) Середи на интерва ла Частота m' i эксперимента льного ряда Частота miтеорети ческого ряда
  190,5-191,5      
  191,5-192,5      
  192,5-193,5      
  193,5-194,5      
  194,5-195,5      
  195,5-196,5      
  196,5-197,5      
  197,5-198,5      
  198,5-199,5      
  199,5-200,5      
  200,5-201,5      
  201,5-202,5      
  202,5-203,5      
  203,5-204,5      
  204,5-205,5      
  205,5-206,5      
  206,5-207,5      
  207,5-208,5      
  208,5-209,5      

Проверим необходимость объединения последних интервалов экспериментального и теоретического рядов. Для экспериментального ряда попробуем объединить четыре последних интервала с номерами 16, 17, 18 и19, вычислим: (10+3+2+1)=16/4=4, т.е. величина менее 5, значит надо объединять последние пять интервалов с номерами 15, 16, 17,

18 и 19. Вычисления дают: для экспериментального ряда: (25+10+3+2+1)=41/5=8,2, т.е. величина более 5, а для теоретического ряда: (35+18+8+4+2)/5=67/5=13,4, т.е. величина также более 5. Значит, объединение последних пяти интервалов достаточно.

Таблица 10.2 Интервальный ряд случайных величин для экспериментального

(графы 3 и 4) и теоретического (графы 3 и 5) законов распределения (после объединения интервалов).

      Час        
    тот        
Границы интервал ов после объедине ния интервал ов   Сер еди на инт ерв ала а экс пер име нта льн ого ряд   Част ота теорети ческого   ряда mi m’i- mi (m’i– mi)2   (m,- m)2 i i   mi
    а,        
    m'i        
               
  190,5- 194,5 192, 5,25   2, 7,6 0,95
  194,5- 195,5           0,71
  195,5- 196,5            

Продолжение табл. 10.2

 

  196,5- 197,5           0,3
  197,5- 198,5           0,04
  198,5- 199,5           0,01
  199,5- 200,5           0,00
  200,5- 201,5           0,01
  201,5- 202,5           0,04
  202,5- 203,5           0,3
  203,5- 204,5            
  204,5- 209,5   8,2 13,4 5,   2,02
Сумма 4,4

mi

 

 


m


m10m11

m'12


m
m' mm'm'10m'1

m


m'1


 


60 m' m


m'1 m1


 

 

 

 


 

20 m

 

m m m

m


m'1

m

 

m1


0 m'm'


m'1 m'1 m'1

x


 

 

Рис. 10.1. Графики распределения случайных величин для экспериментального (пунктирная линия)

и теоретического (сплошная линия) законов распределения (до объединения интервалов)


Таким образом, после объединения число интервалов станет равным 19-3-4=12. Значения экспериментальных и теоретических частот после объединения интервалов приведены в табл. 10.2: в графах 3 и 4 для экспериментального распределения, а в графах 3 и 5- для теоретического распределения случайных величин. В табл. 10.2 приведены также значения разностей экспериментальных и теоретических частот для каждого интервала (графа 6), значения их квадратов (графа 7) и значения отношений квадрата разности к соответствующей частоте теоретического ряда (графа 8).


Подставив значения получим


m 1¢ и тi в выражение (2.23),


k (m ' - m)2

2 = å i i = 0,95+0,71+0,0+0,3+0,04+ +0,01+

i =1 mi

0,0+0,01+0,04+0,3+0,0+2,02= 4,37

 

Число степеней свободы в соответствии с (2.24) равно ν = k – f =12 - 3 = 9

По табл. П1 для χ 2 = 4,37 и ν = 9 находим, что Р = 0,9.

Следовательно, экспериментальное распределение значений напряжения, приведенное в табл. 10.2 и показанное на рис. 10.1 близко к гауссовскому, что означает отлаженность и стабильность технологического процесса производства.


ЛЕКЦИЯ 5


Дата добавления: 2015-07-07; просмотров: 193 | Нарушение авторских прав


Читайте в этой же книге: Общие сведения о качестве изделия и возможность его оценки | Дискретное и непрерывное изменение параметра качества | Диаграмма разброса (поле корреляции) | Диаграмма Парето | Причинно-следственная диаграмма | Состав контрольной карты | Построение контрольных карт |
<== предыдущая страница | следующая страница ==>
Математическое ожидание и дисперсия| Cемь инструментов статистического контроля качества

mybiblioteka.su - 2015-2024 год. (0.016 сек.)