Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Математическая статистика



Ч А С Т Ь Т Р Е Т Ь Я

МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

 

Глава одиннадцатая Вариационные ряды и их характеристики

 

§1 Задачи математической статистики. Генеральная и выборочная совокупности

 

1. Указать способы сбора и группировки статистических сведений.

2. Разработать методы анализа статистических данных в зависимости от целей исследования.

Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.

Всякая подлежащая изучению совокупность объектов называется генеральной совокупностью.

Совокупность случайно отобранных объектов называется выборочной совокупностью или выборкой.

Объемом совокупности называется число объектов этой совокупности.

 

§2 Виды выборок. Способы отбора

 

П о в т о р н о й называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.

Б е с п о в т о р н о й называют выборку, при которой отобранный объект (перед отбором следующего) не возвращается в генеральную совокупность.

Для того, чтобы по данным выборки можно было достаточно уверенно ссудить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки п р а в и л ь н о его представляли, т.е. выборка должна быть репрезентативной (представительной).

Простой случайный бесповторный отбор

В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществить случайно.

                                       
 
   
     

Простой случайный повторный отбор

 
 
   

Типический отбор

   
   

Требующий расчленения

генеральной совокупности на части

   
 
 
       

Механический отбор

       
 
 
 
 
 
   
     

Серийный отбор

 

 

 


П р о с т ой случайный отбор - отбор, при котором объекты извлекаются по одному из всей генеральной совокупности.

Типический отбор - отбор, при котором объекты извлекаются не из всей генеральной совокупности, а из каждой ее "типической" части.

Например, если детали изготавливаются на нескольких станках, то отбор осуществляют не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка.



Механический отбор - отбор, при котором генеральная совокупность механически делится на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.

Например, если нужно отобрать 20% изготовленных деталей, то отбирают каждую пятую деталь.

Серийный отбор - отбор, при котором объекты отбирают из генеральной совокупности не по одному, а "сериями", которые подвергают сплошному обследованию.

Например, если детали изготавливаются большой группой станков, то подвергают сплошному обследованию продукцию только нескольких станков.

 

§3 Статистическое распределение выборки

 

Пусть для изучения признака Х из генеральной совокупности извлечена выборка объема n, причем признак наблюдался раз, - раз, ………., - раз ().

Наблюдаемые значения признака Х называются вариантами.

Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом.

Число наблюдений называются частотой.

Отношение частоты к объему выборки называют относительной частотой (частостью): .

Статистическим распределением выборки называют перечень вариант и соответствующих им частот (или относительных частот).

Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину.

При регистрации разрядов 50 рабочих механического цеха получены следующие данные:

Тарифный разряд

(варианта)

           

= n

Количество рабочих (частота) ()

2

3

6

8

22

9

50

 

 

 

 

 

 

 

 

Частость

 

 

 

 

 

0,04+0,06+0,12+

+0,16+0,44+0,18 =

…..

Накопленная

частота

 

(2+3=) …

 

(5+6=) …

 

(11+8=)…

 

(19+22=) …

 

(41+9=) …

 

Вариационный ряд называется непрерывным (интервальным), если любые его варианты отличаются на сколь угодно малую величину.

Распределение по росту 1000 мужчин - рабочих механического цеха:

Рост

(варианта)

143-146

146-149

149-152

152-155

155-158

158-161

161-164

164-167

167-170

170-173

173-176

176-179

179-182

182-185

185-188

Количество рабочих (частота )

1

2

8

26

65

120

181

201

170

120

64

28

10

3

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Частость

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Плотность частоты

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Накопленная частота

                             

Частота, приходящаяся на единицу величины интервала, называется плотностью частоты.

Распределение выработки на одного рабочего в отчетном году по сравнению с предыдущим::

Выработка

(варианта)

94-100

100-106

106-112

122-118

118-124

124-130

130-136

136-142

Количество рабочих (частота )

3

7

11

20

28

19

10

2

100

 

 

 

 

 

 

 

 

 

 

Частость

 

 

 

 

 

 

 

 

 

 

Плотность частоты

 

 

 

 

 

 

 

 

 

Накопленная частота

 

 

 

 

 

 

 

 

 

§4 Графическое изображение вариационных рядов

 

Полигоном частот называют ломаную, отрезки которой соединяют точки .

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки .

Построить полигон частот (относительных частот) примера 1из §3.

 

Полигон частот

Полигон относительных частот

   

 

В случае непрерывного признака строят гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого интервала сумму частот вариант, попавших в i – интервал

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны (плотность частоты).

Построить гистограмму частот примера 2 из §3.

 

Площадь гистограммы частот равна объему выборки.

Накопленной частотой (частостью) в точке х называют суммарную частоту

(частость) членов статистической совокупности со значениями признака, меньшими х.

Кумулятой называется кривая накопленных частот (частостей).

Для дискретного ряда кумулята представляет собой ломаную, соединяющую точки или . Для интервального ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частости, равной нулю. Другие точки ломаной соответствуют концам интервалов.

Построить кумуляту распределения в примерах из §3

Кумулята распределения рабочих

по тарифному разряду

Кумулята распределения рабочих

по росту

   

 

 

§5 Эмпирическая функция распределения

 

Пусть известно статистическое распределение частот количественного признака Х. Обозначим - число наблюдений, при котором наблюдалось значение признака, меньшее х; n – объем выборки. Ясно, что относительная частота события Х < х равна / n. Если х изменяется, то изменяется и относительная частота, т.е. относительная частота / n есть функция от х.

Эмпирической функцией распределения называют функцию , определяющую для каждого значения х относительную частоту события Х < х

Составить эмпирическую функцию распределения по данному распределению признака

Тарифный разряд

(варианта)

           

Количество рабочих (частота) ()

2

3

6

8

22

9

50

 

 

 

 

 

 

 

 

Частость

 

 

 

 

 

1

Будем придавать различные значения х и находить для них

х

График

 

§6 Числовые характеристики вариационных рядов

 

Вариационным размахом называется разность между наибольшим и наименьшим вариантами ряда: R = .

Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот: , где - варианты или середины интервалов, - соответствующие им частоты.

Найти среднюю арифметическую вариационного ряда:

Вариационный ряд

Средняя арифметическая

1

 

Тарифный

разряд

 

           

Количество рабочих

2

3

6

8

22

9

 

 

4,08

Выработка

 

94-100

100-106

 

112-118

118-124

     

Количество рабочих (частота )

3

7

11

20

28

19

10

2

 

 

 

119,2

Очевидно, что .

Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:

Дисперсия характеризует группировку признака около среднего арифметического или разброс около нее.

Средним квадратическим отклонением вариационного ряда называется арифметическое значение корня квадратного из дисперсии:

Вычислить вариационный размах, дисперсию, среднее квадратическое отклонение и коэффициент вариации вариационного ряда:

Вариационный ряд

Тарифный

разряд

 

           

Количество рабочих

2

3

6

8

22

9

 

Выработка

 

94-100

   

112-118

   

130-136

 

Количество рабочих

3

7

11

20

28

19

10

2

 

R

 

 

4,08

119,2

*

** 87,48

 

9,35 (%)

 

 

Вычисления

*

**

Коэффициентом вариации называется процентное отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации – безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность. Если коэффициент вариации признака, принимающего положительные значения, высок, например, больше 100%, то это свидетельствует о неоднородности значения признака.

Существуют упрощенные формулы для вычислений средней арифметической и дисперсии, а именно: , , где n - объем выборки, - значение признака, - частота значений признака, m - число значений признака, k – величина интервала, с – середина серединного (или одного из серединных) интервалов.

Вычислить упрощенным способом среднюю арифметическую и дисперсию распределения рабочих по выработке.

Интервалы

х

Середина

интервала

 

с = 121

94 - 100

97

 

-24

-4

-12

 

100 - 106

   

-18

-3

-21

 

106 - 112

   

765-12

-2

-22

 

112 - 118

   

-6

-1

-20

 

118 - 124

121

         

124 - 130

           

130 - 136

           

136 - 142

           

100 -30 252

= 119, 2(%), = 87,48

 

Вычислить упрощенным способом среднюю арифметическую и дисперсию распределения рабочих по росту.

Интервалы

х

Середина

интервала

 

с = 165,5

143 - 146

144,5

 

 

 

 

 

146 - 149

 

 

 

 

 

 

149 - 152

 

 

 

 

 

 

152 - 155

 

 

 

 

 

 

155 - 158

 

 

 

 

 

 

158 - 161

 

 

 

 

 

 

161 - 164

 

 

 

 

 

 

164 - 167

 

 

 

 

 

 

167 - 170

 

 

 

 

 

 

170 - 173

 

 

 

 

 

 

173 - 176

 

 

 

 

 

 

176- 179

 

 

 

 

 

 

179 - 182

 

 

 

 

 

 

182 - 185

 

 

 

 

 

 

185 - 188

 

 

 

 

 

 

1000 10 4064

= 165,53; = 36,5751

 

Средняя арифметическая , дисперсия и другие характеристики вариационного ряда являются статистическими аналогами математического ожидания M(X), дисперсии D и соответствующих характеристик случайной величины Х. Вариационный ряд может рассматриваться как одна из реализаций распределения случайной величины.

Случайная величина

Вариационный ряд

Термин

Обозначения, формулы

Термин

Обозначения, формулы

 

Дискретная случайная величина

 

Дискретный ряд

 

Непрерывная случайная величина

 

Интервальный ряд

 

Значение случайной величины

 

 

 

Вариант

 

 

Вероятность

 

 

Частость

 

 

Многоугольник распределения, кривая распределения вероятностей

 

 

Полигон,

гистограмма

Функция распределения

 

Эмпирическая функция распределения

 

 

 

Математическое

ожидание

а =

 

 

Средняя

арифметическая

 

 

 

Дисперсия

 

=

=

 

 

Дисперсия

 

 

=

=

Среднее

квадратическое

отклонение

 

Среднее

квадратическое

отклонение

 

 


Дата добавления: 2015-09-29; просмотров: 24 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Глава о том, почему Гор был самым популярным парнем Бэзилдона; о том, что помогло ему уволиться со службы в банке и о том, что не давало ему уснуть одной июньской ночью. | 1. Что поражается первично при остром гематогенном остеомиелите?

mybiblioteka.su - 2015-2024 год. (0.167 сек.)