|
Ч А С Т Ь Т Р Е Т Ь Я
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
Глава одиннадцатая Вариационные ряды и их характеристики
§1 Задачи математической статистики. Генеральная и выборочная совокупности
1. Указать способы сбора и группировки статистических сведений.
2. Разработать методы анализа статистических данных в зависимости от целей исследования.
Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов.
Всякая подлежащая изучению совокупность объектов называется генеральной совокупностью.
Совокупность случайно отобранных объектов называется выборочной совокупностью или выборкой.
Объемом совокупности называется число объектов этой совокупности.
§2 Виды выборок. Способы отбора
П о в т о р н о й называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Б е с п о в т о р н о й называют выборку, при которой отобранный объект (перед отбором следующего) не возвращается в генеральную совокупность.
Для того, чтобы по данным выборки можно было достаточно уверенно ссудить об интересующем признаке генеральной совокупности, необходимо, чтобы объекты выборки п р а в и л ь н о его представляли, т.е. выборка должна быть репрезентативной (представительной).
|
| |||||||||||||||||||
| |||||||||||||||||||
| |||||||||||||||||||
| |||||||||||||||||||
| |||||||||||||||||||
П р о с т ой случайный отбор - отбор, при котором объекты извлекаются по одному из всей генеральной совокупности.
Типический отбор - отбор, при котором объекты извлекаются не из всей генеральной совокупности, а из каждой ее "типической" части.
Например, если детали изготавливаются на нескольких станках, то отбор осуществляют не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка.
Механический отбор - отбор, при котором генеральная совокупность механически делится на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.
Например, если нужно отобрать 20% изготовленных деталей, то отбирают каждую пятую деталь.
Серийный отбор - отбор, при котором объекты отбирают из генеральной совокупности не по одному, а "сериями", которые подвергают сплошному обследованию.
Например, если детали изготавливаются большой группой станков, то подвергают сплошному обследованию продукцию только нескольких станков.
§3 Статистическое распределение выборки
Пусть для изучения признака Х из генеральной совокупности извлечена выборка объема n, причем признак наблюдался раз, - раз, ………., - раз ().
Наблюдаемые значения признака Х называются вариантами.
Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом.
Число наблюдений называются частотой.
Отношение частоты к объему выборки называют относительной частотой (частостью): .
Статистическим распределением выборки называют перечень вариант и соответствующих им частот (или относительных частот).
Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину.
При регистрации разрядов 50 рабочих механического цеха получены следующие данные:
Тарифный разряд (варианта) | = n | ||||||
Количество рабочих (частота) () | 2 | 3 | 6 | 8 | 22 | 9 | 50 |
|
|
|
|
|
|
|
|
Частость |
|
|
|
|
| 0,04+0,06+0,12+ +0,16+0,44+0,18 = ….. | |
Накопленная частота |
(2+3=) … |
(5+6=) … |
(11+8=)… |
(19+22=) … |
(41+9=) … |
|
Вариационный ряд называется непрерывным (интервальным), если любые его варианты отличаются на сколь угодно малую величину.
Распределение по росту 1000 мужчин - рабочих механического цеха:
Рост (варианта) | 143-146 | 146-149 | 149-152 | 152-155 | 155-158 | 158-161 | 161-164 | 164-167 | 167-170 | 170-173 | 173-176 | 176-179 | 179-182 | 182-185 | 185-188 |
Количество рабочих (частота ) | 1 | 2 | 8 | 26 | 65 | 120 | 181 | 201 | 170 | 120 | 64 | 28 | 10 | 3 | 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Частость
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Плотность частоты |
|
|
|
|
|
|
|
|
|
|
|
|
|
| |
Накопленная частота |
Частота, приходящаяся на единицу величины интервала, называется плотностью частоты.
Распределение выработки на одного рабочего в отчетном году по сравнению с предыдущим::
Выработка (варианта) | 94-100 | 100-106 | 106-112 | 122-118 | 118-124 | 124-130 | 130-136 | 136-142 |
|
Количество рабочих (частота ) | 3 | 7 | 11 | 20 | 28 | 19 | 10 | 2 | 100 |
|
|
|
|
|
|
|
|
|
|
Частость
|
|
|
|
|
|
|
|
|
|
Плотность частоты |
|
|
|
|
|
|
|
|
|
Накопленная частота |
|
|
|
|
|
|
|
|
|
§4 Графическое изображение вариационных рядов
Полигоном частот называют ломаную, отрезки которой соединяют точки .
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки .
Построить полигон частот (относительных частот) примера 1из §3.
Полигон частот | Полигон относительных частот |
В случае непрерывного признака строят гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого интервала сумму частот вариант, попавших в i – интервал
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны (плотность частоты).
Построить гистограмму частот примера 2 из §3.
Площадь гистограммы частот равна объему выборки.
Накопленной частотой (частостью) в точке х называют суммарную частоту
(частость) членов статистической совокупности со значениями признака, меньшими х.
Кумулятой называется кривая накопленных частот (частостей).
Для дискретного ряда кумулята представляет собой ломаную, соединяющую точки или . Для интервального ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частости, равной нулю. Другие точки ломаной соответствуют концам интервалов.
Построить кумуляту распределения в примерах из §3
Кумулята распределения рабочих по тарифному разряду | Кумулята распределения рабочих по росту |
§5 Эмпирическая функция распределения
Пусть известно статистическое распределение частот количественного признака Х. Обозначим - число наблюдений, при котором наблюдалось значение признака, меньшее х; n – объем выборки. Ясно, что относительная частота события Х < х равна / n. Если х изменяется, то изменяется и относительная частота, т.е. относительная частота / n есть функция от х.
Эмпирической функцией распределения называют функцию , определяющую для каждого значения х относительную частоту события Х < х
Составить эмпирическую функцию распределения по данному распределению признака
Тарифный разряд (варианта) |
| ||||||
Количество рабочих (частота) () | 2 | 3 | 6 | 8 | 22 | 9 | 50 |
|
|
|
|
|
|
|
|
Частость |
|
|
|
|
| 1 |
Будем придавать различные значения х и находить для них
х |
| График |
|
| |
| ||
| ||
| ||
| ||
| ||
|
|
§6 Числовые характеристики вариационных рядов
Вариационным размахом называется разность между наибольшим и наименьшим вариантами ряда: R = .
Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот: , где - варианты или середины интервалов, - соответствующие им частоты.
Найти среднюю арифметическую вариационного ряда:
№ | Вариационный ряд | Средняя арифметическая | ||||||||||||||||||
1
|
|
4,08 | ||||||||||||||||||
|
119,2 |
Очевидно, что .
Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:
Дисперсия характеризует группировку признака около среднего арифметического или разброс около нее.
Средним квадратическим отклонением вариационного ряда называется арифметическое значение корня квадратного из дисперсии:
Вычислить вариационный размах, дисперсию, среднее квадратическое отклонение и коэффициент вариации вариационного ряда:
Вариационный ряд |
|
| ||||||||||||||||||||||||||||||||
R |
|
| ||||||||||||||||||||||||||||||||
4,08 | 119,2 | |||||||||||||||||||||||||||||||||
* | ** 87,48 | |||||||||||||||||||||||||||||||||
| 9,35 (%) | |||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||
Вычисления | * | |||||||||||||||||||||||||||||||||
** |
Коэффициентом вариации называется процентное отношение среднего квадратического отклонения к средней арифметической:
Коэффициент вариации – безразмерная величина, поэтому он пригоден для сравнения рассеяний вариационных рядов, варианты которых имеют различную размерность. Если коэффициент вариации признака, принимающего положительные значения, высок, например, больше 100%, то это свидетельствует о неоднородности значения признака.
Существуют упрощенные формулы для вычислений средней арифметической и дисперсии, а именно: , , где n - объем выборки, - значение признака, - частота значений признака, m - число значений признака, k – величина интервала, с – середина серединного (или одного из серединных) интервалов.
Вычислить упрощенным способом среднюю арифметическую и дисперсию распределения рабочих по выработке.
Интервалы х | Середина интервала
|
с = 121 |
| |||
94 - 100 | 97 | -24 | -4 | -12 | ||
100 - 106 | -18 | -3 | -21 | |||
106 - 112 | 765-12 | -2 | -22 | |||
112 - 118 | -6 | -1 | -20 | |||
118 - 124 | 121 | |||||
124 - 130 | ||||||
130 - 136 | ||||||
136 - 142 | ||||||
100 -30 252 | ||||||
= 119, 2(%), = 87,48 |
Вычислить упрощенным способом среднюю арифметическую и дисперсию распределения рабочих по росту.
Интервалы х | Середина интервала
|
с = 165,5 |
| |||
143 - 146 | 144,5 |
|
|
|
| |
146 - 149 |
|
|
|
|
| |
149 - 152 |
|
|
|
|
| |
152 - 155 |
|
|
|
|
| |
155 - 158 |
|
|
|
|
| |
158 - 161 |
|
|
|
|
| |
161 - 164 |
|
|
|
|
| |
164 - 167 |
|
|
|
|
| |
167 - 170 |
|
|
|
|
| |
170 - 173 |
|
|
|
|
| |
173 - 176 |
|
|
|
|
| |
176- 179 |
|
|
|
|
| |
179 - 182 |
|
|
|
|
| |
182 - 185 |
|
|
|
|
| |
185 - 188 |
|
|
|
|
| |
1000 10 4064 | ||||||
= 165,53; = 36,5751 |
Средняя арифметическая , дисперсия и другие характеристики вариационного ряда являются статистическими аналогами математического ожидания M(X), дисперсии D и соответствующих характеристик случайной величины Х. Вариационный ряд может рассматриваться как одна из реализаций распределения случайной величины.
Случайная величина | Вариационный ряд | ||
Термин | Обозначения, формулы | Термин | Обозначения, формулы |
Дискретная случайная величина |
Дискретный ряд | ||
Непрерывная случайная величина |
Интервальный ряд | ||
Значение случайной величины |
|
Вариант |
|
Вероятность |
|
Частость |
|
Многоугольник распределения, кривая распределения вероятностей |
Полигон, гистограмма | ||
Функция распределения |
| Эмпирическая функция распределения |
|
Математическое ожидание |
а = |
Средняя арифметическая |
|
Дисперсия |
= = |
Дисперсия |
= = |
Среднее квадратическое отклонение |
| Среднее квадратическое отклонение |
|
Дата добавления: 2015-09-29; просмотров: 24 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
Глава о том, почему Гор был самым популярным парнем Бэзилдона; о том, что помогло ему уволиться со службы в банке и о том, что не давало ему уснуть одной июньской ночью. | | | 1. Что поражается первично при остром гематогенном остеомиелите? |