|
Порядок построения интервального вариационного ряда (ВР)
В качестве исходных данных мы располагаем некоторой статистической совокупностью Y = {yj}, j = 1,N, где N = ׀Y׀ – мощность множества Y. Пусть в качестве исходных данных выступает объем реализованной продукции десяти предприятий за отчетный период в млн. руб.:
5,2; 13,2; 8,1; 7,5; 11,8; 14,6; 8,5; 7,8; 10,5; 6,0. (1)
Оценку структуры исходных данных проведем в терминах вариационных рядов, когда мы хотим получить отображение исходного множества Y мощностью N = 10 шт. единиц совокупности в некоторое более компактное множество Х мощностью n (n < N, иначе нет смысла; это очевидно). То есть наша цель – построить отображение исходного множества Y на более компактное множество Х:
τ: Y → X. (2)
Для реализации операции (2) необходимо и достаточно сгруппировать элементы статистической совокупности вида (1) по определенным правилам.
Итак, мощность исходной совокупности N=10; максимальный элемент совокупности ymax = 14,6 млн. руб.; ymin = 5,2 млн. руб.
Размах выборки R = ymax - ymin = 14,6 – 5,2 = 9,4 (млн. руб.)
Чтобы определить шаг выборки h, необходимо размах выборки R поделить на число интервалов «n»:
h = R / n (3)
Число интервалов, в свою очередь, можно приближенно найти по формуле Стерджесса
n = 1 + 3,22∙lg N (4)
В нашем случае выражение (4) примет вид:
n = 1 + 3,22∙lg 10 = 1 + 3,22∙ 1 = 4,22 (шт.) ≈ 4.
Тогда согласно выражению (3) шаг h = 9,4 / 4 = 2,35 ≈ 2,40 = 2,4 (млн. руб.).
Таким образом, мы должны составить рабочую таблицу для четырех вариантов (интервалов); вместо 10-ти исходных элементов получили 4 варианта. Группировка осуществлена, интервальный вариационный ряд с равными интервалами получен (см. табл. 1).
Таблица 1
Интервальный вариационный ряд. Результаты отображения вида (2)
Номера интервалов | Начало – конец интервалов | Среднее интервальное значение | Частота попаданий в интервалы | Значение Частоты | Значения накопленной частоты |
I | xiн - xiв | xiср | счет | fi | qi |
4 = n | 5,2 - 7,6 7,6 - 10,0 10,0 - 12,4 12,4 - 14,8 | 6,4 8,8 11,2 13,6 | /// /// // // | ||
| ∑ fi |
|
Далее необходимо визуализировать полученные результаты - построить гистограмму (рис. 1) с графо-аналитическим определением моды Мо и кумуляту (рис. 2) с графо-аналитическим определением медианы Ме. Эти значения являются приближенными по своей природе и служат выражением данных структурных средних как параметров построенного нами вариационного ряда. Сама по себе исходная статистическая совокупность вида (1) их в явном виде не содержит.
Для аналитического (точного) определения значений Мо и Ме необходимо воспользоваться следующими формулами (5) и (6) – соответственно. Однако для их использования необходимо определиться с номером модального интервала и значением его частоты fm.
Определяем модальный интервал. Им будет тот, у которого частота максимальна. Как правило, такой интервал бывает в единственном числе. Однако в данном случае модальным интервалом равным образом может быть как интервал i = 1 (fi = 3), так и интервал с текущим номером i=2 (f2 = 3).
Возьмем для определенности второй интервал. Тогда fm= f2 = 3. Тогда номер модального интервала i = 2; начало модального интервала xiн = 7,6 млн. руб. (см. табл. 1), шаг (размер интервала) h = 2,4 млн. руб. Значение моды:
fm - fm - 1
Мо = xmн + h ∙————————————. (5)
(fm - fm – 1) + (fm - fm + 1)
По формуле (5) получим:
3 - 3
Мо = 7,6 + 2,4∙——————— = 7,6 (млн. руб.).
(3 - 3) + (3 - 2)
Значение медианы вычислим по формуле (6):
(∑ fi / 2) – qm- 1
Ме = xmн + h ∙——————— = (6)
fm
(10 / 2) – 3 5 - 3
= 7,6 + 2,4 ∙ —————— = 7,6 + 2,4∙ ———— = 9,2 (млн. руб.).
3 3
Теперь в качестве модального интервала примем первый интервал i = 1; начало модального интервала xiн = 5,2 млн. руб. (см. табл. 1), шаг (размер интервала) – тот же h = 2,4 млн. руб.; значение fm - fm – 1 = f1 - f1 – 1 = f1 - f0 , а значения f0 в табл. 1 нет; значение накопленной частоты qm- 1 = q1- 1 = q0 = 0, а такого значения в табл. 1 также нет.
Новое значение моды по формуле (5):
3 - 0
Мо = 5,2 + 2,4∙——————— = 7,6 (млн. руб.) – прежнее значение.
(3 - 0) + (3 - 3)
Значение медианы вычислим по той же формуле (6):
(10 / 2) – 0 5
Ме = 5,2 + 2,4 ∙ ————— = 5,2 + 2,4 ∙ —— = 9,2 (млн. руб.) – прежнее значение.
3 3
Таким образом, в случае одинаково значимых модальных интервалов первоначально (на умозрительном уровне) в качестве модального можем выбрать любой из них. Однако тот факт, что значение медианы = 9,2 млн. руб. находится во втором интервале (7,6 – 10.0), то в качестве модального следует считать именно второй, а не первый
Далее необходимо оценить средневзвешенное значение исходной статистической совокупности (7). В качестве вариантов вариационного ряда принимаем средние значения на интервалах:
∑ xiср ∙ fi
xвср = ————. (7)
∑ fi
6,4 ∙ 3 + 8,8 ∙ 3 + 11,2 ∙ 2 + 13,6 ∙ 2
xвср = ——————————————— = 9,50 (млн. руб.).
Располагая значениями моды, медианы и средневзвешенного, можно оценить степень асимметричности распределения. Если нестрогое неравенство (8) выполняется, распределение является «умеренно асимметричным», ели нет, то «асимметрия повышенная»:
│Мо - xвср │ ≤ 3 ∙│ Ме - xвср │. (8)
Для наших расчетов:
│ 7,6 - 9,5 │ ≤ 3 ∙│ 9,2 - 9,5│ или
1,9 ≤ 3 ∙ 0,3 = 0,9 – нестрогое неравенство не соблюдается: 0,9 не больше, чем 1,9; все наоборот. Следовательно, структура данных такова, что распределение их по вариантам имеет повышенную асимметрию.
Таким образом, проведя группирование элементов исходной статистической совокупности Y, мы получили новую, более компактную совокупность Х с дополнительными характеристиками (параметрами), отражающих структуру данных. Кроме традиционного среднего значения общая картина дополнена двумя структурными средними в виде моды (наиболее часто встречающегося значения) и медианы (ее значение делит исходную совокупность пополам: до значения медианы и она включительно – половина элементов исходной совокупности, свыше ее значения – остальная половина элементов исходной совокупности.
Ход защиты результатов контрольного задания № 1 (построение интервальных ВР):
1. Фамилия слушателя, номер варианта.
2. Номер модального интервала; значение модальной частоты.
3. Значения средневзвешенного, моды и медианы (называть точные значения). Графо-аналитические результаты – показать.
4. Оценить степень асимметрии распределения.
5. Значение коэффициента вариации и заключение о степени вариабельности (здесь не приводится).
Дата добавления: 2015-09-29; просмотров: 114 | Нарушение авторских прав
<== предыдущая лекция | | | следующая лекция ==> |
У вас есть такая фантастическая возможность. Современные технологии на стыке физики, кибернетики, электроники и духовных практик теперь позволяют провести моментальную диагностику ауры по обширному | | | Как накачать середину грудной мышцы Довольно актуальный вопрос, как накачать середину грудной мышцы, довольно часто мучает даже профессиональных атлетов, более правильно можно назвать эту группу |