Читайте также:
|
|
ВАРИАНТ 2
Задача 1
Пусть X - oбъем розничного товарооборота, тыс. руб.;
Y - издержки обращения, тыс. руб..
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Так как в основание группировки положен непрерывный количественный признак, то число групп определяют одновременно с размером интервала.
Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса:
n = 1 + 3,2log n
n = 1 + 3,2log 20 = 5
Тогда ширина интервала составит:
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
20.1 | 20.1 - 32.58 | |
24.5 | 20.1 - 32.58 | |
20.1 - 32.58 | ||
33.8 | 32.58 - 45.06 | |
32.58 - 45.06 | ||
40.6 | 32.58 - 45.06 | |
42.5 | 32.58 - 45.06 | |
47.1 | 45.06 - 57.54 | |
47.2 | 45.06 - 57.54 | |
51.1 | 45.06 - 57.54 | |
56.1 | 45.06 - 57.54 | |
56.2 | 45.06 - 57.54 | |
56.9 | 45.06 - 57.54 | |
57.54 - 70.02 | ||
59.1 | 57.54 - 70.02 | |
64.2 | 57.54 - 70.02 | |
66.6 | 57.54 - 70.02 | |
69.6 | 57.54 - 70.02 | |
73.6 | 70.02 - 82.5 | |
82.5 | 70.02 - 82.5 |
Аналитическая группировка.
Группы | № | Кол-во, nj | ∑X | Xcp = ∑Xj / nj | ∑Y | Ycp = ∑Yj / nj |
20.1 - 32.58 | 1,2,3 | 72.6 | 24.2 | 4.97 | 1.66 | |
32.58 - 45.06 | 4,5,6,7 | 155.9 | 38.98 | 12.05 | 3.01 | |
45.06 - 57.54 | 8,9,10,11,12,13 | 314.6 | 52.43 | 20.27 | 3.38 | |
57.54 - 70.02 | 14,15,16,17,18 | 318.5 | 63.7 | 19.79 | 3.96 | |
70.02 - 82.5 | 19,20 | 156.1 | 78.05 | 8.44 | 4.22 | |
Итого | 1017.7 | 65.52 |
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основано на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
1. Находим средние значения каждой группы.
Общее средние значение для всей совокупности:
2. Дисперсия внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучением). Эта дисперсия называется остаточной:
Расчет для группы: 20.1 - 32.58 (1,2,3)
yj | (yj - yср)2 | Результат |
1.62 | (1.62 - 1.66)2 | 0.00134 |
1.51 | (1.51 - 1.66)2 | 0.0215 |
1.84 | (1.84 - 1.66)2 | 0.0336 |
Итого | 0.0565 |
Определим групповую (частную) дисперсию для 1-ой группы:
Расчет для группы: 32.58 - 45.06 (4,5,6,7)
yj | (yj - yср)2 | Результат |
2.67 | (2.67 - 3.01)2 | 0.12 |
2.7 | (2.7 - 3.01)2 | 0.0977 |
2.96 | (2.96 - 3.01)2 | 0.00276 |
3.72 | (3.72 - 3.01)2 | 0.5 |
Итого | 0.72 |
Определим групповую (частную) дисперсию для 2-ой группы:
Расчет для группы: 45.06 - 57.54 (8,9,10,11,12,13)
yj | (yj - yср)2 | Результат |
3.9 | (3.9 - 3.38)2 | 0.27 |
2.86 | (2.86 - 3.38)2 | 0.27 |
3.09 | (3.09 - 3.38)2 | 0.0831 |
2.91 | (2.91 - 3.38)2 | 0.22 |
3.66 | (3.66 - 3.38)2 | 0.0793 |
3.85 | (3.85 - 3.38)2 | 0.22 |
Итого | 1.15 |
Определим групповую (частную) дисперсию для 3-ой группы:
Расчет для группы: 57.54 - 70.02 (14,15,16,17,18)
yj | (yj - yср)2 | Результат |
3.67 | (3.67 - 3.96)2 | 0.0829 |
3.74 | (3.74 - 3.96)2 | 0.0475 |
4.47 | (4.47 - 3.96)2 | 0.26 |
3.91 | (3.91 - 3.96)2 | 0.0023 |
(4 - 3.96)2 | 0.00176 | |
Итого | 0.4 |
Определим групповую (частную) дисперсию для 4-ой группы:
Расчет для группы: 70.02 - 82.5 (19,20)
yj | (yj - yср)2 | Результат |
3.78 | (3.78 - 4.22)2 | 0.19 |
4.66 | (4.66 - 4.22)2 | 0.19 |
Итого | 0.39 |
Определим групповую (частную) дисперсию для 5-ой группы:
3. Внутригрупповые дисперсии объединяются в средней величине внутригрупповых дисперсий:
Средняя из частных дисперсий:
4. Межгрупповая дисперсия относится на счет изучаемого фактора, она называется факторной
δ2 = ((1.66-3.28)2*3 + (3.01-3.28)2*4 + (3.38-3.28)2*6 + (3.96-3.28)2*5 + (4.22-3.28)2*2)/20 = 0.62
Определяем общую дисперсию по всей совокупности, используя правило сложения дисперсий:
σ2 = 0.14 + 0.62 = 0.75
Проверим этот вывод путем расчета общей дисперсии обычным способом:
yi | (yi - yср)2 | Результат |
1.62 | (1.62 - 3.28)2 | 2.74 |
1.51 | (1.51 - 3.28)2 | 3.12 |
1.84 | (1.84 - 3.28)2 | 2.06 |
2.67 | (2.67 - 3.28)2 | 0.37 |
2.7 | (2.7 - 3.28)2 | 0.33 |
2.96 | (2.96 - 3.28)2 | 0.0999 |
3.72 | (3.72 - 3.28)2 | 0.2 |
3.9 | (3.9 - 3.28)2 | 0.39 |
2.86 | (2.86 - 3.28)2 | 0.17 |
3.09 | (3.09 - 3.28)2 | 0.0346 |
2.91 | (2.91 - 3.28)2 | 0.13 |
3.66 | (3.66 - 3.28)2 | 0.15 |
3.85 | (3.85 - 3.28)2 | 0.33 |
3.67 | (3.67 - 3.28)2 | 0.16 |
3.74 | (3.74 - 3.28)2 | 0.22 |
4.47 | (4.47 - 3.28)2 | 1.43 |
3.91 | (3.91 - 3.28)2 | 0.4 |
(4 - 3.28)2 | 0.52 | |
3.78 | (3.78 - 3.28)2 | 0.25 |
4.66 | (4.66 - 3.28)2 | 1.92 |
Итого | 15.02 |
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:
Определяем эмпирическое корреляционное отношение:
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X весьма высокая
Статистическая значимость показателя силы связи.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции (эмпирическое корреляционное отношение) нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости α=0 и степенями свободы k=18 находим tкрит:
tкрит (n-m-1;α/2) = (18;0) = 18
где m = 1 - количество объясняющих переменных.
Если tнабл > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку tнабл < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - не значим
Интервальная оценка для коэффициента корреляции (доверительный интервал).
(η - ε; η + ε), где:
Доверительный интервал для коэффициента корреляции
(0.91 - 0.725; 0.91 + 0.725)
η(0.18;1.63)
Коэффициент детерминации.
Определим коэффициент детерминации:
Таким образом, на 82% вариация обусловлена различиями между признаками, а на 18% – другими факторами.
Задача 2
Среднее количество К студентов в институте определяем как среднее арифметическое значений этого параметра:
Средний процент С студентов, не получающих стипендию, определим, как процентное соотношение между общим числом таких студентов, и числом всех студентов:
Средний размер Р стипендии одного студента стипендиата (руб.) определим, как отношение стипендии, полусенной всеми студентами за месяц, к общему числу студентов:
Наконец, Ч – среднее число студентов в группе – определим, разделив количество всех студентов на количество групп в сумме по институтам:
Задача 3
Таблица для расчета показателей.
Группы | Середина интервала, xi | Кол-во, fi | xi * fi | Накопленная частота, S | |x - xср|*f | (x - xср)2*f | Частота, fi/n |
- 4 | 31.2 | 162.24 | 0.12 | ||||
4 - 8 | 15.6 | 18.72 | 0.26 | ||||
8 - 12 | 58.8 | 164.64 | 0.42 | ||||
12 - | 14.4 | 0.2 | |||||
Итого | 117.6 |
Для оценки ряда распределения найдем следующие показатели:
1) Показатели центра распределения.
Средняя взвешенная
Мода.
Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 8, так как именно на этот интервал приходится наибольшее количество.
Наиболее часто встречающееся значение ряда – 9.68
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 8 - 12, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
Таким образом, 50% единиц совокупности будут меньше по величине 9.14.
2) Показатели вариации.
Абсолютные показатели вариации.
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 2.35
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Несмещенная оценка дисперсии - состоятельная оценка дисперсии (исправленная дисперсия).
Среднее квадратическое отклонение (средняя ошибка выборки).
Каждое значение ряда отличается от среднего значения 7.2 в среднем на 2.68
Оценка среднеквадратического отклонения.
3) Относительные показатели вариации.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
Поскольку v>30%,но v<70%, то вариация умеренная.
Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.
Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.
4) Интервальное оценивание центра генеральной совокупности.
Доверительный интервал для генерального среднего.
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.997/2 = 0.4985
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.4985
tkp(γ) = (0.4985) = 2.96
(7.2 - 1.13;7.2 + 1.13) = (6.07;8.33)
С вероятностью 0.997 можно утверждать, что среднее значение при выборке большего объема не выйдет за пределы найденного интервала.
5) Интервальное оценивание генеральной доли (вероятности события).
Доверительный интервал для генеральной доли.
(p* - ε; p* + ε)
В этом случае 2Ф(tkp) = γ
Ф(tkp) = γ/2 = 0.954/2 = 0.477
По таблице функции Лапласа найдем, при каком tkp значение Ф(tkp) = 0.477
tkp(γ) = (0.477) = 2
Доля i-ой группы fi / ∑f | Средняя ошибка выборки для генеральной доли, ε | Нижняя граница доли, p* - ε | Верхняя граница доли, p* + ε |
0.12 | 0.074 | 0.17 | |
0.26 | 0.2 | 0.32 | |
0.42 | 0.35 | 0.49 | |
0.2 | 0.14 | 0.26 |
С вероятностью 0.954 при большем объеме выборке эти доли будут находиться в заданных интервалах.
Задача 4
Линейное уравнение тренда имеет вид y = a1t + a0
1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1∑t = ∑y
a0∑t + a1∑t2 = ∑y • t
t | y | t2 | y2 | t y |
10.7 | 114.49 | 21325.1 | ||
10.3 | 106.09 | 20548.5 | ||
12.9 | 166.41 | 25748.4 | ||
16.3 | 265.69 | 32551.1 | ||
15.6 | 243.36 | 31168.8 | ||
17.8 | 316.84 | 35582.2 | ||
123.6 | 1780.88 | 246772.1 |
Для наших данных система уравнений имеет вид:
9a0 + 17964a1 = 123.6
17964a0 + 35856204a1 = 246772.1
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a0 = -2198.5, a1 = 1.108
Уравнение тренда:
y = 1.108 t - 2198.5
Эмпирические коэффициенты тренда a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Коэффициент тренда b = 1.108 показывает среднее изменение результативного показателя (в единицах измерения у) с изменением периода времени t на единицу его измерения. В данном примере с увеличением t на 1 единицу, y изменится в среднем на 1.108.
Однофакторный дисперсионный анализ.
Средние значения
Дисперсия
Среднеквадратическое отклонение
2. Анализ точности определения оценок параметров уравнения тренда.
Стандартная ошибка уравнения.
где m = 1 - количество влияющих факторов в модели тренда.
Интервальный прогноз.
Определим среднеквадратическую ошибку прогнозируемого показателя.
Uy = yn+L ± K
где
L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости α и для числа степеней свободы, равного n-2.
По таблице Стьюдента находим Tтабл
Tтабл (n-m-1;α/2) = (7;0.025) = 2.365
Точечный прогноз, t = 2001: y(2001) = 1.11*2001 -2198.5 = 19.27
19.27 - 3.45 = 15.82; 19.27 + 3.45 = 22.72
Интервальный прогноз:
t = 2001: (15.82;22.72)
3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.
1) t-статистика. Критерий Стьюдента.
Статистическая значимость коэффициента b подтверждается
Статистическая значимость коэффициента a подтверждается
Доверительный интервал для коэффициентов уравнения тренда.
Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:
(b - tнабл Sb; b + tнабл Sb)
(1.108 - 2.365•0.15; 1.108 + 2.365•0.15)
(0.75;1.47)
(a - tнабл Sa; a + tнабл Sa)
(-2198.5 - 2.365•303.89; -2198.5 + 2.365•303.89)
(-2917.21;-1479.79)
Методика расчета показателей динамики
Для расчета показателей динамики на постоянной базе каждый уровень ряда сравнивается с одним и тем же базисным уровнем. Исчисляемые при этом показатели называются базисными.
Для расчета показателей динамики на переменной базе каждый последующий уровень ряда сравнивается с предыдущим. Вычисленные таким способом показатели динамики называются цепными.
Важнейшим статистическим показателем динамики является абсолютный прирост, который определяется в разностном сопоставлении двух уровней ряда динамики в единицах измерения исходной информации.
Абсолютный прирост
цепной прирост: ∆yц = yi - yi-1
базисный прирост: ∆yб = yi - y1
Темпы прироста характеризуют абсолютный прирост в относительных величинах. Исчисленный в процентах темп прироста показывает, на сколько процентов изменился сравниваемый уровень с уровнем, принятым за базу сравнения.
Темп прироста
цепной темп прироста: Tпрцi = ∆yi / yi-1
базисный темп прироста: Tпpб = ∆yбi / y1
Распространенным статистическим показателем динамики является темп роста. Он характеризует отношение двух уровней ряда и может выражаться в виде коэффициента или в процентах.
Темп роста
цепной темп роста: Tpцi = yi / yi-1
базисный темп роста: Tpб = yбi / y1
Абсолютное значение 1% прироста
цепной: 1%цi = yi-1 / 100%
базисный: 1%б = yб / 100%
Темп наращения
Важным статистическим показателем динамики социально-экономических процессов является темп наращивания, который в условиях интенсификации экономики измеряет наращивание во времени экономического потенциала
Tн = ∆yцi / y1
Цепные показатели ряда динамики.
Период | Производство молока | Абсолютный прирост | Темп прироста, % | Темпы роста, % | Абсолютное содержание 1% прироста | Темп наращения, % |
- | - | 0.1 | ||||
10.7 | 0.7 | 0.1 | ||||
1.3 | 12.15 | 112.15 | 0.11 | |||
10.3 | -1.7 | -14.17 | 85.83 | 0.12 | -17 | |
12.9 | 2.6 | 25.24 | 125.24 | 0.1 | ||
16.3 | 3.4 | 26.36 | 126.36 | 0.13 | ||
15.6 | -0.7 | -4.29 | 95.71 | 0.16 | -7 | |
17.8 | 2.2 | 14.1 | 114.1 | 0.16 | ||
0.2 | 1.12 | 101.12 | 0.18 |
В 2000 году по сравнению с 1999-м производство молока увеличилось на 0.2 тыс. тонн. или на 1.12%
Максимальный прирост наблюдается в 6 (3.4 тыс. тонн.)
Минимальный прирост зафиксирован в 4 (-1.7 тыс. тонн.)
Темп наращения показывает, что тенденция ряда возрастающая, что свидетельствует об ускорении Производство молока
Базисные показатели ряда динамики.
Период | Производство молока | Абсолютный прирост | Темп прироста, % | Темпы роста, % |
- | - | |||
10.7 | 0.7 | |||
10.3 | 0.3 | |||
12.9 | 2.9 | |||
16.3 | 6.3 | |||
15.6 | 5.6 | |||
17.8 | 7.8 | |||
В 2000-м году по сравнению с 1992-м производство молока увеличилось на 8 тыс. тонн. или на 80%
Расчет средних характеристик рядов.
Средний уровень ряда y динамики характеризует типическую величину абсолютных уровней.
Для нахождения среднего уровня моментного ряда используют среднюю хронологическую:
Среднее значение Производство молока за анализируемый период составило 13.7 тыс. тонн.
Средний темп роста
В среднем за весь период рост анализируемого показателя составил 1.0762
Средний темп прироста
В среднем с каждым периодом Производство молока увеличивалась на 7.62%.
Средний абсолютный прирост представляет собой обобщенную характеристику индивидуальных абсолютных приростов ряда динамики.
Средний абсолютный прирост
С каждым периодом производство молока в среднем увеличивалось на 1 тыс. тонн..
Задача 5
Дата добавления: 2015-10-13; просмотров: 209 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
ночной переезд | | | Общий индекс товарооборота |