Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Построение аналитической группировки

Читайте также:
  1. II. Метод группировки. Виды статистических группировок.
  2. Авиаснабжение окруженной группировки
  3. Авиаснабжение окружённой группировки
  4. Взаимодействие катионов V аналитической группы с общими реагентами
  5. Глава вторая ПОСТРОЕНИЕ ВОЙСК ДЛЯ ПАРАДА
  6. Группировки и мизансцены
  7. Д. Вы слышали многих наших певцов. Чем отличается их построение звука голоса и техника от итальянских?

Лабораторная работа № 3

Цель работы: Освоение электронных таблиц Excel, использование их для решения задач с использованием различных статистических функций.

Краткая теория:

Группировка – это распределение единиц по группам в соответствии со следующим принципом: различия между единицами, отнесенными к одной группе, должны быть меньше, чем между единицами, отнесенными к разным группам.

На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками.

Группировка создает основу для последующей сводки и анализа данных.

Для решения задачи группировки нужно установить правила отнесения каждой единицы к той или иной группе.

В эти правила входят определения тех характеристик (признаков), по которым будет проводиться группировка (так называемых группировочных признаков), и их значений, отделяющих одну группу от другой (интервалов группировки).

В группировках используются открытые и закрытые интервалы. В первом случае указывается верхняя и нижняя границы интервала. Например, группы предприятий по численности работников, человек: 100-400, 400-800, 800-1000. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе, т.е. интервал читается как «от - до». Иногда границы закрытых интервалов предполагают включение единиц с нижней и верхней границами. Например, 0-4, 5-9, 10-14 и т.д. Интервал называется открытым, если указана либо только верхняя, либо только нижняя граница: до 200 или 2000 и более.

Группировка производится с целью установления статистических связей и закономерностей, построения описания объекта, выявления структуры изучаемой совокупности. Различия в целевом назначении группировки выражаются в существующей в отечественной статистике классификации группировок: типологические, структурные, аналитические.

Аналитическая группировка характеризует взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой (другие) – как фактор (факторы).

Постановка задачи:

Построить простую аналитическую группировку.

 

Вариант 1 возраст

Вариант 2 опыт

Вариант 3 …

И т.д.

 

 

Возраст Опыт Пол Образование Зарплата
Х1 Х2 Х3 Х4 У
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         

 

Квартал Прибыль, тыс. руб. Общее число абонентов, чел. Выручка за мобильный трафик, тыс. руб. Затраты на подддержание и обновление программного обеспечения, руб.
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         
         

 

Порядок выполнения работы:

1. Вначале рассчитывается шаг группировки

число групп выбираем:

Возраст, опыт – 3;

Пол – 2;

Образование – 4.

2. Затем группировка разбивается на интервалы согласно шагу группировки.

 

3. После строится рабочая таблица:

 

Интервалы Х входящие в интервал У входящие в интервал Сумма Х Сумма У Среднее по Х Среднее по У
20-31   22100 36900     25,333  
31-42            
42-53            
53-64            

 

И так далее для каждого интервала группировки.

 

4. Затем рассчитывается дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов (не связанных с изучаемым). Эта дисперсия называется остаточной (та колеблемость, которая осталась при закреплении изучаемого фактора Х). Она определяется по формуле:

где - значение признака Y для i-й единицы в j_й группе;

- значение признака Y в j-группе;

- число единиц в j-й группе;

j =1,2,3,…, m.

5. Далее внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:

 

6. Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле:

 

 

7. По правилу сложения дисперсией находим общую дисперсию, которая равна сумме внутригрупповой и межгрупповой дисперсии:

 

 

8. Далее находим эмпирическое корреляционное отношение, которое измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:

 

- коэффициент детерминации,

 

 

- эмпирическое корреляционное отношение.

Этот показатель принимает значения в интервале (0,1): чем ближе к 1, тем теснее связь, и наоборот.

 

9. Важным показателем является характеристика средней силы связи:

,

где - среднее значения результативного признака в последней и первой группах соответственно;

- середины интервалов (или средние значения) факторного признака в последней и первой группах.

В случае прямой связи >0, обратной - <0.

 

10. Влияние фактора на результативный признак проявляется в соотношении между Dм и Dв: чем сильнее влияние фактора на величину изучаемого признака, тем больше Dм и меньше Dв.

 

Для проведения дисперсионного анализа нужно установить источники варьирования признака, объем вариации по источникам, определить число степеней свободы для каждой компоненты вариации.

 

Объем вариации уже установлен, теперь необходимо определить число степеней свободы вариации. Число степеней свободы – это число независимых отклонений индивидуальных значений признака от его среднего значения. Общее число степеней свободы, соответствующее общей сумме квадратов отклонений в дисперсионном анализе, разлагается по составляющим вариации. Так, общей сумме квадратов отклонений Dо соответствует число степеней свободы вариации, равное N – 1. Групповой вариации Dм соответствует число степеней свободы вариации, равное K – 1. Внутригрупповой остаточной вариации соответствует число степеней свободы вариации, равное N – K.

 

Теперь, зная суммы квадратов отклонений и число степеней свободы, можно определить дисперсии для каждой составляющей. Обозначим эти дисперсии: dм– групповые и dв – внутригрупповые.

 

После вычисления этих дисперсий приступим к установлению значимости влияния фактора на результативный признак. Для этого находим отношение: dM /dB = Fф,

 

Величина Fф, называемая критерием Фишера, сравнивается с табличным, Fтабл. Если Fф > Fтабл, то влияние фактора на результативный признак доказано. Если Fф < Fтабл то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, следовательно, не доказывает с достаточной вероятностью влияние изучаемого фактора.

 

Теоретическая величина связана с вероятностью, и в таблице ее значение приводится при определенном уровне вероятности суждения. В приложении имеется таблица, позволяющая установить возможную величину F при вероятности суждения, наиболее часто используемой: уровень вероятности «нулевой гипотезы» – 0,05. Вместо вероятностей «нулевой гипотезы» таблица может быть названа таблицей для вероятности 0,95 существенности влияния фактора. Повышение уровня вероятности требует для сравнения более высокого значения Fтабл.

 

Величина Fтабл зависит также от числа степеней свободы двух сравниваемых дисперсий. Если число степеней свободы стремится к бесконечности, то Fтабл стремится к единице.

 

Таблица значений Fтабл построена следующим образом: в столбцах таблицы указаны степени свободы вариации для большей дисперсии, а в строках – степени свободы для меньшей (внутригрупповой) дисперсии. Величина F находится на пересечении столбца и строки соответствующих степеней свободы вариации.

 

11. В заключении делаются выводы по работе.

 

 


Дата добавления: 2015-07-20; просмотров: 133 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Задача № 7| Группировки и мизансцены

mybiblioteka.su - 2015-2025 год. (0.011 сек.)