Читайте также: |
|
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить, количество групп и интервалы группировки.
Интервал – количественное значение, отделяющее одну единицу (группу) от другой, т.е. интервал очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому число групп должно быть оптимальным, в каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших чисел. Однако в отдельных случаях представляют интерес и малочисленные группы: новое, передовое, пока оно не станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики – выделить эти факты, изучить их.
Таким образом, при решении вопроса о численности единиц в группах нужно руководствоваться не формальными признаками, а знанием сущности изучаемого явления. На количество выделяемых групп существенное влияние оказывает степень вариации группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
n = 1 + 3,322 lg N, (3.1)
где N – численность единиц совокупности. Получаем следующее соотношение:
N | 15-24 | 25-44 | 45-89 | 90-179 | 180-359 | 360-719 |
n |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100-200, 200-300, 300-500, 500-1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50-100 человек имеет существенное значение для мелких предприятий, а для крупных – не имеет.
Группировки с равными интервалами целесообразны в тех случаях, когда вариация проявляется в сравнительно узких границах и распределение является практически равномерным (например, при группировке рабочих одной профессии по размеру заработной платы, посевов какой-либо культуры по урожайности).
Для группировок с равными интервалами величина интервала:
где хmax, хmin – наибольшее и наименьшее значения признака; n – число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы бюджетных работников, которая колеблется в пределах от 600 до 750 руб., и необходимо при этом выделить пять групп, то величина интервала:
Если в результате деления получится не целое число и возникает необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую.
Прибавляя к минимальному значению признака (в данном случае 600 руб.) найденное значение интервала, получаем верхнюю границу первой группы: 600 + 30 = 630.
Прибавляя далее величину интервала к верхней границе первой группы, получаем верхнюю границу второй группы: 630 + 30 = 660 и т.д.
В результате получим такие группы работников по размеру заработной платы, руб.:
600-630; 630-660; 660-690; 690-720; 720-750.
В этом распределении имеет место неопределенность: к какой группе, например, отнести работника с заработком в 630 руб. – к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия – левое число включает в себя обозначенное значение, а правое – не включает. Значит, работник, получающий 630 руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном выше примере), и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что работник с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «750 и выше». И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».
Все вышесказанное относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, имеющиеся группировки могут быть несопоставимы из-за различного числа выделенных групп или неодинаковых границ интервалов. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка – образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
Использование вторичной группировки для приведения двух группировок с различными интервалами к единому виду рассмотрим на примере распределения акционеров двух районов области по размеру дивидендов на одну акцию (по условным данным табл. 3.1).
Таблица 3.1
Дата добавления: 2015-10-24; просмотров: 98 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Задачи и виды группировок | | | Статистические ряды распределения |