Читайте также:
|
|
Варианты | |||||||||
Частоты вариант |
Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Общая сумма частот вариационного ряда равна объему выборки.
Анализ данных исследования начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.
Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это – таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.
Абсолютная и относительная частоты связаны соотношением:
, (3)
где fа, – абсолютная частота некоторого значения признака, N – число наблюдений, f0, – относительная частота этого значения признака. Очевидно, что сумма всех абсолютных частот равна числу наблюдений (т.е. N), а сумма всех относительных частот равна 1. Нередко относительная частота применяется для оценки вероятности встречаемости значения.
Таблицы распределения накопленных частот строятся следующим образом: напротив каждого значения (интервала) указывается сумма частот встречаемости всех наблюдений, величина признака у которых не превышает данного значения (то есть меньше верхней границы данного интервала). Поэтому последняя в столбце накопленная частота будет равна 1.
Для более наглядного представления строится график распределения частот или график накопленных частот – гистограмма или сглаженная кривая распределения.
Гистограмма распределения частот – это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения.
Гистограмма накопленных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу).
Связь между неметрическими переменными, то есть переменными, относящимися к номинальной или порядковой шкале с не очень большим количеством категорий, лучше всего представить с помощью кросстабуляции. Кросстабуляция – процесс объединения двух (или нескольких) таблиц частот таким образом, чтобы каждая ячейка (клетка) в построенной таблице представлялась единственной комбинацией значений или уровней табулированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Исследуя эти частоты, можно определить связи между табулированными переменными. Обычно табулируются категориальные (номинативные) переменные или переменные с относительно небольшим числом значений. Если вы хотите табулировать непрерывную переменную, то вначале ее следует перекодировать, разбив диапазон изменения на небольшое число интервалов (например, доход: «низкий», «средний», «высокий»).
Простейшая форма кросстабуляции – это таблица сопряженности «2x2», в которой значения двух переменных «пересечены» (сопряжены) на разных уровнях и каждая переменная принимает только два значения, т.е. имеет два уровня (поэтому таблица называется «2x2»). К примеру, пусть проводится исследование, в котором мужчины и женщины опрашиваются о том, какой напиток они предпочитают (газированную воду марки A или газированную воду марки B); таблица первичных данных может быть такой, как таблица 3.
Таблица 3
Дата добавления: 2015-08-09; просмотров: 195 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Пример простой таблицы данных | | | Значение пассажирских перевозок и задачи железных дорог по их обеспечению |