Читайте также:
|
|
Доля
Не женат (не замужем) и никогда не был(а) женат (замужем)
Официально женат (замужем), не живем вместе
Не женат (не замужем), разведен(а)
Не женат (не замужем), вдовец (вдова)
Женат (замужем)
ВСЕГО
10 6 1
28 50
0,1
0,2
0,12
0,02
0,56
1,00
Будучи одновременно и тем человеком, который использует информацию, и тем, кто ее передает другим людям, вы должны отдавать себе отчет в том, что конечные пользователи результатов исследования, — сотрудники рекламного агентства и ваши клиенты, — в целом считают доли слишком сложным методом для понимания значения данных и сделанных на их основе выводов. Доли — это эффективный, но не слишком распространенный способ представления относительных размеров групп.
Проценты. Более распространенным способом обобщенного представления данных служит процентное распределение. Оно вычисляется путем деления количества ответов в каждой категории на общее количество ответов и умножением частного на 100 (это все равно, что умножить долю на 100). Так, процент женатых (замужних) респондентов в выборке будет составлять 56%, и подсчитывается он следующим образом.
ГЛАВА 15. Описательные методы анализа количественных данных 419
Процент женатых (замужних участников) = Число женатых (замужних) участников выборки
xlOO.
Общее число участников выборки Процент женатых (замужних участников)= 28/50x100 = 0,56x100 = 56%.
В приведенной ниже таблице представлены распределения частот и процентов для вопроса о семейном положении. Подобно таблице долей, таблица процентного распределения включает три основных элемента: метки категорий, частоты и проценты выборки по каждой из категорий. Обратите внимание, что общая сумма в столбце процентов составляет 100.
Нынешнее семейное положение
Частота Процент ответов
Не женат (не замужем) и никогда не был(а) женат (замужем)
Официально женат (замужем), не живем вместе
Не женат (не замужем), разведен(а)
Неженат (не замужем), вдовец (вдова)
Женат
ВСЕГО
Подсчет процентов для данных на номинальном, интервальном и относительном уровне измерения очень прост. Процент представляет частоту в одной конкретной категории, деленную на сумму частот всех категорий. Этот подход к вычислению процентов несколько отличается для порядковых данных. При вычислении процентов для данных на порядковом уровне измерения каждый из пунктов рассматривается как независимая единица. Порядковые шкалы, такие как вопросы на ранжирование, предлагают респонденту несколько объектов или свойств с просьбой упорядочить в соответствии с определенным критерием. Приведенный ниже пример — типичный вопрос на ранжирование.
Вы только что увидели три рекламных ролика. Каждому из роликов было дано название до того, как вы их просмотрели. Ниже ролики перечислены в порядке, в котором вы их увидели. Пожалуйста, дайте оценку каждому из рекламных роликов, указав степень своего доверия к их содержанию. Поставьте "1" напротив названия ролика, который показался вам наиболее правдоподобным, "2" — напротив менее правдоподобного ролика и "3" — напротив ролика, который, на ваш взгляд, был наименее правдоподобен. Каждая из оценок от " 1" до "3" ставится только один раз. Повторения не допускаются.
New Century Scientist (ученый нового столетия) ___________
New Century Mom (мама нового столетия) ___________
New Century Environment
(окружающая среда в новом столетии) ___________
420 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Первым шагом анализа ранжированных данных является построение распределения частот, показывающего, сколько раз каждому из пунктов был присвоен определенный ранг. Распределение частот для 50 респондентов, ранжировавших эти три рекламных ролика, может выглядеть таким образом.
Частота рангов каждого Рекламный ролик Рекламный ролик Рекламный ролик
рекламного ролика на уровне "Ученый" "Мама" "Окружающая среда"
Сумма частот |
2 18 30 50
Как видно из таблицы, 38 респондентов присвоили рекламному ролику под названием "Ученый" ранг " 1", 8 участников — ранг "2", а 4 участника — ранг "3".
Следующим шагом анализа и представления ранжированных данных является преобразование распределения частот в распределение процентов для каждого из ранжированных объектов. В данном случае распределения будут выглядеть таким образом.
Частота рангов каждого Рекламный ролик Рекламный ролик
рекламного ролика на уровне "Ученый", % "Мама", %
Рекламный ролик "Окружающая среда",
1
Итого
4 36 60 100
Анализ данных по столбцам (сверху вниз) указывает на то, что большая часть участников присвоила:
• рекламному ролику под названием "Ученый" — ранг "1" (76%), затем— "2"
(16%);
• рекламному ролику под названием "Мама" — ранг "2" (48%), а рекламному
ролику под названием "Окружающая среда" — "3" (60%).
Распределение процентов для порядковых данных можно также читать по строке. Данные в первой строке предыдущей таблицы указывают на то, что рекламный ролик "Ученый" получил наибольшее число рангов "1" (76%), намного превысив число рангов "1", полученных рекламными роликами "Мама" (20%) и "Окружающая среда" (4%).
В общем, процесс вычисления и представления таблиц и графиков распределения долей и процентов довольно прост. Однако при этом необходимо придерживаться двух основных правил. Во-первых, всегда указывайте в таблице и на графике общее число наблюдений. Тем самым вы предоставляете своей аудитории возможность оценить объем выборки, для которой построено распределение. Во-вторых, избегайте подсчета долей и процентов, если общее число наблюдений менее 50. Если объем выборки намного меньше этого числа, случайные отклонения данных могут вызвать значительные изменения долей и процентов, сообщающих об отдельной категории ответа.
ГЛАВА 15. Описательные методы анализа количественных данных 421
Пропорции. Третий путь суммирования данных на всех уровнях измерения — использование пропорции. Пропорция одного числа Хв отношении другого числа Копре -деляется как Оделенное на Y. Слова по отношению к — важная составляющая этого определения. Число, предваряющее по отношению к (в данном случае это число X), ставится в числитель дроби, тогда как число после слов по отношению к ставится в знаменатель дроби. Пропорции, как следует из этой математической формулы, дают возможность отчетливо видеть соотношения между относительным размером двух категорий, использованных в анкетном вопросе. Что касается данных о семейном положении, мы видим, что пропорция не состоящих в браке респондентов по отношению к состоящим в браке составляет 22/28 или 22:28. Однако понять соотношение будет легче, если наименьший член пропорции представить равным единице. В этом случае пропорция представляет два числами Y, деленные на наименьшие из них. Таким образом, пропорцию не состоящих в браке респондентов по отношению к состоящим в браке можно также выразить как 1:1,27. Обратите внимание, как использование пропорции сразу делает очевидным относительный объем этих групп.
Анализ данных интервального и относительного уровня измерений
Интервальные и относительные шкалы обладают всеми характерными особенностями, присущими номинальным и порядковым шкалам, а также особыми свойствами, не характерными для этих не столь мощных уровней измерения. Следовательно, все количественные и графические методы, используемые для описания и презентации номинальных и порядковых данных, могут быть применены для описания и представления интервальных и относительных данных. Однако сила данных интервального и относительного уровней позволяет осуществить дополнительный анализ, невозможный на номинальном и порядковом уровне. Характер и количество шагов, которые следует предпринять перед применением этих дополнительных методов анализа, зависят от того, являются ли полученные данные дискретными или непрерывными.
Дискретные данные
Рассмотрим следующий вопрос для оценки.
Пожалуйста, дайте оценку рекламному ролику, который вы только что видели. Для выражения своего согласия или несогласия с утверждением: "Этот рекламный ролик рассчитан именно на таких людей, как я" воспользуйтесь приведенной ниже шкалой.
Абсолютно согласен | <п |
Скорее согласен, чем нет | (2) |
Не могу сказать определенно Скорее не согласен | (3) |
(4) | |
Абсолютно не согласен | (5) |
422 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Данные, полученные с помощью этого вопроса, являются дискретными. Дискретные данные содержат ответы, ограниченные конкретным набором целых чисел, отделенных друг от друга одинаковыми интервалами. Этот вопрос дает возможность собрать дискретные данные, так как респондент должен выбрать один из вариантов ответа (ограниченный набор), представленных кодами " 1", "2" и т.д. (фиксированный и одинаковый шаг между уровнями ответов). Для применения описательных методов анализа дискретных данных можно не предпринимать каких-либо промежуточных шагов.
Непрерывные данные
Непрерывные данные предоставляют такую возможность для ответа, при которой значения, по крайней мере, теоретически, могут быть как угодно близко расположены друг к другу на числовой шкале. Например, с помощью вопроса "Сколько вам лет?" собираются непрерывные данные. Респондент может ответить, что ему 40, 4О'/2, 405/12, 41, 413/4 и т.п. Поскольку вопросы для сбора непрерывных данных не предполагают наличия каких-либо заранее установленных и предварительно закодированных категорий, данные перед вычислением распределения процентов и построением столбиковых или круговых диаграмм следует определенным образом организовать. Организация непрерывных данных называется группировкой (или категоризацией). Процесс группировки осуществляется в определенной последовательности.
• Данные упорядочиваются.
• Определяются число и ширина интервалов категорий.
• Строится распределение частот.
Упорядочение данных. Представим, что на предыдущий вопрос о возрасте ответили 100 участников опроса. Первым шагом группировки непрерывных данных будет упорядочивание данных. Результат упорядочивания называется несгруппированным рядом и его можно сравнить с построением учеников класса по росту или размещением маслин по размеру. Несгруппированный ряд, включающий 100 ответов на вопрос о возрасте, воспроизведен на рис. 15.1.
Определение количества и ширины интервалов категорий. Следующий шаг предполагает определение числа и ширины интервалов категорий. От этого зависит способ группировки данных. По каким категориям группируются данные о возрасте и сколько их — 5 или 25?
Определение количества и ширины интервалов — чрезвычайно важный этап. Хотя твердо установленных правил для проведения границ между категориями не существует, при определении ширины интервалов и границ между категориями следует иметь в виду, что:
• группировки должны отражать характер данных. Если размах данных (т.е.
разность между наибольшим и наименьшим значениями) большой, тогда и
ширина интервалов категорий, скорее всего, будет также большой. Данные,
изменяющиеся в более узком диапазоне, лучше обобщать с использованием
относительно меньших категорий;
ГЛАБА 15. Описательные методы анализа количественных данных 423
количество групп не должно быть настолько большим, чтобы скрыть наиболее важные особенности данных, и не столь малым, чтобы лишить систему категорий смысла;
ширина интервала должна быть целым числом и, по возможности, делиться на удобное число, например 2, 10, 25, 100 и т.д.;
интервалы для всех категорий должны быть, по возможности, одинаковой ширины.
Рис. 15.1. Несгруппированный ряд ответов на вопрос: "Сколько вам лет?"
Руководствуясь этими рекомендациями, вы можете попробовать различные схемы группировки. Например, данные о возрасте могут быть сгруппированы любым из приведенных ниже способов изменения ширины интервала для каждой из групп.
Если просто руководствоваться интуицией, средняя группировка кажется наиболее правильной. Хотя все три схемы группировок удовлетворяют рассмотренным выше третьему и четвертому критерию, группировка на 8 категорий наиболее удачна, поскольку удовлетворяет требованиям первых двух критериев. Размер интервала группировки при разбиении на 8 категорий представляется обоснованным, принимая во внимание размах исходных данных. К тому же, группы не настолько велики, чтобы сгруппировать вместе респондентов с абсолютно разными характеристиками (например объединение шестнадцати- и тридцатилетних), и не столь малы, что группировка не дает преимуществ по сравнению с исходными данными.
424 ЧАСТЬ IV. Количественные исследования и анализ их результатов
5 категорий | 8 категорий | 16 категорий |
1-15 | 1-9 | 1-4 |
16-30 | 10-19 | 5-9 |
31-45 | 20-29 | 10-14 |
46-60 | 30-39 | 15-19 |
70-79 | 40-49 | 20-24 |
50-59 | 25-29 | |
60-69 | 30-34 | |
70-79 | 35-39 | |
40-44 | ||
45-49 | ||
50-54 | ||
55-59 | ||
60-64 | ||
65-69 | ||
70-74 | ||
75-79 |
Описательные статистики
Как отмечалось выше, свойства данных на интервальном и относительном уровнях дают возможность осуществить статистический анализ, невозможный на номинальном и порядковом уровне измерения. Далее в этой главе рассматриваются две фундаментальные группы статистик: меры положения и меры изменчивости. Следующая глава посвящена использованию этих мер в более сложных статистических методах.
Среднее и меры изменчивости. Среднее или среднее арифметическое — пожалуй, наиболее распространенная статистика свертки для совокупности интервальных и относительных данных. Понятие среднего балла должно быть вам хорошо знакомо, поскольку мы часто сами вычисляем это значение, например при подсчете среднего баллов трех экзаменов в виде теста или при определении среднего балла аттестата. В этих и подобных случаях мы вычисляем среднее, складывая все значения чисел и затем деля полученную сумму на общее их количество. Например, средним для чисел 2, 3, 7, 8, 10 будет число 6 (30: 5). Математически это выражается формулой':
1 В этой и других математических формулах для обозначения математических понятий и вычислений часто используются символы. Символ X обозначает среднее арифметическое выборки. Символ N обозначает общее число наблюдений. Символ £ обозначает "сумму всех баллов от первого (I =1) до последнего (п)". Символ X, обозначает балл отдельного респондента. Таким образом, формула означает: "Среднее вычисляется сложением всех баллов от первого до последнего и последующим делением этой суммы на общее число наблюдений".
ГЛАВА 15. Описательные методы анализа количественных данных 425
Если число ответов невелико или данные не сгруппированы, среднее легко вычислить, сложив сырые баллы и поделив полученную сумму на общее число баллов. Большие массивы данных и сгруппированные данные требуют другого метода для вычисления среднего ряда данных. В этом случае подход будет таким же, но математические вычисления — другими.
При вычислении среднего ряда сгруппированных данных предполагается, что все ответы одной категории сконцентрированы посередине интервала. (Обратите внимание: результатом такого предположения является то, что среднее, вычисляемое на основе сгруппированных данных, будет отличаться от среднего, вычисляемого на основе несгруппированного, исходного ряда.) Учитывая это предположение, при вычислении среднего сгруппированных данных следует придерживаться следующих четырех шагов (см. табл. 15.2).
Таблица 15.2. Вычисление среднего сгруппированных данных
Возрастная группа | Первый шаг: вычисление середины интервала Середина интервала | Частота | Второй шаг: умножение середины интервала на частоту Произведение середины интервала на частоту |
0-9 | 4,5 | 13,5 | |
10-19 | 14,5 | 174,0 | |
20-29 | 24,5 | 294,0 | |
30-39 | 34,5 | 897,0 | |
40-49 | 44,5 | 890,0 | |
50-59 | 54,5 | 708,5 | |
60-69 | 64,5 | 516,0 | |
70-79 | 74,5 | 447,0 | |
ВСЕГО |
Третий шаг: сложение произведений Четвертый шаг: деление суммы произведений на общее число наблюдений
=3940/100
• Во-первых, найдите середину каждого интервала группировки, суммируя наименьшее и наибольшее значения и деля полученный результат на два. На-
426 ЧАСТЬ IV. Количественные исследования и анализ их результатов
пример, серединной точкой категории респондентов в возрасте от 20 до 29 лет будет 24,5 (20 + 29: 2).
• Во-вторых, умножьте середину интервала каждой категории на частоту кате
гории (т.е. на количество наблюдений в этой категории).
• В-третьих, сложите все произведения, полученные на предыдущем шаге.
• В-четвертых, разделите сумму, полученную на третьем шаге, на общее число
ответов2.
Среднее ряда данных можно привести в таблице распределения частот и процентов, а также на графиках (см. главу 5).
Среднее является очень мощной статистикой. Оно дает возможность представить одним числом множество ответов на вопрос анкеты. Однако, используя среднее, вы должны быть уверены, что усредненный балл действительно представляет тот ряд ответов, на основе которого он был вычислен.
Приведенная ниже таблица иллюстрирует гипотетический ряд данных о намерении приобрести товар, сложившемся после просмотра одного из трех рекламных роликов.
Дата добавления: 2015-07-16; просмотров: 80 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Насколько вы уверены в этом? | | | Я бы купал рекламируемый товар |