Читайте также:
|
|
Абсолютно согласен (1) Скорее согласен, чем нет (2)
Не могу сказать определенно (3)
Скорее не согласен (4) Абсолютно не согласен (5) Среднее
50 0 0 50 3,0 |
5 15 60 3,0 |
Рекламный ролик 1: Рекламный ролик 2: Рекламный ролик 3:
"Ультра" % "Власть" % "Дети" %
20 20 20
20 20 3,0
Значения средних намерения купить, сложившегося после просмотра каждого рекламного ролика, совпадают, несмотря на то, что лежащие в основе распределения ответов значительно отличаются друг от друга. Ответы после просмотра рекламного ролика 1 под названием "Ультра" равномерно распределились по всем пяти категориям, тогда как ответы на рекламный ролик 2 под названием "Власть" приходятся исключительно на края шкалы. Распределение реакций на рекламный ролик 3 под названием "Дети" напоминают то, что мы зачастую называем колоколообразной
Математически это выражается формулой:
которая означает, что "среднее (X) равно сумме (2) произведений серединной точки (т,) каждой группировки от первой (i = 1) до последней (1) на ее частоту (Q, деленной на общее число наблюдений (N).
ГЛАВА 15. Описательные методы анализа количественных данных 427
кривой нормального распределения — большинство ответов расположены в центре распределения, и процент ответов уменьшается к краям шкалы. Изучение этого распределения иллюстрирует важнейший аспект среднего: среднее становится тем менее репрезентативным по отношению к распределению, на основе которого оно вычисляется, чем больше распределение отличается от нормальной кривой. Несмотря на то, что среднее намерения приобрести товар равняется 3,0 для всех трех роликов, это значение более репрезентативно для распределения реакций на ролик 3 по сравнению с реакциями на ролики 1 и 2. Нельзя утверждать, что среднее ответов после просмотра рекламного ролика 2 составляет 3,0, или определять его как нейтральное, так как, в сущности, ни один из респондентов не дал ему подобной оценки.
Таким образом, если вы вычисляете средний балл, важно определить, насколько хорошо среднее представляет распределение ответов, на основе которого оно вычислялось. Это можно сделать, визуально изучив распределение баллов и приняв субъективное решение о представительности среднего или воспользовавшись статистиками для определения диапазона, в котором изменяются ответы, и адекватности среднего для описания этого диапазона. В последнем случае вы вычисляете и изучаете дисперсию и стандартное отклонение распределения. Дисперсия и стандартное отклонение, которые могут подсчитываться как для сгруппированных, так и для несгруппированных данных, являются вычисляемыми показателями рассеивания значений баллов относительно среднего.
Дисперсия (обозначаемая символом s2) вычисляется таким образом: вычисляется сумма квадратов отклонений каждого наблюдения (X,) от среднего (X), которая делится затем на общее число наблюдений минус один (N-I). Математически это выражается формулой:
Поэтапная процедура вычисления дисперсии ряда данных (сгруппированных и несгруппированных) приведена в табл. 15.3.
Хотя дисперсия — хорошая мера степени рассеивания данных, все же ее использование имеет один недостаток. Дисперсия выражается в квадратах единиц измерения, а не в исходных единицах. Например, дисперсия для данных в табл. 15.3 представляет квадраты оценок. Следовательно, трудно соотнести числовое значение дисперсии с числовым значением среднего.
Эта проблема решается благодаря использованию стандартного отклонения. Стандартное отклонение равно квадратному корню из дисперсии и вычисляется с помощью формулы:
428 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Таким образом, стандартное отклонение как квадратный корень из дисперсии выражается в тех же единицах, что и результаты первоначального измерения. В итоге несложно соотнести величину стандартного отклонения со средним.
Если просто руководствоваться интуицией, становится ясно, что чем больше разброс ряда данных, тем больше дисперсия и стандартное отклонение. Если разброс отсутствует и каждое значение равняется среднему, тогда все отклонения будут равняться нулю, а значит дисперсия (основанная на сумме квадратов этих отклонений) и стандартное отклонение также будут равняться нулю. (Вы можете самостоятельно это доказать. Вычислите дисперсию и стандартное отклонение для ряда, состоящего из десяти одинаковых баллов. Значение баллов не играет роли.) При возрастании разброса в ряду данных, отклонения от выборочного среднего также имеют тенденцию возрастать, как и сумма квадратов этих отклонений. Следовательно, если две выборки респондентов отвечают на один и тот же вопрос, большее значение дисперсии указывает на большее рассеивание баллов.
Таблица 15.3. Вычисление дисперсии и стандартного отклонения на основе несгруппированных и сгруппированных данных
Сгруппированные данные
Первый шаг: вычислите среднее = [(15 х 1) + (45 х 2) + (40 х 3) + (30 х 4) + (70 х 5): 200] = = 695: 200 = 3,48
Количество Значение Отклонение от Квадраты отклонения Квадраты
респондентов ответа среднего отклонениях
(частота) частота
15 1 -2,48 6,15 92,25
45 2 -1,48 2,19 98,55
40 3 -0,48 0,23 9,20
30 4 +0,52 0,27 8,10
70 5 +1,52 2,31 161,70
Итого = 200
Второй шаг: вы- Третий шаг: возведите в Четвертый шаг:
числите отклоне- квадрат отклонения от сложите произ-
ния от среднего среднего ведения квад-
ратов отклонений на частоту
Пятый шаг: дисперсия = сумма квадратов отклонений: (число респондентов — 1) = 369,8: 195 =1,86
Шестой шаг: стандартное отклонение = у]дисперсия = лД,86 =1,36
430 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Если же ряд содержит четное число значений, медиана определяется как среднее двух центральных значений в ранжированном ряду.
Что использовать — среднее или медиану? Определение среднего и медианы ряда значений важно и полезно для более глубокого понимания особенностей данных. В целом, среднее является более предпочтительной мерой в силу своих математических свойств и возможности лучше оценивать среднее генеральной совокупности на основе выборочного среднего. Вместе с тем, существуют две ситуации, когда следует предпочесть медиану.
Первая ситуация — когда ряд данных содержит одно или несколько экстремальных значений (так называемых "выбросов" — необычно малых или больших значений). Определять медиану в таких случаях предпочтительнее, поскольку значение среднего чрезвычайно чувствительно к наличию выбросов, тогда как медианы — нет. Если имеются экстремальные значения, среднее может представить очень искаженную картину. Например, предположим, что вы хотите описать уровень доходов целевой аудитории нового товара. Вы представляете концепцию нового товара репрезентативной выборке и отмечаете уровни доходов тех, кто сильно или умеренно заинтересован в приобретении товара. Допустим, уровень доходов тех, кто сильно и умеренно заинтересован, был таким.
Доход | Частота |
10 000 | |
12 000 | |
17 000 | |
20 000 | |
747 000 |
Среднее доходов части выборки, заинтересованной в новом товаре, составляет 35 314 долл. Это среднее не отражает реальной картины всей совокупности. Оно искусственно завышено, так как ряд содержит одно экстремальное значение, что может повлечь за собой принятие неверного решения. Медиана, которая в данном случае составляет 12 тыс. долл., гораздо лучше описывает данную совокупность. Второй ситуацией, когда следует отдать предпочтение медиане, является наличие открытых категорий в группировке данных. Группировка по возрасту, описанная выше в этой главе, состоит из полностью закрытых групп. Это означает, что каждая возрастная категория имеет верхнюю и нижнюю границу. Однако для некоторых группировок используются открытые категории. Например, одной из категорий группировки данных о доходах может быть пункт "более 100 тыс. долл.". Среднюю точку этой группы определить невозможно, так как не установлена верхняя граница. Следовательно, в этой ситуации необходимо использовать медиану, поскольку без серединной точки вычислить среднее сгруппированных данных невозможно.
Мода. Еще одной мерой центральной тенденции служит мода. Она определяется как наиболее часто встречающееся значение в ряду данных. Описанные выше шка-
ГЛАВА 15. Описательные методы анализа количественных данных ЛЗА
лы, отражающие намерение купить, имеют различные моды. Распределение по рекламному ролику 1 под названием "Ультра" многомодально, так как существует более двух значений, которые встречаются чаще всего. Распределение рекламного ролика под названием "Власть" бимодально, так как чаще других встречаются два значения. Распределение рекламного ролика под названием "Дети" имеет одну моду, равную трем, так как это значение встречается чаще других.
Рис. 15.2. Влияние свойств распределения на значения среднего, медианы и моды
432 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Соотношение среднего, моды и медианы. Среднее, мода и медиана дают различное видение характеристик ряда. Распределение будет симметричным, если среднее, медиана и мода совпадают (см. верхнюю часть рис. 15.2). В таких случаях (а) распределение справа от среднего, медианы или моды — это зеркальное отображение распределения слева от этих величин и (б) большинство наблюдений приходится на центр распределения. В этой ситуации среднее служит точной и предпочитаемой мерой центральной тенденции распределения. Многие распределения не являются симметричными. Распределение, в котором мода меньше медианы, а медиана в свою очередь меньше среднего, скошено влево. Это распределение имеет целый ряд значений с низкой частотой в верхней части (см. среднюю часть рис. 15.2). Распределение, в котором мода больше медианы, а медиана больше среднего, скошено вправо. Это распределение имеет ряд значений с низкой частотой в нижней части (см. нижнюю часть рис. 15.2). В зависимости от скошенности распределения и диапазона значений в качестве меры центральной тенденции выбирается или медиана, или мода.
Упрощенное представление нескольких
дескриптивных мер____________________________
С помощью дескриптивных мер обобщаются тенденции, лежащие в основе данных. Тем не менее, бывают случаи, когда многочисленные дескриптивные меры конечным пользователям результатов исследований не представляются. Ценность проведенных исследований при этом значительно падает, так как конечный пользователь не видит широкой картины полученных результатов исследования, и поэтому не может установить их значимость для принятия необходимых решений.
Подобной ситуации следует всячески избегать. Для упрощенного представления большого количества мер используются несколько различных аналитических приемов. Выбор подхода зависит от уровня измерения данных.
Номинальный уровень данных: организация представления и вычисление "совокупного" процента
Рассмотрим следующий вопрос-меню.
Вы только что просмотрели рекламный ролик. Поставьте свою отметку напротив утверждения, если вы считаете, что оно отражает именно те чувства, которые вызвал у вас просмотр рекламного ролика. Вы можете отметить сколько угодно утверждений (или вообще не отмечать) в зависимости от чувств, испытанных вами от просмотра рекламного ролика.
Было скучно
Я кое-что узнал(а), просмотрев рекламный ролик
Рекламный ролик рассчитан на таких людей, как я
Я видел(а) такие рекламные ролики прежде
Лицам, участвующим в рекламном ролике, можно верить
Рекламный ролик вызвал у меня замешательство
Я скажу своим друзьям, что этот рекламный ролик стоит посмотреть
Музыкальное сопровождение прекрасно подобрано
ГЛАВА 15. Описательные методы анализа количественных данных 433
Лицу, рекламирующему товар, можно верить Рекламный ролик не интересен Мне не нравятся рекламные ролики такого рода Лицо, рекламирующее товар, вызывает раздражение Хотел(а) бы снова увидеть этот рекламный ролик
Ответы на этот вопрос можно представить в виде таблицы (см. табл. 15.4). Отдельные пункты могут располагаться в порядке, представленном в анкете (пример А) или в порядке убывания процента выраженного согласия (пример Б). К сожалению, оба формата представляют данные в таком виде, что трудно будет сообщать основные закономерности реакции респондентов.
Закономерность ответов на этот вопрос можно сделать более ясной, если придерживаться следующих действий.
• Во-первых, определите, о чем данные будут говорить, т.е. установите, что вы
хотите получить — общую картину положительных или отрицательных откли
ков, или реакцию на исполнение ролика в сравнении с реакцией на рекламное
обращение. (В этом примере мы сконцентрируем внимание на положитель
ных и отрицательных реакциях.)
• Во-вторых, сгруппируйте утверждения в соответствии с целью представления
данных. Исходя из поставленной цели, отдельно группируются все положи
тельные утверждения и отдельно — все отрицательные.
• В-третьих, дайте название каждой из группировок. В нашем случае одна груп
пировка будет называться "Положительные реакции", а вторая — "Отрица
тельные реакции".
• В-четвертых, рассчитайте совокупный процент для каждой группы суждений.
Этот процент характеризует долю респондентов, выбравших, по крайней ме
ре, один из пунктов группировки4.
"Совокупный ответ и процент без дублирования, который он представляет, отражает тот факт, что каждый респондент учитывается только единожды при вычислении совокупного процента. Предположим, например, что четыре утверждения: утверждение 1, утверждение 2, утверждение 3 и утверждение 4 вместе составляют некоторую группу. Согласие респондентов с этими утверждениями в представленной ниже таблице отмечено крестиками:
Утверждение 1 | Утверждение 2 | Утверждение 3 | Утверждение 4 | Совокупный (по крайне | |
мере одно) | |||||
Респондент 1 | X | X | X | X | X |
Респондент 2 | X | X | |||
Респондент 3 | |||||
Респондент 4 | |||||
Респондент 5 | X | X | X | ||
Всего | |||||
Процент |
Совокупный процент для этой группы респондентов по сгруппированным утверждениям составляет 60%. Это означает, что 60% респондентов (3 из 5) согласны, по крайней мере, с одним из четырех утверждений.
434 ЧАСТЬ IV. Количественные исследования и анализ их результатов
Таблица 15.4. Способы представления ответов на вопросы-меню
Респонденты, выразившие согласие, %
Пример А: порядок пунктов в соответствии с анкетой
Было скучно 23
Я кое-что узнал(а), просмотрев рекламный ролик 74
Рекламный ролик рассчитан на таких людей, как я 87
Я видел(а) такие рекламные ролики прежде 25
Лицам, участвующим в рекламном ролике, можно 31
верить
Рекламный ролик вызвал у меня замешательство 26
Я скажу своим друзьям, что этот рекламный ролик 24
стоит посмотреть
Музыкальное сопровождение прекрасно подобрано 83
Лицу, рекламирующему товар, можно верить 84
Рекламный ролик не интересен 28
Мне не нравятся рекламные ролики такого рода 22
Лицо, рекламирующее товар, вызывает раздражение 26
Хотел(а) бы снова увидеть этот рекламный ролик 78
Респонденты, выразившие согласие,' Пример Б: упорядочено по убыванию степени согласия
Рекламный ролик рассчитан на таких людей, как я 87
Лицу, рекламирующему товар, можно верить 84
Музыкальное сопровождение прекрасно подобрано 83
Хотел(а) бы снова увидеть этот рекламный ролик 78
Я кое-что узнал(а), просмотрев рекламный ролик 74
Лицам, участвующим в рекламном ролике, можно 31
верить
Рекламный ролик не интересен 28
Рекламный ролик вызвал у меня замешательство 26
Лицо, рекламирующее товар, вызывает раздражение 26
Я видел(а) такие рекламные ролики прежде 25
Я скажу своим друзьям, что этот рекламный ролик 24
стоит посмотреть
Было скучно 23
Мне не нравятся рекламные ролики такого рода 22
ГЛАВА 15. Описательные методы анализа количественных данных 435
Табл. 15.5 демонстрирует указанный подход к представлению номинальных данных. Когда данные организованы так, как показано в таблице, сразу становятся очевидными следующие выводы.
• Почти всем респондентам что-либо понравилось в рекламном ролике
(учитывая высокий совокупный процент группировки положительных утвер
ждений).
• Большинство потребителей согласились с тем, что рекламный ролик —
именно то, что нужно ("рассчитан на таких людей, как я"), а личность, рекла
мирующая товар, была достаточно убедительна, хотя и вызывала некоторое
раздражение.
• Отрицательные ответы отражают мнение лишь нескольких респондентов
(учитывая низкий совокупный процент группировки негативных утвержде
ний), причем каждому из них не нравится почти все в рекламном ролике
(отмечаются почти все отрицательные утверждения).
Таблица 15.5. Представление ответов на вопросы-меню: группировка пунктов
Дата добавления: 2015-07-16; просмотров: 61 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Частота | | | Положительные суждения — совокупный процент |