Читайте также:
|
|
Сравнение средних
Сравнение средних значений различных выборок относится к часто применяемым методам статистического анализа. Основной целью такого анализа становится ответ на вопрос: существует ли различие между значениями средних и насколько оно статистически значимо.
При выборе способа сравнения средних имеют значение такие факторы как характер решаемой задачи, уровень измерения и характер распределения сравниваемых переменных. Таким образом, выделяются несколько типов тестовых ситуаций:
Задача | Применяемые статистические тесты | |
Интервальная шкала, распределение близко к нормальному | Интервальная шкала, распределение существенно отклоняется от нормального, либо порядковая шкала | |
Сравнение средних значений двух независимых выборок | t-тест для независимых выборок | Критерий Манна-Уитни |
Сравнение средних значений двух зависимых (связанных) выборок | t-тест для зависимых выборок | Тест Уилкоксона, знаковый тест, тести хи-квадрат по методу Мак-Немара |
Сравнение более двух независимых выборок | Однофакторный дисперсионный анализ | H-тест по Крускал и Уоллиса, Медианный тест |
Сравнение более двух зависимых (связанных) выборок | Однофакторный дисперсионный анализ с повторными измерениями | Тест Фридмена, W Кендала, Q Кохрана |
Сравнение средних значений двух независимых выборок с помощью t-теста для независимых выборок
Формулировка задачи: выяснить наличие возрастных различий у потенциальных избирателей двух кандидатов – Иванова и Петрова.
Эмпирическую базу составляют ответы респондентов на вопрос «Если бы выборы состоялись в ближайшее воскресенье, за кого бы вы проголосовали?» (номинальная шкала) и информация о возрасте опрашиваемых (интервальная шкала).
На первом этапе необходимо отфильтровать респондентов в соответствии с условиями задачи. Поскольку нас интересуют респонденты, выразившие готовность отдать свои голоса за Иванова или Петрова, которые в базе данных закодированы, соответственно, числами 2 и 4 (переменная v_28), формируем условие отбора:
Data®Select cases * If condition is satisfied ® If… (v_28=2 | v_28=4)®Ok
Поскольку переменная «возраст» имеет интервальный уровень измерения, мы можем воспользоваться t-тестом для независимых выборок. Однако необходимо убедиться, что распределения этого признака в обеих группах не имеет существенных отклонений от нормального.
Шаг 1. Оценка формы эмпирического распределения (альтернатива)
Определить форму распределения (наличие отклонения от нормального) можно с помощью специального теста (тест Колмогорова-Смирнова для проверки формы распределения).
Для этого необходимо выполнить расщепление массива:
Дата добавления: 2015-07-18; просмотров: 130 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Сравнение салонных процедур и продукции Mary Kay | | | Data®Split file *Analize all cases, do not create groups®Ok |