Главная » Статьи » Методы математической статистики
Главная» Статьи» Методы математической статистики
Коэффициент ранговой корреляции Спирмена
Автор статьи: Попов Олег Александрович.
При копировании или цитировании ссылка на сайт и автора обязательна!
Коэффициент ранговой корреляции Спирмена используется в случаях, когда: - переменные имеют ранговую шкалу измерения; - распределение данных слишком отличается от нормального или вообще неизвестно; - выборки имеют небольшой объём (N < 30).
Интерпретация рангового коэффициента корреляции Спирмена не отличается от коэффициента Пирсона, однако его смысл несколько отличен. Чтобы понять различие этих методов и логически обосновать области их применения сравним их формулы.
Коэффициент корреляции Пирсона:
Коэффициент корреляции Спирмена:
Как видим формулы значительно различаются. Сравним формулы
В формуле корреляции Пирсона используется среднее арифметическое и стандартное отклонение коррелируемых рядов, а в формуле Спирмена не используется. Таким образом, для получения адекватного результата по формуле Пирсона, необходимо, чтобы коррелируемые ряды были приближены к нормальному распределению (среднее и стандартное отклонение являются параметрами нормального распределения). Для формулы Спирмена это не актуально.
Элементом формулы Пирсона является стандартизация каждого ряда в z-шкалу.
Как видим, перевод переменных в Z-шкалу присутствует в формуле коэффициента корреляции Пирсона. Соответственно, для коэффициента Пирсона абсолютно не имеет значение масштаб данных: к примеру, мы можем коррелировать две переменных, одна из которых имеет мин. = 0 и макс. = 1, а вторая мин. = 100 и макс. = 1000. Как бы не различался размах диапазона значений, все они будут переведены в стандартные z-значения одинаковые по своему масштабу.
В коэффициенте Спирмена такой нормализации не происходит, поэтому
ОБЯЗАТЕЛЬНЫМ УСЛОВИЕМ ИСПОЛЬЗОВАНИЯ КОЭФФИЦИЕНТА СПИРМЕНА ЯВЛЯЕТСЯ РАВЕНСТВО РАЗМАХА ДВУХ ПЕРЕМЕННЫХ.
Перед использованием коэффициента Спирмена для рядов данных с различным размахом, необходимо обязательно их ранжировать. Ранжирование приводит к тому, что значения этих рядов приобретают одинаковый минимум = 1 (минимальный ранг) и максимум, равный количеству значений (максимальный, последний ранг = N, т.е. максимальному количеству случаев в выборке).
В каких случаях можно обойтись без ранжирования
Это случаи, когда данные имеют исходно ранговую шкалу. К примеру, тест ценностных ориентаций Рокича.
Также, это случаи, когда количество вариантов значений невелико и в выборке присутствуют фиксированные минимум и максимум. К примеру, в семантическом дифференциале минимум = 1, максимум = 7.
Пример расчета рангового коэффициента корреляции Спирмена
Тест ценностных ориентаций Рокича был проведён на двух выборках Xи Y. Задача: узнать, насколько близки иерархии ценностей данных выборок (буквально – на сколько они похожи).
Полученное значение r=0,747 проверяется по таблице критических значений. Согласно таблице, при N=18, полученное значение достоверно на уровне p<=0,005