Читайте также:
|
|
Характер распределения выявляется главным образом с целью определиться в методах математико-статистической обработки данных.
Если характер распределения показателей психологического признака является нормальным или близким к нормальной форме распределения признака, описываемой кривой Гаусса, то мы можем использовать параметрические методы математической статистики как наиболее простые, надежные и достоверные: сравнительный анализ, расчет достоверности отличий признака между выборками по ^-критерию Стьюдента, Р-крите-рию Фишера, коэффициент корреляции Пирсона и др.
Если кривая распределения показателей психологического признака далека от нормальной, то мы вынуждены будем использовать методы непараметрической статистики: расчет достоверности отличий по критерию О Розенбаума (для малых выборок), по критерию С/ Манна-Уитни, коэффициент ранговой корреляции Спирмена, факторный, многофакторный, кластерный и другие методы анализа.
Помимо этого, по характеру распределения можно составить общее представление об общей характеристике выборки испытуемых по данному признаку и тому, насколько данная методика соответствует (т. е. «работает», валидна) данной выборке.
Важнейшими первичными статистиками, характеризующими распределение исследуемого признака, являются:
• средняя арифметическая — это величина, сумма отрицательных и положительных отклонений от которой равна нулю. В статистике ее обозначают буквой «М» или «X». Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений.
• среднее квадратичное отклонение (обозначаемое греческой буквой ст — сигма и называемое также основным, или стандартным отклонением) — мера разнообразия входящих в группу объектов; она показывает, насколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение. Разброс значений характеризует и размах — разность между наибольшим и наименьшим значением в ряду. Однако сигма полнее характеризует разброс значений относительно средней арифметической.
• коэффициент вариации — частное от деления сигмы на среднюю арифметическую, умноженное на 100%. Обозначается СУ:
СУ = ^-хШ%, (7.1)
192 Глава 7. Математико-статистическая обработка данных психологического...
где ст — стандартное отклонение; СУ— коэффициент вариации; М — среднее арифметическое.
Следует иметь в виду, что сигма (ст) — величина именованная и зависит не только от степени варьирования, но и от единиц измерения. Поэтому по сигме можно сравнивать изменчивость лишь одних и тех же показателей, а сопоставлять сигмы разных признаков по абсолютной величине нельзя. Для того чтобы сравнить по уровню изменчивости признаки любой размерности (выраженные в различных единицах измерения) и избежать влияния масштаба измерений средней арифметической на величину сигмы, применяют коэффициент вариации, который представляет собой по существу приведение к одинаковому масштабу величины ст.
Для нормального распределения существуют точные количественные зависимости частот и значений, позволяющие прогнозировать появление новых вариант:
• слева и справа от средней арифметической лежит 50% вариант;
• в интервале от М- 1стдоМ+ 1ст = 68% вариант;
• в интервале от М - 1,96ст до М + 1,96ст = 95% вариант (рис. 7.1).
I! 50% |!
!!-<--------------------------- ^ |
! М-1ст 68% М+1ст!
■-«»-'
М-1,96ст 95% М+1,96ст
Рис. 7.1
Таким образом, ориентируясь на эти характеристики нормального распределения, можно оценить степень близости к нему рассматриваемого распределения психологического признака.
Следующими по важности характеристиками распределения показателей признака являются такие первичные статистики, как коэффициент асимметрии и эксцесс.
7.1. Анализ первичных статистик
Коэффициент асимметрии — показатель скошенности распределения в левую или правую сторону по оси абсцисс. Если правая ветвь кривой длиннее левой — говорят о правосторонней (положительной) асимметрии (рис. 7.2); если левая ветвь длиннее правой — говорят о левосторонней (отрицательной) асимметрии (рис. 7.3).
Частоты
Баллы
Рис. 7.2. Правосторонняя асимметрия
• | |
Частоты | |
Баллы |
Рис. 7.3. Левосторонняя асимметрия
Эксцесс — показатель островершинности. Кривые, более высокие в своей средней части — островершинные — называются эксцессивными, у них большая величина эксцесса. При уменьшении величины эксцесса кривая становится все более плоской, приобретая вид плато, а затем и седловины — с прогибом в средней части (рис. 7.4).
Эти параметры позволяют составить первое приближенное представление о характере распределения:
• у нормального распределения редко можно обнаружить коэффициент асимметрии, близкий к единице и более единицы (-1 и +1);
• эксцесс у признаков с нормальным распределением обычно имеет величину в диапазоне 2-4.
194 Глава 7. Математико-статистическая обработка данных психологического...
а) | б) | в) | |||||||
У | V | V | |||||||
Рис. 7.4. Показатели эксцессивности распределения
Однако это только приблизительная оценка. Точную и строгую оценку нормальности распределения можно получить, используя один из существующих методов проверки.1
В более простом варианте показатели асимметрии и эксцесса с их ошибками репрезентативности определяются по следующим формулам (см.: Сидоренко Е. В., 1996, с. 232-233):
А-.
5>,-М)3
пха
,_%(*,•-М/
пха
-3;
где (х1 -М) — центральные отклонения; а — стандартное отклонение; п — количество испытуемых.
Вычислить показатели асимметрии и эксцесса эмпирического распределения можно, используя функцию «Описательная статистика»
1 См., например: Суходольскйй Г. В. Основы математической статистики для психологов. СПб., 1998; Математические методы в психологии. СПб., 2003.
7.1. Анализ первичных статистик _______________________________ 195
в программе Ехсе1. Данную операцию мы рассмотрим в разделе 7.2.3 учебного пособия.
Показатели асимметрии и эксцесса свидетельствуют о достоверном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезентативности в 3 и более раз:
тЕ
Общей причиной отклонения формы выборочного распределения признака от нормального вида чаще всего является особенность процедуры измерения: используемая шкала может обладать неравномерной чувствительностью к измеряемому свойству в разных частях диапазона его изменчивости [40, с. 61].
Такие эмпирические отклонения от нормального вида, как право-или левосторонняя асимметрия или незначительный эксцесс (или бимодальное распределение) довольно часто встречаются на практике. Связано это с особенностями экспериментальной выборки и используемыми измерительными процедурами.
В то же время рассматриваемые в учебном пособии методы статистического анализа эмпирических данных вполне допускают отклонения от нормального распределения (одни — в большей степени, другие — в меньшей).
Но в случае, если требуется убедительное обоснование полученных результатов и производимых по ним вычислений, следует использовать, в качестве дополнительных несложные методы непараметрической статистики.
Следующий момент, на который следует обратить особое внимание, относится к интерпретации психологического значения, выявляемого данным характером распределения. Что же выявляет кривая Гаусса в характеристике психологических явлений? Какой психологический смысл раскрывает кривая распределения данных, оценок, тестовых баллов исследуемого психологического признака?
Следует иметь в виду, что кривая распределения тестовых баллов (оценок, результатов выполнения заданий и т. д.), с одной стороны,
196 Глава 7. Математико-статистическая обработка данных психологического...
отражает свойства пунктов, из которых составлен тест (задание), а с другой — характеризует состав выборки испытуемых, т. е. насколько успешно они справляются с заданием, насколько данный тест (задание) дифференцирует выборку по соответствующему качеству, признаку.
Если кривая имеет правостороннюю асимметрию1, то это значит, что в тесте преобладают трудные задания (для данной выборки) (см. рис. 7.2); если кривая имеет левостороннюю асимметрию, то значит, большинство пунктов в тесте — легкие (слабые) (см. рис. 7.3).
Таким образом, имеется два варианта объяснения:
1) тест (задание) плохо дифференцирует испытуемых с низким уровнем развития способностей (свойств, качеств, характеристик): большинство испытуемых получают примерно одинаковый, низкий балл;
2) тест хуже дифференцирует испытуемых с высоким развитием способностей (свойств, качеств, характеристик): большинство испытуемых получают достаточно высокий балл.
Анализ эксцесса кривой распределения позволяет сделать следующие выводы в зависимости от формы распределения показателей (данных, вариант) психологического признака:
• в случае, когда возникает значительный положительный эксцесс
(эксцессивная кривая)' и вся масса баллов скучивается вблизи
среднего значения (рис. 7.4а), возможны следующие объяснения:
♦ ключ составлен неверно — объединены при подсчете отрицательно связанные признаки, которые взаимоуничтожают баллы. Но в практике психолога, который работает с валидными и надежными методиками, такие случаи исключаются (кроме собственной невнимательности и безответственности);
♦ испытуемые применяют, разгадав направленность теста (опросника), специальную тактику «медианного балла» — искусственно балансируя ответы «за» и «против» одного из полюсов измеряемого психологического признака;
• если подбираются пункты, тесно положительно коррелирующие
между собой (т. е. испытания не являются статистически незави
симыми), то в распределении баллов возникает отрицательный
эксцесс, принимающий форму плато (рис. 7.45);
1 При условии, что тестовые баллы по результатам обследования тем выше, чем лучше развито данное свойство, способность или качество.
7Л. Анализ первичных статистик
• максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершины распределения — до образования двух вершин — двух мод (с «провалом» между ними, см. рис. 7.4в). Такая бимодальная конфигурация распределения баллов указывает на то, что выборка испытуемых разделилась на две категории, подгруппы (с плавным переходом между ними): одни справились с большинством заданий (согласились с большинством вопросов), другие — не справились (не согласились). Такое распределение свидетельствует, что в основе заданий (пунктов) лежит какой-то один общий им всем признак, соответствующий определенному свойству испытуемых: если у испытуемых есть это свойство (способность, знание, умение), то они справляются с большинством пунктов, заданий, если нет этого свойства — то не справляются [42, с. 55-56].
Начать с анализа первичных статистик надо еще и по той причине, что они весьма чувствительны к наличию выпадающих вариант. Большие величины эксцесса и асимметрии часто являются индикатором ошибок при подсчетах вручную или ошибок при введении данных через клавиатуру для компьютерной обработки. Грубые промахи при введении данных в обработку можно обнаружить, если сравнить величины сигм у аналогичных параметров. Выделяющаяся величиной сигма может указывать на ошибки.
Существует правило, согласно которому все расчеты вручную должны выполняться дважды (особо ответственные — трижды), причем желательно разными способами, с вариацией последовательности обращения к числовому массиву.
Другой причиной больших показателей эксцесса и асимметрии может являться недостаточная надежность и валидность методик, используемых для данной популяции.
В научных исследованиях по части (отдельной выборке) никогда не удается полностью охарактеризовать целое (генеральную совокупность, популяцию, всегда остается вероятность того, что оценка генеральной совокупности на основе выборочных данных недостаточно точна, имеет некоторую большую или меньшую ошибку. Такие ошибки, представляющие собой ошибки обобщения, экстраполяции, связанные с перенесением результатов, полученных при изучении выборки, на всю генеральную совокупность, называются ошибками репрезентативности.
Репрезентативность — степень соответствия выборочных показателей генеральным параметрам.
Статистические ошибки репрезентативности показывают, в каких пределах могут отклоняться от параметров генеральной совокупности
198 Глава 7. Математико-статистическая обработка данных исследования
(от математического ожидания или истинных значений) наши частные определения, полученные на основе конкретных выборок. Очевидно, величина ошибки тем больше, чем больше варьирование признака и чем меньше выборка. Это и отражено в формулах для вычисления статистических ошибок, характеризующих варьирование выборочных показателей вокруг их генеральных параметров.
Поэтому в число первичных статистик обязательно входит статистическая ошибка средней арифметической. Формула для ее вычисления такова:
тм=±-р=, (7.2)
\п
где тм— ошибка средней арифметической; ст — сигма, стандартное отклонение; п — число значений признака.
Перечисленные основные первичные статистики позволяют оценить характер распределения данных в экспериментальном массиве и использовать основные методы параметрической и непараметрической статистики для обоснования результатов эмпирического психологического исследования.
7.2. Основные методы математической статистики и форма представления результатов сравнительного анализа
7.2.1. Использование прикладных статистических программ
Использование прикладных статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и предоставляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы. Однако в полной мере эти* преимущества могут быть использованы, если психолог имеет необходимый уровень подготовки в этой области. Обычно чем мощнее компьютерная программа (чем более широкие у нее возможности), тем больше времени она требует для освоения. Таким образом, затрачивать время на ее изучение при редких обращениях к мощному статистическому аппарату не совсем эффективно. Кроме того, очень часто использование таких программ для решения даже несложных задач также требует определенной суммы умений. Для того чтобы избежать лишних сложностей и временных затрат, целесообразно стремиться выбрать програм-
7.2. Основные методы математической статистики...
му, имеющую достаточно развитую функцию подсказок, в том числе для неподготовленного пользователя. Необходимо, чтобы в программе был предусмотрен режим меню — при нем пользователь на каждом шаге делает выбор для дальнейшей работы из предложенных альтернатив и избавлен от необходимости самостоятельно формулировать задачу для работы компьютера и помнить все нужные для этого требования.
В настоящее время к числу таких программ относятся наиболее широко известные: $1аЩгарккв, 5Р88, $1аИзИса, Ма1кетайса и их различные версии. Значительную помощь в овладении прикладной программой 5Р55 может оказать учебное пособие А. Д. Наследова «Математические методы психологического исследования. Анализ и интерпретация данных» (2004). В данной книге многообразие мате-матико-статистических методов представлено в виде упорядоченной, логически взаимосвязанной системы с ориентацией на читателя, не имеющего основательной математической подготовки. Описаны основы применения этих методов, алгоритмы их выбора в зависимости от исследовательской ситуации — от исходных данных и задач исследования. Кроме того, применение каждого метода сопровождается примерами и пошаговыми алгоритмами вычислений — как «вручную», так и с использованием стандартных статистических пакетов 5Р55.
Мы же опираемся на возможности программы Ехсе1 как наиболее распространенной и простой в обращении. Ее возможностей вполне достаточно для использования методов математико-статистическо-го анализа при выполнении квалификационной научно-исследовательской работы (диплома) и анализа данных в практической работе психолога. Однако следует иметь в виду, что ее возможности ограничены, особенно при проведении и математическом обосновании фундаментальных исследований.
7.2.2. Математико-статистическая обработка данных в программе Ехсе1
После того как составлена сводная таблица (в электронном варианте), в которую занесены все данные результатов экспериментов, обследований, преобразована и закодирована дополнительная информация, необходимо определить возможность использования наиболее оптимальных методов математико-статистической обработки данных. Мы уже указывали в настоящей главе (раздел 7.1.) и повторимся еще раз.
В случае, если распределение признака по основным или интегральным шкалам имеет вид нормального или близкого к нормальному, то
200 Глава 7. Математико-статистическая обработка данных исследования
можно вполне обоснованно использовать методы параметрической статистики как более простые и надежные. В этой группе методов мы рассмотрим:
• сравнительный анализ первичных статистик;
• оценка достоверности отличий по С-критерию Стьюдента;
• корреляционный анализ.
Кроме того, мы покажем, каким образом данные вычисления осуществляются при помощи прикладной программы Ехсе1 различных версий, встроенной в стандартную оболочку операционной системы ХУтсЬте как для домашнего использования, так и для офисных систем. Вычисление данных в этом варианте удобно для пользователя РС 1ВМ потому, что не требует использования дополнительных прикладных программ математической статистики.
В случае, если распределение показателей психологического признака далеко от нормального или выборка незначительна -^ используют методы непараметрической статистики. Среди этой группы методов наиболее часто используют:
• (>-критерий Розенбаума;
• 17-критерий Манна—Уитни.
Вычисление данных критериев и некоторых других: Я-критерия Крускала-Уоллиса, Г-критерия Вилкоксона, коэффициента ранговой корреляции г5Спирмена и т. д. — может осуществляться при помощи обычного калькулятора. Алгоритмы проведения данных расчетов с примерами очень подробно и доходчиво изложены Е. В. Сидоренко в практическом руководстве «Методы математической обработки в психологии» (1996), к которому мы и отсылаем читателя в случае необходимости использовать подобные методы непараметрической статистики.
7.2.3. Вычисление первичных статистик и характера распределения признака
Прежде всего необходимо твердо уяснить некоторые немногочисленные правила работы в программе ЕхсеЬ.
• входные параметры, параметры вычислений задаются на английском языке, за исключением случаев, которые будут специально оговорены;
• вычисления производятся в той ячейке, которая выделена курсором;
7.2. Основные методы математической статистики... 201
• для определения (задания) параметров вычислений (или координат ячеек) используются верхняя (буквенная) и левая (числовая) координатные рамки окна Ехсе1.
После того как сводная ведомость составлена в рукописном варианте (на необходимость этого мы указывали выше), она составляется в компьютерном варианте. Общий вид рабочего окна программы Ехсе1 и пример сводной таблицы представлены на рис. 7.5. Первое, с чего следует начать, — это вычислить первичные статистики и выявить характер распределения признака.
Первичные статистики: М, а, п, т— вычисляются внизу таблицы по каждому признаку отдельно.
М— средняя арифметическая вычисляемого признака. Функция «СРЗНАЧ».
ст — стандартное отклонение, среднеквадратичное отклонение показателей, вариант признака. Часто обозначается в программе Ехсе1 буквой 5, для того чтобы не использовать лишний раз таблицу символов. Функция «СТАНДОТКЛОН».
и — количество показателей (вариант) признака в столбце. Функция «СЧЕТ».
т — ошибка средней арифметической.
В программе Ехсе1 существует два варианта вычислений первичных статистик:
1) полуавтоматический (полуручной, с набором некоторых данных для выполнения программных функций на клавиатуре);
2) автоматический (с использованием возможностей, запрограммированных функций).
Полуавтоматический вариант вычисления первичных статистик. Вся работа ведется в окне, в котором набрана сводная таблица (как правило, это Лист 1). Курсором выделяется ячейка внизу таблицы, под столбцом первого психологического признака, напротив вычисляемых статистик по порядку. Вначале М, затем — о, далее — и и т. Алгоритм вычисле-
ний: выбираем в меню Вставку функции _/^|, щелчок левой клавишей мышки — открывается диалоговое окно Мастер функций (рис. 7.6).
В левом окне «Категория» выбираем «10 недавно использовавшихся». В правом окне «Функция» появляется ряд функций, из которых нас интересует: «СРЗНАЧ» вычисляет М, «СТАНДОТКЛОН» - а (5), «СЧЕТ» — п (Если некоторые из указанных функций отсутствуют, то их можно найти в окне «Категория» > «Статистические»). Вычисля-
202 Глава 7. Математико-статистическая обработка данных исследования
Дата добавления: 2015-08-05; просмотров: 119 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Глава 7. Математико-статистическая обработка данных психологического исследования (эксперимента) и форма представления результатов | | | Длйй &»** Ву» 6^#г*> Ч'^й» Зю** 2**ш» *У« Ф$»*<0 |