Характер распределения признака

Читайте также:

Точные количественные характеристики распределения, как было показано выше, вычисляются при помощи функции «Описательная статистика». Однако для наглядного представления характера распределения исследуемого признака целесообразно построить гистограмму частотного распределения. Особенно в случае, если вы предполагаете использовать методы параметрической статистики.

208 Глава 7. Математико-статистическая обработка данных исследования

Сюдиая табямцр - '

Студент С _ __ I

Студент Т.

24 Студент Ю _

Ч-^Пч-ИГ /|^»^ '-Т ^11-1 М, *^»*/Т*-«/ «•*!

ТГр'

Студент А.

Студент Б

Студент В _

Стущнт Г

9ш

Студент Д _

Студент Ж

Студент 3

Студент К

Студаня П.

Студент

Студент Н.

Студент 0

Студент Р

&ул*нтУ

Студент».

Студент Э.

Quot;2Г

75 Студент Я ____

28 Студент АА _

Л>

Е ' > I С ИI I I.1 I К I 1 I й 1 Н 1 II I Р I СГ

„^^Х^:Ж

Рис. 7.14. Параметры «Входного интервала» СЗ: Р29

1,	Л'Ч" ' " «•	<
Л¹	41- ^ - "Г	- II	\|>
р
¹15	•1. ' '.	•.
г	*м«; ^м и	■I Г	ц.\|-
я-	•!■■■«. '	4*1	.'Ич
г	'1 •; 1я	Мп	ьн*-	-
г	!-:[.■ ' -		И\|Л	.•*-
г	у..,- _».,	-«■Г	, „	""Г
р	¹ ■ 'V «"_г.	:-•-

-^.1

Рис. 7.15. Вид диалогового окна функции «Гистограмма»

Алгоритм вычислений в программе Ехсе1 следующий: «Сервис» > «Анализ данных» > «Гистограмма» — ОК (см. рис. 7.11). Появляется диалоговое окно «Гистограмма» (рис. 7.15).

Гистограмма строится по столбцам, т. е. по совокупности данных (параметров) признака. Как правило, характер распределения данных признака выявляется по основным (интегральным) шкалам методики (теста, задания).

7.2. Основные методы математической статистики...

Для нашего случая целесообразно построить гистограммы и выявить характер распределения признака по основным подшкалам методики МЛО «Адаптивность» (ПР — поведенческая регуляция; КК — коммуникативные качества; МН — моральная нормативность) и интегральной шкале (ЛАП — личностный адаптационный потенциал), основным шкалам методики «Спилбергер-Ханин» (РТ — реактивная тревожность, ЛТ — личностная тревожность), интегральной шкале интеллектуального развития «Балл».

В качестве примера рассчитаем только характер распределения по интегральной шкале общего уровня интеллектуального развития «Балл». В диалоговом окне функции «Гистограмма» задаем входной интервал. Начиная от наименования признака столбца данных в общей шкале наименований (параметры Р 3) и заканчивая последним численным значе-' нием признака в данном столбце (параметр Р 29).

Для нашей таблицы значений признака этот интервал Р 3: Р 29 (рис. 7.5, 7.15). Далее выставляем:

«Метки» — «Новый рабочий лист» (задается автоматически) — «Вывод графика» — ОК. На новом рабочем листе появляется гистограмма частотного распределения значений признака в данном столбце (рис. 7.16).

Рис. 7.16. Гистограмма частотного распределения значений признака по шкапе «Балл»

Аналогично строятся гистограммы частотного распределения значений признака по остальным шкалам.

Выяснив, что распределение признака по основным шкалам нормальное или близкое к нормальному, мы вправе переходить к сравнительному анализу и использованию наиболее распространенных методов параметрической статистики.

210 Глава 7. Математико-статистическая обработка данных исследования

7.2.4. Сравнительный анализ первичных статистик и формы его представления

Первичной и наиболее распространенной формой анализа данных результатов психологического исследования является сравнительный анализ первичных статистик между двумя или более группами выборок. Пренебрегать им не следует уже в силу того, что он показывает степень различия в значениях между исследуемыми психологическими признаками. Помимо этого, практика показывает, что эти различия всегда будут существовать.

Однако делать обобщения, касающиеся этих различий в исследуемых выборках, и экстраполировать (переносить) их на всю популяцию в целом недопустимо. Ибо выявленные различия посредством сравнительного анализа первичных статистик показательны и характеризуют различия лишь между данными выборками.

Данные сравнительного анализа первичных статистик оформляются в таблицах. Форма их представления в тексте научной публикации или квалификационной (дипломной) работы выглядит следующим образом (табл. 7.1).

Таблица 7.1. Сравнение средних значений компонентов эмпатийного

потенциала высокодисциплинированных и низкодисциплинированных учащихся

Психологический признак	Дисц. = 8-10 баллов, л = 63 чел.	Недисц.= 1-3 балла, л = 36 чел.	Г-51ис1	Р
М±т	а	М±т	а
5р— стремление к принятию	101,2 ±2,19	17,4	92,6 ± 2,71	17,5	2,471	р < 0,05
5о— страх отвержения	151,3 ±2,74	21,8	136,6 ±2,51		3,937	р < 0,05
/?с — рациональный канал змпатии	3,2 ±0,15	1,2	3,4 ±0,23	1,5	0,714	р > 0,05
Ее — эмоциональный канал	2,6 ±0,21	1,7	2,9 ±0,22	1,5	0,962	р > 0,05
Ш — установки, способств. эмпатии	3,1 ± 0,20	1,6	2,5 ±0,18	1,2	2,314	р < 0,05
Рг — проникающая способность	3,7 ± 0,13	1,1	2,9 ± 0,23	1,5	3,069	р<0,05
П — идентификация	3,5 ± 0,21	1.6	2,5 ±0,12	0,8	3,924	р < 0,05
Ои — общий уровень эмпатии	18,7 ± 0,49	3,9	16,9 ±0,46	3,0	2,685	р < 0,05
Е1 — эмпатическая тенденция	-1,3 ±2,65	21,1	-5,5 ± 3.08	20.0	1,022	р > 0,05

7.2. Основные методы математической статистики... _______________ 211

Примечание. Жирным шрифтом выделены психологические признаки, по которым существуют различия на достоверно значимом уровне.

После использования ряда других методов (в приведенном примере это оценка достоверности различий между средними по г>критерию Стьюдента) таблица может быть дополнена показателями критериев и уровнем их доверительной значимости (р).

Кроме того, эти данные можно для наглядности отобразить графически, например в диаграммах разных форм и видов.

16 9...- ------- 18,7

{3.1 Дисципл. ЦЭ Недисципл.

По результатам выполненных вычислений мы можем сделать некоторые выводы о существовании различий по психологическим признакам между двумя (или более) выборками испытуемых.

Степень выявленного различия между средними желательно также оценивать, опираясь на содержательные критерии. Наиболее распространено для этого использование сигмы (а). Разницу между двумя значениями в одну сигму и более можно считать достаточно выраженной. Если сигма (а) подсчитана для ряда значений п более 35, то достаточно выраженной можно рассматривать разницу и в 0,5а.

Помимо этого среднее квадратическое отклонение обладает и другими чрезвычайно полезными свойствами, из которых следует запомнить одну важную формулу, в которую входит среднее квадратическое отклонение. Предположим, что нам известны среднее значение и среднее квадратическое отклонение для определенного набора данных. Умножьте среднее квадратическое отклонение на 1,96. Вычтите полученный результат из среднего значения и запишите разность. Теперь прибавьте результат умножения (т. е. 1,96 х а-среднее квадратическое отклонение) к среднему значению и также запишите ответ.

1)М- 1,96а; 2) М+ 1,96а

212 Глава 7. Математико-статистическая обработка данных исследования

Вы получили границы диапазона, в который попадают 95% всех результатов из вашего набора. Любые результаты, большие или меньшие этих крайних значений, являются относительно редкими, поскольку они встречаются только в 5% всех случаев. По этой причине в большинстве психологических журналов требуется, чтобы в описании представленных к публикации данных присутствовало не только среднее значение, но и среднее квадратическое отклонение — это позволит читателям оценить вариабельность обсуждаемых данных, а также быстро рассчитать наиболее вероятный разброс результатов

Таким образом, сравнительный анализ первичных статистик является одним из распространенных методов обобщения данных. Он предусматривает их описание с помощью какой-либо меры центральной тенденции (обычно используется среднее значение) и какой-либо оценки вариабельности (обычно используется среднее квадратическое отклонение). Оценка вариабельности показывает, насколько хорошо среднее значение отражает свойства рассматриваемой выборки результатов. Однако при этом предполагается, что данные распределяются по нормальному закону. Это условие соблюдается в большинстве случаев, с которыми обычно сталкиваются исследователи, однако не во всех.

В то же время для ответственных выводов о том, насколько велика разница между значениями, и для того, чтобы иметь возможность представить эти обобщения как определенные тенденции и распространить их на всю генеральную совокупность (популяцию) в целом, лучше использовать более строгие существующие статистические критерии, которые используются для определения уровня достоверности (статистической значимости) выявляемых различий или связи.

Рассмотрим методы статистического вывода — наиболее простые, надежные и чаще используемые из них. Но прежде уточним некоторые понятия, которые используются при применении данных методов. Это понятие статистических критериев, уровень достоверности различий или уровень статистической значимости.

7.3. Понятие статистической значимости и статистического критерия

В любой научно-практической ситуации эксперимента (обследования) исследователи могут исследовать не всех людей (генеральную совокупность, популяцию), а только определенную выборку. Напри-

7.3. Понятие статистической значимости и статистического критерия 213

мер, даже если мы исследуем относительно небольшую группу людей, например больных, страдающих определенной болезнью, то и в этом случае весьма маловероятно, что у нас имеются соответствующие ресурсы или необходимость тестировать каждого человека, болеющего этой болезнью. Вместо этого обычно тестируют выборку из популяции, поскольку это удобнее и занимает меньше времени. В таком случае откуда нам известно, что результаты, полученные на выборке, представляют всю группу? Или, если использовать профессиональную терминологию, можем ли мы быть уверены, что наше исследование правильно описывает всю популяцию, выборку из которой мы использовали?

Чтобы ответить на этот вопрос, необходимо определить статистическую значимость результатов тестирования. Статистическая значимость (ЗщпфсаШ 1еюе1, сокращенно 5щ.), или р-уровень значимости (р-1еюе1) — это вероятность того, что данный результат правильно представляет популяцию, выборка из которой исследовалась. Отметим, что это только вероятность — невозможно с абсолютной гарантией утверждать, что данное исследование правильно описывает всю популяцию. В лучшем случае по уровню значимости можно лишь заключить, что это весьма вероятно. Поэтому неизбежно встает следующий вопрос: каким должен быть уровень значимости, чтобы можно было считать данный результат правильной характеристикой популяции?

Например, при каком значении вероятности вы готовы сказать, что таких шансов достаточно, чтобы рискнуть? Если шансы будут 10 из 100 или 50 из 100. А что, если эта вероятность выше? Что можно сказать о таких шансах, как 90 из 100,95 из 100 или 98 из 100? Для ситуации, связанной с риском, этот выбор довольно проблематичен, ибо зависит от личностных особенностей человека.

В психологии же традиционно считается, что 95 или более шансов из 100 означают, что вероятность правильности результатов достаточно высока для того, чтобы их можно было распространить на всю популяцию. Эта цифра установлена в процессе научно-практической деятельности — нет никакого закона, согласно которому следует выбрать в качестве ориентира именно ее (и действительно, в других науках иногда выбирают другие значения уровня значимости).

В психологии оперируют этой вероятностью несколько необычным образом. Вместо вероятности того, что выборка представляет популяцию, указывается вероятность того, что выборка не представляет популяцию. Иначе говоря, это вероятность того, что обнаруженная

214 Глава 7. Математико-статистическая обработка данных исследования

связь или различия носят случайный характер и не являются свойством совокупности. Таким образом, вместо того чтобы утверждать, что результаты исследования правильны с вероятностью 95 из 100» психологи говорят, что имеется 5 шансов из 100, что результаты неправильны (точно так же 40 шансов из 100 в пользу правильности результатов означают 60 шансов из 100 в пользу их неправильности). Значение вероятности иногда выражают в процентах, но чаще его записывают в виде десятичной дроби. Например, 10 шансов из 100 представляют в виде десятичной дроби 0,1; 5 из 100 записывается как 0,05; 1 из 100 — 0,01. При такой форме записи граничным значением является 0,05. Чтобы результат считался правильным, его уровень значимости должен быть ниже этого числа (вы помните, что это вероятность того, что результат неправильно описывает популяцию). Чтобы покончить с терминологией, добавим, что «вероятность неправильности результата» (которую правильнее называть уровнем значимости) обычно обозначается латинской буквой «р». В описание результатов эксперимента обычно включают резюмирующий вывод, такой как «результаты оказались значимыми на уровне достоверности (р < 0,05)». В переводе на обычный язык это означает, что вероятность неправильности результатов (р) менее 0,05 (т. е. меньше 5%).

Таким образом, уровень значимости (р) указывает на вероятность того, что результаты не представляют популяцию. По традиции в психологии считается, что результаты достоверно отражают общую картину, если значение р меньше 0,05 (т. е. 5%). Тем не менее это лишь вероятностное утверждение, а вовсе не безусловная гарантия.. В некоторых случаях этот вывод может оказаться неправильным. На са-' мом деле мы можем подсчитать, сколь часто это может случиться, если посмотрим на величину уровня значимости. При уровне значимости 0,05 в 5 из 100 случаев результаты, вероятно, неверны. На первый взгляд кажется, что это не слишком часто, однако если задуматься, то 5 шансов из 100 — это то же самое, что 1 из 20. Иначе говоря, в одном из каждых 20 случаев результат окажется неверным. Такие шансы кажутся не особенно благоприятными, и исследователи должны остерегаться совершения ошибки первого рода. Так называют ошибку, которая возникает, когда исследователи считают, что обнаружили реальные результаты, а на самом деле их нет. Противоположные ошибки, состоящие в том, что исследователи считают, будто они не обнаружили результата, а на самом деле он есть, называют ошибками второго рода.

7.3. Понятие статистической значимости и статистического критерия 215

Эти ошибки возникают потому, что нельзя исключить возможность неправильности проведенного статистического анализа. Вероятность ошибки зависит от уровня статистической значимости результатов. Мы уже отмечали, что для того чтобы результат считался правильным, уровень значимости должен быть ниже 0,05. Разумеется, некоторые результаты имеют более низкий уровень, и нередко можно встретить результаты с такими низкими р, как 0,001 (значение 0,001 говорит о том, что результаты могут быть неправильными с вероятностью 1 из 1000). Чем меньше значение р, тем тверже наша уверенность в правильности результатов [63, с. 266-267].

В табл. 7.2 приведена традиционная интерпретация уровней значимости о возможности статистического вывода и обосновании решения о наличии связи (различий).

Таблица 7.2. Традиционная интерпретация уровней значимости,

используемых в психологии

Уровень значимости	Возможный статистический вывод
р>0,1	«Статистически достоверные различия не обнаружены»
р<0,1	«Различия обнаружены на уровне статистической тенденции»
р < 0,05	«Обнаружены статистически достоверные (значимые) различия»
р < 0,01	«Различия обнаружены на высоком уровне статистической значимости»
р < 0,001	«Различия обнаружены почти на абсолютном уровне статистической значимости»

На основе опыта практических исследований рекомендуется: чтобы избежать по возможности ошибок I и II рода при ответственных выводах, следует принимать решения о наличии различий (связи), ориентируясь на уровень р < 0,01 или на вычисленный статистический критерий для меньшего числа п признака.

Статистический критерий (51а1кИса1 Тез() — это инструмент определения уровня статистической значимости. Это решающее правило, обеспечивающее принятие истинной и отклонение ложной гипотезы с высокой вероятностью¹ (см.: Суходольский Г. В., 1972, с. 291).

¹ В настоящем учебном пособии мы подробно не рассматриваем проблему статистических гипотез (нулевой — Я₀ и альтернативной — Н_{) и принимаемые статистические решения, поскольку это студенты-психологи изучают отдельно по дисциплине «Математические методы в психологии». Кроме того,

216 Глава 7. Математико-статистическая обработка данных исследования

Статистические критерии обозначают также метод расчета определенного числа и само это число. Рассмотрим основные типы статистических критериев, используемые в психологии:

• инструменты для анализа различий между результатами групп;

• инструменты для выявления связи между результатами групп;

• инструменты для анализа различий в долях, занимаемых различными группами.

Все эти критерии используются с одной главной целью: определить уровень значимости анализируемых с их помощью данных (т. е. вероятность того, что эти данные отражают истинный эффект, правильно представляющий популяцию, из которой сформирована выборка). Существует множество разнообразных методов статистического анализа, и обычно для любой экспериментальной ситуации можно предложить значительный выбор статистических критериев для анализа полученных данных. Выбор конкретного критерия часто зависит от того, получены ли данные, которые необходимо подвергнуть статистическому анализу, на популяции с нормальным законом распределения. Мы рассмотрели некоторые статистические процедуры, позволяющие выяснить, подчиняются ли данные нормальному закону распределения (хотя многие психологи предполагают, что любые непрерывные данные распределены нормально; это не слишком большой грех, поскольку большинство критериев, созданных для анализа нормально распределенных данных, довольно легко справляются с небольшими статистическими отклонениями от нормального закона). Некоторые критерии можно использовать только для нормально распределенных данных (и если признак измерен по интервальной шкале), эти критерии обычно называют параметрическими. С помощью других критериев можно анализировать данные практически с любым законом распределения, и их называют непараметрическими критериями.

необходимо отметить, что при оформлении исследовательского отчета (курсовой или дипломной работы, публикации) статистические гипотезы и статистические решения, как правило, не приводятся. Обычно при описании результатов указывают критерий, приводят необходимые описательные статистики (средние, сигмы, коэффициенты корреляции и т. д.), эмпирические значения критериев, степени свободы и обязательно р-уровень значимости. Затем формулируют содержательный вывод в отношении проверяемой гипотезы с указанием (обычно — в виде неравенства) достигнутого или недостигнутого уровня значимости.

7.3. Понятие статистической значимости и статистического критерия 217

Дата добавления: 2015-08-05; просмотров: 119 | Нарушение авторских прав

Читайте в этой же книге: Глава 3. Этические принципы деятельности психолога | Глава 4. Вилы переменных и типы психологических данных | Занимательные страницы из биографии | Концепция исследования | Состав по полу | Рекомендации отечественных психологов | Глава 6. Сбор эмпирических данных и их первичная обработка | Протокол эксперимента | Глава 7. Математико-статистическая обработка данных психологического исследования (эксперимента) и форма представления результатов | Необходимо запомнить! |

<== предыдущая страница	\|	следующая страница ==>
Длйй &»** Ву» 6^#г> Ч'^й» Зю* 2*ш» У« Ф$»*<0	\|	Обратите внимание

mybiblioteka.su - 2015-2025 год. (0.026 сек.)