Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Занятие №14

Читайте также:
  1. Анализ прибыли и рентабельности. (Занятие 34-36).
  2. Второе занятие на звук т
  3. Второе занятие с биокомпьютером
  4. Е ЗАНЯТИЕ
  5. Е ЗАНЯТИЕ
  6. Е ЗАНЯТИЕ
  7. Заблуждение No 2. Силовой спорт - занятие только для молодых.

Тема: «Общие принципы проверки статистических гипотез. Статистические критерии различий. Параметрические и непараметрические критерии. Критерий t-Стьюдента. Критерий χ2»

2. Форма организации занятия: практическое занятие.

3. Значение изучения темы (актуальность изучаемой проблемы): овладение навыками работы в электронных таблицах позволит студентам проводить первоначальную статистическую обработку данных.

4. Цели обучения:

- общая:

обучающийся должен обладать способностью и готовностью к пониманию значения гуманистических ценностей для сохранения и развития современной цивилизации; совершенствованию и развитию общества на принципах гуманизма, свободы и демократии (ОК-1); способностью и готовностью к применению основных математических и статистических методов, стандартных статистических пакетов для обработки данных, полученных при решении различных профессиональных задач (ОК-5); готовностью к активной коммуникации и информационно-аналитической деятельности: активным включением в сеть профессионального сообщества, ведением постоянного информационного наблюдения за предметной областью, анализом динамики ее развития, поддержанием активных контактов с коллегами, активным информированием профессионального сообщества о результатах собственной научной и информационно-аналитической деятельности (ПК-1); владением приемами анализа, оценки и ин­терпретации результатов психологического ис­следования, проверки и оценки соотношения теории и эмпирических данных, подготовки от­четной документации и обобщения полученных данных в виде научных статей и докладов (ПК-4);

- учебная:

обучающийся должен знать способы хранения информации в медицинских и биологических системах, основные подходы к формализации и структуризации различных типов медицинских данных, используемых для формирования решений в ходе лечебно-диагностического процесса; основные статистические методы обработки данных, полученных при решении основных профессиональных задач; основы современных технологий сбора, обработки и представления информации с использованием стандартных офисных пакетов прикладных программ;

обучающийся должен уметь проводить обработку медицинских данных с использованием стандартных средств операционной системы и общепринятых офисных приложений, а также прикладных и специальных программных средств, получать, обрабатывать и интерпретировать данные исследований с помощью математико-статистического аппарата;

обучающийся должен владеть базовыми технологиями преобразования информации; методами числовой обработки данных с использованием большинства возможностей электронных таблиц; навыками представления числовой информации в форме диаграмм и графиков; навыками анализа и обработки числовой информации в электронных таблицах.

5. План изучения темы:

5.1 Контроль исходного уровня знаний (тест на сайте дистанционного обучения cdo.krasgmu.ru).

5.2 Основные понятия и положения темы (наглядные формы – таблицы, схемы, алгоритмы и др.).

Статистический вывод. Проверка гипотез. На практике часто приходится делать некоторые выводы по имеющемуся у нас небольшому объему данных (выборки) о свойствах всей генеральной совокупности. Эти выводы осуществляются с помощью определенных статистик и поэтому называются статистическими. Теория статистического вывода занимает центральное место в статистике. Основным способом, с помощью которого делаются статистические выводы, является проверка гипотез.

Существует два вида гипотез: 1) научные 2) статистические. Научная гипотеза — это предполагаемое решение некоторой проблемы. Она обычно формулируется в виде теоремы. Статистическая гипотеза — некоторое утверждение относительно неизвестного параметра или какой-либо характеристики. Например, среднее значение генеральной совокупности равно 125 или коэффициент корреляции равен 0. Для проверки статистических гипотез используются статистические критерии, которые представляют собой некоторое правило, по которому мы делаем вывод о правильности или неправильности рассматриваемой статистической гипотезы.

Проверяемую статистическую гипотезу принято называть основной (или нулевой) гипотезой (обозначается H0), а противоречащую ей гипотезу — альтернативной (или конкурирующей) гипотезой (обозначается Н1). Нулевая гипотеза обычно заключается в предположении о том, что изучаемое вмешательство не оказывает значимого воздействия на генеральные параметры распределения. Изначально предполагается, что вмешательство не влияет. Любые различия между изучаемыми группами объясняются случайностью, и становится задача опровергнуть это предположение

Поскольку при проверке статистических гипотез приходится иметь дело со статистическим материалом, то, отвергая или принимая нулевую гипотезу, всегда рискуем совершить ошибку. Ошибку, заключающуюся в том, что нулевая гипотеза отвергается, тогда как она в действительности верна, называют ошибкой первого рода. Ошибку, состоящую в том, что нулевая гипотеза не отвергается, тогда как она в действительности неверна, называют ошибкой второго рода.

Проверка статистических гипотез осуществляется с помощью различных статистических критериев. В качестве критерия используется некоторая случайная величина, значения которой могут быть вычислены на основе имеющихся данных. Во множестве возможных значений критерия выбирается подмножество, называемое критической областью. Если вычисленное значение критерия принадлежит критической области, то нулевая гипотеза отвергается.

Критическая область выбирается таким образом, чтобы вероятность совершить ошибку первого рода не превосходила некоторого заранее определенного положительного числа α. Это число α называют уровнем значимости и говорят: «нулевая гипотеза отвергается на уровне значимости α. В качестве α обычно берут одно из чисел: 0,05; 0,01; 0,001.

Вероятность совершить ошибку второго рода обозначается β. Величина 1-β называется мощностью критерия; она равна вероятности отвергнуть неверную гипотезу. Чаще всего множество возможных значений критерия принадлежит некоторому интервалу. Интервалом является и критическая область. Граничные точки критической области называются критическими точками. Критические точки выбираются таким образом, чтобы при выбранном уровне значимости, а мощность критерия (1 — β) была наибольшей.

В психологии принять считать низшим уровнем статистической значимости 5%-ный уровень, а достаточным 1%-ный. В таблицах критических значений обычно приводятся значения критериев, соответствующих уровням значимости р ≤0,05 и р ≤0,01 иногда для р ≤0,001.

Среди возможных статистических критериев выделяют: односторонние и двусторонние, параметрические и непараметрические, более и менее мощные.

Односторонние и двусторонние. Понятие одностороннего либо двустороннего критерия связано с формулировкой гипотез. Если «нулевая» гипотеза формулируется о равенстве (Х1 = Х2), то для проверки используется двусторонний критерий. Если же «нулевая» гипотеза формулируется о неравенстве, то возможны три варианта:

1) если Х1≠Х2, то используется двусторонний критерий;

2) если Х12 или Х1<Х2, то односторонний критерий.

Параметрические критерии — это некоторые функции от параметров совокупности, они служат для проверки гипотез об этих параметрах или для их оценивания. Параметрические критерии включают в формулу расчета параметры распределения, т.е. средние и дисперсии.

Непараметрические критерии — это некоторые функции от функций распределения или непосредственно от вариационного ряда наблюдавшихся значений изучаемого случайного явления. Они служат только для проверки гипотез о функциях распределения или рядах наблюдавшихся значений.

Непараметрические критерии не включают в формулу расчета параметров распределения и основанные на оперировании частотами или рангами.

И те, и другие критерии имеют свои преимущества и недостатки. Параметрические критерии могут оказаться несколько более мощными, чем непараметрические, но только в том случае, если признак измерен по интервальной шкале и нормально распределен. Лишь с некоторой натяжкой мы можем считать данные, представленные в стандартизованных оценках, как интервальные. Кроме того, проверка распределения «на нормальность» требует достаточно сложных расчетов, результат которых заранее не известен.

Может оказаться, что распределение признака отличается от нормального, и нам, так или иначе все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном — с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака.

К сожалению, в существующем в табличном процессоре Excel, пакете анализа, представлены лишь параметрические критерии (t-Стьюдента, Фишера). Для использования непараметрических критериев (Q-критерий Розенбаума, Т-критерий Вилкоксона) существуют специальные надстройки к Excel, либо специализированные статистические пакеты.

Часто в психологических исследованиях требуется оценить достоверность различий между двумя выборками. Это могут быть выборки из разных совокупностей (например, сравнение опытной и контрольной групп), а также выборки из одной совокупности (например, исследование какого-либо параметра в одной выборке до и после проведения эксперимента).

В пакете статистического анализа Excel реализовано три варианта использования t-теста: равные дисперсии генерального распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок до и после наблюдения по одному и тому же субъекту.

Режимы работы «Двухвыборочный t-тест с одинаковыми дисперсиями» и «Двухвыборочный t-тест с различными дисперсиями» служат для проверки гипотез о различии между средними (математическими ожиданиями) двух нормальных распределений соответственно с неизвестными, но равными дисперсиями () и с неизвестными дисперсиями, равенство которых не предполагается.

Например, при определении различий в выраженности некоторого психического свойства в двух группах, опытной и контрольной, была проведена оценка этого свойства в баллах, которые распределились следующим образом:

Опытная группа — 19, 16, 17, 12, 15,16, 17,17, 21, 23, 18, 13, 12, 13, 19, 20, 21.

Контрольная — 27, 9, 12, 13, 26, 23, 14, 15, 22, 21, 16, 16, 18, 17, 10, 12, 17.

При уровне значимости α = 0,05 требуется проверить гипотезу H0: ах= ау, предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения: 1) с одинаковыми дисперсиями и ; 2) с различными дисперсиями и .

Для проверки предположения 1 используем режим работы «Двухвыборочный t-тест с одинаковыми дисперсиями», а для проверки предположения 2 — «Двухвыборочный t-тест с различными дисперсиями».

На листе MS Excel формируем таблицу из данных исследования. С помощью мастера функций находим дисперсию выборок в опытной и контрольно группе и зависимости от значений дисперсии выбираем в Пакете анализа «Двухвыборочный t-тест с одинаковыми дисперсиями», либо «Двухвыборочный t-тест с различными дисперсиями».

В нашем случае это должен быть тест с различными дисперсиями.

 

 

В полученной таблице с результатами сравниваем значение t-статистики, или t — экспериментальное с t — критическим двухсторонним.

Так как показатель t-статистики = 0,039 был меньше значения t — критическое = 2,052, то гипотезу H0: аху принимаем с уровнем значимости 0,05, т.е. уровень изучаемого психологического свойства в опытной и контрольной группах не отличался.

 

 

Рассмотренная выше процедура сравнения двух выборок часто применяется для обнаружения результата какого-либо воздействия либо, напротив, для подтверждения его отсутствия. Чем более однородными окажутся выбранные для эксперимента объекты (для контроля и воздействия), чем меньше их случайные различия, тем точнее можно будет дать ответ на поставленный вопрос. Ясно, что различие между объектами, выбранными для воздействия и для контроля (или для двух разных воздействий, если интерес представляет их сопоставление), будет наименьшим, если в обоих качествах выступает один и тот же объект.

Если это возможно, то далее обычным порядком составляется группа экспериментальных объектов и затем для каждого объекта измеряются два значения интересующей нас характеристики (например, до воздействия и после или при двух разных воздействиях). Так возникают пары наблюдений или парные данные.

Пусть xi и yi — результаты измерений для объекта номер i, i = 1,..., n, где n — численность экспериментальной группы (число объектов). Тогда совокупность пар случайных величин (x1, y1)..., (xn … уn) образует парные данные. Как обычно, все наблюдения будем считать реализациями случайных величин и предполагать, что методика эксперимента обеспечивает их независимость для разных объектов. Но наблюдения, входящие в одну пару, нельзя считать независимыми, поскольку они относятся к одному и тому же объекту. Эти два наблюдения отражают свойства общего для них индивидуального объекта и потому могут зависеть друг от друга. Для пар наблюдений (x1, y1) введем величину z i1 - x1, которую будем считать независимой и нормально распределенной. Тем самым задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии.

Режим работы «Парный двухвыборочный t-тест для средних» служит для проверки гипотезы о различии между средними (математическими ожиданиями) двух нормальных распределений на основе парных выборочных данных. При этом равенство дисперсий генеральных совокупностей не предполагается (). В диалоговом окне данного режима задаются параметры, аналогичные параметрам, задаваемым выше.

 

Например, проводится измерение ситуативной тревожности до и после психотерапевтического воздействия с помощью некого опросника. Исследователя интересует вопрос, приводит ли воздействие к изменению уровня тревожности.

Так как, значение t-статистика превышает t-критическое, то нулевая гипотеза H0: аху отвергается с уровнем значимости <0.05. Следовательно мы можем сделать вывод о том, что психотерапевтическое воздействие влияет на величину ситуативной тревожности.

Поиск закономерностей для качественных данных. Анализ «хи-квадрат»

Критерий хи-квадрат используют для проверки гипотез о качественных данных, представленных не числами, а категориями. Здесь принято оперировать подсчетом частоты (поскольку ранжирование или арифметические действия выполнять невозможно).

Критерий (тест) «хи-квадрат» основан на частотах, которые представляют собой количество объектов выборки, попадающих в ту или иную категорию. Суть показателя хи-квадрат2): он измеряет разницу между наблюдаемыми (экспериментальными) частотами fЭ и ожидаемыми (теоретическими) частотами fТ. Конкретно он рассчитывается как сумма квадратов разности этих частот, выраженная в долях частоты теоретической.

Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения «да — нет», «допустил брак — не допустил брака», «решил задачу — не решил задачу».

Ограничения критерия.

1) Объем выборки должен быть достаточно большим: n >30. При n <30 критерий χ2 дает приближенные значения. Точность критерия повышается при больших n.

2) Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: ƒ≥5.

Выясним, наблюдаются ли различия по проявлению эгоистического стиля поведения в межличностных отношениях между юношами и девушками?

Тип эгоистичности Юноши Девушки
Адаптивный    
Промежуточный    
Дезадаптивный    

Сформулируем статистические гипотезы:

H0 — эмпирические распределения признака не отличаются между собой;

H1 — эмпирические распределения признака отличаются между собой.

Для расчета теоретических частот сформируем данную таблицу на листе MS Excel в следующем виде:

Для подсчета значений теоретического распределения для каждой ячейки таблицы умножим сумму по строке на сумму по столбцу и разделим на общую сумму.

 

Далее воспользуемся функцией ХИ2ТЕСТ (Мастер функций/ Статистические / ХИ2ТЕСТ).

Полученное нами значение 0,12 превышает уровень значимости α = 0,05. То есть, мы принимаем нулевую гипотезу H0 об отсутствии различий в распределении признаков. Другими словами, эгоистический стиль поведения не зависит от пола.

5.3. Самостоятельная работа по теме:

- решение задачи:

Задача. Психолог измерял время сложной сенсомоторной реакции выбора (в милисекундах) в контрольной и экспериментальной группах. В экспериментальную группу (X) входили 9 спортсменов высокой квалификации. Контрольной группой (Y) являлись 8 человек, активно не занимающихся спортом. Психолог проверяет гипотезу о том, что средняя скорость сложной сенсомоторной реакции выбора у спортсменов выше, чем эта же величина у людей, не занимающихся спортом.


Дата добавления: 2015-07-15; просмотров: 219 | Нарушение авторских прав


Читайте в этой же книге: РАБОТА С ФОРМУЛАМИ И ФУНКЦИЯМИ | ИСПОЛЬЗОВАНИЕ ССЫЛОК | Правила синтаксиса при записи функций | Тестовые задания без эталонов ответов. | Изменение диапазона исходных данных | Графики | Тестовые задания без эталонов ответов. | Занятие №12 | Занятие №13 | Представление экспериментальных данных в Excel |
<== предыдущая страница | следующая страница ==>
Табулирование данных| Задача № 2

mybiblioteka.su - 2015-2024 год. (0.015 сек.)