Читайте также:
|
|
Предположим, для оценки качества усвоения материала по Закону о техническом регулировании разработан тест. В соответствии с условиями этого теста студенту предлагается ответить на 10 вопросов. За каждый правильный ответ студент получает один балл, а за неправильный ответ – ноль баллов. Для оценки качества усвоения положений Закона о техническом регулировании, из группы случайным образом выбраны 10 студентов и с ними проведено три этапа тестирования:
* 1-й или начальный этап проводится после самостоятельного изучения студентами положений Закона;
* 2-й этап проводится после групповой консультации, на которой разбираются общие для всей группы недостатки 1-го этапа тестирования;
* 3-й этап проводится после индивидуальной консультации, на которой разбираются конкретные ошибки, допущенные каждым студентом.
Результаты 3-х этапов тестирования одной и той же группы студентов приведены в табл. 8.
Данные табл. 8 свидетельствуют о том, что количество баллов, набираемых одной и той же группой студентов, возрастает с увеличением номера тестирования. Однако возникает вопрос: существенен ли достигаемый успех в уровне подготовки студентов?
Таблица 8
Измерения результатов тестирования
Сумма баллов | |||
Порядковый номер студента | Начальные результаты тестирования | Результаты тестирования после групповой консультации | Результаты тестирования после индивидуальной консультации |
I | |||
II | |||
III | |||
IV | |||
V | |||
VI | |||
VII | |||
VIII | |||
IX | |||
X | |||
Итого |
Воспользовавшись формулой (9), можно провести парные сравнения различных этапов тестирования, сравнив получаемые значения t -статистики с критическим значением t n - 1 распределения Стьюдента.
Значительно быстрее и проще эти вычисления выполнить с помощью программы Microsoft Excel. При выполнении расчетов примем уровень значимости α равным 0,05. В табл.9 приведены, выполненные в Excel, результаты сравнения между 1-м и 2-м этапами тестирования, а в табл. 10 - результаты сравнения между 2-м и 3-м этапами тестирования.
Поскольку полученное значение t = - 2,538461538 ( см.табл. 9) лежит вне критической области (t критическое двухстороннее = ± 2,262157158), нулевая гипотеза Н 0 отклоняется. Таким образом, в среднем 2-й этап тестирования дает более высокие результаты.
Различия между результатами, полученными на 2-м и 3-м этапе тестирования, на уровне значимости α равным 0,05 статистически не различимы, т.к. в этом случае t - статистика равна величине -1,30931 илежит внутри критической области, ограниченной диапазоном ± 2,262157158 (см. табл. 10).
Таблица 9
Парный двухвыборочный t -тест для средних | ||
Начальные результаты тестирования | Результаты тестирования после групповой консультации | |
Среднее | 4,3 | 5,4 |
Дисперсия | 2,233333333 | 0,711111 |
Наблюдения | ||
Корреляция Пирсона | 0,42320737 | |
Гипотетическая разность средних | ||
df | ||
t -статистика | -2,538461538 | |
P(T<=t) одностороннее | 0,015895464 | |
t критическое одностороннее | 1,833112923 | |
P(T<=t) двухстороннее | 0,031790928 | |
t критическое двухстороннее | 2,262157158 |
Таблица 10
Парный двухвыборочный t -тест для средних | ||
Результаты тестирования после групповой консультации | Результаты тестирования после индивидуальной консультации | |
Среднее | 5,4 | 5,8 |
Дисперсия | 0,711111 | 1,733333 |
Наблюдения | ||
Корреляция Пирсона | 0,680545 | |
Гипотетическая разность средних | ||
df | ||
t -статистика | -1,30931 | |
P(T<=t) одностороннее | 0,111434 | |
t критическое одностороннее | 1,833113 | |
P(T<=t) двухстороннее | 0,222868 | |
t критическое двухстороннее | 2,262157 |
3.2. Использование Z -критерия для оценки разности между двумя долями признака
Иногда необходимо выполнить анализ различий между двумя генеральными совокупностями, используя категорийные данные. В данном разделе мы рассмотрим процедуру, в которой на основе Измеренная разность между двумя выборочными долями признака может служить оценкой разности двумя долями признака в генеральных совокупностях . Если объем выборок достаточно велик, то в качестве критерия оценки выступает Z -статистика, которая имеет стандартизованное нормальное распределение:
(10)
где
- доля успехов в первой выборке;
m 1 — количество успехов в первой выборке;
n 1 — объем выборки из первой генеральной совокупности;
p 1 — доля успехов в первой генеральной совокупности;
— доля успехов во второй выборке;
m 2 — количество успехов во второй выборке;
n 2 - объем выборки из второй генеральной совокупности;
р 2 —— доля успехов во второй генеральной совокупности;
оценка доли успехов в объединенной генеральной совокупности.
Нулевая гипотеза заключается в том, что доли признака в двух генеральных совокупностях одинаковы. Следовательно, проверку равенства долей признака в двух генеральных совокупностях можно свести к оценке доли признака в объединенной генеральной совокупности. Оценка объединенной доли равна результату деления количества успехов в обеих выборках m 1+ m 2 на сумму объемов выборок n 1+ n 2.
Z -критерий позволяет определить, существуют ли различия между долями успеха в двух группах (двусторонний тест). Можно также установить, превышает ли доля успехов в одной группе долю успехов в другой (односторонний критерий).
Поэтому нулевая и альтернативная гипотезы могут быть сформулированы следующим образом.
Двусторонний критерий | Односторонний критерий | Односторонний критерий |
При заданном уровне значимости a нулевая гипотеза отклоняется, если вычисленная Z -статистика (10) больше верхнего или меньше нижнего критического значения стандартизованного нормального распределения.
Дата добавления: 2015-07-15; просмотров: 81 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Критерии для оценки разности между двумя математическими ожиданиями | | | Упражнение 6. |