Читайте также:
|
|
Дисперсионный анализ дает общую схему проверки статистических гипотез, основанную на тщательном изучении различных источников вариации (изменчивость, неоднородности) в сложной ситуации. Он позволяет оценить влияние одного, или нескольких факторов на результирующий признак.
Рассмотрим пример, когда можно указать один фактор, влияющий на конечный результат, и этот фактор принимает конечное число значений. Такая ситуация может быть проанализирована при помощи однофакторного дисперсионного анализа.
Данные для однофакторного дисперсионного анализа - это k независимых выборок из k генеральных совокупностей. Однофакторный дисперсионный анализ сравнивает два источника вариации: между выборками (межгрупповая вариация) и внутри каждой выборки (внутригрупповая вариация). Каждая генеральная совокупность подчиняется нормальному распределению, причем все стандартные отклонения одинаковы.
Гипотеза H0 утверждает, что все средние равны между собой. Гипотеза H1 говорит о том, что не все средние равны между собой, (есть хотя бы две неравные средние).
Фактор A имеет k уровней. На каждом уровне проводится выборка объемом Тогда общее число наблюдений равно: . Пусть – результат j -й выборки. Отсюда
,
Статистика подчинена распределению Фишера, поскольку это отношение дисперсий для выборки нормально распределенных случайных величин. Доверительная вероятность , . По таблице - распределения находим граничную точку . Если F> , то мы отклоняем гипотезу H0 на уровне значимости .
Рассмотрим конкретный пример. В источнике http://www.memoid.ru/node/Razvitie_rossijskogo_rynka_kinopokaza_v_XXI_veke рассмотрены вопросы развития кинопоказа. Там сказано «В 2008 году этот процесс продолжился, и около 16 кинотеатров сменили своих владельцев. Общее число современных кинотеатров в этом году составляло 736, а количество залов в них равнялось 1864. Всего в России действовало около 430 независимых операторов, из них 12 федеральных сетей, занимающих 34,7 % рынка, 13 региональных — 19,6 % и 40 местных 13,4 %. Крупнейшим оператором по-прежнему осталась сеть «Каро фильм» — 35 кинотеатров и 166 кинозалов, второе место досталось «Синема Парку» (13 и 105), а третье получил «Киномакс» (23 и 92).»
Сначала исключим из этих данных показатели по всей РФ и получим таблицу
Таблица 1
Каро фильм | ||
Синема Парку | ||
Киномах |
В этой таблице левый столбец содержит название фирмы, а второй и третий столбцы соответственно количество кинотеатров и количество залов
Графически это выглядит следующим образом
Рис.1 Сравнительная таблица по развитию кинопоказа в 2008 г.
Проверим гипотезу об отсутствия влияния качества развития трех фирм на величины количества кинотеатров и кинозалов. Пусть доверительная вероятность равна 95%. Будем предполагать, что выборки из независимых нормальных генеральных совокупностей с одной и той же генеральной дисперсией. .
H0: различия между фирмами не влияют на тенденцию развития количества кинотеатров и кинозалов.
H1: различия между фирмами влияют на развитие количества кинотеатров и кинозалов.
Заполним следующую таблицу
Количество кинотеатров | Общее кол-во залов | сумма | nj | |
Каро фильм | 166+35=201 | |||
Синема Парку | 105+13=118 | |||
Киномах | 92+23=115 | |||
Сумма | - | - |
Таблица 2
Тогда = = 17575,3
= =2382.3
=15193
Статистика
По таблице F -распределения находим граничную точку
, т.к. 0,235<9,55, то принимаем гипотезу H1, т.е. различия между фирмами влияют на развитие количества кинотеатров и кинозалов. По той же таблице можно определить, что вероятность принятия этой гипотезы равна 0,8.
Дата добавления: 2015-08-21; просмотров: 42 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Познакомьтесь с покупателем | | | Решение задачи дисперсионного анализа в ППП Excel MS Office 2010 |