Читайте также:
|
|
Если F -тест является значимым, то вам известно, что одна или несколько X- переменных могут быть полезны в прогнозировании Y и, следовательно, можно продолжать анализ с помощью t -тестов для отдельных коэффициентов регрессии с целью выяснять, какие именно из Х- переменных действительно полезны. Эти t -тесты определяют, оказывает ли значимое влияние на Y та или иная X- переменная, если все другие Х- переменные остаются при этом неизменными. Следует помнить, что, приняв нулевую гипотезу, вы сделали слабое заключение и, по сути, тем самым не доказали бесполезность Х- переменной, а просто у вас не хватило убедительных доказательств наличия взаимосвязи. Таким образом, взаимосвязь может существовать, но вследствие действия фактора случайности или из-за небольшого размера выборки вы не в состоянии обнаружить ее с помощью тех данных, которые имеются в вашем распоряжении.
Если же F -тест не является значимым, то использовать t -тесты для отдельных коэффициентов регрессии нельзя. В редких случаях эти t -тесты могут быть значимыми даже тогда, когда F -тест не является значимым. При этом F -тест считается более важным и необходимо делать вывод о том, что все коэффициенты являются незначимыми.
t -тест для каждого коэффициента основан на оценке коэффициента регрессии и его стандартной ошибке и использует критическое значение из t -таблицы для «п – k – 1» степеней свободы (где k – количество исследуемых факторов-аргументов). Доверительный интервал для какого-либо конкретного коэффициента регрессии в генеральной совокупности (например, j-го – β j) определяется обычным способом:
от bj – tSbj до bj + tSbj,
где t берется из t -таблицы для «п – k – 1» степеней свободы.
t-тест является значимым, если заданное значение «0 » (указывающее на отсутствие влияния) не попадает в этот доверительный интервал. Здесь нет ничего нового: это обычная процедура для двустороннего тестирования.
Как альтернативный вариант можно сравнить t -статистику bj / Sb со значением из t -таблицы и сделать вывод о значимости, если абсолютное значение этой t - статистики оказывается больше. Если посмотреть на последние значения в каждом из столбцов t -таблицы, можно увидеть достаточно простой, приблизительный способ определения значимости коэффициентов: значимыми будут те коэффициенты регрессии, для которых t -статистика по абсолютному значению равна или больше 2, поскольку для достаточно больших п и уровня значимости 5% значение из t -таблицы приблизительно равно 2. Как всегда, оба метода, и на использовании t -статистики, и на использовании доверительного интервала, должны в любом случае обеспечивать одинаковый результат (значимость или не значимость) для каждого теста.
Что же именно в данном случае тестируется? В результате t -теста для β j; мы должны принять решение, оказывает ли Xj значимое влияние на Y в исследуемой генеральной совокупности, когда все другие Х- переменные остаются неизменными. В этом случае речь не идет о корреляции между Xj и У, которая игнорирует все остальные Х- переменные. Скорее, это проверка влияния Xj на Y после внесения поправки на все остальные факторы. Например, в исследованиях уровня заработной платы, цель которых заключается в выявлении возможных фактов дискриминации по признаку пола, обычно делают поправку на уровень образования и стаж работы. Несмотря на то что мужчины в компании могут (в среднем) получать более высокую заработную плату, чем женщины, очень важно понять, не объясняются ли эти различия какими-либо другими факторами, помимо пола. В результате включения всех этих факторов в множественную регрессию (регрессия Y = заработная плата на X1 = пол, X2 = образование и X3 = стаж работы) коэффициент регрессии для пола будет отражать влияние пола на уровень заработной платы с учетом поправок на уровень образования и стаж работы.
Ниже приведены формулы для гипотез, касающихся проверки значимости j- го коэффициента регрессии.
Дата добавления: 2015-07-10; просмотров: 137 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
H1 :по крайней мере один из коэффициентов регрессии β1, β2, ... , βk ¹ 0. | | | Гипотезы для t-теста j -го коэффициента регрессии |