Статистики интегрального типа

Читайте также:

В прикладной статистике широко используются статистики типа омега-квадрат и типа Колмогорова-Смирнова [6]. Они применяются для проверки согласия с фиксированным распределением или семейством распределений, для проверки однородности двух выборок, симметрии распределения относительно 0, при оценивании условной плотности и регрессии в пространствах произвольной природы и т.д.

Статистики интегрального типа и их асимптотика. Рассмотрим статистики интегрального типа

, (1)

где Х – некоторое пространство, по которому происходит интегрирование (например, X = [0; 1], X = R ¹ или X = R^k). Здесь {б} – направленное множество, переход к пределу по которому обозначен как б→∞ (см. приложение 1). Случайные функции f _б: X ЧЩ → Y обычно принимают значения, являющиеся числами. Но иногда рассматривают и постановки, в которых У = R^k или У – банахово пространство (т.е. полное нормированное пространство [27]). Наконец, F _б(x,щ) – случайная функция распределения или случайная вероятностная мера; в последнем случае используют также обозначение dF _б(x,щ)= F _б(dx,щ).

Предполагаются выполненными необходимые для корректности изложения внутриматематические предположения измеримости, например, сформулированные в [28, 29].

Пример 1. Рассмотрим критерий Лемана – Розенблатта, т.е. критерий типа омега-квадрат для проверки однородности двух независимых выборок [6]. Его статистика имеет вид:

LR = F_m (x) – G_n (x))² dH_m₊_n(x),

где F_m (x) – эмпирическая функция распределения, построенная по первой выборке объема m, G_n (x)) - эмпирическая функция распределения, построенная по второй выборке объема n, а H_m+n (x) – эмпирическая функция распределения, построенная по объединенной выборке объема m+n. Легко видеть, что

H_m₊_n (x) = F_m (x) + G_n (x).

Ясно, что статистика LR имеет вид (1). При этом х – действительное число, Х = У = R ¹, в роли б выступает пара (m, n), и б→∞ означает, что min(m, n) → ∞. Далее,

f _б(x,щ) = .

Наконец, F _б(x,щ) = H_m₊_n (x).

Теперь обсудим асимптотическое поведение функций f _б(x,щ) и F _б(x,щ), с помощью которых определяется статистика Лемана – Розенблатта LR. Ограничимся случаем, когда справедлива гипотеза однородности, т.е. совпадают функции распределения, соответствующие генеральным совокупностям, из которых взяты выборки. Их общую функцию распределения обозначим F (x). Она предполагается непрерывной. Введем в рассмотрение выборочные процессы

Нетрудно проверить, что

Сделаем замену переменной t = F (x). Тогда выборочные процессы переходят в соответствующие эмпирические процессы (см. приложение 1):

Конечномерные распределения этого процесса, т.е. распределения случайных векторов

для всех возможных наборов (t ₁, t ₂, …, t_k), сходятся к конечномерным распределениям квадрата броуновского моста о²(t). В соответствии с разделом П-5 приложения 1 рассматриваемая сходимость по распределению обозначается так:

. (2)

Нетрудно видеть, что при любом х

F _б(x,щ) = H_m₊_n (x) → F (x)

при б→∞ (сходимость по вероятности). С помощью замены переменной t = F (x) получаем, что

F _б(F ^-1(t),щ) = H_m₊_n (F ^-1(t)) → t (3)

при б→∞. Из соотношений (2) и (3) хотелось бы сделать вывод, что в случае статистики Лемана - Розенблатта типа омега-квадрат

т.е. предельным распределением этой статистики является классическое распределение [30], найденное как предельное для одновыборочной статистики критерия согласия омега-квадрат, известного также как критерий Крамера - Мизеса - Смирнова.

Действительно, сформулированное утверждение справедливо. Однако доказательство нетривиально.

Так, может показаться очевидным следующее утверждение.

Утверждение 1. Пусть f: [0; 1] → R ¹ – ограниченная функция, G_n (x) и G (x) – функции распределения, G_n (0) = G (0) =0, G_n (1) = G (1) = 1, причем G_n (x) → G (x) при всех х. Тогда

. (4)

Это утверждение неверно (ср. [31, с.42]). Действительно, пусть f (x) = 1, если х рационально, и f (x) = 0, если х иррационально, G (x) = x, а G_n (x) имеет скачки величиной 2 ^-ⁿ в точках m /2 ⁿ, m = 1, 2, …, 2 ⁿ при всех n =1, 2, … Тогда G_n (x) → G (x) при всех х, однако

при всех n =1, 2, … Следовательно, вопреки сформулированному выше утверждению 1,

т.е. соотношение (4) неверно.

Итак, сформулируем проблему. Пусть известно, что последовательность случайных функций f _б(x, щ) сходится по распределению при б→∞ к случайной функции f (x,щ). Пусть последовательность случайных мер F _б(A,щ), определенных на множествах А из достаточно обширного семейства, сходится по распределению к вероятностной мере F (A) при б→∞. Если речь идет о конечномерном пространстве и меры задаются функциями распределения, то сходимость F _б(х,щ) к F (х) должна иметь место во всех точках непрерывности F (х). В каких случаях можно утверждать, что при б→∞ справедлив предельный переход

Выше показано, что, например, ограниченности f _б(x, щ) для этого недостаточно.

Метод аппроксимации ступенчатыми функциями. Рассмотрим общий метод, позволяющий получить предельные распределения не только для статистик интегрального типа, но и для других статистических критериев, например, для критериев типа Колмогорова. Пусть T = { С ₁, С ₂, …, С_k } – разбиение пространства Х на непересекающиеся подмножества. Пусть в каждом элементе С_j разбиения T выделена точка x_j, j = 1, 2, …, k. На множестве функций f: X → Y введем оператор A_T: если x С_j, то

A_Tf (x) = f (x_j), j = 1, 2, …. k. (5)

Тогда A_Tf – аппроксимация функции f ступенчатыми (кусочно-постоянными) функциями.

Пусть f_б (x,щ) – последовательность случайных функций на Х, а К (∙) – функционал на множестве всех возможных их траекторий как функций от х. Для изучения распределения К (f_б) методом аппроксимации ступенчатыми функциями используют разложение

К (f_б) = К (А_Тf_б) + { К (f_б) - К (А_Тf_б)}. (6)

Согласно (5) распределение первого слагаемого в (6) определяется конечномерным распределением случайного элемента, а именно, распределением вектора

(f _б(x ₁,щ), f_б (x ₂,щ), … f_б (x_k,щ)). (7)

В обычных постановках предельной теории классических непараметрических критериев распределение вектора (7) сходится при б→∞ к соответствующему конечномерному распределению предельной случайной функции f (x,щ), т.е. к распределению случайного вектора

(f (x ₁,щ), f (x ₂,щ), … f (x_k,щ)). (8)

В соответствии с теорией наследования сходимости (приложение 1) при слабых условиях на функционал К (∙) из сходимости по распределению вектора (7) к вектору (8) следует сходимость по распределению К (А_Тf_б) к К (А_Тf).

Используя аналогичное (6) разложение

К (f) = К (А_Тf) + { К (f) - К (А_Тf)}, (9)

можно устанавливать сходимость по распределению К (f_б) к К (f) при б→∞ в два этапа: сначала выбрать разбиение Т так, чтобы вторые слагаемые в правых частях соотношений (6) и (9) были малы, а затем при фиксированном операторе А_Т воспользоваться сходимостью по распределению К (А_Тf_б) к К (А_Тf).

Рассмотрим простой пример применения метода аппроксимации ступенчатыми функциями.

Обобщение теоремы Хелли. Пусть f: [0; 1] → R ¹ – измеримая функция, F_n (x) – функции распределений, сосредоточенных на отрезке [0; 1]. Пусть F_n (x) сходятся в основном к функции распределения F (x), т.е.

(10)

для всех х, являющихся точками непрерывности F (x).

Утверждение 2. Если f (x) – непрерывная функция, то

(11)

(рассматриваются интегралы Лебега-Стилтьеса).

Утверждение 2 известно в литературе как первая теорема Хелли [27, с.344-346], вторая теорема Хелли [32, с.174-175], лемма Хелли-Брея [33, с.193-194].

Естественно поставить вопрос: при каких f из (10) следует (11)? Необходимо ввести условия и на F_n: если F_n ≡ F, то соотношение (11) верно для любой измеримой функции f, для которой интеграл в (11) существует. Поэтому рассмотрим следующую постановку.

Постановка 1. Пусть функция f такова, что для любой последовательности F_n, удовлетворяющей (10), справедливо (11). Что можно сказать о функции f?

В работах [28, 29] найдены следующие необходимые и достаточные условия на функцию f.

Теорема 1. Пусть ограниченная на [0; 1] функция f интегрируема по Риману-Стилтьесу по функции распределения F (x). Тогда для любой последовательности функций распределения F_n, сходящейся в основном к F, имеет место предельный переход (11).

Теорема 2. Пусть функция f не интегрируема по Риману-Стилтьесу по функции распределения F (x). Тогда существует последовательность функций распределения F_n, сходящаяся в основном к F, для которой соотношение (11) не выполнено.

Теоремы 1 и 2 в совокупности дают необходимые и достаточные условия для f в постановке 1. А именно, необходимо и достаточно, чтобы ограниченная на [0; 1] функция f была интегрируема по Риману-Стилтьесу по F.

Напомним определение интегрируемости функции f по Риману-Стилтьесу по функции распределения F [27, с.341]. Рассмотрим разбиение T = { С ₁, С ₂, …, С_k }, где

С_i = [ y_i _-1, y_i), i = 1, 2, …, m – 1, С_m = [ y_m _-1, y_m ], (12)

0 = y ₀ < y ₁ < y ₂ <…< y_m = 1.

Выберем в С_i произвольную точку x_i, i = 1, 2, …, m, и составим сумму

Если при max(y_i – y_i _-1) → 0 эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления отрезка [0; 1], ни от выбора точек x_i в каждом из элементов разбиения), то этот предел называется интегралом Римана-Стилтьеса от функции f по функции F по отрезку [0; 1] и обозначается символом, приведенным в правой части равенства (11).

Рассмотрим суммы Дарбу-Стилтьеса

где

Ясно, что

S_H (T) < S (T) < S_B (T).

Необходимым и достаточным условием интегрируемости по Риману-Стилтьесу является следующее: для любой последовательности разбиений T_k, k = 1, 2, 3, … вида (12) такой, что max(y_i – y_i _-1) → 0 при k →∞, имеем

. (13)

Напомним, что согласно разделу П-3 приложения 1 колебанием д(f, B) функции f на множестве B называется д(f, B) = sup{| f (x) – f (y)|, x B, y B }. Поскольку

д(f, С_i) = M_i – m_i,

то условие (13) можно записать в виде

. (14)

Условие (14), допускающее обобщение с Х = [0; 1] и f: [0; 1] → R ¹ на X и f более общего вида, и будем использовать при доказательстве теорем 1 и 2.

Доказательство теоремы 1. Согласно методу аппроксимации ступенчатыми функциями рассмотрим оператор А_Т. Как легко проверить, имеет место разложение

. (15)

Поскольку

| f (x) - A_Tf (x)| < д(f, X_i), x С_i,

то первое слагаемое в правой части (15) не превосходит

, (16)

а второе не превосходит

Согласно определению оператора А_Т третье слагаемое в (15) имеет вид

Очевидно, оно не превосходит по модулю

(здесь используется ограниченность f на X).

Согласно (16) первое слагаемое в правой части (15) не превосходит

Поскольку

то первое слагаемое в правой части (15) не превосходит

Из оценок, относящихся к трем слагаемым в разложении (15), следует, что

. (17)

Используя оценку (17), докажем, что в _n → 0 при n → ∞. Пусть дано е > 0. Согласно условию интегрируемости функции f по Риману-Стилтьесу, т.е. условию (14), можно указать разбиение T = T (е) такое, что

, (18)

и в точках y_i, i = 1, 2, …, m - 1 (см. (12)), функция F непрерывна.

Поскольку

F_n (X_i) = F_n (y_i) - F_n (y_i _-1),

то из (10) следует, что существует число n = n (е) такое, что при n > n (е) справедливо неравенство

. (19)

Из (17), (18) и (19) следует, что при n > n (е) справедливо неравенство

что и требовалось доказать.

Обсудим условие ограниченности f. Если оно не выполнено, то из (10) не всегда следует (11).

Пример 2. Пусть f (x) = 1/ x при x > 0 и f (0)=0. Пусть F (0,5) = 0, т.е. предельное распределение сосредоточено на [1/2; 1]. Пусть распределение F_n на [0; Ѕ) имеет единственный атом в точке x = 1/ n величиной n ^-1/2, а на [1/2; 1] справедливо (10). Тогда по причинам, изложенным при доказательстве теоремы 1,

однако

т.е. соотношение (11) не выполнено.

Условие ограниченности подынтегральной функции f можно заменить, как это сделано, например, в [28], на условие строгого возрастания функции распределения F.

Лемма. Пусть функции распределения F всюду строго возрастает, т.е. из x ₁ < x ₂ вытекает F (x ₁) < F (x ₂). Пусть функция f интегрируема по Риману-Стилтьесу по F, т.е. выполнено (14). Тогда функция f ограничена.

Доказательство. Рассмотрим точки 0 = y ₀ < y ₁ < y ₂ <…< y₂_m = 1 и два разбиения

Тогда для любых двух точек х и х ′ можно указать конечную последовательность точек x ₁ = x, x ₂, x ₃, …, x_s, x_s ₊₁ = x ′ такую, что любые две соседние точки x_i, x_i ₊₁, i = 1, 2, …, s, одновременно принадлежат некоторому элементу C_i разбиения T ₁ или разбиения T ₂, причем С_i ≠ С_j при i ≠ j. Действительно, пусть . Пусть для определенности q > p. Тогда можно положить x ₂ = y_p ₊₁, x ₃ = y_p ₊₂, …, x_s = y_q. Поскольку среди элементов разбиений Т ₁ и Т ₂ есть С ₁ = [ y_p; y_p ₊₂), то . Далее, , и т.д.

Из указанных выше свойств последовательности x ₁ = x, x ₂, x ₃, …, x_s, x_s ₊₁ = x ′ следует, что

Пусть теперь число max(y_i – y_i _-2) настолько мало, что согласно (14)

Тогда согласно двум последним соотношениям

что и доказывает лемму.

Доказательство теоремы 2. Пусть условие (14) не выполнено, т.е. существуют число г > 0 и последовательность разбиений T_n, n = 1, 2, …, такие, что max(y_i – y_i _-1) → 0 при n →∞ и при всех n

. (20)

Для доказательства теоремы построим две последовательности функций распределения F ₁ _n и F ₂ _n, n = 1, 2, …, для которых выполнено (10), но последовательность

не стремится к 0 при n → ∞. Тогда (11) не выполнено хотя бы для одной из последовательностей F ₁ _n и F ₂ _n.

Для любого С – элемента некоторого разбиения Т – можно указать, как вытекает из определения д(f, C), точки x ₁(C) и x ₂(C) такие, что

f (x ₁(C)) - f (x ₂(C)) > Ѕ д(f, C). (21)

Построим F ₁ _n и F ₂ _n следующим образом. Пусть F ₁ _n (С) = F ₂ _n (С) = F (С) для любого С из T_n. При этом F ₁ _n имеет в С один атом в точке x ₁(C) величиной F (С), а F ₂ _n имеет в С также один атом в точке x ₂(C) той же величины F (С). Другими словами, распределение F ₁ _n в С сосредоточено в одной точке, а именно, в x ₁(C), а распределение F ₂ _n сосредоточено в x ₂(C). Тогда

. (22)

Из (20), (21) и (22) следует, что

Остается показать, что для последовательностей функций распределения F ₁ _n и F ₂ _n выполнено (10). Пусть х – точка непрерывности F. Пусть

y ₁(x, T) = max{ y_kn: y_kn < x }, y ₂(x, T) = min{ y_kn: y_kn > x },

где y_kn – точки, определяющие разбиения T_n согласно (12). В соответствии с определением F_in

F_in (y_j (x, T_n))= F (y_j (x, T_n)), i = 1, 2, j = 1, 2,

а потому

| F_in (x) – F (x)| < F (y ₂(x, T_n)) - F (y ₁(x, T_n)), i = 1, 2.

В силу условия max(y_kn – y₍_k _-1) _n) → 0 и непрерывности F в точке x правая часть последнего соотношения стремится к 0 при n → ∞, что и заканчивает доказательство теоремы 2.

Теоремы 1 и 2 демонстрируют основные идеи предельной теории статистик интегрального типа и непараметрических критериев в целом. Как показывают эти теоремы, основную роль в рассматриваемой теории играет предельное соотношение (14). Отметим, что если д(f, T_n) → 0 при n → ∞, то (14) справедливо, но, вообще говоря, не наоборот. Естественно возникает еще ряд постановок. Пусть (14) выполнено для f ₁ и f ₂. При каких функциях h это соотношение выполнено для h (x, f ₁(x), f ₂(x))? В прикладной статистике вместо f (x) рассматривают f _б(x, щ) и f (x, щ), а вместо интегрирования по функциям распределения F_n (x) – интегрирование по случайным мерам F _б(щ). Как меняются формулировки в связи с такой заменой? В связи со слабой сходимостью (т.е. сходимостью по распределению) A_Tf _б к A_T и переходом от f _б(x, щ) к h _б(x, f _1б(x, щ), f _2б(x, щ)) возникает следующая постановка. Пусть к_б слабо сходится к к при б→∞. Когда распределения g_б (к_б) сближаются с распределениями g_б (к)? Полным ответом на последний вопрос являются необходимые и достаточные условия наследования сходимости. Они приведены в приложении 1.

Основные результаты. Наиболее общая теорема типа теоремы 1 выглядит так [29].

Теорема 3. Пусть существует последовательность разбиений T_n, n = 1, 2, …, такая, что при n →∞ и б→∞

. (23)

Пусть для любого С, входящего хотя бы в одно из разбиений T_n,

F _б(C, щ) → F (C) (24)

при б→∞ (сходимость по вероятности). Пусть f _б асимптотически ограничены по вероятности при б→∞. Тогда

(25)

при б→∞ (сходимость по вероятности).

Как известно, полное сепарабельное метрическое пространство называется польским. Это понятие понадобится для формулировки аналога теоремы 2.

Теорема 4. Пусть Х – польское пространство, У конечномерно, существует измельчающаяся последовательность T_n разбиений, для которой соотношение (23) не выполнено. Тогда существует удовлетворяющая (24) последовательность F_б, для которой соотношение (25) неверно, хотя F_б слабо сходится к F при б→∞.

Условие (23) естественно назвать условием римановости, поскольку в случае, рассмотренном в теореме 1, оно является условием интегрируемости по Риману-Стилтьесу. Рассмотрим наследуемость римановости при переходе от f ₁_б(x, щ) со значениями в У ₁ и f ₂_б(x, щ) со значениями в У ₂, удовлетворяющих (23), к h _б(x, f _1б(x, щ), f _2б(x, щ)) со значениями в У ₃.

Положим

где ||∙|| _k – норма (т.е. длина вектора) в пространстве Y_k, k = 1, 2. Рассмотрим также множества

и функции

Наконец, понадобится измеритель колеблемости

и множество

Теорема 5. Пусть функции h _б асимптотически (при б→∞) ограничены на множестве Z (a) при любом положительном a. Пусть функции f _1б и f _2б асимптотически ограничены по вероятности и удовлетворяют условию (23). Пусть для участвующей в (23) последовательности T_n

c(h _б, T_n, a, е) → 0 (26)

при б→∞, n →∞, е→ 0 и любом положительном a. Тогда функции f ₃_б(x, щ) = h _б(x, f _1б(x, щ), f _2б(x, щ)) удовлетворяют условию (23) и асимптотически ограничены по вероятности.

Теорема 6. Пусть условие (26) не выполнено для h_б. Тогда существуют детерминированные ограниченные функции f _1б и f _2б такие, что соотношение (23) выполнено для f _1б и f _2б и не выполнено для f ₃_б.

Пример 3. Пусть X = [0; 1] ^k, пространства Y ₁ и Y ₂ конечномерны, функция h _б ≡ h (x, y ₁, y ₂) непрерывна. Тогда условие (26) выполнено.

С помощью теорем 3 и 5 и результатов о наследовании сходимости можно изучить асимптотическое поведение статистик интегрального типа

со значениями в банаховом пространстве У.

Теорема 7. Пусть для некоторой последовательности T_n разбиений Х справедливы соотношения (23) для f _1б и f _2би (24) для F _б. Пусть последовательность функций h _б удовлетворяет условию в теореме 5, конечномерные распределения (f _1б(x, щ), f _2б(x, щ)) слабо сходятся к конечномерным распределениям (f ₁(x, щ), f ₂(x, щ)), причем для f ₁ и f ₂ справедливо соотношение (23). Тогда

где L – расстояние Прохорова (см. раздел П-3 приложения 1),

Теорема 7 дает общий метод получения асимптотических распределений статистик интегрального типа. Важно, что соотношение (23) выполнено для эмпирического процесса и для процессов, связанных с оцениванием параметров при проверке согласия [28].

Один из выводов общей теории состоит в том, что в качестве F _б можно использовать практически любую состоятельную оценку истинной функции распределения. Этот вывод использовался при построении критерия типа омега-квадрат для проверки симметрии распределения относительно 0 и обнаружения различий в связанных выборках (см. ниже).

Асимптотическое поведение критериев типа Колмогорова может быть получено с помощью описанного выше метода аппроксимации ступенчатыми функциями. Этот метод не требует обращения к теории сходимости вероятностных мер в функциональных пространствах. Для критериев Колмогорова и Смирнова достаточно использовать лишь свойства эмпирического процесса и броуновского моста. В случае проверки согласия добавляется необходимость изучения еще одного случайного процесса. Он является разностью между двумя функциями распределения. Одна - функция распределения элементов выборки. Вторая - случайный элемент параметрического семейства распределений, полученный путем подстановки оценок параметров вместо их истинных значений.

Статистика интегрального типа для проверки симметрии распределения. В прикладной статистике часто возникает необходимость проверки гипотезы о симметрии распределения относительно 0. Так, при проверке однородности связанных выборок необходимость проверки этой гипотезы основана на следующем факте [6]. Если случайные величины Х и Y независимы и одинаково распределены, то для функции распределения H (x) =P (Z < x) случайной величины Z = X – Y выполнено, как нетрудно видеть, соотношение

H (-x) = 1 - H (x).

Это соотношение означает симметрию функции распределения относительно 0. Плотность такой функции распределения является четной функцией, ее значения в точках х и (-х) совпадают. Проверка гипотезы однородности связанных выборок в наиболее общем случае сводится к проверке симметрии функции распределения разности Z = X – Y относительно 0.

Рассмотрим методы проверки этой гипотезы. Сначала обсудим, какого типа отклонения от гипотезы симметрии можно ожидать при альтернативных гипотезах?

Рассмотрим сначала альтернативу сдвига

В этом случае распределение Z при альтернативе отличается сдвигом от симметричного относительно 0. Для проверки гипотезы однородности может быть использован критерий знаковых рангов, разработанный Вилкоксоном (см., например, справочник [34, с.46-53]).

Альтернативная гипотеза общего вида записывается как

при некотором х₀. Таким образом, проверке подлежит гипотеза симметрии относительно 0, которую можно переписать в виде

H (x) + H (-x) - 1 = 0.

Для построенной по выборке Z_j = X_j - Y_j _, j = 1,2,…, n, эмпирической функции распределения H_n (x) последнее соотношение выполнено лишь приближенно:

Как измерять отличие от 0? По тем же соображениям, что и в предыдущем пункте, целесообразно использовать статистику типа омега-квадрат. Соответствующий критерий был предложен в работе [35]. Он имеет вид

(27)

Представим эту статистику в интегральном виде. Рассмотрим выборочный процесс

При справедливости нулевой гипотезы

Положим

Тогда, как легко видеть, статистика, заданная формулой (27), представляется в виде

Таким образом, асимптотическое поведение этой статистики может быть изучено с помощью описанной выше предельной теории статистик интегрального типа. Исторически ход мысли был обратным - сначала была построена и изучена статистика (27), а потом путем обобщения разработанных при анализе конкретной статистики методов исследования была построена общая теория, включающая в себя ряд необходимых и достаточных условий.

Критерий проверки гипотезы симметрии распределения относительно 0 с помощью статистики (27) является состоятельным, т.е. если функция распределения элементов выборки не удовлетворяет рассматриваемой гипотезе, то вероятность отклонения гипотезы стремится к 1 при росте объема выборки.

В работе [35] найдено предельное распределение этой статистики:

В табл.1 приведены критические значения статистики типа омега-квадрат для проверки симметрии распределения (и тем самым для проверки однородности связанных выборок), соответствующие наиболее распространенным значениям уровней значимости (расчеты проведены Г.В. Мартыновым; см.также [31]).

Таблица 1. Критические значения статистики

для проверки симметрии распределения

Значение функции распределения	Уровень значимости	Критическое значение х статистики
0,90	0,10	1,20
0,95	0,05	1,66
0,99	0,01	2,80

Как следует из табл.1, правило принятия решений при проверке симметрии распределения (или однородности связанных выборок) в наиболее общей постановке и при уровне значимости 5% формулируется так. Вычислить статистику . Если < 1,66, то принять гипотезу однородности. В противном случае - отвергнуть.

Пример. Пусть величины Z_j_,j =1,2,…,20, таковы:

20, 18, (-2), 34, 25, (-17), 24, 42, 16, 26,

13, (-23), 35, 21, 19, 8, 27, 11, (-5), 7.

Соответствующий вариационный ряд имеет вид:

(-23)<(-17)<(-5)<(-2)<7<8<11<13<16<18<

<19<20<21<24<25<26<27<34<35<42.

Для расчета значения статистики построим табл.2 из 7 столбцов и 20 строк, не считая заголовков столбцов (сказуемого таблицы). В первом столбце указаны номера (ранги) членов вариационного ряда, во втором - сами эти члены, в третьем - значения эмпирической функции распределения при значениях аргумента, совпадающих с членами вариационного ряда. В следующем столбце приведены члены вариационного ряда с обратным знаком, а затем указываются соответствующие значения эмпирической функции распределения. Например, поскольку минимальное наблюдаемое значение равно (-23), то H_n (x) = 0 при x < -23, а потому для членов вариационного ряда с 14-го по 20-й в пятом столбце стоит 0. В качестве другого примера рассмотрим минимальный член вариационного ряда, т.е. (-23). Меняя знак, получаем 23. Это число стоит между 13-м и 14-м членами вариационного ряда, 21<23<24. На этом интервале эмпирическая функция распределения совпадает со своим значением в левом конце, поэтому следует записать в пятом столбце значение 0,65. Остальные ячейки пятого столбца заполняются аналогично. На основе третьего и пятого столбцов элементарно заполняется шестой столбец, а затем и седьмой. Остается найти сумму значений, стоящих в седьмом столбце. Подобная таблица удобна как для ручного счета, так и при использовании электронных таблиц типа Excel.

Таблица 2. Расчет значения статистики

для проверки симметрии распределения

j	Z (j)	H_n (Z (j))	- Z (j)	H_n (-Z (j))	H_n (Z (j))+ H_n (-Z (j)) - 1	(H_n (Z (j))+ H_n (-Z (j))-1)²
	-23	0,05		0,65	-0,30	0,09
	-17	0,10		0,45	-0,45	0,2025
	-5	0,15		0,20	-0,65	0,4225
	-2	0,20		0,20	-0,60	0,36
		0,25	-7	0,10	-0,65	0,4225
		0,30	-8	0,10	-0,60	0,36
		0.35	-11	0,10	-0,55	0,3025
		0,40	-13	0,10	-0,50	0,25
		0,45	-16	0,10	-0,45	0,2025
		0,50	-18	0,05	-0,45	0,2025
		0,55	-19	0,05	-0,40	0,16
		0,60	-20	0,05	-0,35	0,1225
		0,65	-21	0,05	-0,30	0,09
		0,70	-24		-0,30	0,09
		0,75	-25		-0,25	0,0625
		0,80	-26		-0,20	0,04
		0,85	-27		-0,15	0,0225
		0,90	-34		-0,10	0,01
		0,95	-35		-0,05	0,0025
		1,00	-42

Результаты расчетов (суммирование значений по седьмому столбцу табл.2) показывают, что значение статистики =3,055. В соответствии с табл.1 это означает, что на любом используемом в прикладных эконометрических исследованиях уровнях значимости отклоняется гипотеза симметрии распределения относительно 0 (а потому и гипотеза однородности в связанных выборках).

Дата добавления: 2015-07-20; просмотров: 77 | Нарушение авторских прав

<== предыдущая страница	\|	следующая страница ==>
Непараметрические оценки плотности	\|	Методы восстановления зависимостей

mybiblioteka.su - 2015-2025 год. (0.056 сек.)