Читайте также:
|
|
Совокупность значений случайной величины x 1, x 2,…, xn полученных при n независимых опытах в однородных условиях, называется случайной выборкой. Закон распределения такой ограниченной по объему совокупности значений исследуемой случайной величины x называется выборочным законом распределения.
Выборка бесконечного объема, распределение которой совпадает с истинным законом распределения исследуемой случайной величины x, называется генеральной совокупностью.
Таким образом, если будут выполнены различные серии опытов с регистрацией случайных значений, или реализаций, величины x, будут получены несколько случайных выборок, выступающих как часть одной и той же генеральной совокупности. Каждой из этих выборок будет соответствовать свой выборочный закон распределения, являющийся некоторым приближением истинного закона.
Можно выделить два основных вида задач обработки случайных выборок:
- получение выборочного закона распределения;
- определение некоторых оценок, то есть приближений моментов или параметров истинного закона распределения.
Статистикой называется некоторая функция, определенная на выборке, yn=y (x 1, x 2,…, xn), значение которой может быть предсказано с существенно более высокой точностью, чем значение случайной величины, образующей выборку [20].
Поясним суть такого свойства, называемого статистической устойчивостью, на примере.
Пусть получена выборка значений случайной величины x объемом n= 10: 1,2; 1,8; 2,2; 2,5; 2,1; 1,9; 1,8; 1,5; 1,3; 2,4.
Найдем: среднее арифметическое и вероятность того, что наблюдаемое значение x оказывается большим2, p А= P (x> 2)=0,4.
Если на основе имеющейся выборки попытаться предсказать значения, которые примут случайные величины x, и p А после проведения дополнительного 11-го опыта, то можно сделать следующие предположения: 1,2≤ x ≤2,5; 1,81≤ ≤1,93; 0,36≤ p А≤0,45.
Очевидно, при больших n прогнозируемые диапазоны для и p А окажутся значительно более узкими, в отличие от x. Таким образом, они действительно обладают статистической устойчивостью и могут использоваться как статистики.
Выбор той или иной статистики в качестве оценки искомой величины в конкретной задаче не всегда однозначен. Помимо статистической устойчивости, к оценке предъявляются следующие требования:
1. Состоятельность – оценка должна сходиться по вероятности к оцениваемой величине. Для этого достаточно, чтобы предел дисперсии оценки был равен нулю при n→∞.
2. Эффективность – оценка должна иметь минимальную дисперсию среди всех статистик, которые можно построить для определения искомой величины.
3. Несмещенность – математическое ожидание оценки должно совпадать с истинным математическим ожиданием оцениваемой величины.
4. Достаточность – оценка должна использовать всю информацию, содержащуюся в выборке.
Последними двумя требованиями иногда пренебрегают в пользу статистической устойчивости и эффективности или для простоты вычислений.
Примеры оценок:
1. Оценка вероятности случайного события – относительная частота (3.1) – отвечает всем указанным требованиям: p A * = hn.
2. Оценка математического ожидания – выборочное среднее (3.2) – является состоятельной, несмещенной, достаточной и при условии конечности дисперсии оцениваемой величины эффективной: .
3. Для нахождения дисперсии случайной величины x может быть построена статистика, непосредственно соответствующая определению дисперсии и называемая выборочным стандартным отклонением:
, (3.8)
где xi - значения реализаций x, образующих выборку; - выборочное среднее. Однако такая статистика, удовлетворяя остальным требованиям, для конечной выборки оказывается смещенной.
Несмещенная оценка дисперсии выглядит следующим образом:
(3.9)
Нетрудно убедиться, что при n> 50 смещение статистики (3.8) оказывается незначительным и ее также можно использовать для оценки дисперсии.
4. Оценка корреляционного момента связи двух случайных величин x и y, удовлетворяющая всем указанным выше требованиям:
. (3.10)
5. Оценки математического ожидания m h и корреляционной функции K h(t) стационарного эргодического случайного процесса h(t) могут быть получены по случайной выборке, образованной n последовательными измерениями одной реализации процесса h1,h2,...,h i,...,h n с шагом D t:
, (3.11)
, (3.12)
где h i =h(i D t), t= j D t.
Оценка (3.11) удовлетворяет всем указанным выше требованиям, а оценка (3.12), не будучи несмещенной, традиционно используется при достаточно больших n в силу простоты алгоритмической реализации.
Дата добавления: 2015-11-04; просмотров: 46 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
Теоретические основы метода статистического моделирования | | | Точность оценок и определение необходимого количества опытов |