Читайте также: |
|
Ответ: 85,5 %.
В практических задачах представляет интерес какое количество случайных величин лежит в диапазонах: ; и . Расчеты, аналогичные проведенным выше показывают следующее. 68,26 % случайных величин, т.е. примерно 2/3 значений, лежат в пределах между границами и . Остальная треть, т.е. 31,74 % наблюдений, лежит за этими границами, а именно: 15,87 % правее и 15,87% левее . Границы и охватывают 95,44 % всех значений, а вне их находится 4,56 % (по 2,28 % левее и правее ). Наконец, между трехсигмовыми границами ( и ) находится 99,73 % всех наблюдений, т.е. практически все. Только 0,27 %, т.е. 27 из 10000 находится за пределами этих границ.
Это означает, что для случайных величин, подчиняющихся нормальному распределению, практически все поле рассеивания укладывается в диапазон . Таким образом, зная среднюю величину распределения случайных величин и его стандартное отклонение, можно указать ориентировочно диапазон ее практически возможных значений.
5.3 Проведение выборочных наблюдений
в оргпроектировании управленческих процессов
В последние годы для изучения объемов документооборота, объемов и расстояний передачи информации, обследовании режимов и времени работы оборудования широко распространены выборочные наблюдения. Дело в том, что сплошное наблюдение обычно становится экономически невыгодным при больших объемах, сложности и трудоемкости учета анализируемого признака.
Сущность выборочного метода заключается в отборе из всей статистической совокупности изучаемого материала некоторой его части (выборки) и ее испытании с целью получения информации о всей совокупности.
Введем некоторые основные определения:
− Генеральная совокупность – вся статистическая совокупность изучаемого материала.
− Выборка – часть членов генеральной совокупности, отобранных из нее для получения сведений о всей совокупности.
Основная цель отбора членов генеральной совокупности – получить такую выборку, которая при ограниченном объеме возможно полнее воспроизводила бы в себе исследуемые свойства всей совокупности. Для того чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы члены выборки ее правильно представляли. Эти требования формируют так: выборка должная быть репрезентативной (представительной).
В зависимости от особенностей организации извлечения изучаемых признаков из генеральной совокупности можно выделить следующие виды выборок:
− Повторная (с возвращением). В этом случае отобранная и изученная единица генеральной совокупности возвращается назад в генеральную совокупность и может наравне с другими снова быть отобранной для исследования. С точки зрения здравого смысла человека далекого от теории вероятности и статики такой подход к формированию выборки не совсем понятен. Но с точки зрения теории вероятности такая выборка наиболее полно характеризует особенности генеральной совокупности, так как не изменяет в ходе исследования вероятность извлечения любой ее единицы.
− Бесповторная (без возвращения). В этом случае отобранная единица генеральной совокупности не возвращается назад после исследования. Считается, и это можно показать теоретически, что при относительно небольшом объеме выборки (n) по сравнению с объемом генеральной совокупностью (N) – n << N, результаты повторной и бесповторных выборок практически совпадают.
− Случайная. В этом случае каждая единица генеральной совокупности должна иметь равную возможность попасть в выборку, независимо от того, где она находится и кем (чем) является.
При случайной выборке во время извлечения отдельного замера (например, в виде записи, листка, длительности элемента операции и т.п.) из генеральной совокупности лицо производящее выборку действует и выбирает наугад. Эта предпосылка, кажется, простой и легко осуществимой. Однако это не всегда так и на выбор могут оказать влияние различные факторы. В таком случае для организации случайной выборки можно использовать жребий, генератор случайных чисел, таблицы случайных чисел и т.п.
− Механическая. В случае механического отбора устанавливают определенный порядок, по которому располагаются все единицы совокупности. Этот порядок не должен быть связан со значением изучаемого признака. После установления порядка производится отбор по принятому алгоритму. Например, отбирается каждая 50-я анкета, 100-я и так далее, или анкета, номер которой оканчивается на 1, 7 и т.п.
− Типическая. При типическом отборе вся генеральная совокупность предварительно разбивается на отдельные типические группы единиц, районы или серии по какому-то признаку, а внутри уже этой группы производится индивидуальный случайный отбор. Например, в переписи всех управленческих работников отбирают группы по профессиям (руководители, референты, секретари и так далее). В отобранных же группах производят случайный отбор.
− Серийная. В основу серийного отбора закладывают произвольный отбор определенных районов или пунктов в генеральной совокупности, предварительно разбитой на группы (так же, как при типической выборке), внутри которых производится сплошное наблюдение. Например, имея общую перепись, мы хотим на основе серийного отбора дать распределение работников по видам работ и таким образом подойти к определению трудоемкости этих работ. Для этого выбираем несколько районов, в которых встречаются различные виды строительства (промышленное, жилищное, энергетическое и т.п.) и в этих районах проводим указанное исследование.
Выборочному обследованию свойственна некоторая погрешность в сравнении со сплошным. Эта погрешность органично присуща любому выборочному наблюдению. Ее называют ошибкой репрезентативности. Поэтому в каждом конкретном случае необходимо рассчитать среднюю и предельную ошибки выборки, которые позволяют распространить результаты выборочного обследования на генеральную совокупность.
Из теории математической статистики известно, что величина средней ошибки при определении средней арифметической случайной повторной выборки зависит от величины характеристики рассеивания генеральной совокупности − (стандартного отклонения) и объема выборки – n по следующей формуле:
, (5.40)
Для определения величины предельной возможной ошибки принимают решение о вероятности этой ошибки. Чаще всего в качестве такой вероятности принимают величину 0,3%, или 0,003. В этом случае величина предельной ошибки составляет 3 .
Для бесповторной выборки при изъятии очередного объекта исследования из генеральной совокупности изменяются вероятностные характеристики оставшихся единиц. В этом случае величину ошибки величины средней по формуле (5.40) корректируют поправкой:
, (5.41)
где N – общее число единиц объектов в генеральной совокупности;
– доля выборки.
Если величина стандартного отклонения генеральной совокупности неизвестна, то вычисляют выборочное стандартное отклонение . При этом, если объем выборки большой (n ≥ 30):
в. (5.42)
Если же n < 30, то:
. (5.43)
Приведенные выше формулы для величины ошибки справедливы для выборок случайных и механических. Для выборок другого вида учитываются особенности отбора единицы из генеральной совокупности, в результате чего выражение для средней ошибки приобретают следующий вид:
− Типическая повторная выборка:
, (5.44)
, (5.45)
где − внутригрупповое стандартное отклонение;
− дисперсия результативного признака в i -ой группе;
R − количество групп, в совокупности;
– объем (численность) i -ой группы
−общий объем выборки.
− Типическая бесповторная выборка:
. (5.46)
− Серийная повторная выборка:
, (5.47)
, (5.48)
где − межгрупповое стандартное отклонение;
r − количество групп в генеральной совокупности, отобранных для исследования;
− среднее значение результативного признака по i -ой группе;
− общая средняя по совокупности в целом.
− Серийная бесповторная выборка:
. (5.49)
Из приведенных выше формул видно, что величина ошибки определения величины генеральной совокупности зависит от объема выборки. Поэтому следует говорить о необходимой численности выборки исходя из заданного уровня точности (ошибки), которой можно достичь с определенной вероятностью. Обычно формулы для расчета необходимой численности выборки выводят из формул для предельной ошибки, то есть при уровне вероятности ошибки 0,003. Учитывая, что величина предельной ошибки обычно принимается равной 3 запишем выражение для необходимого объема выборки для рассмотренных способов формирования выборочной совокупности (таблица 5.11).
Таблица 5.11 – Необходимый объем выборки для некоторых способов формирования выборочной совокупности
Виды выборок | Повторный отбор | Бесповторный отбор |
Случайная | ||
Механическая | То же | То же |
Типическая | ||
Серийная | r = | r = |
Для того, чтобы распространить результаты выборочного исследования на генеральную совокупность вводят понятие доверительного интервала, в котором может находиться генеральная средняя (). Доверительный интервал – это область тех значений генеральной средней, выход за пределы которой имеет весьма малую вероятность.
Доверительный интервал определяют по следующей формуле:
, (5.50)
где − нижнее предельное отклонение;
− верхнее предельное отклонение.
Пример. Была исследована бесповторная выборка объемом n = 15 из генеральной совокупности выходных документов организации объемом 100 штук. Подсчет количества знаков в каждом документе дал следующие результаты в млн. знаков: 12,2; 9,0; 10,8; 1,6; 8,9; 5,5; 3,7; 3,5; 9,1; 9,0; 12,0; 22,5; 11,7; 11,9; 6,6.
Определить среднюю предельную ошибки оценки генеральной средней и величину доверительного интервала, в котором с вероятностью 0,997 будет находиться генеральная средняя.
Решение. Находим величину выборочной средней:
Дальнейшие вычисления, необходимые для получения величины стандартного отклонения систематизируем в таблице 5.12.
Выборочное стандартное отклонение составит:
Величина средней ошибки равна:
млн. зн.,
а с учетом поправки на бесповторность выборки:
Предельная ошибка составит:
нижнее предельное отклонение:
верхнее предельное отклонение:
Таблица 5.12 – Промежуточные результаты расчета
№ п/п | х i | х i - | (хi - )2 |
12,2 9,0 10,8 1,6 8,9 5,5 3,7 3,5 9,1 9,0 12,0 22,5 11,7 11,9 6,6 | 3,0 -0,2 1,6 -7,6 -0,3 -3,7 -5,5 -5,7 -0,1 -0,2 2,8 13,3 2,5 2,7 -2,6 | 0,04 2,56 57,76 0,09 13,69 30,25 32,49 0,02 0,04 7,84 172,9 6,25 7,29 6,76 | |
346,98 |
Таким образом с вероятностью 0,997 можно утверждать, что генеральная средняя никак не меньше 5,78 млн. знаков и никак не больше 12,62 знаков.
5.4 Дисперсионный анализ в оргпроектировании
При анализе результатов исследования с целью принятия проектных решений оргпроектанту часто приходится задаваться вопросом о влиянии тех или иных факторов на анализируемый показатель. Так, например, на показатели, характеризующие экономическую эффективность системы управления могут влиять размер организации, степень механизации и автоматизации ее основных процессов, квалификация сотрудников и т.п. Так как анализируемые показатели имеют статистический характер, т.е. отличаются разбросом, для оценки степени влияния на них изучаемого фактора (или факторов) используется статистический метод, называемый дисперсионным анализом.
В зависимости от количества факторов, чье влияние на анализируемый показатель оценивается, различают однофакторный, двухфакторный и многофакторный дисперсионный анализ. Рассмотрим особенности применения однофакторного дисперсионного анализа.
Пусть на количественный, нормально распределенный признак Х воздействует фактор Ф. Пусть из генеральной совокупности этого признака взята выборка объемом n. Разобьем эту выборку согласно данному фактору Ф на t групп (подвыборок), объемом , где
.
Общая средняя арифметическая всей выборки объемом составит:
,
где − j -ый элемент i -ой группы (j = 1,2, …, );
− средняя арифметическая i -ой группы, которая вычисляется по следующей формуле:
.
Дисперсионный анализ в данном случае состоит в решении задачи: при данной вероятности ошибки (уровне значимости) проверить нулевую гипотезу (предложение) о равенстве групповых средних.
Для решения этой задачи вводятся следующие характеристики:
Общая сумма квадратов отклонений наблюдаемых значений признака от общей средней:
Она характеризует общее выборочное рассеивание.
Факторная сумма квадратов отклонений групповых средних от общей средней:
Она характеризует рассеивание между группами, т.е. рассеивание, вызванное анализируемым фактором Ф.
Остаточную сумму квадратов отклонений наблюдаемых значений группы от своей групповой средней:
Она характеризует изменчивость внутри групп, т.е. рассеивание, вызванное остальными факторами (кроме Ф).
Можно доказать, что
.
Разделив уже вычисленные факторную и остаточные суммы на соответствующее число степеней свободы (t–1 и n-t соответственно), находят факторную и остаточную дисперсии ( и ):
,
.
Если факторная дисперсия оказалась меньше по величине, чем остаточная, то уже отсюда следует справедливость нулевой гипотезы о равенстве групповых средних. В этом случае считается, что влияние исследуемого фактора Ф на изучаемый параметр невелико и его можно не принимать во внимание. В противном случае для того, чтобы оценить значимо или нет различие групповых средних прибегают к сравнению факторной и остаточной дисперсии по критерию Фишера F:
.
Полученное значение критерия F сравнивают с его критической величиной , которая определяется в зависимости от принятой вероятности ошибки α (уровне значимости), числа степеней свободы при определении факторной дисперсии: и числа степеней свободы при определении остаточной дисперсии: . Рассчитанные значения критической величины можно найти в специальных таблицах (приложение А).
В случае, если считают, что различие групповых средних незначимо и действие исследуемого фактора Ф принимать во внимание не следует. Если же , то считают, что различие групповых средних значимо и, следовательно, рассматриваемый фактор Ф существенно влияет на изменчивость средних значений и его необходимо учитывать при проектировании.
Рассмотрим конкретный пример использования дисперсионного анализа при оценке влияния на исследуемый показатель одного фактора.
Задача. Исследуются организации, выполняющие работы по обработке документов. Эти организации подобны по структуре, составу и другим показателям, но несколько отличаются по объему работ и по количеству сотрудников. Ставится задача при уровне значимости α=0,05 оценить, насколько зависит численность сотрудников от объемов работ организаций.
Решени е. Взята выборка объемом 15 организаций (n =15). Данные исследования систематизированы в таблице 6.2.
Таблица 6.2 – Результаты исследования
№ п/п | Объем работ, млн. знаков | Численность сотрудников, человек | № п/п | Объем работ, млн. знаков | Численность сотрудников, человек |
10,1 | 19,9 | ||||
10,8 | 20,0 | ||||
10,9 | 22,0 | ||||
11,8 | 24,4 | ||||
14,9 | 29,2 | ||||
15,2 | 29,4 | ||||
15,3 | 29,7 | ||||
17,9 |
Как видно из таблицы эти данные построены в ранжированный (возрастающий) ряд по объему работ.
Разобьем общую совокупность данных на три группы (t=3) с объемами работ:
- в первой группе от 10,0 до 15,0 млн. знаков;
- во второй группе от 15,1 до 20,0 млн. знаков;
- в третьей группе от 20,1 до 30,0 млн.знаков.
Т.о. объем каждой группы будет одинаковым и равен пяти ( =5, при i =1,2,3). Дальнейшие вычисления систематизируем в таблице 6.3.
Таблица 6.3 – Результаты вычислений
Показатели | Уровни фактора Ф (объемы выполненных работ) | Дополнительные вычисления и данные | ||
Номер испытания | ||||
Количество сотрудников | ||||
n=15 t=3 =5 3645 | ||||
Групповая средняя | =243 | |||
+14 | -14 | |||
+4 +7 +3 +12 | +11 +2 -23 +15 -5 | -17 +22 -41 -27 -7 | ||
Используем данные этой таблицы для дальнейших расчетов:
= 5(196 + 0 + 196) = 1960
= = 6642
= 6642 – 1960 = 4682
И далее:
= = 980
= = 390
Находим значение критерия Фишера:
= = 2,51
Используя таблицу в приложении №, находим критическое значение при α=0,05; ; :
.
Из сравнения F и имеем:
F =2,51< .
Таким образом, показано, что отличия групповых средних значений числа сотрудников в нашем случае незначимо, т.е. несущественно зависит от объема выполняемых работ.
5.5 Применение корреляционных моделей в оргпроектировании
Корреляционный метод – это один из математических методов исследования, анализа и моделирования, позволяющих установить количественную взаимосвязь между двумя или несколькими параметрами исследуемой системы, если эта взаимосвязь является не функциональной, а статистической. Так, например, на рисунке 6.6 графически показана взаимосвязь между параметрами у и х, которая имеет функциональный характер и может быть выражена математической зависимостью уравнения прямой: у = а + bх.
Рисунок 6.6 – Функциональная связь между параметрами
На рисунке 6.7 точками показаны результаты попарного измерения параметров Y и X, между которыми явно отсутствует функциональная связь. Значение обоих параметров характеризуются значительным разбросом, т.е. имеют статистический характер.
Дата добавления: 2015-11-30; просмотров: 28 | Нарушение авторских прав