Читайте также:
|
|
В здравоохранении и в различных разделах медицины часто приходится проводить статистический анализ связей всевозможных признаков в совокупности. Связь может проявляться между различными признаками в следующих формах: 1) связь между факторными и результативными признаками (причинно-следственная связь); 2) зависимость параллельных изменений нескольких признаков от какой-то третьей величины.
Необходимо уметь изучать особенности этих связей, определять их размеры и характер, а также оценивать их достоверность.
Различают две формы проявления количественных связей между явлениями или процессами: функциональную и корреляционную.
Под функциональной понимают такую связь, при которой любому значению одного из признаков соответствует строго определенное значение другого (радиусу круга соответствует определенная площадь круга). Функциональная связь характерна для физико-химических процессов. В социально-гигиенических исследованиях, а также в клинической медицине и биологии зависимости между явлениями носят иной характер - характер корреляционной связи.
При корреляционной связи: значению каждой средней величины одного признака соответствуют несколько значений другого взаимосвязанного с ним признака. Всем известно, что рост и масса тела человека связаны между собой. У группы лиц с одинаковым ростом наблюдаются различные колебания массы тела. Однако эти колебания массы тела варьируют в определенных размерах - вокруг своей средней величины. Измерить и оценить статистическую достоверность этой связи можно лишь при помощи специального коэффициента корреляции (rxу) и его средней ошибки (mr).
Коэффициент корреляции одним числом измеряет силу связи между изучаемыми явлениями и дает представление об ее направлении – таблица 15. Чем больше среднему значению одного признака соответствует значений другого признака, тем выше сила связи между ними.
Таблица 15.
Критерии оценки силы и направления корреляционной связи по коэффициенту корреляции.
Сила связи | Прямая (+) | Обратная (-) |
Полная | +1,0 | -1,0 |
Сильная | От + 1,0 до +0,7 | От -1,0 до -0,7. |
Средняя | От +0,7 до +0,3 | От - 0,7 до - 0,3 |
Слабая | От +0,3 до 0,0 | От - 0,3 до 0,0 |
Отсутствует | 0,0 | 0,0 |
По направлению связь может быть прямой и обратной. При прямой связи с увеличением значений одного признака, возрастает среднее значение другого признака.
Например: с повышением температуры тела увеличивается частота пульса у большинства инфекционных больных.
Коэффициент корреляции, характеризующий прямую связь, обозначается знаком плюс (+). При обратной связи: с увеличением одного признака убывает среднее значение другого признака.
Например, чем ниже температура воздуха в осенний период, тем выше заболеваемость детей острым бронхитом.
Коэффициент корреляции, характеризующий обратную связь, обозначается знаком минус (-).
Корреляционная связь может быть прямолинейной и криволинейной. Прямолинейная связь характеризуется относительно равномерным изменением средних значений одного признака при равных изменениях другого. В случаях криволинейной зависимости иное соотношение: при равномерном изменении одного признака могут наблюдаться возрастающие и убывающие средние значения другого признака. Коэффициент корреляции - определяется по следующей формуле:
где х и у — переменные варианты сопоставляемых вариационных рядов, dx и dy - отклонение каждой переменной (варианты) от своей средней арифметической.
Например: требуется определить, имеется ли зависимость между температурой тела и частотой пульса
Таблица 16.
Температура тела (х) | Частота пульса в минуту (у) | dx | dy | dx×d y | d2x | d2 y |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
36 | 60 | -2 | -20 | 40 | 4 | 400 |
36 | 70 | -2 | -10 | 20 | 4 | 100 |
38 | 80 | 0 | 0 | 0 | 0 | 0 |
40 | 90 | +2 | +10 | 20 | 4 | 100 |
40 | 100 | +2 | +20 | 40 | 4 | 400 |
åх=190 | åу = 400 | å dx =0 | å dy =0 | å dx×d y = 120 | å d2x =16 | å d2 y = 1000 |
Мх= 38 | Му= 80 |
Последовательность расчета.
1. Построить вариационные ряды из парных признаков х и у (графы 1, 2).
2. Определить их средние величины — Мх и Му.
В нашем примере: Мх =190/5=38; Му =400/5=80
3. Найти dx - отклонение каждой варианты от средней для ряда х = V - Мx и для ряда у = V - Мy (графы 3, 4).
В нашем примере: 36-38=-2 и т.д.; 60-80=-20 и т.д.
4. Полученные отклонения перемножить (dx×d y) и просуммировать – å(dx×dy) (графа 5).
В нашем примере: -2×(-20) = 40 и т.д. и сложить между собой.
5. Каждое отклонение возвести в квадрат и суммировать по ряду х (графа 6) и по ряду у (графа7).
В нашем примере: - 2×(-2) = 4 и т.д. и сложить между собой; -20×(-20) = 400 и т.д. и сложить между собой.
6. Определить произведение å d2x×å d2y и из произведения извлечь квадратный корень.
В нашем примере: 16×1000=16000 и Ö16000 =126
7. Рассчитать r xy по формуле:
В нашем примере: rxy = 120/126=+0,952
В некоторых случаях измерение направления и силы связи можно осуществлять с помощью, так называемого коэффициента ранговой корреляции (r) и его ошибки (mr).
Коэффициент ранговой корреляции для измерения взаимосвязи между парными признаками применяют при следующих условиях:
1) при небольшом числе наблюдений (не более 30 парных величин);
2) когда нет необходимости в точных расчетах уровня силы связи, а нужны лишь ориентировочные данные;
3) когда признаки имеют не только количественные, но и качественные значения;
4) когда ряды распределения имеют открытые варианты (например: <20 или >40).
При расчете коэффициента ранговой корреляции (r) не имеет значения характер связи: прямолинейная или криволинейная. Формула расчета:
где r - коэффициент ранговой корреляции, d - разность рангов, n - число сравниваемых пар.
Например: распространенность флюороза среди населения, употребляющего воду с различным содержанием фтора.
Таблица 17.
Содержание фтора в воде мг/л(х) | Процент пораженных флюорозом(у) | Ранг №x | Ранг №y | Разница рангов (d) | Квадрат разности рангов (d2) |
1 | 2 | 3 | 4 | 5 | 6 |
Низкое | 0,0 | 1 | 1 | 0,0 | 0,0 |
Оптимальное | 3,0 | 2 | 2 | 0,0 | 0,0 |
Условнодопустимое | 15,0 | 3 | 3 | 0,0 | 0,0 |
Повышенное | 98,0 | 4 | 4,5 | -0,5 | 0,25 |
Недопустимое | 98,0 | 5 | 4,5 | +0,5 | 0,25 |
n= 5 | åd2 =0,5 |
Последовательность расчета коэффициента ранговой корреляции.
1. Составить ряды из парных признаков (х) и (у) (графы 1, 2).
2. Каждую величину признака заменить ранговым (порядковым) номером. (В тех случаях, когда имеется несколько одинаковых по величине чисел, порядковый номер обозначают средним числом из суммы очередных порядковых их номеров.) (графы 3, 4).
В нашем примере: низкое-1, оптимальное-2 и т.д., 0,0-1, 0,3-2 и т.д.
3. Определить разность рангов d=№х -№у (графа 5).
В нашем примере: 1-1=0…. 4-4,5= -0,5 и т.д.
4. Возвести в квадрат разность рангов, и получить сумму квадратов разности рангов (графа 6).
В нашем примере: 0,02=0,0….. –0,52=0,25…åd2 =0,5
5. Определить r по формуле
В нашем примере:
Ошибка коэффициента корреляции и коэффициента ранговой корреляции определяется по соответствующим формулам:
;
Cтандартизация – метод расчёта условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за неоднородности состава сравниваемых групп.
Пол | Цех А | Цех Б | 1 этап | II этап | III этап | ||||||
число рабочих | из них больных | число рабочих | из них больных | % больных гепатитом | стандарт (графа 1+графа 3) | «ожидаемое число» больных в группе стандарта | |||||
А | Б | ||||||||||
А | Б | ||||||||||
М | 2,0 | 2,3 | 4,4 | 5,06 | |||||||
Ж | 5,0 | 10,0 | 11,5 | 23,0 | |||||||
Итого | 4,4 | 3,3 | 450. | 15,9 | 28,06 | ||||||
IV этап: | 3,5% | 6,2% | |||||||||
Рассчитанные при помощи метода стандартизации показатели условны, потому что они, устраняя влияние того или иного фактора на истинные показатели, указывают, какими были бы эти показатели, если бы влияние данного фактора отсутствовало. Следовательно, стандартизированные показатели могут быть использованы только с целью сравнения. Наиболее распространенным является прямой метод.
Таблица 18.
Метод стандартизации (прямой) состоит из 5 этапов.
Например:
I этап - расчет общих и специальных (по каждой группе - половой, возрастной и др.) интенсивных показателей (или средних величин) для двух сравниваемых совокупностей.
II этап - выбор и расчет стандарта.
III этап - расчет «ожидаемых величин» для каждой группы стандарта.
IV этап - определение стандартизованных показателей.
V этап - сравнение групп по общим интенсивным (или средним) и стандартизованным показателям. Выводы.
Например: заболеваемость гепатитом в цехе А и в цехе Б одного химического завода в 2002г. (таблица 18).
Последовательность расчета:
1. На I этапе стандартизации требуется определить, как часто среди рабочих мужчин и женщин цеха А и цеха Б встречаются лица, страдающие гепатитом. Для этого вычисляют специальные интенсивные показатели, т. е. процент больных гепатитом мужчин и женщин отдельно (графы 5,6).
В нашем примере: 1/50 × 100%=2% и т.д. по каждой паре цифр включительно строку Итого
2. II этап. Выбор и расчет стандарта. За стандарт следует принимать тот состав совокупностей, в котором отразились бы все особенности состава сравниваемых групп (графа 7).
В нашем примере: за такой стандарт принята суммарная численность работавших в цехах А и Б (графа 1 + графа 3). Стандартом для группы мужчин будет 220 (50 + 170), а для женщин 230 (200+30). Общее число рабочих' в двух цехах составит 450.
3. III этап. Определение «ожидаемых чисел». Смысл этого этапа заключается в том, что новое число работающих (стандарт) при неизменных показателях в сравниваемых совокупностях должно дать новое число явления (больных в каждой группе стандарта) (графы 8,9).
В нашем примере: в цехе А мужчин, больных гепатитом, 2%. Сколько было бы больных мужчин среди 220 человек при данном уровне заболеваемости? Составим пропорцию и произведем расчет: ма = 220×2%/100%= 4,4 м ж=230×5%/100%=11,5 и т.д. кроме строки Итого.
4. IV этап. Определение стандартизованных показателей. Просуммировав абсолютные «ожидаемые» числа относят к общей численности стандарта, указанной в итоговой строке. Это отношение выражают в процентах и получают стандартизованные показатели.
В нашем примере: так, в цехе А сумма «ожидаемых» чисел больных составит: 4,4 + 11,5 = 15,9. Стандартизованный показатель заболеваемости в цехе А равен: 15,9/450×100%= 3,5%. В цехе Б- 5,06 + 23= 28,06%
5. V этап. Сравнение уровней интенсивных и стандартизованных показателей изучаемого явления в сравниваемых совокупностях. Обращается внимание на пропорцию интенсивных и отдельно стандартизованных показателей, если пропорция изменилась, то значит, устранённые различия влияли на интенсивные показатели.
В нашем примере: при сравнении общих интенсивных показателей результаты получились противоположными (А>Б) в связи с тем, что на общие интенсивные показатели оказал влияние разный состав рабочих по полу в этих цехах. Произошло это от того, что у женщин значительно выше заболеваемость гепатитом, чем у мужчин, а в цехе А преобладали женщины, тогда как в цехе Б — мужчины.
Дата добавления: 2015-08-03; просмотров: 80 | Нарушение авторских прав
<== предыдущая страница | | | следующая страница ==> |
А × р). | | | ПРАКТИЧЕСКАЯ РАБОТА |