Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

1. Многомерный факторный анализ экологической ситуации территорий



Факторный анализ

 

1. Многомерный факторный анализ экологической ситуации территорий

 

Факторный или многомерный факторный анализ может быть использован во всех тех случаях решения практических задач, когда какое-либо явление выявляется только при анализе большого количества наблюдений. К таким предметным областям исследований относится многочисленная эмпирическая информация биосферы, экологии, геохимии, биогеохимии, эпизоотологии, петрохимии и т. д., когда необходимо установить (исследовать) причинность взаимозависимых или взаимообусловленных факторов системы (процесса), закономерности факторно-пространственного распространения болезней или их количественного проявления.

Факторный анализ как статистический метод был разработан и изложен в работах С. Спирмена (1904), Г. Томпсона (1916), Л. Тэрстоуна (1935) и других авторов.

Первоначально факторный анализ применялся только в психологии, но сейчас из-за легкой доступности ЭВМ возможности его использования расширились, и его можно применять во многих областях науки – географии, геологии, экологии, медицине, в социальных науках, однако основная трудность при этом – отсутствие необходимых знаний. Только по этой причине факторный анализ используется крайне редко.

Обработка данных этим методом важна, когда цель исследования заключается в выявлении смысла зависимостей между переменными. Например, нас интересует характер связей между долей неблагополучных фактов по какой-либо болезни и другими переменными, взятыми в анализ (заболеваемость, плотность населения, плотность населенных пунктов, осадки и т. п.). Если число изучаемых переменных велико, то обычно неясен смысл связей. Поэтому для интерпретации результатов наблюдений за многими переменными полезно провести их преобразование, используя факторный анализ.

Обычно в факторном анализе рассматривается группа объектов, характеризующихся некоторыми общими для них свойствами. В каждом конкретном случае термину «объект» могут соответствовать самые различные элементы: животные, районы, зоны и т. д. Измерения общих свойств (признаков) этих объектов называются значениями их параметров (переменных).

Факторный анализ дает возможность с достаточной точностью рассчитывать корреляционную структуру между относительно большим числом наблюдаемых параметров (переменных) посредством меньшего числа простых факторов.



Применительно к задачам эпизоотологии это означает, что поведение всей системы (эпизоотического процесса), на которую оказывают воздействие многие переменные, может быть описано с помощью небольшого числа наиболее значимых факторов.

Как уже выше говорилось, численное выражение какого-либо признака объекта называется его параметром. Например, если рассматривать несколько географических районов, как группу объектов, то эти районы можно характеризовать, в частности, такими признаками, как высота над уровнем моря, среднегодовая температура воздуха, плотность населения и т. п. Для каждого конкретного района эти признаки, измеренные в принятых единицах, вообще говоря, различны. Измерения данных признаков и будут являться параметрами группы объектов.

Индекс i используется для обозначения любого объекта (i = l, 2, 3,..., N).

Отдельный параметр обозначается через хj, где j = 1, 2, 3,..., п.

Основное уравнение факторного анализа можно записать следующим образом:

. (1)

 

Здесь т число факторов (m < n), с помощью которых можно описать n коррелирующихся между собой параметров. F1, F2,..., Fm это так называемые общие факторы, учитывающие корреляции между параметрами. еj так называемые характерные факторы; они учитывают остаточную дисперсию (в том числе связанную с различными погрешностями).

Эти п случайных величин еj независимы между собой. Математически это означает, что коэффициент корреляции между любыми двумя еj и еk (j = 1, 2, 3,..., п; k = 1, 2, 3, …, п; j ≠ k) равен нулю.

Коэффициенты при факторах аj 1, аj 2,... ajm называют нагрузками j -го параметра на факторы F 1, F 2 ,..., Fm.

В факторном анализе для получения оценок нагрузок на факторы используются различные методы. Но независимо от используемого метода первым этапом факторного анализа обычно является вычисление коэффициентов корреляции между всеми изучаемыми параметрами. Факторный анализ объясняет матрицу корреляций между параметрами наличием небольшого числа гипотетических переменных или факторов.

Главная цель факторного анализа – сжатие информации, экономное описание экспериментальных данных. Это, однако, не означает, что методами факторного анализа всегда ищут фундаментальные категории (факторы) в данной области исследования, например при анализе эпизоотического процесса. Иногда необходимо по возможности наиболее полно проанализировать набор переменных, характеризующих эпизоотический процесс.

Но и в этом случае факторы не могут полностью описать ситуацию хотя бы потому, что некоторые переменные, оказывающие влияние на процесс, не взяты в анализ. Теоретически задача исчерпывающе полного описания неразрешима; однако в практических исследованиях с ограниченным кругом решаемых вопросов и небольшим числом рассматриваемых переменных она вполне разрешима. Надо только помнить, что факторный анализ всегда дает интерпретацию лишь данного экспериментального материала и, следовательно, сжатое описание лишь данного набора переменных.

Большинство методов, используемых в факторном анализе для оценок факторных нагрузок, достаточно сложно из-за большого объема требуемых вычислений. С внедрением в научные исследования ЭВМ это затруднение устраняется.

Для обучения исследования факторных взаимосвязей в системе из небольшого числа параметров воспользуемся простым аппроксимационным (приближенным) методом, который можно осуществить на инженерных калькуляторах. Одним из них является центроидный метод (или метод простого суммирования). Этот метод заслуживает внимания, так как оценки факторных нагрузок, которые он дает, достаточны для многих практических целей. Рассмотрим центроидный метод факторного анализа на примере, который носит иллюстративный характер.

Для исследования взято 14 административных районов из двух областей и одной автономной республики России (Таршис, Константинов,1975, с. 103–119), которые достаточно хорошо представляют природные условия Европейской России. Таким образом, число объектов N равно 14 (вообще конкретные исследования требуют большей выборки для повышения достоверности), однако для ручного счета на калькуляторах такого количества данных достаточно. Параметры, по которым проводился факторный анализ, были отобраны следующие:

1) число вспышек болезни (эмфизематозного карбункула) за 20 лет;

2) площадь территории, на которой преобладают почвы определенного типа, приходящаяся на 100 животных (крупный рогатый скот);

3) среднегодовая температура воздуха;

4) годовое количество осадков.

В пределах этих районов встречается более 15 типов почв. Для уменьшения числа параметров и упрощения примера эти почвы были расклассифицированы на три генетические группы по степени близости между собой:

черноземы всякие;

лесные, темно-серые лесные почвы и т. п.;

дерновые, подзолы, луговые почвы и т. п.

Таким образом, число параметров п = 6 (число вспышек болезни, 3 типа почв, температура, осадки).

В табл. 21.9 приведены значения параметров каждого из 14 объектов.

А. Первым этапом факторного анализа является вычисление парных коэффициентов корреляции между всеми изучаемыми параметрами. Предварительно для всех параметров проверяется гипотеза о соответствии их распределения нормальному закону. Если гипотеза оказывается верной для всех параметров, то оценка для парного коэффициента корреляции определяется по формуле

.

 

Таблица 21.9. Исходная выборка переменных величин параметров

 

 

Районы

П а р а м е т р ы

           

число вспышек болезни

черноземы, км2/100 голов

лесные и т. п., км2/100 голов

дерновые, луговые и т. п., км2/100 голов

температура воздуха,

в оС

осадки, мм

Переменные величины параметров

       

6,98

3,1

 
   

3,78

   

5,0

 
       

8,08

2,5

 
   

3,73

   

5,1

 
   

1,78

0,99

0,2

5,6

 
   

0,78

1,18

0,78

5,7

 
   

9,48

2,37

 

1,2

 
   

34,03

 

10,47

0,7

 
   

3,02

1,52

3,02

2,5

 
   

8,82

2,2

 

0,8

 
   

3,82

1,42

 

2,6

 
   

3,17

2,38

 

2,5

 
     

5,56

2,12

1,8

 
       

7,39

3,1

 

Сумма

 

72,41

17,72

39,04

42,2

 

Среднее

29,86

5,17

1,27

2,79

3,02

 

 

 

Вместо обычного коэффициента корреляции можно воспользоваться и ранговыми коэффициентами корреляции.

Если гипотеза о соответствии параметров нормальному закону распределения не подтверждается, то парные коэффициенты корреляции вычисляются по методам, специально предназначенным для непараметрических данных. Одним из таких методов является метод «дробового выстрела» или метод Бломквиста (Коган и др., 1983), вычисляемый по формуле

 

,

где n 1, n 2, n 3 и n 4 – число точек в первом, втором, третьем и четвертом квадрантах.

Вычисляются все коэффициенты корреляции между параметрами и заносятся в таблицу, в которой п строк и п столбцов. На пересечении j -й строки и k- го столбца помещается коэффициент корреляции между j -м и k- м параметрами rjk. Так, в табл. 21.10 на пересечении пятой строки и шестого столбца находится коэффициент корреляции r 56 (между температурой воздуха и осадками). Всего в таблицу заносим п×п коэффициентов корреляции. Так как коэффициент корреляции симметричен относительно индексов (т. е. rjk = rkj,), а корреляция параметра с собой равна единице, то вычислять надо коэффициентов корреляции, расположенных выше (или ниже) диагонали, проведенной из левого верхнего угла таблицы в правый нижний. В нашем примере п = 6, т. е. надо вычислить 15 коэффициентов, корреляции. В случае десяти параметров таких коэффициентов надо вычислить уже 45. Отсюда становится понятной трудность проведения факторного анализа при большом числе переменных без ЭВМ.

Диагональные элементы таблицы, т. е. элементы, стоящие на пересечении строки и столбца с одинаковым номером имеют коэффициент корреляции, равным единице (так как r 11 = r 22 = r 33 = rnn = 1).

Заполнив таблицу, получаем матрицу корреляций (6 × 6) между параметрами.

Матрица симметрична относительно главной диагонали, т. е. при замене строк столбцами с тем же номером матрица остается такой же.

Для того чтобы начать собственно факторный анализ, надо заменить диагональные элементы матрицы (табл. 21.10), т. е. коэффициенты корреляции, равные 1,0, надо заменить на факторные дисперсии.

 

Таблица 21.10. Матрица корреляций шести типов переменных

 

 

 

Параметры

           

Вспышки заболевания

Черноземы

Лесные и т. п.

Дерновые и т. п.

Температура

Осадки

1. Вспышки заболевания

1,00

0,14

–0,14

–0,14

–0,43

–0,14

2. Чернозем

0,14

1,00

0,14

–0,43

–0,14

–0,43

3. Лесные почвы

–0,14

0,14

1,00

–0,142

–0,43

–0,74

4. Дерновые почвы

–0,14

–0,43

–0,14

1,00

–0,14

0,14

5. Температура воздуха

–0,43

–0,14

–0,43

–0,14

1,00

0,71

6. Осадки

–0,14

–0,43

–0,71

0,14

0,71

1,00

 

 

Числа, которые вписывают по диагонали таблицы, носят название факторных дисперсий, или общностей; их величина не превышает единицы. Факторная дисперсия, или общность, представляет долю полной дисперсии параметра, которую вносят т общих факторов. Иначе говоря, она является разностью между полной дисперсией и остаточной дисперсией (остаточная дисперсия дается членом еj в формуле 1). Так как общность, а обычно и число факторов т вначале неизвестны, то они берутся из опыта. Это приводит к приблизительному решению задачи в виде первых оценок нагрузок на факторы. Из этих нагрузок получают новые оценки общностей.

Окончательное решение достигается путем последовательных итераций (итерация – неоднократно применяемая какая-либо математическая операция) до момента, когда последующий результат итерации будет мало отличаться от предыдущего. Сходимость процесса обычно достаточно быстрая.

В качестве первых приближений общностей возьмем наибольшие по абсолютной величине (так как общности всегда положительны) коэффициенты корреляции в каждом столбце и подставим в пустые диагональные графы таблицы. Прежде чем начать анализ, минимизируем число отрицательных коэффициентов корреляции. Для этого берем параметр, у коэффициентов корреляции которого наибольшее число минусов. В нашем случае коэффициенты корреляции третьего и пятого параметров имеют по четыре минуса. Однако величины самих коэффициентов у пятого параметра значительно больше, поэтому меняем знак у пятого параметра.

Сначала заменим знаки на противоположные в пятой строке, затем в пятом столбце (диагональный элемент остается положительным).

После этого наибольшее число минусов остается у шестого параметра. Проделываем ту же операцию по замене знака у него, как у пятого параметра. В результате матрица корреляций принимает вид, изображенный в табл. 21.11.

Параметры, у которых произошла замена знака, называются отраженными.

Б. Следующим этапом является суммирование столбцов матрицы (табл. 21.11) и нахождение полной суммы коэффициентов корреляции Т.

В нашем примере Т = 11,1. Извлечем квадратный корень из этой суммы: .

Разделим на это число суммы в соответствующих столбцах; получим первые оценки нагрузок на первый фактор (табл. 21.12).

Контролировать вычисление можно с помощью суммы нагрузок, которая должна быть равной делителю (с точностью до ошибки округления): 0,34 + 0,51 + 0,60 + 0,34 + 0,68 + 0,85 = 3,32 = .

В. Исключим теперь влияние первого фактора из первоначальной матрицы (табл. 21.11).

 

Таблица 21.11. Матрица корреляций шести типов переменных с первыми приближениями общностей по диагонали

 

Параметры

     

4(–)

5(–)

6(–)

 

 

Итоговая сумма столбцов (Т)

1. Вспышки заболевания

(0,43)

0,14

–0,14

0,14

0,43

0,14

2. Чернозем

0,14

0,43)

0,14

0,43

0,14

0,43

3. Лесные почвы

–0,14

0,14

(0,71)

0,14

0,43

0,71

4. Дерновые (–)

0,14

0,43

0,14

(0,43)

–0,14

0,14

5. Температура (–)

0,43

0,14

0,43

–0,14

(0,71)

0,71

6. Осадки (–)

0,14

0,43

0,71

0,14

0,71

(0,71)

Сумма по столбцам

1,14

1,71

1,99

1,14

2,28

2,84

11,1

Нагрузки на первый фактор

 

0,34

 

0,51

 

0,60

 

0,34

 

0,68

 

0,85

Сумма

3,32

 

 

Для этого образуем новую матрицу из полученной строки нагрузок следующим образом: разместим полученные нагрузки вдоль строк и столбцов (табл. 21.12).

 

Таблица 21.12. Новая матрица промежуточных величин из полученной строки нагрузок для дальнейшего вычисления остаточной матрицы корреляций

 

 

Нагрузки

           

0,34

0,51

0,60

0,34

0,68

0,85

1. 0,34

 

 

 

 

 

 

2. 0,51

0,17

 

 

 

 

 

3. 0,60

0,20

0,31

 

 

 

 

4. 0,34

0,11

0,17

0,20

 

 

 

5. 0,68

0,23

0,34

0,41

0,23

 

 

6. 0,85

0,29

0,43

0,51

0,29

0,58

 

 

Каждая пустая клетка таблицы (кроме диагональных) заменяется произведением нагрузок той строки и столбца, на пересечении которых она находится. Заполняется лишь половина таблицы (левее или правее диагонали), так как матрица симметрична.

Затем из каждого коэффициента первоначальной матрицы (табл. 21.11) вычитаем соответствующий коэффициент полученной матрицы (табл. 21.12). Результат заносим в новую таблицу (табл. 21.13). Например, на пересечении второй строки и первого столбца первоначальной матрицы стоит величина 0,14. В полученной матрице (табл. 21.12) на этом месте стоит 0,17 (0,51 × 0,34 = 0,17).

 

Таблица 21.13. Первая остаточная матрица корреляций

 

Параметры

           

1. Вспышки...

()

–0,03

–0,34

0,03

0,20

–0,15

2. Черно…

–0,03

()

–0,17

0,26

–0,20

 

3. Лесные

–0,34

–0,17

()

–0,06

0,02

0,20

4. Дернов..

0,03

0,26

–0,06

()

–0,37

–0,15

5. Темпе…

0,20

–0,20

0,02

–0,37

()

0,13

6. Осадки

–0,15

 

0,20

–0,15

0,13

()

 

Разность 0,14–0,17 = –0,03 заносим в табл. 21.13. Заполнив всю таблицу, получаем первую матрицу остаточных корреляций. Прежде чем продолжить анализ, надо минимизировать число отрицательных знаков таким же образом, как и перед началом анализа (пункт А). Поместим на место диагональных элементов наибольшие коэффициенты из каждого столбца (табл. 21.14). Далее, повторив вычисления пункта В, получим первые оценки нагрузок на второй фактор (табл. 21.14).

Из-за громоздкости вычислений нагрузку на третий фактор вычислять не будем.

Г. Параметры, у которых изменяли знаки на каждой стадии процесса, должны в самом конце восстановить их. В нашем примере это означает, что нагрузки на первый фактор параметров 5 и 6, приведенные в последней строке табл. 21.11, и нагрузки на второй фактор параметров 1, 2 и 4, приведенные в последней строке табл. 21.14, надо взять со знаком минус.

В табл. 21.15 даны нагрузки на оба фактора после восстановления знаков и новые оценки общности, полученные в виде суммы квадратов нагрузок для каждого параметра. Так, для параметра 1 имеем: 0,342 + (–0,27)2 = 0,19.

 

Таблица 21.14. Первая остаточная матрица корреляций с измененными знаками (по диагонали в скобках первые оценки общностей по второму фактору)

 

Параметры

1(–)

2(–)

 

4(–)

   

 

 

Итоговая сумма по столбцам (Т)

1. Вспышки (–)

(0,34)

–0,03

0,34

0,03

–0,20

0,15

2. Черноземы (–)

–0,03

(0,26)

0,17

0,26

0,20

 

3. Лесные почвы

0,34

0,17

(0,34)

0,06

0,02

0,20

4. Дерновые (–)

0,03

0,26

0,06

(0,37)

0,37

0,15

5. Температура

–0,20

0,20

0,02

0,37

(0,37)

0,13

6. Осадки

0,15

 

0,20

0,15

0,13

(0,20)

Сумма по столбцам

0,63

0,86

1,13

1,24

0,89

0,83

5,58

Нагрузки на первый фактор

 

0,27

 

0,36

 

0,48

 

0,52

 

0,38

 

0,35

Сумма

2,36

 

 

Таблица 21.15. Первые оценки факторных нагрузок на переменные

 

Факторные значения

Параметры

           

I фактор

0,34

0,51

0,60

–0,34

–0,68

–0,85

II фактор

–0,27

–0,36

0,48

–0,52

0,38

0,35

Факторные дисперсии (общности)

0,19

0,39

0,59

0,39

0,62

0,84

 

Для получения более точных оценок нагрузок надо вписать в диагональные клетки первоначальной матрицы (табл. 21.11) полученные оценки общностей и повторить процесс с пункта В.

Оценки факторных нагрузок после второй и третьей итераций представлены в таблицах 21.16 и 21.17.

Обычно 3–4 итераций бывает достаточно.

 

Таблица 21.16. Вторые оценки факторных нагрузок на переменные

 

Факторные значения

Параметры

           

I фактор

0,28

0,51

0,57

–0,34

–0,67

–0,91

II фактор

–0,22

–0,40

0,40

–0,47

0,36

0,35

Факторные дисперсии (общности)

0,13

0,42

0,54

0,34

0,58

0,95

 

Если вычислять сумму квадратов нагрузок по каждому фактору, то получим итоговый вклад каждого фактора в суммарную дисперсию шести параметров. Нормированная дисперсия параметра равна единице. Всего в нашем примере шесть параметров. Следовательно, суммарная дисперсия равна шести. Вклад первого фактора равен 0,262 + 0,522 + 0,562 + (–0,32)2 + (–0,66)2 + (–0,94)2 = 2,07, т. е. 34,5 %. Вклад второго фактора равен 0,93, т. е. 15,5 % (табл. 21.17).

 

 

Таблица 21.17. Третьи оценки факторных нагрузок на переменные

 

 

Факторы

Параметры

Дисперсии, %

           

I фактор

0,26

0,52

0,56

–0,32

–0,66

–0,94

34,5

II фактор

–0,20

–0,41

0,44

–0,54

0,35

0,34

15,5

 

Д. Вращение факторов. Построим график, где оси – факторы, а координаты точек – факторные нагрузки. Это сделано на рисунке 21.2, где видно, что пять параметров имеют тесную связь (точки 1, 2, 4, 5, 6), так как лежат в пределах острого угла а. Корреляции между параметрами в факторном пространстве (прямоугольные координаты) зависят от длин векторов и угла между ними и не зависят от ориентации координатных осей. Например; коэффициент корреляции в факторном пространстве между пятым и шестым параметром равен (рис. 21.2) произведению длин векторов, проведенных из начала координат в точки, соответствующие пятому и шестому параметрам, умноженному на косинус угла между ними,

 

r 56 = OP · OR ·cos γ.

 

Если повернуть оси координат по часовой стрелке на угол θ, то можно увидеть, что это вращение на взаимное расположение векторов не повлияло, и, следовательно, коэффициенты корреляции остаются теми же.

Оси координат можно поворачивать, получая различные нагрузки на факторы (постоянной остается доля дисперсии, приходящаяся на все факторы).

Обычно для удобства интерпретации факторного решения угол вращения подбирается так, чтобы параметры, которые измеряют некоторые хорошо опознаваемые свойства изучаемой системы, имели бы столь высокие нагрузки на один фактор, насколько это возможно (этому фактору и присваивается соответствующее этим параметрам название). В данном примере можем поступить согласно этой рекомендации, если повернуть оси по часовой стрелке, так чтобы ось первого фактора прошла через точку 2 (рис. 21.2, 21.3).

Чтобы получить нагрузки на факторы в новой системе координат, надо сначала найти угол поворота θ. Его легко найти вычислением, так как отношение нагрузок на факторы второго параметра, через который проведена новая горизонтальная ось, равно tg(6) θ:

 

,

т. е. θ = 19º9´; sin θ = 0,34; cos θ = 0,94.

Если записать столбцом матрицу табл. 21.17, то получим матрицу (6×2) (табл. 21.18). Для получения факторных нагрузок в новой системе координат ее надо умножить на матрицу поворота на угол θ (по часовой стрелке):

 

.

 

Таблица 21.18. Те же данные, что и в табл. 21.17, но развернутые в столбик

 

Номер параметра

F 1

F 2

 

0,26

–0,20

 

0,52

–0,41

 

0,56

0,44

 

–0,32

–0,54

 

–0,66

0,35

 

–0,94

0,34

 

Технику вычислений можно описать следующим образом. Новая матрица такого же размера (т. е. 6×2), как и первоначальная (табл. 21.18); элемент, находящийся на пересечении j -й строки и k- го столбца (j = 1, 2,..., 6; k = 1, 2), получается как сумма произведений каждого элемента j -й строки матрицы табл. 21.18 на соответствующий элемент k- го столбца матрицы поворота (табл. 21.19). Причем первый член строки умножается на первый член столбца, второй член строки на второй член столбца.

 

Таблица 21.19. Вспомогательные значения углов и их отношения для транспонирования данных табл. 21.18 в данные табл. 21.20

 

= .

 

Для первой точки

 

F 1 = 0,26·0,94 + (–0,20)·(–0,34) = 0,31.

 

Нагрузка первого параметра на второй фактор находится в первой строке (j = 1) и втором столбце (k = 2). Соответствующая первая строка матрицы до вращения (табл. 21.18) равна 0,26; –0,20; k -й (2-й) столбец матрицы поворота осей (табл. 21.19) равен 0,34; 0,94. Искомое значение нагрузки равно:

 

F 2 = 0,26·0,34 + (–0,20)·0,94 = –0,10.

 

Помещаем его в первую строку и второй столбец табл. 21.20. Подобным образом заполняем остальные клетки таблицы. В результате получаем матрицу нагрузок на факторы после вращения. Запишем се в привычном горизонтальном виде (табл. 21.21). Видно, что доля дисперсии, приходящаяся на первый главный фактор, повысилась с 34,5 % (табл. 21.17) до 36,7 % (табл. 21.21).

 

Таблица 21.20. Нагрузки на факторы после вращения координатных осей (после совмещения оси абсцисс с 6-м фактором) (рис. 21.3)

 

Номер параметра

F 1

F 2

 

0,31

–0,10

 

0,63

–0,21

 

0,38

0,60

 

–0,11

–0,62

 

–0,74

0,10

 

–1,00

0,00

 

Е. Интерпретация факторов. Следующим шагом факторного анализа является интерпретация факторов.

В данном примере найдена нагрузка на два фактора для шести параметров (табл. 21.21):

1) число вспышек болезни,

2) черноземы ,

3) лесные почвы,

4) дерновые почвы,

5) среднегодовая температура (в оС),

6) осадки (в мм).

 

 

Таблица 21.21. Нагрузка на факторы и дисперсия после вращения (рис. 21.3)

 

Факторы

Параметры

Дисперсия, в %

           

I фактор

0,31

0,63

0,38

–0,11

–0,74

–1,00

36,7

II фактор

–0,10

–0,21

0,60

–0,62

0,10

0,00

13,5

 

 

Рис. 21.2. Графическое изображение факторных параметров до вращения.

 

Для второй точки

 

F 1 = 0,52·0,94 + (–0,41)·(–0,34) = 0,63;

F 2 = 0,52·0,34 + (–0,41)·0,94 = –0,21.

 

Если осуществить поворот против часовой стрелки, то матрица поворота имеет другой вид:

 

.

 

В случае трех факторов графики строятся попарно (I–II; I–III; II–III) и процедура вращения проводится последовательно на всех трех графиках.

Рис. 21.3. Вид факторного решения после вращения факторов.

 

То, что часть нагрузок на факторы отрицательна, означает, что параметры по-разному влияют па факторы.

Первый фактор F 1 является основным, определяющим поведение всей системы в целом, так как на его долю падает 36,7 % общей дисперсии (табл. 21.21) из 50,2 %.

Первый фактор можно назвать фактором почвенно-климатического градиента числа вспышек болезни. Он интерпретируется следующим образом. В пределах рассматриваемой территории наиболее вероятно максимальное проявление болезни в районах с большим количеством черноземных почв, относительно низкой температурой воздуха (в пределах рассматриваемых) и относительно низким количеством осадков.

В том, что верно интерпретирован этот фактор, можно убедиться, обратившись к табл. 21.9. В районах 7, 8, 9, 10, 11 для первого параметра (число вспышек болезни) сумма равна (50 % от общей суммы) (табл. 21.22).

 

Таблица 21.22. Сравнение средней арифметической величины исходной выборки и средних значений величин для 7, 8, 9, 10 и 11 районов

 

Параметры

 

29,86

41,60

 

5,17

11,85

 

1,27

1,50

 

2,79

2,70

 

3,01

1,56

 

486,00

388,00

 

Среднее значение .

Для второго параметра (площадь черноземных почв) для тех же районов (табл. 21.9) сумма равна

(км2/100 голов) (82 % от общей суммы).

Среднее значение .

Для четвертого параметра (дерновые и т. п. почвы) в 7, 8, 9, 10, 11 районах сумма равна

; (34,5 % от общей суммы);

.

Для пятого параметра (среднегодовая температура воздуха) сумма равна

(18,5 % от общей суммы).

Средняя .

Для шестого параметра (осадки) сумма равна

(28,5 % от общей суммы).

Средняя .

Теперь сравним средние значения по всей выборке из 14 районов (нижняя строка табл. 21.9) для 1, 2, 4, 5, 6-го параметров со средними значениями для этих же параметров, вычисленных по выше взятой выборке.

Из этих данных видно, что на пять районов (35,5 %), соответствующих по тенденциям главному фактору, приходится 50 % вспышек, 82 % черноземов, 34,5 % дерновых почв, всего лишь 18,5 % суммарной температуры и 28,5 % осадков.

Второй фактор вносит в общую дисперсию параметров лишь 13,5 % (табл. 21.21), и поэтому его значение в нашей системе параметров невелико, т. е. он малоинформативен. О нем можно сказать, что на лесных и темно-серых лесных почвах, а также дерновых, подзолах и луговых почвах число вспышек болезни минимально. Влияние пятого и шестого параметров на второй фактор можно не учитывать.

То, что третий параметр (лесные почвы) не оказывает существенного влияния на нашу систему, можно объяснить тем, что в пределах Центральной России лесные почвы распространены почти повсеместно и встречаются они как в местах неблагополучных по эмкару (эмфизематозному карбункулу), так и в местах, где эмкар почти не регистрируется.

В общем, на основе факторного анализа шести параметров для нашего примера можно статистически описать возможные значения первого параметра (число вспышек болезни) на сходных территориях Центральной России, зная остальные пять параметров.

Отсюда видно две основные стороны применения факторного анализа в экологии (эпизоотологии).

Во-первых, описание большого числа взаимодействующих параметров (эпизоотология имеет дело всегда с большой группой переменных, влияющих на болезнь, причем зачастую эти переменные не поддаются контролю: т. е. одновременно действует много параметров) через сравнительно небольшое число общих факторов.

Посредством этих факторов достигается достаточно глубокое изучение статистических тенденций, действующих в исследуемой системе.

Во-вторых, есть возможность, проведя анализ по предварительной выборке из совокупности объектов (например, районов некоторой территории), дать характеристику остальным объектам совокупности по некоторому изучаемому параметру (например, уровень заболеваемости).

При проведении факторного анализа большого числа переменных объем вычислений значительно возрастает, для чего обязательно нужна ЭВМ. На ЭВМ факторный анализ можно проводить более строгими, чем центроидный, математическими методами, например, R -методом факторного анализа.

В геологии широко распространенным способом «свертки» матрицы индивидуальных анализов изверженных образований к вектору с меньшей размерностью, является вычисление средних арифметических составов. Они вычисляются по «интрузивным» фазам, разновидностям пород, выделяемым по качественным и количественным минеральным признакам, петрографическим структурам, либо формальным петрохимическим шкалам по какому-либо петрохимическому показателю. Один из способов свертки петрохимических анализов к пространству с меньшей размерностью – кластеризация анализов на диаграммах МГК. Наилучшая кластеризация анализов в петрохимические группы обеспечивается при использовании полных анализов в массометрическом выражении с участием «ппп». При любой редукции полного анализа – к сухому остатку, нормированию элементов к кислороду, к объединению оксидов железа – кластеризационная способность диаграмм понижается.

Кластеризация анализов на диаграммах МГК часто реализуется с первого построения. Это происходит с выборками, дискретность пород которых связана с каким-либо генетическим процессом. В этом случае кластеризация реализуется и другими способами. Если выборки искусственные, то они «рыхлые». Естественно, что составные выборки, дискретность пород которых связана с несколькими генетическими процессами, имеют несколько вариантов дискретизации. Для их отыскания выборку анализов надо рассматривать в главных сечениях нескольких диаграмм. Перед каждым новым построением из выборки удаляются анализы с сильно отклоняющимися точками или группами точек, как уже классифицированные, что способствует разворачиванию эллипсов дисперсий. Типы петрохимических систем по числу составов могут быть подразделены на простые (один странный аттрактор) и сложные (гармоника-аттрактор, представленные несколькими странными аттракторами). Простой, однофазной петрохимической системой, или одиночным странным аттрактором, можно назвать такую петрохимическую систему, пространство состояний которой отличается концентрационной однородностью на диаграмме МГК. Примером могут служить около 30 массивов южного и северного ареалов шадонского комплекса (Лутков и др., 1985) в Гиссаро-Алае. В противном случае система будет сложной, многофазной гармоникой-аттрактором. Простые системы имеют (Дуденко, 1981): 1) примерно одинаковый набор оксидов во всех частях системы, включая флуктуации и изопарагенные замещения элементов в породах, 2) непрерывность функций концентрации оксидов в зависимости от пространственных координат, 3) выпуклое, компактное и односвязное множество состояний. Сложные петрохимические системы на диаграммах МГК реализуются в виде дискретных ареалов точек. Сложную петрохимическую систему условно всегда можно разделить на простые подсистемы (системы).

 

 

Рис. 21.4. Компонентная диаграмма в оксидах 45 анализов пород пироксенитов, габбро и диоритов Каратегина.

Массивы пироксенитов, базитов и диоритов Каратегина маркированы следующим образом: А – Асиобдаринский, Д – Домбрачинский, Ж – Джафрский, К – Камароуский, Р – Каракрумский, П – Пизанский, Ш – Шаурский, У – Шульмакский, Я – Янголыкский.

Точки средних (точка с кружком) и эталонных (точка) составов, а также 1 анализ кварцевого диорита около эталонного состава 24 нанесены на диаграмму по нагрузкам на оси. Номера точек средних и индивидуальных составов из (Богатиков и др., 1987). Клинопироксенит и оливиновый клинопироксенит: 1 – средний состав, 2 – эталонный состав, Северный Урал, Кытлымский массив, 3 – то же, Воронежский кристаллический массив, интрузив Липов куст. Пироксенит роговообманковый и оливин-роговообманковый: 4 – средний состав, 5 – эталонный состав, Воронежский кристаллический массив, интрузив Липов куст, 6 – то же, Полярный Урал, Сыньинский массив. Пироксеновый горнблендит и оливин-пироксеновый горнблендит: 7 – средний состав, 8 – эталонный состав, Кольский полуостров, о. Еловый Кандалакшского архипелага, ксенолит из трубки, 9 – то же, Новая Каледония, Накети. Горнблендит и оливиновый горнблендит: 10 – средний состав, 11 – эталонный состав, Полярный Урал, р. Няысь, 12 – то же, Швеция. Габбро: 13 – средний состав, 14 – эталонный состав, Украина, Коростеньский массив, 15 – то же, Северная Карелия, Елетьозерский массив. Оливиновое габбро: 16 – средний состав, 17 – эталонный состав, Кузнецкий Алатау, гора Патын, 18 – то же, Полярный Урал, р. Малая Лагорта. Диорит: 19 – средний состав, 20 – эталонный состав, Грузия, карьер у с. Цинна, 21 – то же, Алтай, Катунские Альпы. Кварцевый диорит: 22 – средний состав, 23 – эталонный состав, Южное приморье, бухта Мутухе, 24 – то же, Алтай, Катунские Альпы, оз. Когурминское.

 

Петрохимические системы с наложенными (вторичными) процессами, в экологии это называется загрязнением, выглядят «деформированными». Это выражается в «необычном» наименовании факторных нагрузок на концах осей диаграмм МГК. Кроме того, метасоматически измененные породы на диаграммах МГК отстоят от линий трендов нормального ряда пород. Например, на диаграмме анализов пород наукрумского (D2) и кабуткрымского (D2–3) «интрузивных» комплексов Каратегина в Южном Тянь-Шане (Климов, Дусматов, 1984) метасоматически измененные породы значительно удалены от линии нормального тренда изверженных пород (рис. 21.4). Это по 2–3 анализа пород Пизанского, Шаурского и Шульмакского массивов в левой верхней четверти диаграммы, а также по одной фигуративной точке Камароуского, Каракрумского и Янголыкского массивов.

 


Дата добавления: 2015-08-29; просмотров: 117 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Управленческое решение — это выбор, который должен сделать руководитель, чтобы выполнить обязанности, обусловленные занимаемой им должностью (выбор альтернативы, осуществлённый руководителем в | Факторный анализ товарной продукции

mybiblioteka.su - 2015-2024 год. (0.171 сек.)