Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Многомерное шкалирование



Многомерное шкалирование

Задача 1

Задача:

Провести многомерное шкалирование данных(экспертных оценок) о странах на основании чего разделить их на группы

Итак перед нами матрица сходства

Выбираем Multidimensional Scaling

Устанавливаем два измерения

Выбираем все переменные для шкалирования

 

Числовые параметры шкалирования:

 

Количество пройденных итераций: 30

Процедура сошлась на 30 итерациях и это уже хороший признак того что процедура могла пройти вполне корректно, а сами данные не содержат аномалий.

D-star raw stress

D-star alienation

D-hat raw stress

d-hat stress

8,287206

,2381639

5,169298

,1894674

 

Первый параметр D-star raw stress позволяет оценить насколько расстояния, полученные в ходе работы с выборокой учитывают различия объектов, нестандартизированность этого показатель очень нестабилен, оценивать только по нему неправильно. Это лишь первичная оценка

 

D-hat raw stress-а это показатель корректности оценки различий уже в ходе многомерного шкалирования, если он меньше чем в случае работы с выборкой перед шкалированием это говорит о том, что многомерное шкалирование выявило новую структуру в выборке, так как

снизилась та часть дисперсии что не была объяснена.

 

d-hat stress- этот показатель необъясненной дисперсии уже стандартизирован. Оценивать его критический уровень для отвержения результатов. Наиболее строгое отношение требует отвергнуть при d-hat stress>0.10. Однако учитывая что данные сложные мы имеем право поднять планку до 0.2 Исходя из этого мы можем принять результаты многомерного шкалирования.

 

Теперь приведем данные диаграммы Шепарда:

 

Диаграмма Шепарда показывает насколько различаются оценки сходств между объектами в выборке и в выбранной модели многомерного шкалирования. Если бы модель полностью соответствовала данным, то все бы точки легли на график ступенчатой функции, однако как мы видим это не так, довольно много точек хоть и близки к линии, но не лежат на ней.

 

Диаграмма рассеивания:

 

Интерпретировать диаграмму рассеивания можно следующим образом:

Китай наиболее жесткая административно-командная система и это действительно характерно для политики Мао Цзедуна, Югославия и СССР были так же административно-командными экономками, однако все же менее жесткими чем в Китае(реформа Косыгина как одна из попыток снижения сверхцентрализации, разрешение частного дела в Югославии). Куба имела весьма централизованную экономику как и Китай с минимальным воздействием со стороны рыночных механизмов.



Египет сохранял в своей экономике административно-командные тенденции времен Гамаля Абдель Насера, однако последующие руководители Египта такие как Анвар Садат начали переориентироваться на западные страны и способствовать развитию рыночных отношений в Египте, а потому и получается, что Египет нельзя отнести ни к рыночным странам, ни к социалистическому лагерю.

В Индии эта тенденция проявлялась еще сильнее, так как с одной стороны правительство Индиры Ганди проводило политику национализации тяжелой промышленности, а с другой стороны в стране оставалось множество частных фирм, зарубежные фирмы и игнорировать этот факт экономической жизни Индии было весьма неэффективно.

В Бразилии к 1974 году было довольно много частных фирм, присутствовали фирмы США, а это в свою очередь определяло, то что путь Бразилии в рамках капиталистической экономики вряд ли мог быть кем-то изменен. Под влиянием требований внешнеторговых отношений и взаимодействия с США Бразилия двигалась к форме капиталистических отношений с поэтапным сокращением регулирующей функции государства.

Франция всегда была одной из главных капиталистических держав, однако она всегда отличалась и большими симпатиями населения к левому политическому спектру сил, а французские социалисты, находясь у власти, стремились вводить различные государственные ограничения для частных фирм, проводить политику социальной поддержки со стороны государства. Поэтому Франция представляла собой модель «социального капитализма».

Израиль же и США придерживались политики свободного рынка, предпочитая ограничивать роль государства в регуляции рынка.

Япония с одной стороны придерживалась концепции весьма умеренной госрегуляции экономики, а с другой стороны японский подход к найму работников для многих из них предлагал весьма большое количество социальных льгот от самих корпораций. Это и сближает в некотором роде Францию и Японию.

 

Задача 2

С учетом проблем зрения для измерения попарных расстояний были использованы возможности сервиса Google Maps(виджет Линейка), в качестве карты для измерений была взята следующая карта:

 

Объекты – станции метро:

1) Александра невского I

2) Александра невского II

3) Площадь Восстания

4) Маяковская

5) Лиговский проспект

 

Из-за технических проблем со STATISTICA был использован язык и окружение для статистических рассчетов GNU R. Особенностью данного инструмента является применение интерфейса командной строки для управления рассчетами, введенные команды можно сохранить как скрипт. Этот скрипт далее можно многократно использовать к разным данным.

 

Исходные расстояния:

 

>geo

AlekI PloVos Majk AlekII Ligov

AlekI 0.000 1.500 1.950 0.148 1.76

 

PloVos 1.500 0.000 0.423 1.450 1.04

 

Majk 1.950 0.423 0.000 1.910 1.21

 

AlekII 0.148 1.450 1.910 0.000 1.65

Ligov 1.760 1.040 1.210 1.650 0.00

 

Теперь пересчитаем расстояния я в метрике Евклида:

 

 

 

Для полноты картины была выведена полная матрица, хотя по уиолчанию она выводится усеченой по диагонале.

 

 

Теперь можно провести саму процедуру шкалирования по итогам, которой получается такая диаграмма рассеивания:

 

 

 

 

Рассматривая эту диаграмму можно заметить, что:

1) Лиговский проспект действительно довольно отдален от всех остальных станций до группы станций Александр-I и II расстояние примерно километр

2) Весьма верно отражено что есть две группы, при этом станции Александр-I и II стоят друг другу гораздо ближе, чем Маяковская и Площадь Восстания

3) Сами же эти группы имеют довольно большое расстояние между собой.

Скрипт для проведения многомерного шкалирования по данным карты:

 

geo=read.table("spbdist.csv",header=TRUE)

#читаем данные из csv файла, учитывая что в 1 строках и столбцах-заголовки

geo.d <-dist(geo,diag = TRUE, upper = TRUE)

#вычисляем матрицу расстояний в метрике Евклида,выводя элементы выше #главной диагонали

geo.scals= cmdscale(geo.d,eig=TRUE, k=2)

#шкалируем метрически, возвращаем собственные значения,шкалируем по 2 #измерениям

png(filename="/home/jck/dms.png")

#открываем или создаем png файл

plot(geo.scals$points,xlab="Coordinate 1", ylab="Coordinate 2",type="n")

#вычерчиваем график, назначаем метку оси X,оси Y,не выводим точки

text(geo.scals$points, labels = row.names(geo), cex=.7)

#берем из столбца таблицы geo точки, которым назначаются имена, берем

#имена из столбцов

dev.off()

#отключаем устройство вывода


Дата добавления: 2015-08-27; просмотров: 56 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Миф о князе Рюрике в свете западно-славянского происхождения приильменских славян и Генеалогическое Летосчисление | 

mybiblioteka.su - 2015-2024 год. (0.014 сек.)