Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Визуализация и сопоставление условных вероятностей типа и



 

 

Визуализация и сопоставление условных вероятностей типа и

Работаем в системе статистического анализа R с использованием удобной интегрированной проектной среды RStudio.

 

 


В закладке Packages отмечаем пакет ‘VCD’ (Visualizing Categorical Data). В результате загружается этот пакет и некоторые другие, без которых он не работает:

 

 

Подготавливаем к работе скрипт для построения сразу двух диаграмм. Один – для графического сопоставления чувствительности, специфичности и их дополнений, другой – для графического сопоставления прогностичностей и их дополнений:

 

Скрипт:

 

library(vcd)
tab <- matrix(c(a, b, c, d), 2, 2, byrow = TRUE)
dimnames(tab) <- list(T=1:0, D=1:0)
tab
fourfold(tab, margin = 2)
fourfold(tab, margin = 1)

 

Подставляем вместо величин a, b, c, d их наблюдаемые численности:

 

library(vcd)
tab <- matrix(c(629, 3885, 97, 117744), 2, 2, byrow = TRUE)
dimnames(tab) <- list(T=1:0, D=1:0)
tab
fourfold(tab, margin = 2)
fourfold(tab, margin = 1)

 

 

Копируем скрипт с данными в рабочую зону (Console) RStudio:

 

 


Запускаем скрипт нажатием клавиши Enter и в окне Plots получаем квадрантно-секторную диаграмму:

 

 

Это – второй график. Первый график появляется при нажатии голубой стрелки: Å

 


Нажав закладку Zoom (увеличение), можно получить увеличенные изображения графиков в новом окне:

 

 


и

 

 

Каждый из графиков можно сохранить в нужной папке. Лучшего качеств аполучаются графики, сохраненные в формате JPEG. Для этого надо вызвать команду Save Plot as Image (сохрагить график как изображение) в закладке Export:

 


Во всплывшем окне выбираем нужную директорию, вводим желаемое название для сохраняемого файла с изображением и нажимаем кнопку Save (сjхранить):

 

 

 

Для оформление отчета в нужную страницу отчета вставляем таблицу из одной строки и двух столбцов:

 

 

 


В первую клетку копируем первый рисунок, во вторую второй. Подгоняем размер картинок под размер клеток такой таблицы. Получаем сдвоенный график:

 

 

На левом графике – от первого квадранта по часовой клетке:

Se = 0,87; (1 – Sp) = 0,03; (1 ‑ Se) = 0,13 и Sp = 0,97.

На правом графике: PPV = 0,14; (1 – PPV) = 0,86; NPV = 0,9992 и (1 – NPV) = 0,0008.

 

На таких диаграммах наблюдаемые численности (nij = { a, b, c, d }) в каждом квадранте графика наблюдаемые доли представлены секторами, площади которых пропорциональны оцениваемым условным вероятностям.

На первом графике они пропорциональны наблюдаемым значениям показателей точности: чувствительности - Se, специфичности - Sp и их дополнениям: (1 – Se) и (1 – Sp).



На втором графике они пропорциональны наблюдаемым значениям показателей информативности: прогностичности позитивов – PPV, прогностичности негативов – NPV и их и их дополненияи: (1 – PPV) и (1 – NPV).

 

Статистическая значимость отклонения этих показателей от их неинформативных значений наглядно отражается в том, что секторы квадранты по одной диагонали отличаются по размеру от секторов по другой диагонали. На диаграмме пары таких квадрантов окрашены в два разных цвета – синий и красный.

 

Если отклонения статистически значимы, то их окраска темная. Если отклонения статистически незначимы, то их окраска светлая.

 

Тонкие линии доверительных окружностей для наблюдаемых значений позволяют визуально проверять нулевую гипотезу о незначимости отклонений. Когда у пары прилежащих (сопряженных) квадрантов доверительные границы перекрываются, тогда наблюдаемые численности согласуются с этой нулевой гипотезой (не противоречат этой нулевой гипотезе).

 

В данном примере можно видеть, что и чувствительность и специфичность маммогафического скрининга довольно высоки и при этом специфичность несколько выше. Однако предсказательную способность позитивов вряд ли можно признать удовлетворительной, она составляет всего лишь 14% и вероятность ложноположительных предсказаний очень высока: (1 – PPV) = 86%. В то же время, предсказательная способность негативов можно признать очень высокой: NPV = 0,9992, т.е. 99,92% и вероятность ложноотрицательных предсказаний очень низка: (1 – NPV) = 0,0008.

 

Следовательно, можно придти к выводу, что маммографический скрининг позволяет с высокой вероятностью исключать наличие рака молочной железы у женщин с отрицательным результатом теста, но малопригоден для предсказаниия наличия болезни.

 

Примечание

Если пакет VCD отсутствует в перечне пакетов, то его легко скачать из хранилища (депозитария) пакетов на сайте CRAN в Интернете. Для этого надо открыть закладку Install Packages (установка пакетов) и набрать название нужного пакета, в данном случае VCD:

 

 

Ссылаться на пакет VCD в публикациях рекомендуется вот так:

David Meyer, Achim Zeileis, and Kurt Hornik (2-02). vcd: Visualizing Categorical Data. R package version 1.2-13.

См. http://cran.r-project.org/web/packages/vcd/citation.html

 

 


Дата добавления: 2015-08-29; просмотров: 29 | Нарушение авторских прав




<== предыдущая лекция | следующая лекция ==>
Бюджетирование – не просто одна из наиболее применяемых методик финансового планирования в зарубежной практике, но и инструмент активного менеджмента, так как в ходе бюджетирования реализуется не | Методичні рекомендації щодо написання

mybiblioteka.su - 2015-2024 год. (0.011 сек.)