Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Встречайте биоинформатику

Неживые формы | Простейшие формы жизни | Клеточная форма жизни | Многоклеточные формы жизни | Социальные образования | Свойства информации и законы ее преобразования | Прием информационных кодов | Интерпретация информации | Структура компонент данных ИМВС | Структура компонент шаблонов действий ИМВС |


Основные темы, связанные с разработкой и использованием биоинформационных систем: природа биологических данных; хранение, анализ и выборка данных; компьютерное моделирование и имитация; ориентированная на биологию интеграция информации; добыча данных; обработка изображений и визуализация; создание замкнутого цикла исследований. Данные, получаемые в ходе биологических экспериментов, всегда неполны; поэтому приходится комбинировать индуктивные рассуждения, базирующиеся на существующей биологической информации, с новыми экспериментальными результатами.

Биологические базы данных отличает большой объем и специфические типы данных (геномы, протеины, данные о генах и т.д.). Выборка обычно производится путем задания одной характеристики, например, по заданному нуклеотиду или аминокислоте. Анализ данных включает, например, поиск последовательностей протеинов, наиболее похожих на данную. Моделирование и имитация играют важную роль в биологических исследованиях. Так, процесс деления клеток может моделироваться системой дифференциальных уравнений. Во многих случаях используется имитационное моделирование.

Глобальную интеграцию биологических данных авторы считают несбыточной мечтой, поскольку невозможно заранее предсказать потребности биологов в информации. Однако осмысленная интеграция информации, ориентированной на определенные области биологии, возможна. Уже существует ряд интегрированных информационных источников, основанных на Web-технологиях. Громадные объемы биологических данных затрудняют их «ручной» анализ и вынуждают использовать автоматизированные аналитические системы, основанные на добыче данных. Одна из основных задач биоинформационных систем — добыча данных из интегрированных источников в контексте экспериментальных исследований.

Многие результаты экспериментальной биологии представляются в виде изображений. Поскольку число таких результатов непрерывно растет, требуются средства автоматического извлечения свойств и смысла изображений. Биологов не устраивает двумерная или даже трехмерная визуализация биоинформационных данных; требуется многомерная визуализация.

Каждая клетка живого организма содержит хромосомы, состоящие из последовательности базовых пар ДНК. Эта последовательность называется геномом и управляет размножением и функционированием каждого организма. Появление автоматизированных синтезаторов ДНК породило геномику, науку, направленную на аналитическое и сравнительное изучение геномов. Конечной целью установления последовательностей геномов является получение всех последовательностей ДНК в организме.

Остановимся на перспективах нового программного обеспечения компьютерной филогенетики. Филогенетика исследует генетическую историю живых организмов. В типичном процессе филогенетической реконструкции используются биомолекулярные данные, такие как последовательности ДНК, и строится дерево, называемое филогенезом, представляющее гипотетическую эволюционную историю. По набору данных можно построить много разных деревьев; в филогенетике имеются критерии выбора «наилучшего» дерева, в наибольшей степени соответствующего современным представлениям о природе эволюции. Задача нахождения наилучшего дерева является NP-полной, и как обычно, на практике применяются эвристические алгоритмы, позволяющие уменьшить пространство поиска. В статье приводится обзор современного состояния алгоритмов и соответствующего программного обеспечения, обсуждаются ближайшие перспективы.

Еще одно бионаправление в новейших Информационных системах - визуализация изображений для изучения феномики. Феномика, или функциональная геномика, изучает какую роль играют геномы в образовании миллиардов фенотипов клетки. Система BioSig обеспечивает модель данных для сохранения результатов экспериментов, вычислительные средства для обобщения большого числа изображений и распределенную архитектуру, поддерживающую удаленную совместную работу исследователей.

Исследователи полагают, что новый взгляд на роль ДНК в обменных и управляющих процессах может обеспечить изучение геномов на основе теории информации. Все большую роль в биологических исследованиях играют такие области математики, как динамические системы, теория управления, теория игр, математическая логика и т.д. Вычислительная среда Valis, предназначенная для прототипирования биоинформационных приложений, обеспечивает набор библиотек для чтения данных из реляционных данных и файлов, эффективную реализацию полезных в геномике алгоритмов, разнообразные средства визуализации.

Направление исследований — «Интерактивный анализ результатов иерархической кластеризации» (Interactively Exploring Hierarchical Clastering Results). Ее авторы — Джинвук Сео (Jinwook Seo) и Бен Шнейдерман (Ben Shneiderman). Разработанный авторами иерархический анализатор кластеризации интегрирует несколько интерактивных возможностей: общее представление всего набора данных и возможность видеть детали; динамические запросы, позволяющие удалять неинтересные кластеры и четче показывать интересные; двунаправленные связи между общим представлением набора данных и двухмерными диаграммами рассеяния; сравнение кластеров, позволяющее видеть, как кластеризуются гены с помощью разных алгоритмов.


Лекция 15


Дата добавления: 2015-11-14; просмотров: 53 | Нарушение авторских прав


<== предыдущая страница | следующая страница ==>
Навигация данных в структуре ИМВС| Потребности применений

mybiblioteka.su - 2015-2024 год. (0.006 сек.)