Студопедия
Случайная страница | ТОМ-1 | ТОМ-2 | ТОМ-3
АрхитектураБиологияГеографияДругоеИностранные языки
ИнформатикаИсторияКультураЛитератураМатематика
МедицинаМеханикаОбразованиеОхрана трудаПедагогика
ПолитикаПравоПрограммированиеПсихологияРелигия
СоциологияСпортСтроительствоФизикаФилософия
ФинансыХимияЭкологияЭкономикаЭлектроника

Часть I. Механизмы хранения и реализации 60 страница



метода.

Семейный генетический анализ сцепления. Эта группа методов часто

используется в медицинской генетике для выявления связи (сцепления) между

симптомами заболевания, вызываемого мутацией в неизвестном гене, и

другими генетическими маркерами. В данном случае в качестве одного из

генетических маркеров выступают сами симптомы заболевания. В геноме

человека обнаружено большое количество полиморфизмов, в том числе ПДРФ

(см. разделы 11.1 и 11.2). ПДРФ распределены более или менее равномерно в

геноме человека на расстоянии ∼5–10 сМ друг от друга. Чем ближе

индивидуальные полиморфные локусы расположены к гену, ответственному за

заболевание, тем меньше вероятность их разделения при рекомбинации в

мейозе и тем чаще они будут встречаться вместе у больного индивидуума и

вместе передаваться от родителей потомству. Клонировав протяженный

участок генома, включающий соответствующий полиморфный маркер (его

отбор из клонотеки геномной ДНК проводят с помощью зонда), можно

одновременно вместе с ним с большой вероятностью выделить ген,

вызывающий наследственное заболевание. Такие подходы были, в частности,

успешно применены для проведения семейного анализа и выделения

соответствующих генов при мышечной дистрофии Дюшенна, кистозном

фиброзе почек (муковисцидозе) и миотонической дистрофии. Информативность

отдельных ПДРФ генома человека зависит от уровня их гетерозиготности в

исследуемой популяции. Мерой информативности ПДРФ как генетического

маркера по предложению Д. Ботштейна и соавторов (1980 г.) принято считать

значение содержания полиморфной информации PIC (polymorphism information

content), которое представляет собой отношение числа скрещиваний, в которых

хотя бы у одного из родителей исследуемый полиморфный маркер находится в

гетерозиготном состоянии, ко всем скрещиваниям.

Определение эффекта дозы гена и использование хромосомных

аберраций. Этими методами обнаруживают корреляции между уровнем

экспрессии исследуемого гена и количеством конкретных хромосом в

анеуплоидных линиях клеток или структурными перестройками хромосом

(хромосомными мутациями – аберрациями). Анеуплоидией называют наличие у

клетки, ткани или целого организма числа хромосом, не равного типичному для

802

данного биологического вида. Хромосомные __________аберрации в виде транслокаций



участков хромосом в гетерохроматиновые области тех же самых или других

хромосом часто сопровождаются подавлением транскрипции генов,

расположенных в транслоцированных участках или в хромосоме-акцепторе

(мозаичный эффект положения). Изменение уровня активности исследуемого

гена при конкретных транслокациях может быть основанием для картирования

его в соответствующей области хромосомы.

Использование синтении. Синтения – это структурное сходство групп

сцепления генов у организмов разных биологических видов. В частности, в

геномах человека и мыши известно несколько десятков синтеничных групп

генов. Наличие феномена синтении позволяет суживать круг поиска места

локализации исследуемого гена на хромосомах, ограничивая его областью

известных генов, принадлежащих к конкретной синтеничной группе.

Сегрегация генов, индуцируемая ионизирующим излучением. С

помощью этого метода определяют расстояние между исследуемыми генами

путем оценки вероятности их разделения (сегрегации) после облучения клеток

определенной стандартной дозой ионизирующего излучения. Облученные

__________клетки спасают от гибели гибридизацией с соматическими клетками грызунов, и

у соматических гибридов в культуре определяют наличие исследуемых

маркеров облученных клеток. В итоге удается сделать вывод о наличии или

отсутствии сцепления (физическом расстоянии) между этими генами.

Среди других методов следует упомянуть способы, основанные на

использовании для картирования генов больших фрагментов ДНК, образуемых

под действием крупнощепящих рестриктаз. После расщепления геномной ДНК

образующиеся фрагменты разделяют электрофорезом в импульсном

электрическом поле и далее их гибридизуют по Саузерну с зондами,

соответствующими картируемым генам. Если после проведения гибридизации

сигналы обоих зондов локализуются на одном и том же крупном фрагменте

ДНК, это говорит о тесном сцеплении таких генов.

12.1.2. ПЦР в исследованиях генома человека

Полимеразная цепная реакция занимает центральное место в

разработке подходов к практическому осуществлению программы "Геном

человека". Как уже обсуждалось выше (раздел 7.1.3), с помощью ПЦР можно

803

быстро и эффективно амплифицировать почти любой короткий участок генома

человека, и полученные продукты ПЦР далее использовать в качестве зондов

для картирования соответствующих участков на хромосомах путем

гибридизации по Саузерну или in situ.

Концепция STS. Одной из ключевых концепций, лежащих в основе

картирования генов человека в рамках обсуждаемой программы, является

концепция сайтов, привязанных к последовательностям (sequence-tagged

sites – STS). В соответствии с этой концепцией все фрагменты ДНК,

используемые для построения генетических или физических карт, можно

однозначно идентифицировать с помощью последовательности нуклеотидов

длиной в 200–500 п.о., которая будет уникальной для данного фрагмента.

Каждый из этих сайтов необходимо секвенировать, что даст возможность в

дальнейшем их амплифицировать с помощью ПЦР и применять в качестве

зондов. Использование STS позволило бы применять их последовательности в

виде продуктов ПЦР в качестве зондов для направленного выделения любого

фрагмента ДНК того или иного участка генома из клонотек геномных

последовательностей. В результате могут быть созданы базы данных,

включающие локализацию и структуру всех STS, а также праймеров,

необходимых для их амплификации. Это избавило бы лаборатории от

необходимости хранения многочисленных клонов и их рассылки в другие

лаборатории для проведения исследований. Кроме того, STS создают основу

для разработки единого языка, на котором разные лаборатории могли бы

описывать свои клоны. Таким образом, конечным результатом разработки

концепции STS была бы исчерпывающая карта STS генома человека.

Теоретически для построения генетической карты размером в 1 сМ необходимо

∼3000 полностью информативных, полиморфных ДНК-маркеров. Однако

поскольку полиморфные маркеры распределены в геноме неравномерно и

лишь немногие из них полностью информативны, реальное число маркеров,

требуемых для построения карты такого размера, оценивается в 30–50 тысяч.

Для получения маркеров, соответствующих исследуемым участкам хромосом, в

настоящее время часто применяют праймеры, соответствующие

диспергированным повторяющимся последовательностям, среди которых

первыми стали использовать Alu-последовательности (см. раздел 1.3.1).

Alu-ПЦР. Диспергированные повторяющиеся Alu-последовательности

804

характерны именно для генома человека. Праймеры, специфичные в

отношении Alu-последовательностей, используют для амплификации участков

ДНК генома человека, заключенных между Alu-повторами, которые

располагаются в среднем на расстоянии 4–10 т.п.о. друг от друга. Другим

вариантом Alu-ПЦР является направленный синтез с ее помощью ДНК-зондов к

участкам хромосом, полученным после лазерной фрагментации,

индивидуальным хромосомам, выделенным с помощью проточной

цитофлуориметрии, или ДНК гибридных клеток, содержащих определенную

часть генома человека. Кроме того, Alu-ПЦР используют для получения

уникальных фингерпринтов, характеризующих клеточные гибриды с точки

зрения стабильности их генома, а также для характеристики фрагментов ДНК

человека, клонированных в YAC-векторах, космидах или векторах на основе

ДНК бактериофагов. Уникальность Alu-последовательностей для генома

человека делает возможным их применение для "прогулок по хромосомам" (см.

раздел 7.4.2), а также для расширения существующих контигов (см. ниже).

Поскольку в геноме человека >90% умеренно повторяющихся

последовательностей представлены семействами Alu и KpnI, неудивительно,

что последние также применяются в ПЦР для тех же целей, что и Alu. Однако

здесь профили продуктов ПЦР менее сложны, поскольку последовательности

KpnI повторяются в геноме реже и обладают характерной локализацией в

хромосомах.

ПЦР активно используется для выявления полиморфных молекулярных

маркеров при построении генетических карт сцепления, основные принципы

получения которых были рассмотрены выше. Этот метод оказывается

полезным и при секвенировании ДНК, а также при построении физических карт

высокого разрешения для генома человека. О последних двух сферах

применения ПЦР подробнее речь пойдет ниже.

12.1.3. Физические карты низкого разрешения

В отличие от рассмотренных выше генетических карт сцепления

физические карты генома отражают реальное расстояние между маркерами,

выражаемое в парах оснований. Физические карты различаются по степени их

разрешения, т.е. по тем деталям структуры генома, которые на них

представлены (рис. II.39). Исчерпывающая физическая карта генома человека

805

максимального разрешения будет содержать полную нуклеотидную

последовательность всех его хромосом. На другом полюсе физических карт с

минимальным разрешением находятся хромосомные (цитогенетические)

карты генома.

Рис. II.39. Четыре типа генетических карт геномной ДНК и их

взаимоотношения

1 – генетическая карта сцепления, 2 – физическая рестрикционная карта,

пробелы обозначают места расщепления ДНК рестриктазами, 3 –

физическая карта контигов, показаны перекрывающиеся клоны ДНК,

полученные с помощью YAC-векторов, 4 – исчерпывающая физическая

карта в виде последовательности нуклеотидов ДНК. На всех картах

представлен один и тот же участок хромосомы

Хромосомные карты. Хромосомные карты генома человека получают

локализацией генетических маркеров на индивидуальных хромосомах с

использованием цитогенетических методов, включая авторадиографию и FISH.

В последних двух случаях радиоактивная или флуоресцентная метки,

ассоциированные с исследуемыми генетическими локусами интактных

хромосом, выявляются с помощью световой микроскопии. Еще совсем недавно

хромосомные карты позволяли локализовать исследуемый фрагмент ДНК на

участке хромосомы протяженностью ∼10 м.п.о. Современные методы

гибридизации in situ с использованием метафазных хромосом, главным

образом, метод FISH, локализуют полинуклеотидные маркеры в пределах 2–5

м.п.о. Более того, при гибридизации in situ с интерфазными хромосомами, в

которых генетический материал находится в менее компактной форме,

разрешающая способность хромосомных карт приближается к 100 т.п.о.

Точность хромосомных карт повышается и с использованием

806

современных генетических методов. Например, способность ПЦР

амплифицировать сегменты ДНК единичного сперматозоида позволяет

исследовать большое число мейозов, как бы законсервированных в отдельных

образцах спермы. В результате появляется возможность проверки взаимного

расположения генетических маркеров, локализованных на хромосомных картах

более грубыми методами.

Карты кДНК. Карты кДНК отражают положение экспрессирующихся

участков ДНК (экзонов) относительно известных цитогенетических маркеров

(бэндов) на метафазных хромосомах. Поскольку такие карты дают

представление о локализации транскрибирующихся участков генома, в том

числе и генов с неизвестными функциями, они могут быть использованы для

поиска новых генов. Этот подход особенно полезен при поиске генов,

повреждения которых вызывают заболевания человека, в том случае если

приблизительная локализация таких участков хромосом уже предварительно

проведена на генетических картах сцепления в результате семейного

генетического анализа.

807

12.1.4. Физические карты высокого разрешения

808

Рис. II.40. Две стратегии построения физических карт ДНК

а – стратегия "сверху вниз": ДНК целой хромосомы расщепляется

крупнощепящими рестриктазами, для каждого из индивидуальных

фрагментов ДНК строится рестрикционная карта; б – стратегия "снизу

вверх", индивидуальные YAC-клоны после идентификации объединяются

в контиги

В попытках построения карт генома человека высокого разрешения

экспериментально реализуются два альтернативных подхода, получивших

названия картирования сверху вниз (top-down mapping) и картирования снизу

вверх (bottom-up mapping). При картировании сверху вниз (рис. II.40,а)

исходным в анализе является препарат ДНК индивидуальной хромосомы

человека. ДНК разрезается крупнощепящими рестриктазами (например NotI) на

длинные фрагменты, которые __________после разделения электрофорезом в импульсном

электрическом поле подвергаются дальнейшему рестрикционному анализу с

другими рестриктазами. В результате получают макрорестрикционную карту,

на которой достаточно полно представлены все последовательности

исследуемой хромосомы или ее части, однако ее разрешение невысоко. На

такой карте очень трудно локализовать индивидуальные гены. К тому же

каждая индивидуальная карта редко охватывает протяженные сегменты ДНК

(как правило, не более 1–10 м.п.о.).

При картировании генома человека снизу вверх (см. рис. II.40,б) на

основе препарата суммарной ДНК генома или индивидуальной хромосомы

получают серию случайных клонов протяженных последовательностей ДНК

(10–1000 т.п.о), часть из которых перекрывается друг с другом. В качестве

вектора для клонирования в этом случае часто используют искусственные

минихромосомы бактерий (BAC) или дрожжей (YAC), подробно описанные в

разделе 7.2.4. Серия частично перекрывающихся и дополняющих друг друга

клонов образует непрерывную состыкованную (contiguous) последовательность

нуклеотидов ДНК, получившую название контига (contig). Правильность

__________полученных контигов подтверждают гибридизацией in situ (FISH) с

одновременной их привязкой к определенным участкам исследуемых

хромосом. Карты, основанные на контигах, представляют полную информацию

о структуре отдельных сегментов хромосом и позволяют локализовать

отдельные гены. Однако такие карты трудно применять для реконструкции

целых хромосом или протяженных их участков из-за отсутствия

809

соответствующих клонов в имеющихся клонотеках генов.

Основная проблема, которую приходится решать при использовании

обоих подходов к построению физических карт высокого разрешения, –

объединение разрозненных фрагментов ДНК в непрерывные

последовательности нуклеотидов. Чаще всего для этого применяют

специальные клонированные фрагменты ДНК, получившие название

связующих (linking) клонов. Фрагменты ДНК из связующих клонов содержат в

своих внутренних частях последовательности нуклеотидов крупнощепящих

рестриктаз и, следовательно, представляют собой места стыковки фрагментов

ДНК, используемых на первых этапах физического картирования.

Гибридизацией по Саузерну, при проведении которой в качестве зондов

используют фрагменты ДНК связующих клонов, определяют фрагменты ДНК

физических карт, содержащие последовательности нуклеотидов окрестностей

сайтов рестрикции крупнощепящих рестриктаз. Если два таких фрагмента

найдены, то соответствующий связующий клон перекрывает оба этих

фрагмента и является их частью. Связующие клоны, в свою очередь, отбирают

из клонотек генов с помощью зондов, которые представляют собой

последовательности нуклеотидов сайтов рестрикции крупнощепящих

рестриктаз.

12.2. Определение полной первичной структуры ДНК генома человека

Исчерпывающая физическая карта генома человека (и любого другого

организма) должна представлять собой полную последовательность

нуклеотидов ДНК всех его хромосом. Благодаря тому, что к решению такой

грандиозной по объему задачи привлечены многие хорошо финансируемые

лаборатории в разных странах мира и для этих целей используются

автоматические высокопроизводительные секвенаторы, она представляется

скорее рутинной, чем захватывающей. Секвенирование начинается с

субклонирования небольших рестрикционных фрагментов ДНК, образуемых в

результате рестрикции предварительно клонированных более крупных

фрагментов, и первичная структура коротких фрагментов далее определяется

одним из известных методов.

Опубликованные одновременно в 1977 г. методы секвенирования ДНК

А. Максама и У. Гилберта, а также Ф. Сенгера сделали процесс определения

810

первичной структуры генов доступным любой биохимической лаборатории. С

тех пор метод Сенгера, основанный на случайной терминации синтеза ДНК in

vitro как следствие включающихся в синтезируемую цепь ДНК

дидезоксирибонуклеозидмонофосфатов, получил широкое распространение.

Дальнейшим развитием метода Сенгера было использование в продукте

реакции флуоресцентной метки вместо радиоактивной, что позволило

автоматизировать процесс секвенирования. Во многих случаях для

определения первичной структуры того или иного участка ДНК теперь уже нет

необходимости в предварительном клонировании соответствующего

фрагмента, поскольку разработаны эффективные методы секвенирования

непосредственно продуктов ПЦР. Все это резко стимулировало эффективность

анализа первичной структуры генов. Однако необходимо иметь в виду, что

длина ДНК даже самой маленькой Y-хромосомы человека составляет 50 м.п.о.,

а лучшие автоматические секвенаторы сегодняшнего дня позволяют

определять за один год последовательность из ∼0,1 м.п.о. Это наглядно

демонстрирует масштабы задачи, которую предстоит решить3.

12.3. Базы данных получаемой информации

Полное использование информации о структуре генома человека в

биологии и медицине станет возможным лишь в отдаленном будущем. Еще

долгие годы предстоит собирать и обрабатывать получаемую информацию,

устранять противоречия между экспериментальными данными разных

лабораторий. Одна только запись всей последовательности нуклеотидов

генома человека обычным шрифтом потребует ~200 томов книг по 1000

страниц каждая. Анализ такого объема информации неминуемо повлечет за

собой необходимость разработки новых подходов в информатике и будет

невозможен без создания уникальных алгоритмов обработки информации с

помощью вычислительной техники.

По мере накопления информации о последовательностях нуклеотидов

различных частей генома человека на первое место будут выходить задачи по

идентификации среди них функционально значимых. В первой части книги уже

3 К концу 1999 года полностью определена последовательность нуклеотидов

хромосомы 22 человека.

811

подчеркивалось, что даже определение границ генов в ряде случаев является

трудно разрешимой задачей. То же относится и к идентификации регуляторных

последовательностей генов. Не исключено, что накопление новых данных о

структуре генома человека, в конце концов, потребует пересмотра как

критериев функциональной значимости нуклеотидных последовательностей

генома, так и самой концепции гена.

Крупнейшей базой данных по структуре генома человека в настоящее

время является GDB (Genome Data Base), созданная и поддерживаемая в

университете Дж. Гопкинса (Балтимор, США). Кроме известных

последовательностей нуклеотидов генома человека в ней хранится вся

получаемая информация о генетических маркерах, зондах и контигах,

ассоциированных с генетическими заболеваниями. Проводятся работы по

включению в базу данных результатов физического картирования генома. В

этом же университете поддерживается база данных по менделевскому

наследованию у человека (Online Mendelian Inheritance in Man Database),

которая представляет собой каталог наследуемых признаков и наследственных

заболеваний человека.

Четыре другие базы данных хранят все известные последовательности

нуклеотидов, включая последовательности нуклеотидов генома человека:

GenBank и Genome Sequence Data Base (GSDB) в США, European Molecular

Biology Laboratory (EMBL) Nucleotide Sequence Database в Великобритании, а

также DNA Data Bank of Japan (DDBJ). В этих базах данных в 1996 году

хранилось ∼200 м.п.о. последовательностей нуклеотидов, предоставленных как

самими авторами, так и вводимых из статей, опубликованных в периодических

изданиях. В России Институтом молекулярной биологии РАН поддерживается

аналогичная база данных по геному человека (Hugene) с более скромными

задачами, работающая на отечественном программном обеспечении. Основной

международной базой данных по последовательностям аминокислот является

Protein Identification Resource (Швейцария).

Принесет ли молекулярной генетике определение полной первичной

структуры генома человека принципиально новые знания? Действительно,

максимальную информацию о функционировании генома и функциональной

значимости его основных частей могло бы принести только полное

сравнительное секвенирование двух геномов, принадлежащих разным

812

индивидуумам. Это позволило бы отделить консервативные

последовательности от последовательностей, изменяющихся в процессе

онтогенеза. Ведь даже в двух соседних соматических клетках одного организма

последовательности нуклеотидов различаются из-за соматического мутагенеза.

Выполняемая же программа исследований по геному человека в конечном

счете даст только усредненную информацию. Если же, как это предполагается

в разделе 5.3, основной функцией избыточных последовательностей,

составляющих ∼90% генома млекопитающих, является обеспечение

запрограммированной скорости изменения отдельных генетических локусов

под действием мутаций, и(или) поддержания пространственной структуры

кодирующих частей генов, то полное секвенирование таких

последовательностей будет лишено большого смысла. Каков будет конец этой

истории, может показать только будущее.

813

ЗАКЛЮЧЕНИЕ

Современная генетика находится на взлете. Новые факты

обнаруживаются настолько быстро, что едва хватает времени на то, чтобы

просто осознать их появление. Еще труднее уловить многочисленные связи

между ними. Уже сейчас многие главы монографии хотелось бы переписать

заново и реализацию этого замысла сдерживает лишь бесконечность такого

пути. В этом заключении я хотел бы, с известной долей субъективности,

отметить несколько новых направлений генетических исследований, которые

достаточно явно обозначились к настоящему времени и, на мой взгляд, могут

определять некоторые будущие направления генетических исследований.

Геномика. Конец 1990-х годов отмечен определением полной первичной

структуры геномов нескольких организмов. В настоящее время уже имеются

полные данные о последовательности нуклеотидов целых геномов нескольких

эубактерий, архебактерии и эукариотического организма – дрожжей. На

подходе получение таких данных о геномах дрозофилы, нематоды C. elegans,

арабидопсиса и человека. По мере развития этих исследований молекулярная

биология получит через соответствующие базы данных доступ к

неограниченному числу первичных структур природных белков и нуклеиновых

кислот. Ключевой проблемой, которую необходимо решить в связи с

накоплением такого рода информации (и которая пока далека от своего

разрешения) является возможность соотнесения первичных структур

открываемых новых генов с функциями кодируемых этими генами белков и

нуклеиновых кислот.

Базы данных последовательностей нуклеотидов целых геномов дают

возможность изучения эволюционной истории семейств белков разных видов

организмов. На основании этих данных все аминокислотные

последовательности организуют в виде набора ∼10 000 независимо

эволюционирующих блоков ("модулей"). Для каждого из этих модулей на

основании степени сходства или различия их аминокислотных (и

соответствующих нуклеотидных) последовательностей строится эволюционное

древо, которое отражает эволюционную историю семейств белков и позволяет

814

обнаруживать предполагаемые исходные полипептиды-предшественники. При

этом полагают (С.Ф. Беннер с соавторами, 1998 г.), что сопоставление данных

эволюционной истории белков с их биохимическими свойствами и

пространственной структурой позволит, в конечном счете, связать первичную

структуру полипептидов с их биологическими функциями. Решение этой

ключевой проблемы геномики будет сопровождаться получением большого

количества новой информации о конформации макромолекул, их

надмолекулярной организации, механизмах катализа и несомненно обогатит

многие области исследований в биологии и химии.

Экспрессией генов управляют большие надмолекулярные

комплексы. Определение функций продуктов новых генов на основе их

первичной структуры осложняется тем, что многие белки и нуклеиновые

кислоты проявляют свою активность и функционируют только в составе

больших надмолекулярных комплексов, размеры которых часто приближаются

к размерам рибосом. При этом многие белки сами по себе не обладают

ферментативной активностью, а выполняют вспомогательные функции,

например, молекул-адаптеров, обеспечивающих сборку комплексов и


Дата добавления: 2015-08-29; просмотров: 36 | Нарушение авторских прав







mybiblioteka.su - 2015-2024 год. (0.065 сек.)







<== предыдущая лекция | следующая лекция ==>