Геном человека геномные технологии геномика. Геномика — изучение всего генома. Геномика - изучение всего генома

Первый черновой вариант, 2003 год - завершение проекта). Её развитие стало возможно не только благодаря совершенствованию биохимических методик, но и благодаря появлению более мощной вычислительной техники, которая позволила работать с огромными массивами данных. Протяженность геномов у живых организмов подчас измеряется миллиардами пар оснований . Например, объём генома человека составляет порядка 3 млрд пар оснований. Самый крупный из известных (на начало 2010 года) геномов принадлежит одному из видов двоякодышаших рыб (примерно 110 млрд пар).

Разделы геномики

Структурная геномика

Структурная геномика - содержание и организация геномной информации. Имеет целью изучение генов с известной структурой для понимания их функции, а также определение пространственного строения максимального числа «ключевых» белковых молекул и его влияния на взаимодействия .

Функциональная геномика

Функциональная геномика - реализация информации, записанной в геноме, от гена - к признаку.

Сравнительная геномика

Сравнительная геномика (эволюционная) - сравнительные исследования содержания и организации геномов разных организмов.

Получение полных последовательностей геномов позволило пролить свет на степень различий между геномами разных живых организмов. Ниже в таблице представлены предварительные данные о сходстве геномов разных организмов с геномом человека. Сходство дано в процентах (отражает долю пар оснований , идентичных у двух сравниваемых видов).

Вид Сходство Примечания и источники
Человек 99,9 % Human Genome Project
100 % Однояйцевые близнецы
Шимпанзе 98,4 % Americans for Medical Progress;
98,7 % Richard Mural из Celera Genomics, цитируется в MSNBC
Бонобо , или карликовый шимпанзе То же, что и для шимпанзе.
Горилла 98,38 % Основано на изучении интергенной неповторяющейся ДНК (American Journal of Human Genetics, февраль 2001, 682, стр. 444-456)
Мышь 98 %
85 % при сравнении всех последовательностей, кодирующих белки, NHGRI
Собака 95 % Jon Entine в San Francisco Examiner
C. elegans 74 % Jon Entine в San Francisco Examiner
Банан 50 % Americans for Medical Progress
Нарцисс 35 % Steven Rose в The Guardian от 22 января

Примеры применения геномики в медицине

В больнице Висконсина ребёнок в возрасте трёх лет долгое время ставил врачей в тупик, его кишечник отёк и был полностью пронизан абсцессами. К своим трем годам этот ребёнок пережил более ста отдельных хирургических операций. Для него был заказан полный сиквенс кодирующих участков его ДНК, по результатам с помощью подручных средств был выявлен виновник заболевания – белок XIAP, участвующий в сигнальных цепях запрограммированной клеточной смерти. При нормальной работе он играет очень важную роль в иммунной системы. На основе такого диагноза физиологами была рекомендована трансплантация костного мозга в июне 2010. К середине июня ребёнок уже смог впервые в своей жизни поесть.

Другой случай связан был с нетипичным раковым заболеванием у 39ти летней женщины, страдающей острой формой промиелоцитарной лейкемии. При стандартных методах диагностики, однако, заболевание не было выявлено. А вот при расшифровке и анализе генома раковых клеток выяснилось, что крупный участок 15ой хромосомы переместился на 17ю, что вызвало определённое генное взаимодействие. В результате женщина получила необходимое ей лечение.

Примечания

См. также

Ссылки

  • Тищенко П. Д. Геномика: новый тип науки в новой культурной ситуации .
  • Complete Microbial Genomes (полностью расшифрованные геномы бактерий и архей).

Wikimedia Foundation . 2010 .

Синонимы :

Смотреть что такое "Геномика" в других словарях:

    геномика - * геноміка * genomics новое направление генетики, наука о геномах, включающая изучение их структуры, функционирования и эволюции на молекулярном, хромосомном, биохимическом, физиологическом уровнях. Одной из задач структурной Г. является… … Генетика. Энциклопедический словарь

    Сущ., кол во синонимов: 1 генетика (11) Словарь синонимов ASIS. В.Н. Тришин. 2013 … Словарь синонимов

    геномика - Наука, изучающая все гены и их роль в структуре организма, как в нормальном состоянии, так и при заболевании Тематики биотехнологии EN genomics … Справочник технического переводчика

    Геномика - прочтение генома, в частности, человека, и сопутствующая научная и техническая деятельность: ஐ Очевидно то, что легче было безнаказанно придумать дифференциацию направлений в технобиологии, поскольку призывая к плагиату и даже к улучшению… … Мир Лема - словарь и путеводитель

    геномика - Genomics Геномика Исследование всей совокупности генов, составляющих организм … Толковый англо-русский словарь по нанотехнологии. - М.

    геномика - genomika statusas T sritis augalininkystė apibrėžtis Nauja genetikos kryptis, kuri apima genomo individualių genų molekulių lygyje, geno sandaros, jo raiškos, aktyvumo reguliavimo mechanizmo ir genų panaudojimo genų inžinerijos tikslams… … Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

    Раздел генетики, изучающий структуру и функционирование генома разл. организмов с помощью биол., физ. хим. и компьютерных методов … Естествознание. Энциклопедический словарь

    геномика - ген омика, и … Русский орфографический словарь

    Геномика - раздел генетики, предметом которого является изучение принципов построения геномов и их структурно функциональной организацииСловарь по психогенетике

    Стремится описать трехмерную структуру каждого белка, закодированного данным геномом. Используется комбинация экспериментальных и моделирующих подходов. Принципиальное различие между структурной геномикой и традиционным структурным… … Википедия

Книги

  • Клиническая генетика. Геномика и протеомика наследственной патологии. Учебное пособие. Гриф УМО по классическому университетскому образованию , Мутовин Геннадий Романович. В книге рассмотрены основные положения и понятия клинической генетики с учетом результатов международной научной программы`Геном человека` (1988-2005 гг.). Представлены история, положения,…

Геномика - изучение всего генома

Последние достижения в области секвенирова-ния и развитие технических средств для обработки большого количества клонов в библиотеке генов позволили ученым исследовать сразу весь геном организма. Сейчас определены полные последовательности многих видов, в том числе большинства так называемых модельных генетических организмов, таких как Е. coli; круглого червя Caenorhabditis elegans; и, конечно, классического объекта генетики, плодовой мушки Drosophila melanogaster. В 1990-х годах, несмотря на ряд неурядиц и разногласий, был начат проект по исследованию человеческого генома («Геном человека»), средства на который выделил Национальный институт здоровья. В феврале 2001 года большая группа исследователей во главе с Дж. Крэй-гом Вентером из частной лаборатории «Селера Дже-номикс» сделали заявление о предварительной расшифровке человеческого генома. Результат их работы был опубликован 16 февраля 2001 года в журнале «Science».

Другая версия, которую представила группа из Международного консорциума по секвенированию человеческого генома, была напечатана 13 февраля 2001 года в журнале «Nature».

Временем зарождения геномики можно считать середину XX века, когда генетики составили карты всех хромосом модельных организмов, основываясь на частоте рекомбинаций (см. гл. 8). Однако на этих картах были показаны лишь те гены, для которых были известны мутантные аллели, и поэтому полными такие карты назвать нельзя. Полное сек-венирование ДНК позволяет выявить местонахождение всех генов организма, а также установить последовательность оснований между ними.

Геномика делится на структурную и функциональную. Структурная геномика ставит целью выяснить, где именно в хромосомной ДНК расположены те или иные гены. Компьютерные программы распознают типичные для генов начала и концы, отбирая те последовательности, которые, вероятнее всего, и являются генами. Такие последовательности называют открытой рамкой считывания (open reading frame, OFR). Те же компьютерные программы могут опознавать и типичные интроны в OFR-nocледовательностях. После того как интроны из потенциального гена вычленены, по оставшемуся коду компьютер определяет последовательность аминокислот в белке. Затем эти потенциальные белки сравнивают с теми белками, функции которых уже известны и последовательности которых уже занесены в базу данных. Благодаря такому роду программ был установлен так называемый эволюционный консерватизм: то, что для большинства генов в разных организмах имеются схожие гены. С позиций эволюционного развития такое сходство объяснимо: если белок какого-то одного биологического вида хорошо приспособлен для своих функций, то его ген передается в том же виде или с небольшими изменениями к видам, происходящим от начального. Эволюционный консерватизм позволяет опознавать гены, родственные данному гену в других организмах. Сравнив полученный ген с уже известными, зачастую можно определить и его функцию, обязательно проверив ее в последующих экспериментах.

После определения всех потенциальных генов приступают к составлению генетической карты. Генетическая карта человека - довольно запутанная и пестрая диаграмма, так как каждый ген отмечают определенным цветом в зависимости от его функции, устанавливаемой в сравнении с другими известными генами. Большинство генов человека, как и вообще гены всех эукариот, имеют большие интроны. По приблизительным оценкам, среди опубликованных последовательностей около трети или четверти приходится на интроны. Любопытно, что только около 1,5% всего генома человека (около 2,9 х 10 9 пар оснований) содержат последовательности (экзоны), кодирующие белки. Кроме того, похоже, что эта ДНК содержит только 35 000-45 000 генов, а это меньше предсказанного. Нам еще предстоит понять, как относительно малое количество генов кодирует такой сложный организм.

Количество копий повторяющейся ДНК у разных людей неодинаково, поэтому их можно использовать для установления личности, в том числе и в судебной медицине.

Функциональная геномика - это исследование функций генов на уровне всего генома. Хотя потенциальные гены можно определить по сходству с генами, выполняющими известные функции в других организмах, все догадки следует проверять на примере изучаемого организма. В некоторых модельных организмах, например в пищевых дрожжах, можно систематически отключать функцию генов по очереди. Выключение гена происходит посредством замены его функциональной формы стертой формой на особом векторе. Затем получают штамм с выключенным геном и оценивают его фенотип. В ходе продолжающейся программы по анализу генома пищевых дрожжей по очереди было выключено несколько тысяч генов.

Другой метод функциональной геномики заключается в том, что изучают механизм транскрипции на уровне всего генома. Данный метод основан на предположении, что большинство биологических явлений представляют собой сложные процессы с участием многих генов. Особый интерес у исследователей вызывают процессы, связанные с развитием организма, о которых мы упоминали в гл. 11. Если транскрипцию генов изучать в разных условиях роста, то можно составить представление о полных генетических путях развития организма.

Но как можно изучать транскрипцию на уровне всего генома? Опять-таки в этом ученым помогают новые технологии. ДНК каждого гена в геноме или некоторой части генома помещают на поверхности небольших стеклянных пластин, расположенных по порядку. Потом их подвергают воздействию со стороны всех видов мРНК, обнаруженных в клетке данного организма. ДНК на пластинках получают двумя способами. При одном способе все мРНК подвергаются обратной транскрипции, чтобы получить короткие комплементарные молекулы ДНК, соответствующие одному гену. При другом способе гены (или части генов) синтезируются по одному основанию за раз на определенных участках пластин. Синтез осуществляют роботы, открывающие и закрывающие поверхность стекла в определенном порядке. Пластинки с геномом многих организмов можно приобрести в химических компаниях.

Это часть 1 истории геномики, которая называется "геномные проекты". В этой части я постараюсь научно-популярно рассказывать о том, как появились первые методы чтения генетических последовательностей, в чем они заключались и как геномика двигалась от чтения отдельных генов к чтению полных геномов, в том числе полных геномов конкретных людей.

Вскоре после открытия Уотсона и Крика (Рис.1) рождается наука геномика. Геномика - это наука об исследовании геномов организмов, которая включает интенсивное чтение полных последовательностей ДНК (секвенирование) и их нанесение на генетические карты. Это наука так же рассматривает взаимодействия между генами и аллелями генов и их разнообразие, закономерности в эволюции и устройства геномов. Развитие этой области происходило так стремительно, что еще совсем недавно текстовые редакторы вроде Microsoft Word не знали слова “геном” и пытались исправить его на слово “гном”.

Рис. 1 Джеймс Уотсон (слева) и Френсис Крик (справа) - ученые открывшие двойную спираль ДНК

Самый первый прочтенный ген был ген оболочки бактериофага MS2, изученный в лаборатории Валтера Файерса в 1972-ом году . В 1976-ом были известны и другие гены бактериофага - его репликаза, ген отвечающий за размножение вирусных частиц . Короткие молекулы РНК тогда уже читались сравнительно легко, но крупные молекулы ДНК читать толком еще не умели. К примеру, полученная в 1973-ем году Вальтером Гилбертом и Алленом Максам последовательность участка гена лактозного оперона, длинной в 24 буквы, рассматривалась как существенный прорыв в науке. Вот эта последовательность:

5"—TGGAATTGTGAGCGGATAACAATT 3"
3"—ACCTTAACACTCGCCTATTGTTAA 5"

Первые техники чтения ДНК были очень неэффективными и использовали радиоактивные метки для ДНК и химические методы, чтобы различить нуклеотиды. Например, можно было взять ферменты, которые разрезают нуклеотидную последовательность с разной вероятностью после разных букв. Молекула ДНК состоит из 4-ех букв (нуклеотидов) A, T, G и С, которые входят в состав двойной анти-параллельной (две цепи направлены в противоположные стороны) спирали. Внутри этой спирали нуклеотиды находятся друг напротив друга в соответствии с правилом комплементарности: напротив А в другой цепи стоит T, напротив G стоит С и наоборот.

Гилберт и Максам использовали 4 типа ферментов. Один разрезал после А или G, но лучше после A (A>G), второй разрезал лучше после G (G>A), третий после C, а четвертый после С или T (С+T) . Реакция проводилась в 4-ех пробирках с каждым типом ферментов, а затем продукты помещали на гель. ДНК - заряженная молекула и при включении тока бежит от минуса к плюсу. Маленькие молекулы бегут быстрее, поэтому разрезанные молекулы ДНК выстраиваются по длине. Глядя на 4 дорожки геля, можно было сказать в какой последовательности расположены нуклеотиды.

Прорыв в области секвенирования ДНК случился, когда английский биохимик Фредерик Сенгер в 1975-ом году предложил, так называемый “метод терминации цепи” для чтения последовательностей ДНК. Но прежде чем рассказать об этом методе, необходимо ввести в курс процессов происходящих при синтезе новых молекул ДНК. Для синтеза ДНК необходим фермент - ДНК-зависимая ДНК полимераза, которая способен достраивать одноцепочечную молекулу ДНК до двухцепочечной. Для этого ферменту необходима “затравка” - праймер, короткая последовательность ДНК, способная связаться с длинной одноцепочечной молекулой, которую мы хотим достроить до двухцепочечной. Так же необходимы сами нуклеотиды в форме нуклеотидтрифосфатов и некоторые условия, такие как определенное содержание ионов магния в среде и определенная температура. Синтез всегда идет в одном направлении от конца называемого 5’ к концу называемому 3’. Разумеется, для чтения ДНК необходимо большое количество матрицы - то есть копий той ДНК, которую собираются читать.

В 1975-ом году Сенгер придумал следующее. Он брал специальные (терминирующие) нуклеотиды, которые, присоединившись к растущей цепи молекулы ДНК, мешали присоединению последующих нуклеотидов, то есть “обрывали” цепь. Далее он брал 4 пробирки, в каждую из которых добавлял все 4 типа нуклеотидов и один тип терминирующих нуклеотидов в небольшом количестве . Таким образом, в пробирке, где находился терминирующий нуклеотид “А” синтез каждой новой молекулы ДНК мог оборваться в любом месте, где должна была встать “А”, в пробирке с терминирующей “G” - в любом месте, где должна встать G и так далее. На гель наносились 4 дорожки из 4-ех пробирок (Рис. 2) и снова самые коротки молекулы “убегали” вперед, а самые длинные оставались в начале, а по отличиям в полосах можно было сказать, какой нуклеотид следует за каким. Чтобы увидеть полосы, один из четырех нуклеотидов (A, T, G или C) метился, без изменения химических свойств, с использованием радиоактивных изотопов.

Рис. 2 Метод Сангера. Показаны три серии из 4-ех дорожек.

С помощью этого метода был прочитан первый геном, основанный на ДНК - геном бактериофага ϕX174, длинной 5,386 нуклеотидов (геном фага MS2, прочитанный ранее был на основе РНК и имел геном длинной 3,569 нуклеотидов).

Метод Сенгера был существенно улучшен в лаборатории Лероя Худа, где в 1985-ом году радиоактивную метку смогли заменить светящейся, флюрисцентной меткой . Это дало возможность создать первый автоматический секвенатор: каждая молекула ДНК теперь была покрашена разным цветом в зависимости от того, какой была последняя буква (меченый цветом нуклеотид, обрывающий цепь). Фрагменты разделялись на геле по размерам и машина автоматически считывала спектр свечения поступающих полос, выдавая результаты на компьютер. В результате такой процедуры получается хроматограмма (Рис. 2), по которой легко установить последовательность ДНК длинной до 1000 букв, с очень небольшим количеством ошибок.



Рис. 3 Пример хроматограммы, на современном секвенторе, использующий метод обрывания цепи Сангера и светящуюся метку.

На многие годы улучшенный метод Сенгера станет основным методом массового секвенирования геномов и будет использован для многих проектов полных геномов, а Сенгер в 1980-ом получит вторую нобелевскую премию по химии (первую он получил еще в 1958-ом за прочтение аминокислотной последовательности белка инсулина - первого прочитанного белка). Первым полным геномом клеточного организма стал геном бактерии, вызывающей некоторые формы пневмонии и менингита - Haemophilus influenzae в 1995-ом году. Геном этой бактерии имел длину 1,830,137 нуклеотидов. В 1998-ом году появляется первый геном многоклеточного животного, круглого червяка Caenorhabditis elegans (Рис. 4 справа), с 98 миллионами нуклеотидов, а затем в 2000-ом году появляется первый растительный геном - Arabidopsis thaliana (Рис. 4 слева), родственницы хрена и горчицы. Геном этого растения имеет длину 157 миллионов нуклеотидов. Скорость и масштабы секвенирования росли с изумительной скоростью и появляющиеся базы данных нуклеотидных последовательностей пополнялись все быстрее и быстрее.


Рис. 4 Arabidopsis thaliana (слева) и Caenorhabditis elegans (справа).

Наконец, настал черед генома млекопитающих: геномы мыши и человека. Когда в 1990-ом году Джеймс Уотсон возглавил проект чтения полного генома человека в Институте Национального Здоровья (NIH) в США многие ученые скептически относились к этой идее. Подобный проект требовал колоссальных вложений денег и времени и, учитывая ограниченные возможности существовавших машин для чтения геномов, многим казался просто не выполнимым. С другой стороны проект обещал революционные изменения в медицине и понимании устройства человеческого организма, но и здесь были свои проблемы. Дело в том, что в тот момент не существовало какой-либо точной оценки количества генов у человека. Многие полагали, что сложность устройства человеческого организма указывает на наличие у него сотен тысяч генов, а может и несколько миллионов, а, следовательно, разобраться в таком количестве генов, даже если их последовательности удастся прочитать, будет непосильной задачей. Именно в наличии большого количества генов многие предполагали принципиальное отличие человека от других животных - представление, впоследствии опровергнутое проектом генома человека.

Сама идея прочитать геном человека родилась в 1986-ом году по инициативе Департамента Энергии США, который впоследствии финансировал проект вместе с NIH. Стоимость проекта была оценена в 3 миллиарда долларов, а сам проект был рассчитан на 15 лет при участии в проекте целого ряда стран: Китай, Германия, Франция, Великобритания и Япония. Для чтения генома человека использовались так называемые “искусственные бактериальные хромосомы” (BAC - bacterial artificial chromosome). При этом подходе геном разрезаются на множество частей, длинной примерно в 150000 тысяч нуклеотидов. Эти фрагменты встраивают в искусственные кольцевые хромосомы, которые встраиваются в бактерии. С помощью бактерий эти хромосомы размножаются, и ученые получают множество копий одного и того же фрагмента молекулы ДНК. Каждый такой фрагмент затем читается отдельно, а прочитанные куски по 150000 нуклеотидов наносятся на карту хромосомы. Данный метод позволяет довольно точно секвенировать геном, однако требует очень больших затрат времени.

Но проект генома человека двигался крайне медленными темпами. Ученый Крейг Вентер и его компания Celera Genomics, основанная в 1998-ом году, сыграли примерно такую же роль в истории геномики, как Советский Союз повлиял на полет американцев на луну. Вентер заявил, что его компания закончит проект генома человека раньше, чем завершится государственный проект. На проект потребуется всего 300 миллионов долларов - лишь малую фракцию от затрат государственного проекта, используя новую технологию секвенирования “whole genome shotgun” - чтение случайных коротких фрагментов генома. Когда Френсис Коллинс, сменивший в 1993-ем году Джеймса Уотсона на посту руководителя проекта по чтению генома человека, узнал о намерениях Вентера, он был шокирован. “Мы сделаем геном человека, а вы можете сделать мышку ” - предложил Вентер. Научное сообщество всполошилось, и на то был ряд причин. Во-первых, Вентер обещал закончить свой проект в 2001-ом году, на 4 года раньше срока, намеченного для государственного проекта. Во-вторых, компания Celera Genomics собиралась заработать на проекте, создав абсолютную базу данных, которая была бы платной для коммерческих фармоцевтических компаний.

В 2000-ом году Селера доказала эффективность своего метода секвенирования, опубликовав геном плодовой мушки дрозофилы вместе с лабораторией генетика Джеральда Рубина (ранее whole genome shotgun использовался для прочтения первого генома бактерии, но мало кто верил, что этот метод пригоден для крупных геномов). Именно такой пинок со стороны коммерческой компании стимулировал разработку улучшенных и применение более современных методов чтения геномов в проекте генома человека. В 2001-ом году был опубликован предварительный вариант генома со стороны государственного геномного проекта и Селеры . Тогда была сделана предварительная оценка количества генов в геноме человека, 30-40 тысяч. В 2004-ом году вышла окончательная версия генома , почти на два года раньше, чем следовало по плану. В последней статье было сказано, что количества генов у человека предположительно составляет лишь 20-25 тысяч. Это число сравнимо с другими животными, в частности с червяком C. elegans .

Практически никто не угадал, что количество генов, обеспечивающих работу нашего организма, может быть столь мало. Позже стали известны и другие подробности: геном человека имеет длину около трех миллиардов нуклеотидов, большую часть генома составляют не кодирующие последовательности, в том числе всевозможные повторы. Лишь небольшая часть генома действительно содержит гены - участки ДНК, с которых считываются функциональные молекулы РНК. Интересный факт, что по мере увеличения знаний о геноме человека, число предполагаемых генов только сокращалось: многие потенциальные гены оказывались псевдогенами (не работающими генами), в других случаях несколько генов оказывались частью одного и того же гена.

Дальнейшие темпы секвенирования возрастали экспоненциально. В 2005-ом году опубликован геном Шимпанзе , который подтвердил потрясающее сходство между обезьянами и человеком, которое видели еще зоологи прошлого. К 2008-ому году были полностью прочитаны геномы 32-ух позвоночных, включая кошку, собаку, лошадь, макаку, орангутанга и слона, 3 генома беспозвоночных вторичноротых, 15 геномов насекомых, 7 геномов червяков и сотни геномов бактерий.

Наконец в 2007-ом человечество приблизилась к возможности секвенирования геномов индивидуальных людей. Первым человеком, для которого прочитали полный индивидуальный геном, стал Крейг Вентер (Рис. 4). При этом геном был прочитан так, что можно было сравнить хромосомы Вентера, доставшиеся ему от обоих родителей. Так было выяснено, что между одним и другим набором хромосом внутри одного человека существует около трех миллионов однобуквенных нуклеотидных отличий, не считая огромного количества крупных варьирующих участков. Год спустя опубликован полный диплоидный геном Джеймса Уотсона (Рис. 5). Геном Уотсона содержал 3.3 миллиона однобуквенных замен по сравнению с аннотированным геномом человека, из которых более 10000 вели к изменением в белках, которые кодируют его гены. Геном Уотсона обошелся в 1 миллион долларов, то есть цена на чтение геномов упала более чем в 3000 раз за 10 лет, но и это не предел. Сегодня перед учеными стоит задача ‘1 геном - 1000 $ - 1 день” и она уже не кажется невыполнимой с появлением новых технологий секвенирования. О них расскажет следующая часть "истории".


Рис. 5 Джеймс Уотсон и Крейг Вентер - первые люди с индивидуальными прочитанными геномами.

  1. Watson J, Crick F: A Structure for Deoxyribose Nucleic Acid . Nature 1953(171):737-738.
  2. Min Jou W, Haegeman G, Ysebaert M, Fiers W: Nucleotide sequence of the gene coding for the bacteriophage MS2 coat protein. Nature 1972, 237(5350):82-88.
  3. Fiers W, Contreras R, Duerinck F, Haegeman G, Iserentant D, Merregaert J, Min Jou W, Molemans F, Raeymaekers A, Van den Berghe A et al: Complete nucleotide sequence of bacteriophage MS2 RNA: primary and secondary structure of the replicase gene. Nature 1976, 260(5551):500-507.
  4. Gilbert W, Maxam A: The nucleotide sequence of the lac operator. Proc Natl Acad Sci U S A 1973, 70(12):3581-3584.
  5. Maxam AM, Gilbert W: A new method for sequencing DNA. Proc Natl Acad Sci U S A 1977, 74(2):560-564.
  6. Sanger F, Nicklen S, Coulson AR: DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A 1977, 74(12):5463-5467.
  7. Smith LM, Sanders JZ, Kaiser RJ, Hughes P, Dodd C, Connell CR, Heiner C, Kent SB, Hood LE: Fluorescence detection in automated DNA sequence analysis. Nature 1986, 321(6071):674-679.
  8. Fleischmann RD, Adams MD, White O, Clayton RA, Kirkness EF, Kerlavage AR, Bult CJ, Tomb JF, Dougherty BA, Merrick JM et al: Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science 1995, 269(5223):496-512.
  9. Genome sequence of the nematode C. elegans: a platform for investigating biology. Science 1998, 282(5396):2012-2018.
  10. Analysis of the genome sequence of the flowering plant Arabidopsis thaliana. Nature 2000, 408(6814):796-815.
  11. Adams MD, Celniker SE, Holt RA, Evans CA, Gocayne JD, Amanatides PG, Scherer SE, Li PW, Hoskins RA, Galle RF et al: The genome sequence of Drosophila melanogaster. Science 2000, 287(5461):2185-2195.
  12. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M, Evans CA, Holt RA et al: The sequence of the human genome. Science 2001, 291(5507):1304-1351.
  13. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al: Initial sequencing and analysis of the human genome. Nature 2001, 409(6822):860-921.
  14. Finishing the euchromatic sequence of the human genome. Nature 2004, 431(7011):931-945.
  15. Initial sequence of the chimpanzee genome and comparison with the human genome. Nature 2005, 437(7055):69-87.
  16. Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G et al: The diploid genome sequence of an individual human. PLoS Biol 2007, 5(10):e254.
  17. Wheeler DA, Srinivasan M, Egholm M, Shen Y, Chen L, McGuire A, He W, Chen YJ, Makhijani V, Roth GT et al: The complete genome of an individual by massively parallel DNA sequencing. Nature 2008, 452(7189):872-876.
Часть 2 - здесь

В качестве потенциального вектора рассматривается небольшой аденоассоциированный вирус (AAV), потому что в отличие от аденовирусов он не вызывает заболевания. Однако он не так хорошо переносит ген. Для улучшения его как вектора проводятся эксперименты по облучению и химической модификации. В других лабораториях экспериментируют с ретровирусами-переносчиками CFTR, так как эти вирусы естественным образом встраивают свой геном в клетки хозяина.

Правда, при этом остается нерешенным вопрос, избавит ли нормальный синтез белка CFTR от бактериальных инфекций легких, на которые приходятся 90% заболеваемости и смертности. Есть все основания надеяться, что генная инженерия успешно справится с этой задачей. Белок в легких, функция которого заключается в уничтожении чужеродных клеток, не активизируется при повышенной концентрации соли (а именно этим и характеризуется кистозный фиброз); но как только CFTR начинает вырабатывать свой продукт, концентрация соли понижается, и белок активизируется.

В настоящее время разрабатываются методы генной терапии при лечении других наследственных болезней. Так, при нарушениях функции кровяных клеток их можно преобразовывать в культуральной среде и вводить в

костный мозг пациента, в их естественную среду. Несомненно, некоторые из разработок увенчаются успехом и в течение последующих лет станут обычной медицинской практикой.

Все приведенные факты - примеры так называемой соматической генной терапии, то есть они применяются по отношению к телу (соме ) пациента в надежде, что получится достаточное количество клеток, способных выполнять нормальные функции. Пациент может выздороветь, но риск передачи нежелательных генов потомству все равно остается, потому что половые клетки таким образом не модифицируются.Терапия половых клеток нацелена на модификацию всего организма, включая и железы, вырабатывающие половые клетки. Простейший (теоретически) способ состоит в том, чтобы модифицировать оплодотворенную яйцеклетку, введя в нее подходящий трансген. Такого рода процедура уже возможна и успешно проведена на опытных животных, например на мышах. Но можно ли ее применить по отношению к человеку и, главное, стоит ли? Это серьезный этический вопрос, и некоторые поборники нравственности утверждают, что если соматическая генная терапия этична, то играть с человеческим геномом и изменять генный набор наших потомков недопустимо, поэтому подобные процедуры следует запретить.

Геномика - изучение всего генома

Последние достижения в области секвенирования и развитие технических средств для обработки большого количества клонов в библиотеке генов позволили ученым исследовать сразу весь геном организма. Сейчас определены полные последовательности многих видов, в том числе большинства так называемых модельных генетических организмов, таких как Е. coli, круглого червяCaenorhabditis elegans;

и, конечно, классического объекта генетики, плодовой мушки Drosophila melanogaster. В 1990-х годах, несмотря на ряд неурядиц и разногласий, был начат проект по исследованию человеческого генома («Геном человека»), средства на который выделил Национальный институт здоровья. В феврале

ПРЕСС, 2004. - 448 с: ил.

2001 года большая группа исследователей во главе с Дж. Крэйгом Вентером из частной лаборатории «Селера Дженомикс» сделали заявление о предварительной расшифровке человеческого генома. Результат их работы был опубликован 16 февраля 2001 года в журнале «Science».

Другая версия, которую представила группа из Международного консорциума по секвенированию человеческого генома, была напечатана 13 февраля 2001 года в журнале «Nature».

Временем зарождения геномики можно считать середину ХХ века, когда генетики составили карты всех хромосом модельных организмов, основываясь на частоте рекомбинаций (см. гл. 8). Однако на этих картах были показаны лишь те гены, для которых были известны мутантные аллели, и поэтому полными такие карты назвать нельзя. Полное секвенирование ДНК позволяет выявить местонахождение всех генов организма, а также установить последовательность оснований между ними.

Геномика делится на структурную и функциональную. Структурная геномика ставит целью выяснить, где именно в хромосомной ДНК расположены те или иные гены. Компьютерные программы распознают типичные для генов начала и концы, отбирая те последовательности, которые, вероятнее всего, и являются генами. Такие последовательности называют открытой рамкой считывания (open

reading frame, OFR ). Те же компьютерные программы могут опознавать и типичные интроны в OFR-последовательностях. После того как интроны из потенциального гена вычленены, по оставшемуся коду компьютер определяет последовательность аминокислот в белке. Затем эти потенциальные белки сравнивают с теми белками, функции которых уже известны и последовательности которых уже занесены в базу данных. Благодаря такому роду программ был установлен так называемыйэволюционный консерватизм: то, что для большинства генов в разных организмах имеются схожие гены. С позиций эволюционного развития такое сходство объяснимо: если белок какого-то одного биологического вида хорошо приспособлен для своих функций, то его ген передается в том же виде или с небольшими изменениями к видам, происходящим от начального. Эволюционный консерватизм позволяет опознавать гены, родственные данному гену в других организмах. Сравнив полученный ген с уже известными, зачастую можно определить и его функцию, обязательно проверив ее в последующих экспериментах.

После определения всех потенциальных генов приступают к составлению генетической карты. Генетическая карта человека - довольно запутанная и пестрая диаграмма, так как каждый ген отмечают определенным цветом в зависимости от его функции, устанавливаемой в сравнении с другими известными генами. Большинство генов человека, как и вообще гены всех эукариот, имеют большие интроны. По приблизительным оценкам, среди опубликованных последовательностей около трети или четверти приходится на интроны. Любопытно, что только около 1,5% всего генома человека (около 2,9 х 109 пар

оснований) содержат последовательности (экзоны), кодирующие белки. Кроме того, похоже, что эта ДНК содержит только 35 000-45 ООО генов, а это меньше предсказанного. Нам еще предстоит понять, как относительно малое количество генов кодирует такой сложный организм.

От двух третей до трех четвертей генома приходится на обширные

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.

Количество копий повторяющейся ДНК у разных людей неодинаково, поэтому их можно использовать для установления личности, в том числе и в судебной медицине.

Функциональная геномика

Функциональная геномика - это исследование функций генов на уровне всего генома. Хотя потенциальные гены можно определить по сходству с генами, выполняющими известные функции в других организмах, все догадки следует проверять на примере изучаемого организма. В некоторых модельных организмах, например в пищевых дрожжах, можно систематически отключать функцию генов по очереди.Выключение гена происходит посредством замены его функциональной формы стертой формой на особом векторе. Затем получают штамм с выключенным геном и оценивают его фенотип. В ходе продолжающейся программы по анализу генома пищевых дрожжей по очереди было выключено несколько тысяч генов.

Другой метод функциональной геномики заключается в том, что изучают механизм транскрипции на уровне всего генома. Данный метод основан на предположении, что большинство биологических явлений представляют собой сложные процессы с участием многих генов. Особый интерес у исследователей вызывают процессы, связанные с развитием организма, о которых мы упоминали в гл. 11. Если транскрипцию генов изучать в разных условиях роста, то можно составить представление о полных генетических путях развития организма.

Но как можно изучать транскрипцию на уровне всего генома? Опять-таки в этом ученым помогают новые технологии. ДНК каждого гена в геноме или некоторой части генома помещают на поверхности небольших стеклянных пластин, расположенных по порядку. Потом их подвергают воздействию со стороны всех видов мРНК, обнаруженных в клетке данного организма. ДНК на пластинках получают двумя

способами. При одном способе все мРНК подвергаются обратной транскрипции, чтобы получить короткие комплементарные молекулы ДНК, соответствующие одному гену. При другом способе гены (или части генов) синтезируются по одному основанию за раз на определенных участках пластин. Синтез осуществляют роботы, открывающие и закрывающие

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.

поверхность стекла в определенном порядке. Пластинки с геномом многих организмов можно приобрести в химических компаниях.

Для изучения механизма транскрипции все мРНК определенной стадии развития помечают флуоресцентной меткой и распределяют их по поверхности пластин. Эти мРНК прикрепляются к соответствующим им ДНК, и их можно опознать по светящимся участкам. Поскольку положение каждой ДНК отдельного гена на пластинах известно заранее, компьютер определяет, какие гены транскрибируются на данной стадии развития.

Итак, с помощью этих и других технологий генетики начинают выяснять общие модели организации живого с функциональной и структурной стороны. Для обработки громадного количества информации появилась особая ветвь науки - биоинформатика. Ближайшие десятилетия обещают стать временем поистине великих открытий.

Генетика / Бартон Гуттман, Энтони Гриффитс, Дэвид Сузуки, Тара Куллис. - М.: ФАИР-

ПРЕСС, 2004. - 448 с: ил.

Геномика Геномика – комплексная наука, изучающая геномы. Разделы геномики: структурная геномика – содержание и организация геномной информации; функциональная геномика – реализация информации, записанной в геноме, от гена – к признаку; сравнительная геномика – сравнительные исследования содержания и организации геномов разных организмов; Все эти разделы геномики вносят вклад в фундаментальную биологию (индивидуальное развитие, эволюция), здравоохранение, сельское хозяйство и биотехнологию. Итог структурной геномики – получение последовательности нуклеотидов (сиквенс от англ. sequence), которая представляла бы полностью каждую из хромосом с первого нуклеотида до последнего. 2

Для того, чтобы получить такой сиквенс, сегодня приходится определять последовательность нуклеотидов в достаточно коротких отрезках ДНК, длиной примерно 1000 позиций. В геноме человека 3 миллиарда позиций, значит, его надо разбить на куски, которые и будут «читаться» . Затем нужно восстановить единую последовательность нуклеотидов из сравнения отдельных прочтенных отрезков текста. Восстановление основано на сравнении определенных последовательностей и выявлении в них перекрывающихся (идентичных) участков текста. Длина участка перекрывания должна превышать длину последовательности, которая может встретиться в данном геноме по причинам случайного характера. Например, в геноме человека 3 х109 п. н. случайно может встретится последовательность длиной 15 нуклеотидов – поскольку в каждой позиции может находится один из четырех нуклеотидов, то вероятность того, что заданные нуклеотиды окажутся в 15 позициях подряд 415 =230 что примерно равно 109. То есть в отрезке длиной 109 позиций заданная 15 -нуклеотидная последовательность может встретиться 1 раз по причинам случайного характера. 3

Но дело в том, что в ДНК нуклеотиды расположены не случайно и это является проблемой для восстановления последовательности из перекрывания отрезков. Если две последовательности из 1000 нуклеотидов перекрываются на 20 нуклеотидов или сто – это еще ничего не значит, так как весь этот фрагмент из 1000 нуклеотидов может быть несколько раз повторен в геноме. Поэтому нужно было сначала расставить вдоль генома фрагменты, а уже потом выявлять их перекрывание на основе сиквенса. Таков был путь мирового сообщества при секвенировании генома человека. (секвенированием в русскоязычной литературе называют процесс определения последовательности нуклеотидов. Этот термин также является калькой с английского названия). Как это можно было сделать? Нужно было поставить какие-нибудь «буйки» в геноме человека, какой участок стоит за каким. Последовательность таких участков и составляет карту генома. Первой такой картой стала карта генетическая. Она показана на рисунке слева. 4

Рядом показана окрашенная хромосома, на которой видны поперечные полоски. Поперечная окрашенность индивидуальна для каждой хромосомы, каждая полоска имеет собственный номер, который представляет собой "адрес" данного участка на хромосоме. В каждом таком участке миллионы пар нуклеотидов, последовательность которых должна быть определена. Получены полиморфные маркеры, то есть найдены такие участки хромосомы, которые у разных людей (или на разных хромосомах одного человека) содержат неидентичные последовательности нуклеотидов. Заметим, что для генетической карты с интервалом в 10% рекомбинации нужно 300 равноудаленных маркеров, чтобы отличить одну хромосому от другой в данном локусе. 5

В основе детекции ДНК маркеров лежит метод амплификации (размножения) фрагментов ДНК in vitro с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Методом ПЦР можно синтезировать фрагмент ДНК in vitro (в пробирке) и получить его как химически чистое вещество. Для синтеза используются короткие синтетические отрезки ДНК, называемые праймерами (затравка для синтеза). С 3’-конца праймера начинается синтез фрагмента ДНК по матричной нити, на которую он отжигается (прилипает при комплементарном взаимодействии между нуклеотидами праймера и матрицы). За один цикл достройки ДНК из двух нитей ДНК получили 4. В следующем цикле из 4 нитей получится уже 8 и т. д. Каждый цикл занимает несколько минут. За 30 циклов ПЦР целевой фрагмент размножится в 1 миллиард раз, что позволяет наблюдать фрагмент (после окраски). Время проведения каждого этапа ПЦР в будущем сократится на 2 -3 порядка, таким образом, что каждый цикл будет проводиться за секунды. 6

Для различения папиной и маминой хромосом использовали так называемые STR-маркеры (Short Tandem Repeat), состоящие из одинаковых звеньев, чаще всего звено состояло из пары нуклеотидов ЦА. То есть нашли места в геноме, где повторялись эти вкрапленные звенья. Допустим в папиной хромосоме в фрагменте из 100 пар нуклеотидов была вставка из 20 звеньев, а в таком же месте маминой хромосомы было вставлено 22 звена. Этот фрагмент ДНК размножили in vitro, с точностью до нуклеотида методом полимеразной цепной реакции (ПЦР). Длина этих фрагментов будет у папы 100+20 х2=140, а у мамы – 100+22 х2=144. При фракционировании образованных фрагментов в геле под действием постоянного тока (электрофорез) мы можем провести разделение фрагментов по размеру. Чем тяжелее фрагмент, тем меньше его электрофоретическая подвижность и тем ближе к старту он будет находиться. Если у родителей ребенка длины фрагментов составляли (как указано в примере выше) 140 и 144 п. н. , то и у ребенка будут эти полоски присутствовать. 7

Описанный подход применяется не только в фундаментальных исследованиях, но и в практике идентификации личности при судебномедицинской экспертизе. Допустим данный локус в хромосоме может находиться в одном из 10 альтернативных состояний. (Эти состояния, аллели, различимы по их электрофоретической подвижности). Эти состояния различают 10 хромосом или людей с такими хромосомами. Если мы возьмем в анализ еще один локус (на другой хромосоме) с такими же характеристиками, то по этому локусу мы тоже различим 10 хромосом или людей. А по сочетанию состояний в этих двух локусах различимы 10 х10=102 хромосом. Пять таких локусов позволят различить 105 хромосом. А поскольку хромосом у каждого из нас по паре, то сочетания аллелей этих пяти локусов дают 105 х105 = 1010 вариантов. Это число вариантов больше, чем число людей на земле. На практике при идентификации используют набор аллелей из 13 локусов, хотя и пяти как мы видим, может быть волне достаточно. Генетическая карта была первой картой генома человека, на основе которой строилась дальнейшая работа по картированию. Эту карту соотнесли с физической картой, показывающей порядок следования клонированных фрагментов ДНК вдоль генома (см. рисунок 1 справа). 8

Физические карты генома часто представлены наборами фрагментов ДНК, клонированные в векторных молекулах (рекомбинантных ДНК), упорядоченно расположенных относительно друга. Такой набор непрерывно перекрывающихся фрагментов ДНК называется контиг. Для того чтобы выявить перекрывание клонированных фрагментов ДНК и понадобилась ранее установленная карта генетических маркеров. Перекрывание устанавливалось между «большими» молекулами ДНК, содержащими примерно 106 пар нуклеотидов, которые были клонированы в искусственных хромосомах дрожжей (YAC-клоны, сокращение от Yeast Artificial Chromosome). Искусственные, потому что у них удалили основную часть собственно дрожжевой ДНК и вставили человеческие фрагменты ДНК. Такие конструкции способны реплицироваться в клетках дрожжей. Размер хромосом дрожжей как раз примерно 1 -2 миллиона пар нуклеотидов. Как устанавливали перекрывание клонированных фрагментов ДНК? У нас есть YAC-клон № 1 с протяженным фрагментом клонированной ДНК, а в нем, предположим, обнаружен и маркер А и маркер В, для которых из генетических данных известно, что они соседние на карте. В YAC-клоне № 2 уже нет маркера А, а есть маркеры В и С, причем также известно из генетической карты что В и С – соседи. В клоне № 3 есть маркеры С и D. Сопоставление данных по присутствию генетических маркеров А, В, С и D в YAC-клонах показывает что они перекрываются в последовательности YAC № 1, № 2, № 3. 9

Вставки ДНК из 3000 YAC-клонов примерно равны по длине геному человека. В анализ на перекрывание YAC-колонов взяли 30000 клонов, с тем чтобы каждая точка генома перекрывалась несколькими клонами. Вначале неизвестно было, как они расположены, но в среднем каждая точка генома перекрывалась 10 раз. Было использовано порядка 3000 STR-маркеров, и посмотрели, эти как маркеры и клоны друг с другом перекрываются. В качестве метода, выявляющего присутствие генетического маркера в составе YAC-клонов, использовался ПЦР. На заключительном этапе составления физической карты генома человека в этих 30 000 YAC-клонов, выявлено присутствие примерно 30000 маркеров. Это один маркер на 100 000 пар нуклеотидов. Расстояние между концами YAC-клонов также составило 100 000 п. н. (при длине клона 1 млн. п. н.). Картирование проводили на роботизированных машинах, которые проводили приблизительно по 300 000 ПЦР-реакций в день. Позволило расставить в контиг все YAC клоны. Предполагалось, что они будут непосредственно секвенироваться. Однако в дальнейшем была использована друга схема секвенирования клонов. Картированные YAC-клоны часто использовали для поиска генов, находящихся во вставке YAC, а к сиквенсу этот этап не привел. 10

11

Перекрывание можно также посмотреть по расположению специфических рестрикционных сайтов. Рассмотрим этот способ подробнее. Структура фрагмента ДНК выявляется по положению участков расщепления специфическими ферментами – рестрикционными эндонуклеазами (рестриктазами). Каждая рестриктаза узнает последовательность нуклеотидов определенной длины и состава. Например, рестриктаза Eco. RI узнает GAATTC и никакую другую (расщеплять ДНК она будет в среднем один раз на 46=4096 нуклеотидов), Bam. HI узнает GGATTC. Предположим, что у нас есть клонированный фрагмент ДНК, длиной 13000 нуклеотидов, и мы расщепили его рестриктазой Bam. HI, получив два фрагмента по 9 и 4 тысячи нуклеотидов. Затем если мы расщепим Eco. RI, получим фрагменты по 8, 3 и 2 kb. Когда мы посмотрим двойное расщепление, получим фрагменты размерами 7, 3, 2, 1 kb. Размеры известны, потому что рядом есть дорожка, в которой идет фракционирование молекул стандартного размера, что позволяет создать калибровочную кривую. Если мы проведем второе расщепление, то увидим, что фрагмент в 9 kb расщепился на фрагменты по 7 и 2 kb. Эта специфическая последовательность сайтов и специфическое расстояние между ними является портретом молекулы (см. рис. ниже). По этим портретам мы можем сопоставлять молекулы друг с другом, независимо от того, что они кодируют, и что в них находится. Это очень типичная процедура. Расщепление фрагмента ДНК каждой рестриктазой по отдельности и их смесью позволяет создать рестрикционную карту фрагмента. 12

13

14

Итак, мы расставили молекулы методом генетического и физического картирования. Вернемся к методу секвенирования. Использовалась примесь дидезоксинуклеотидов - dd. NTP (на рисунке – справа; у них нет OH-группы у 3’-атома углерода), которая добавлялась к обычным дезоксинуклеотидам (на рисунке слева). И при синтезе ДНК in vitro это приводило к прекращению синтеза цепи в позиции, в которой вставился dd. NTP. Через позицию 3’ идет присоединение нуклеотида к строящейся молекуле ДНК. Но если на 3`- конце не будет гидроксильной группы, а водород, то синтез дальше не пойдет – он будет терминирован. Это используется следующим образом. У нас есть матрица (нить ДНК), которую надо секвенировать. Если идет синтез, и в первой позиции матрицы стоит А (см. рис. ниже), то может встроиться обычный Т и синтез пойдет дальше, а может встроиться dd. ТTP и синтез дальше не пойдет. Произойдет обрыв цепи, а полученный синтезированный огрызок займет при фракционировании определенную позицию согласно своему размеру. Следующий обрыв будет соответствовать второй букве секвенируемой нити, и также займет свою позицию согласно длине при фракционировании на электрофорезе и т. д. И так по каждому нуклеотиду. Так мы восстановим последовательность нуклеотидов в секвенируемой нити ДНК. Этот метод предложил Фрэд Сэнгер, за что получил свою вторую Нобелевскую премию. 15

16

17

Рассмотрим определение последовательности нуклеотидов в клонированном фрагменте ДНК. Клонированный фрагмент находится в так называемой векторной молекуле ДНК – молекуле, которая позволяет ввести его в клетку (обычно это клетка бактериальная, но иногда используются и дрожжевые клетки). Все работы по секвенированию генома человека прошли при участии бактериальных векторных молекул. Участок вектора, прилежащий к вставке, содержит последовательность нуклеотидов, комплементарную универсальному секвенирующему праймеру. С этого праймера инициируется синтез ДНК in vitro, который с первого нуклеотида будет идти по матрице клонированного фрагмента ДНК человека. Универсальных праймеров используется два, один к последовательности вектора прилежащей к одному концу вставки, другой праймер к последовательности вектора прилежащей к другому концу вставки. С одного из праймеров клонированный фрагмент секвенируется с одной стороны, а с другого праймера – с другой стороны. 18

Вектор у нас один и тот же, а вставок – миллионы, но все они секвенировались с одной и той же пары праймеров. Основная часть генома была секвенирована при клонировании фрагментов в 2 тысячи пар нуклеотидов, потому что тысяча читалась с одной стороны и тысяча – с другой. Каждая точка генома человека была просеквенирована несколько десятков раз в составе разных клонированных молекул ДНК. То есть расстояние в геноме между концами клонированных и секвенированных фрагментов ДНК составляло меньше 200 пар нуклеотидов. От каждой точки старта было прочитано около 1000 нуклеотидов. Из всего этого набора «текстов» воспроизводилась структура генома человека. Но собрать эти 1000 -буквенные сиквенсы в контиги длинной в мииллионы букв удалось лишь на основе того, что большая часть фрагментов была предварительно картирована относительно хромосом человека. Без картирования сиквенс мог попасть в повторяющийся участок генома, а продолжение сиквенса из такого участка имеет столько вариантов продолжений, сколько раз повтор присутствует в геноме человека (некоторые повторы – миллион раз). Поэтому сначала устанавливали последовательность расположения клонированных фрагментов в геноме. Это было сделано для фрагментов размером около 200 тыс пар нуклеотидов, а уже затем их секвенировали. Процесс секвенирования по методу Сенгера может быть автоматизирован. Механизм представлен на следующем слайде. 19

20

На слайде виден праймер, синтез с которого идет влево. У нас есть дидезоксинуклеотидфосфаты T, A, C и G. Каждый из них занимает свою позицию во фрагменте синтезируемом по исследуемой матричной нити. На предыдущем слайде каждой букве соответствовала отдельная дорожка геля, их всего четыре. Если каждую из букв терминирующих синтез пометить в свой цвет, то все терминаторы можно объединить в одной пробирке и фракционировать продукты в одной дорожке. Обрыв синтеза в позиции данной буквы даст фрагмент со своим положением в геле после фракционирования. Каждое положение обрыва будет характеризоваться цветом той- буквы терминатора, на которой произошел обрыв. В ходе фракционирования терминированных фрагментов лазер будет фиксировать на детекторе последовательные пики - какая прошла полоса по счету, и какого она цвета. Далее эта последовательность пиков дешифруется в последовательность нуклеотидов в молекуле ДНК. Точность сиквенса (установления того, какая именно буква терминировала синтез в данной позиции) определяется соотношением высот пиков соответствующих разным буквам в одной и той же позиции секвенируемого фрагмента. Между двумя пиками разных цветов в одной позиции было заданное дискриминирующее значение. Техника отрабатывалась так, что буква считалась достоверно установленной для данной позиции, если основной пик в этой позиции был выше других в заданное количество раз. 21

22

Бактерия H. influenzae была первым свободно живущим организмом, геном которого был полностью секвенирован. Поскольку геном бактерии маленький, около тысячи нуклеотидов, и повторов нем мало (да и короткие они), то предварительное картирование клонированных фрагментов ДНК не понадобилось – эти фрагменты сразу сиквенировались. Такая работа была проведена в институте генетических исследований ТIGR под началом Крега Вентера. Вентер затем организовал фирму Селера, секвенировавшую геном человека, где он применил ту же схему секвенирования что и для бактерии. Причем деньги он взял у частных фирм, так как государство не верило, что у него что-нибудь получится. Мировое сообщество предварительно использовало генетическую и физическую карты, относительно которой была выстроена последовательность перекрывающихся фрагментов клонированной ДНК (контиг), предназначенной для секвенирования. То есть сиквенс генома человека был собран из фрагментов правило благодаря использованию упорядоченного набора клонов и установлению последовательности нуклеотидов картированных клонов. 23

24

25

Вентер же, в отличие от мирового сообщества, использовал случайный набор клонов и попытался восстановить полную последовательность нуклеотидов прямо из сравнения сиквенсов всей кучи фрагментов. На бактерии у него это удалось, но на человеке это сработало лишь потому, что он использовал публично доступные данные от мирового сообщества о том, какие молекулы где расположены в геноме человека. Вентер опубликовал свою работу на месяц раньше, чем мировое сообщество, потому что он ничего не картировал, а использовал секвенирование совсем коротких рекомбинантных молекул. Общую длина секвенированных фрагментов ДНК была у Вентера в пять раз больше, чем сделало все мировое сообщество. Используя данные мирового сообщества о картированных фрагментах, Вентер смог восстановить в единую последовательность нуклеотидов все то, что он насеквенировал. Если бы данных мирового сообщества не было бы, то вся его работа была представлена короткими отрезками, которые бы разветвлялись, из-за того, что в геноме находятся повторы. В результате проделанной работы вышло две статьи: статья Вентера в журнале Science и статья Лэндера – лидера мирового сообщества - в журнале Nature. 26

Проект генома человека начат в 1990 г. Первая (черновая) версия последовательности нуклеотидов была закончена в 2000 г. Конечная версия, которая больше не будет совершенствоваться (названная Build 35) - закончена в 2004 г. 27

Последняя версия последовательности содержит 2, 85 миллиардов пар нуклеотидов с 341 брешью, то есть в этих местах по каким-то причинам секвенировать геномную ДНК не удалось. Сиквенс покрывает около 99% той части генома человека, которая представлены в некомпактизированной форме – эухроматине. Точность сиквенса в конечной версии – 1 ошибка на 100 тысяч позиций подряд. Еще точнее секвенировать весь геном уже никто не будет. Напомню, что папин геном отличается у вас от маминого генома примерно в 1 позиции на тысячу. Предсказанное число генов у человека теперь 2025 тысяч, что немного меньше, чем предсказывалось раньше. 28

Кроме данных о последовательности нуклеотидов геномной ДНК человека (референтная последовательность) созданы также базы данных: 1) о последовательности нуклеотидов транскрибируемых участков ДНК (EST database, EST = Expressed Sequence Tags), которая характеризует не геномную ДНК, а то, что транскрибировалось с ДНК. 2) о положении и содержании отличий (полиморфизмов, то есть нуклеотидных замен) других известных последовательностей ДНК человека от референтной последовательности (SNP database, SNP = Single Nucleotide Polymorphism) 29

Геномика – недавно возникшее направление науки, объектом изучения которой являются геномы всех организмов, не только человека. Одно из направлений геномики - воссоздание суммарной карты метаболических путей живого, состоящей из частных метаболических карт, характерных для каждого организма. Выявление в разных геномах определенных наборов генов метаболических функций позволяет предположить функциональную связь генов этого набора в едином участке метаболической цепи. В частности, один из подходов такой. Исследуют ряд видов (рисунок ниже), к примеру, бактерий. У первых трех видов есть гены для белков 1, 3 и 6. Остальные белки у некоторых есть, а у некоторых нет. Этот набор генов (1, 3 и 6) отсутствует у четвертого вида. Такого рода присутствие-отсутствие цельного набора генов позволяет сделать предположение о том, что кодируемые ими белки каким-то образом связаны в метаболическом цикле. Гены такого набора необязательно располагаются рядом в геноме. 30

31

Еще один критерий функциональной связи между генами, особо хорошо работающий на бактериях, основан на сохранении соседства одних и тех же (по сиквенсу) генов у разных видов бактерий. У бактерий нередко бывает, что группа генов, расположенных вместе, отвечает за группу последовательных этапов метаболизма. Такая группа генов регулируется на уровне транскрипции единым образом и называется оперон (единица операции). Часто последовательность расположения генов в опероне совпадает с последовательностью метаболических этапов. Для эукариот соседнее расположение функционально связанных генов не типично, хоть такие гены и разбросаны у них по геному, скоординированная 32 регуляция транскрипции есть и эукариот.

На данный момент просеквенировано несколько сотен геномов бактерий и геномы нескольких эукариот. Теперь мы знаем, что - у бактерий размеры генома не бывают меньше 0, 5 миллионов пар нуклеотидов, - а максимальный размер генома около 10 миллионов п. н. , - у дрожжей (эукариотический организм)– порядка 12 миллионов, - у червя нематоды – 97 млн. , - а у человека – 3 миллиарда пар нуклеотидов. - А число генов у про- и эукариот различается уже в меньшее число раз. Минимальное количество генов у бактерии микоплазмы – 470 штук, - у дрожжей – 6000, - у нематоды – 19000, - а у человека около 20000, то есть от нематоды и мухи по количеству генов мы не сильно отличаемся. Количество хромосомной ДНК, приходящейся на один ген - у бактерий -1000 п. н. то есть гены упакованы очень плотно; - у дрожжей – 2000 п. н. , и кое-где гены разделены некоторым пространством; - у нематоды – 5000 п. н. на ген и появляются пространства внутри генов – интроны; у человека – 30000 п. н. - У нас в геноме большие межгенные пространства и большие пространства внутри генов, которые не переходят в зрелую РНК. 33

Заметим, все эти организмы по размерам зрелых транскриптов не сильно отличаются. В зрелой РНК белок-кодирующий участок занимает обычно основную часть последовательности. Часть генов кодируют РНК, с которой белок вообще не синтезируется. Перед белок-кодирующей последовательностью в зрелой м. РНК расположены участки регуляции трансляции, а после белок кодирующей последовательности – участки определяющие стабильность (время жизни РНК). У прокариот последовательности перед и после белок-кодирующей части гораздо короче, чем у эукариот. Так что по размерам РНК все организмы ближе, чем по размерам генов, а по размерам белков – еще ближе. 34

Экспериментально проводили «выключение» каждого гена у многих бактерий, и смотрели, выживут они в данных условиях или нет. Оказалось, что у бактерий можно «выключить» (поочередно) около 50% генов, и они все равно будут жить. У дрожжей можно выключить 80% генов и они все равно будут жить. Как это было экспериментально показано? В геном клетки вставляют репортерный фрагмент ДНК, который позволяет замерить скорость транскрипции и трансляции в точке вставки фрагмента. Известно поэтому, что и траснкрипция и трансляция репортерного гена через данную точку в данных условиях происходит с регуляторных элементов гена, разорванного вставкой репортера, хотя разорванный ген сам не функционален. Таким образом 80% генов дрожжей по одному «убивали» и видели, что клетка дрожжей все равно живет. 35

У нематоды на 20 000 генов получено несколько десятков тысяч мутаций, которые, по-видимому, поражают около 2 000 генов (так называемых групп комплементации). Это около 10% всех генов нематоды. То есть если «выключить» около 90% генов, клетка будет продолжать жить. У человека из 20 000 генов только в 1700 (меньше 10%) известны мутации, которые связаны с болезнями, наследуемыми по Менделю как моногенный признак. 36

37

В связи с этим понятно, что количество генов, мутации в которых будут приводить заболеваниям человека (по крайней мере, к летальным), скорее всего, не увеличится значительно, по сравнению с тем, что уже известно к настоящему времени. Сейчас в интернет доступна база данных OMIM (Online Mendelian Inheritance in Man) по генам, мутации которых приводят к заболеваниям и проявляются как менделирующие признаки. В геноме не все его участки транскрибируется. В связи с этим встал вопрос экспериментального определения, где и сколько в геноме генов. Под одним геном понимается участок ДНК, который соответствует единому транскрипту, образованному с этого участка. При транскрипции участка ДНК получается так называемыя пре-м. РНК, которая содержит и экзоны (участки, переходящие затем в зрелую м. РНК), и интроны (вставочные последовательности, которые удаляются из м. РНК). Интроны удаляются из пре-м. РНК в результате процесса, называемого сплайсингом. Остающиеся в результате участки пре-м. РНК, называемые экзонами, соединяются в единую нить. Она называется зрелой м. РНК. (Некоторые из РНК не кодируют белок. Называть такие РНК матричными, т. е. м. РНК терминологически не верно, хотя они соответствуют генам и имеют свои функции.) 38

Зрелая м. РНК используется как материал для экспериментального исследования наличия гена в геноме, его положения и интрон-экзонной структуры. Инструментом для такого исследования являются биологические микрочипы. Первый патент на микрочипы принадлежит коллективу под руководством Андрея Дарьевича Мирзабекова, который был директором Института молекулярной биологии РАН и заведующий одной из кафедр ФМБФ МФТИ. Он предложил иммобилизовать синтетические фрагменты ДНК на твердые матрицы, и проводить гибридизацию этой матрицы с исследуемым образцом нуклеиновой кислоты – ДНК или РНК. Как исследовать, действительно ли ген существует, то есть транскрибируется ли данный участок ДНК? Для этого ген представляют в чипе частью его последовательности – олигонуклеотидом, который иммобилизован в микроплощадке с определенными координатами на этой матрице. Этот олигонуклеотид соответствует части экзона, предсказанного компьютером на основе сиквенса геномной ДНК. Чтобы выяснить, действительно геном в данном участке транскрибируется, берется клетка и из нее выделяется суммарная РНК. Из всех этих молекул РНК получают ДНК-копии, которые флуоресцентно метят и проводят гибридизацию с иммобилизованными на микрочипе олигонуклеотидами. Если в данных условиях какие-то площадки с олигонуклеотидами «молчат» (они показаны черным), то это значит, что участок геномной последовательности, комплементарной этому олигонуклеотиду, не транскрибируется. Если же площадка матрицы «светится» , значит олигонуклеотиды в этой площадке прогибридизовались с флуоресцентно меченым продуктом, то есть соответствующий участок генома транскрибировался и действительно 39 является частью какого-то гена.

40

В реальном эксперименте все участки на матрице в той или иной мере «светятся» . Поэтому без сравнения с некоторым стандартом, нельзя сказать с чем связано появление сигнала в данной площадке чипа. Чтобы определить, является ли полученный результат ошибкой эксперимента или нет, проводится сравнение двух объектов. Для этого берутся некие клетки А, из них получают РНК, и их флуоресцентно метят (на слайде - красным). То же проводят и с клетками В, но метят РНК другим цветом (зеленым). Затем проводят гибридизацию чипа со смесью этих двух препаратов РНК. Если сигнал в данной площадке на чипе получается красным, значит в клетках А транскрипция данного гена сильнее, чем в клетках В. Если сигнал зеленый, то транскрипция сильнее в клетках В. Если красного и зеленого поровну, то получится желтый цвет. Таким образом, возникает возможность сравнивать уровень траснкрипции данного гена в разных клетках - B, C, D и т. д. , нормируя его на уровень транскрипции этого гена в клетках А. При этом сравнивают транскрипцию гена в разных тканях, в них гены экспрессируются поразному. Можно сравнивать опухоль и норму, тогда выявляют те гены, которые специфически более сильно транскрибируются в опухоли или в норме. Можно посмотреть разные стадии развития, как работают гены в зародышевом развитии и во взрослом состоянии. Таким образом, гибридизация на микрочипах позволяет узнать, какие гены в геноме в данных условиях транскрибируются, а именно этим он и проявляет свою жизнь. 41

42

Гибридизация на микрочипах позволяет проверить компьютерное предсказание о том, что данный фрагмент генома – экзон, (участок, остающийся в зрелой м. РНК) и он действительно транскрибируется. Каждый ген не обязан экспрессироваться во всех тканях и в каждых данных условиях. Поэтому нужно исследовать много условий и тканей, чтобы выявить все участки генома, соответствующие экзонам. На слайде каждая гибридизация на данном чипе соответствует какому-то одному типу ткани или условиям ее функционирования. Красным указано количество экзонов в каждой из хромосом, существование которых экспериментально подтверждено. На каждом чипе 1 090 408 площадок с пробами-олигонуклеотидами, соответствующими каждому из 442 785 экзонов человека, предсказанных компьютером. Олигонуклеотиды в площадках соответствуют как транскрибируемой нити ДНК, так комплементарной нити. В геноме человека транскрипция комплементарных нитей ДНК, характерна для небольшой части генов. Такие гены перекрываются и, возможно, взаимно регулируются на уровне транскрипции. У бактерий перекрывание генов гораздо более частое явление, чем у эукариот. 43

44

Микрочипы могут быть использованы для исследования изменений уровня транскрипции генов, связанной с возникновением или прогрессией заболевания, (например, опухолевого или инфекционного). Предполагается, что каждая болезнь, характеризуется своим штрихкодом - изменением уровня транскрипции набора генов характерного именно для данной болезни. Этот анализ является очень важным для усовершенствования функциональной диагностики в медицине. 45

Провели такой опыт. Взяли образцы РНК из опухолей у двух групп больных. В одной группе метастазы были, а в другой – нет. Метастазы – это возникновение новых очагов опухоли в организме, пространственно отделенных от исходного очага. На данном чипе довольно резко проходит граница между группами зеленых и красных площадок. То есть видны гены, изменение уровня экспрессии которых характерно для стадии метастазирования опухоли, что можно использовать для диагностики этой стадии. Пока этот метод диагностики недоработан. Предполагается, что в будущем по штрих-коду изменения экспрессии в определенном наборе генов можно будет диагностировать конкретные заболевания и стадии их развития, а следовательно и знать, как лечить. 46

47

Сделаем небольшое отступление. Генетические карты были построены для многих видов. На видах с подробными генетическими картами проводится экспериментальный поиск мутаций связанных с регистрируемыми морфологическими изменениями. На слайде показана схема такой работы на рыбах. Вначале проводят мутагенез. После этого получают гибриды первого поколения. Их используют для возвратных скрещиваний с мутагенизированными родителями. Если оказывается, что какой-то признак выявляется, то смотрят, с какими генетическими маркерами он сонаследуется. Таким образом исследуется, какие гены повреждены мутациями, выявляемыми фенотипически. 48

Обобщая вышесказанное, гены (мутации), определяющие морфологические или биохимические признаки, могут быть идентифицированы после общегеномного мутагенеза (например, EMS) и генетического скрининга. Для этого проводят анализ сонаследования исследуемого аллеля с полиморфными маркерами ДНК, перекрывающими весь геном в известной последовательности, и расстояние между которыми достаточно мало, чтобы отнести исследуемый аллель к одному из интервалов генетической карты. 49

На этом слайде показано, что существуют бактерии, у которых количество генов может быть больше, чем например у дрожжей. Мы привыкли считать, что бактерии устроены проще, но это не всегда так. Существуют бактерии, у которых генов порядка 10 тысяч. 50

51

На этом слайде обращает внимание, что хотя число генов разнится у разных видов, число так называемых белковых доменов (структурные единицы в белке, отвечающие за единичную функцию) отличаются в пределах разных царств живого (прокариоты и эукариоты) до полутора раз, не более. Конечно комбинации этих доменов разные, но сами домены похожи, то есть они кодируются сходными по последовательности нуклеотидов участками генома и эти сходные участки имеют общее происхождение в эволюции. Обратно заявление будет не верно. Если функции белков сходны, это не означает, что их структура будет одинакова. Одна и та же функция, например, один и тот же каталитический процесс, может выполняться разными, не родственными по происхождению белками. Один и тот же процесс может катализироваться даже и белком 52 и РНК (рибозим), у которых нет ничего общего в происхождении.

На данном слайде показаны средние значения характеристик различных элементов генов человека. Средний размер экзона - 145 нуклеотидов, интрона – 3365 и т. д. В общей сложности получается, что белоккодирующая часть гена невелика по сравнению с белок-некодирующей частью, поэтому, когда происходят какие-нибудь мутации, велика вероятность, что промутирует белок-некодирующая часть. Такие мутации или вообще не скажутся на структуре белка, или приведут к изменению его количества, но не структуры (изменения регуляторных участков инициации транскрипции или стабильности РНК), или приведут к драматическим изменениям структуры РНК (мутации в мишенях для сплайсинга). 53

Распределение генов человека по размеру Размер, тыс. пар нуклеотидов 500 % общего числа 23, 3 35, 6 20, 2 13, 0 6, 7 1, 2 54

Общая структура генома такова (размер генома человека 3200 Mb) Гены занимают всего 1200 Мb. Основная часть этого пространства приходится на псевдогены (нефункциональные гены, инактивированные мутациями), различные фрагменты генов и интроны. На экзоны функциональных генов (суммарная длина зрелых РНК) приходится 48 Мb. Здесь есть некоторое лукавство, так как на одну пре-м. РНК в среднем приходится 1, 4 зрелых РНК. А из одной зрелой м. РНК в некоторых случаях может получиться до тысячи белков. Межгенная ДНК занимает 2000 Мb, она представлена главным образом короткими рассеянными по всему геному повторяющимися последовательностями, которые занимают 1400 Мb. Один из таких повторов – Alu-повтор, длиной около 300 п. н. , повторен в геноме миллион раз. Другой примечательный тип рассеянных повторов – длинные концевые повторы (LTR, long terminal repeat). Эти элементы являются молекулярными свидетельствами перескока фрагмента ДНК внутри генома. Общая протяженность таких участков на молекуле ДНК– 250 Мb. 55

Число генов у человека оценено в 20 - 25 тысяч, (оценка 2001 г. - 35 – 40 тыс.). 56

Основная часть генома человека занята не генами: 63 -74% длины – межгенные пространства, половина из них – повторы. Ген человека внутри «пустой»: 95% внутригенной ДНК вырезается (интроны). Общая длина белок кодирующих областей около 1% от геномной ДНК человека. Это лишь в 3 раза больше длины генома бактерий. 57

Примечание: От 26383 до 39114 генов человека были предсказаны компьютером (в 2001 г.), но лишь менее 7000 были подтверждены на человеке. И более, чем для 80% генов, хоть в чем-то была пересмотрена структура в период с 2001 по 2003 г и продолжает уточняться на микрочипах. Сейчас предсказанное число генов у человека 20 -25 тысяч и существование около 19 000 из них экспериментально подтверждено – с них образуются транскрипты. Имеющееся на данный момент определение гена (ген – это фрагмент геномной ДНК с котранскрибируемыми субфрагментами) - не полное. Например, возможна транскрипция с двух цепей. Плохо выявляются короткие гены и белок-некодирующие гены. Их, по крайней мере, под тысячу, но точное число не известно. Такие гены – тоже гены, хоть белок они и не кодируют. Они - гены, потому что с них образуется РНК. Причем РНК некоторых белк-некодирующих генов состоит из нескольких экзонов. То есть, клетке эти РНК зачем-то нужны, но мы пока не понимаем, зачем. 58

59

Предположим, образовался транскрипт зрелой м. РНК, и он может содержать экзоны 1, 2, 3. Это вовсе не означает, что он обязательно будет содержать их все. У нас может появиться РНК, которая будет содержать экзоны 1 и 2 или экзоны 1 и 3, и в результате с них будут образовываться разные белки. Такой способ процессинга (обработки) генетической информации называется альтернативный У человека есть ген slo. Он «работает» во внутреннем ухе, в частности, этот белок присутствует в ворсинках, которые отвечают за распознавание высоты звука. Он состоит из 35 экзонов (на рисунке - прямоугольники), 8 из которых (синие) могут или присутствовать, или отсутствовать в зрелой м. РНК. Возможны 8! = 40 320 вариантов сплайсинга, но только около 500 из них обнаружены. Других, может быть, и нет, то есть природа не должна, вообще говоря, реализовывать все возможные варианты. 61

62

Биологическая роль множественного сплайсинга заключается в следующем. Разные типы волосяных клеток внутреннего уха реагируют на звуки разных частот от 20 до 20 000 герц. Различия клеток в восприятии частоты частично определяются свойствами альтернативных сплайс-форм белка Slo. Как определяется выбор между вариантами сплайсинга неизвестно. Известны случаи, когда с одного локуса образуются тысячи разных белков. К ним, в частности, относятся белки, которые образуются на поверхности нервных клеток. Таким образом, они, видимо, как-то участвуют в распознавании друга, и в формировании нейронных сетей. В этом случае происходит выбрасывание не только экзонов или интронов, но и может реализовываться и альтернативный участок инициации транскрипции. Такие случаи известны, в частности, для человека, когда у разных генов есть несколько разных промоторов, каждый из которых дает свою РНК, в которой, в зависимости от того, где он начался, будет дополнительный экзон, связанной с различной длиной транскрипта на 5’-конце. 63

64

Механизм сплайсинга Процесс соединения одного экзона с другим происходит в участках определенной последовательности нуклеотидов. Донорный сайт сплайсинга всегда заканчивается одним из двух динуклеотидов, обычно – AG. В начале происходит нуклеофильная атака донорного экзона, затем происходит разрезание, кусочек GU заворачивается и присоединяется к А. Затем разрезается вторая часть, первый экзон соединяется со вторым, и образуется интрон. 65

66

Если посмотреть, какую долю гена составляют экзоны, то самый большой известный транскрипт (у гена миодистрофина) имеет длину около 2, 5 миллионов нуклеотидов. У него в зрелую часть РНК переходит 14 тыс нуклеотидов (0, 6%), а остальные 99, 4% от первичного транскрипта выкидывается (интроны). С ростом размеров гена в хромосоме его белок-кодирующая часть увеличивается незначительно, а количество интронов в гене растет. С ростом числа интронов растет число сайтов сплайсинга и вероятность их повреждения. Поэтому для генов с большим числом интронов потеря функции при мутации может быть связана не с белок- кодирующей частью ДНК, а с регуляторными элементами сплайсинга. Секвенирование генома человека показало, что некоторые экзоны многократно повторены в геноме. Это могут повторы экзонов в составе одного гена, или присутствие одного и того же экзона в составе нескольких разных генов. Получается, что экзоны, основные элементы структуры РНК, то есть белок-кодирующие элементы, в процессе эволюции могут каким-то образом размножаться в геноме и «перетасовываться» между разными генами. Такое явление получило название exon shuffling – перетасовка экзонов. Ниже показаны разные белки, в которых содержатся одинаковые экзоны. Таким образом, оказывается, что эволюция – это нередко именно блоковые изменения генома, а не точечные изменения. 67

68

69

На 2001 год для более 40% генов человека не было никаких предположений относительно выполняемых функций. А для остальных раскладка была достаточно условной. Принадлежность белка к одному функциональному классу не исключает его принадлежности также и к другому классу. Например, то что белок связывается с ДНК, не означает, что он не может быть еще и ферментом и т. д. Это - характеристика, которая была дана гену по той его части, которая связана с охарактеризованной функцией, но, вообще говоря, такая функция у белка может быть и не одна. Больше всего генов отвечают за экспрессию, репликацию и поддержание функций генома; около 20% - за передачу сигналов между клетками, около 17% - за то, чтобы клетка сама по себе была здорова, и для других функции не классифицированы. Оказывается, что у человека, по сравнению с дрожжами, бактериями и т. д. , в геноме имеется больше генов регуляторов транскрипции. То есть, транскрипционные регуляторы сильно размножились в эволюционной линии млекопитающих, в частности, человека. Предполагается что разнообразие регуляторов транскрипции обеспечивает большую тонкость реакции генома на сигналы внешней среды. То есть у млекопитающих больше число ансамблей координировано транскрибируемых генов, чем в других группах. 71

72

73

Ниже показано, как выглядит кусок генома человека (≈50 000 п. н.). Около половины длины этого фрагмента ДНК занимают элементы, структура и функция которых понятна. Среди этих элементов есть гены (экзоны и интроны) и псевдогены - есть гены функциональные, а есть их нефункциональные копии. Они, обычно, не содержат интронов (считается, что после транскрипции и преобразовании зрелой РНК возможен процесс встраивания ее обратно в геном в виде ДНК-копии; тогда это будет ген, содержащий лишний «хвост» и не содержащий интронов). А также короткие (SINE) и длинные (LINE) диспергированные повторы, длинные концевые повторы (LTR) – следы, оставшиеся после транспозиции, транспозоны, микросателлиты. 74

75

К 2001 году в геноме человека было выявлено 1112 “генов болезней” (то есть таких, мутации в которых ведут к заболеванию) и еще есть 94 “составных” гена, образующихся при опухолевых перестройках генома. Пока, в основном, раскрыты по механизму те заболевания, которые затрагивают белок-кодирующую часть гена. Возможно, не меньшее количество мутаций, вызывающих болезни, будет найдено и в участках регуляции транскрипции, сплайсинга и стабильности РНК. 76

77

По представлениям на март 2005 года, у человека 24000 белоккодирующих генов, из них 1700 генов ассоциированы с заболеваниями. Обнаружено 44, 500 мутаций в этих 1700 генах (в среднем 26 на ген), связанных к заболеваниям. А для остальных 10 000 известных мутаций подобная связь не выявлена. 20% смертей в США происходит из-за того, что прием лекарства осуществлялся либо не того, либо не так. Но это связано не с некомпетентностью врачей, а с тем, что мы все генетически разные. У болезней много мишеней и если бить не по той мишени, то лекарство точно не будет полезным, а потому может быть и вредным. У человека может быть специфическая реакция на данное лекарство (слишком низкая или слишком высокая скорость метаболизма). А в нашей стране ведущая пока причина смертей взрослого населения – пьянство. Эта первопричина просто скрыта за определением «травматизм» (производственный, бытовой, дорожный и т. д.), который и указывают как причину смерти. Выявлена корреляция потребления алкоголя в нашей стране и продолжительности жизни: когда, снижается потребление алкоголя, продолжительность жизни идет вверх, и наоборот. 78

Если два белка характеризуются сходной последовательностью аминокислотных (выше критической длины, до которой совпадения могут быть остатков чисто случайными), то у них есть общая предковая последовательность, и соответствующий предковый ген. Количество таких предковых структур у белков весьма ограничено. К примеру, был один ген в геноме, а потом их стало два (дупликация). Со временем мутации изменили эти гены каждый по-своему. А потом этот вид дал начало двум новым видам (см. рис. ниже). Все эти гены являются «родственниками» (гомологами), но по-разному называются. Гомологичные гены, которые мы рассматриваем в составе разных видов, называются ортологи, а гомологичные гены в одном геноме называют паралоги. 79

80

Сравнения таких родственных генов часто используют при исследовании эволюции. Эволюционная геномика (сравнительная геномика), используется очень интенсивно в медицине. Пример ее практического применения. У людей по разным причинам бывает ожирение. В частности, есть семейные формы, менделирующие. У человека мутации, вызывающие это заболевание, картированы не были. Сходный фенотип ожирения наблюдали у мышей. У мышей этот генетически картировали (картируют, на самом деле, не ген, а собственно мутацию в гене). Просеквенировали участок вокруг этой мутации, потом нашли такую же последовательность нуклеотидов в геноме человека. Стало ясно, в каком месте генома человека надо искать мутации, вызывающие ожирение у человека. Проверка этого участке генома человека у больных людей и сравнение его со той же нуклеотидной последовательностью у здоровых подтвердила, что мутации этого гена у человека, как и у мыши, приводят к 81 ожирению.

Данные по количеству генов, вовлеченных в развитие и функционирование некоторых органов и тканей человека 82

83

86

Геном актинии оказался почти таким же сложным, как у человека Прочтение генома актинии показало, что важнейшие генетические новации в эволюции многоклеточных животных произошли на самых ранних ее этапах. Последний общий предок актинии, человека и мухи, повидимому, жил около 700 млн лет назад и уже обладал весьма сложным геномом. Базовая генетическая «программа» , руководившая развитием первых животных, оказалась настолько удачной и гибкой, что последующая прогрессивная эволюция животных обеспечивалась в основном изменениями ее «настроек» , а не «архитектуры» . Геном человека оказался в целом гораздо больше похож на геном актинии (на фото - актиния Nematostella), чем геномы мухи и червя. Фото с сайта genome. jgipsf. org 87

88

89

Геномом называется полный состав ДНК клетки. Геномика - это молодая интенсивно развивающаяся отрасль генетики, изучающая принципы построения геномов и их структурнофункциональную организацию. Структурная геномика изучает нуклеотидные последовательности ДНК, в том числе строение и локализацию генов. Одной из задач структурной геномики является построение генетических карт организмов. Функциональная геномика решает задачи идентификации функций отдельных участков генома и механизмы их взаимодействий в клеточном ансамбле. Современные представления о геноме человека базируются на нескольких открытиях молекулярной биологии 70 -х годов ХХ века, основными из которых являются открытие полимеразной цепной реакции (ПЦР), позволяющей получать достаточное количество ДНК для анализа, и разработка методов секвенирования, которые позволяют расшифровывать точную последовательность нуклеотидов в цепях ДНК. 90

В конце 80 -х годов ХХ столетия началось осуществление международного проекта "Геном человека", основной задачей которого было секвенирование генома человека. Полное секвенирование генома человека было завершено в 2000 году. Секвенирование генома человека привело к открытию огромного количества однонуклеотидных полиморфизмов (ОНП) - генетических вариантов последовательностей нуклеотидов одного и того же участка ДНК у разных людей. Распределенные по всему геному ОНП используются в качестве генетических маркеров. По расчетам генетиков люди оказываются идентичными по нуклеотидным последовательностям на 99, 9%. Таким образом, генетическая вариативность людей возникает за счет различий лишь в 0, 1% генома. Данные секвенирования показали, что в геноме человека чуть более 30000* генов. Большинство генов имеют размеры до 50000 пар нуклеотидов. Число синтезируемых белковых продуктов превышает число генов в 1, 5 -2 раза. Это является результатом альтернативного сплайсинга. 91

В конце 80 -х годов ХХ столетия началось осуществление международного проекта "Геном человека", основной задачей которого было секвенирование генома человека. Полное секвенирование генома человека было завершено в 2000 году. 92

Цель этого проекта заключалась в выяснении последовательности оснований во всех молекулах ДНК в клетках человека. Одновременно должна быть установлена локализация всех генов, что помогло бы выяснить причину многих наследственных заболеваний и этим открыть пути к их лечению. Что бы последовательно приближаться к решению проблемы картирование генов человека, было сформулировано пять основных целей: 1) Завершить составление детальной генетической карты, на которой были бы помечены гены, отстоящие друг от друга на расстоянии не превышающем в среднем 2 млн. оснований (1 млн. оснований принято называть мегобазой); 2) составить физические карты каждой хромосомы (разрешение 0. 1 Мб); 3) получить карту всего генома в виде охарактеризованных клонов (5 тыс. оснований в клоне или 5 Кб); 4) завершить к 2004 году полное секвенирование ДНК (разрешение одного основание); 5) нанести на полностью завершенную секвенсовую карту все гены человека (к 2005 году). 94

Ожидалось, что, когда все указанные цели будут постигнуты, исследователи определят все функции генов и разработают методы биологического и медицинского применения полученных данных. Рассмотрев темпы ускорения работы в рамках проекта «Геном человека» , руководители этого проекта объявили 23 октября 1998 г. , что программа будет полностью завершена гораздо раньше, чем планировалось, и сформулировали «Новые задачи проекта «Геном человека»: 1) полностью завершить в декабре 1998 года работу по секвенирование генома «Круглого червя» С. elegans (это было сделано в срок); 2) закончить предварительный анализ последовательности ДНК человека к 2001 году, а полную последовательность к 2003 году; 3) картировать к 2002 году геном плодовой мухи; 4) начать секвенирование генома мыши с использованием методов ДНК искусственных хромосом дрожжей (завершить этот проект к 2005 году). Помимо этих целей, официально включен в поддерживаемый правительством США и рядом других правительств проект, некоторые исследовательские центры объявили о задачах, которые будут решаться в основном за счет частных фондов и пожертвователей. Так, ученые калифорнийского университета (Беркли), Орегонского университета и Ракового исследовательского центра имени Фрейда Хатчинсона начали программу «Геном собаки» . Международное общество секвенирование в феврале 1996 года приняло решение о том, что любая последовательность нуклиотидов размером 1 -2 Кб должна быть обнародована (через Интернет) в течение 24 часов после ее установления. 95

ЧТО БУДЕТ СДЕЛАННО ПОСЛЕ ЗАВЕРШЕНИЯ АНАЛИЗА ГЕНОМА ЧЕЛОВЕКА? Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных портретов людей, что в частности даст возможность лечить болезни, но и определить различия между популяциями. А также выявлять географические районы повышенного риска, что поможет давать чёткие рекомендации о необходимости очистке территории от загрязнения и выявить производства, на которых есть большая опасность поражение геномов персонала. Эта грандиозная задача рождает не одни радужные ожидания всеобщего блага, но и вполне осознанную тревогу юристов и борцов за индивидуальные права человека. Так, в частности, высказываются возражения против распространения персональной информации без решения тех, кого она касается. Один пример помогает понять эти тревоги: уже сейчас страховые компании нацелились на добывание таких сведений правдами и неправдами, они намериваются использовать данные против тех, кого они страхуют. Например, если подающий на страховку несёт потенциально болезнетворный ген, компании не хотят страховать таких людей вовсе или же пытаются заломить бешенные суммы за их страховки. Исходя из этого, . конгресс США уже принял ряд законов, направленный на строгий запрет распространения генетической информации относительно отдельных людей, юристы всего мира 96 интенсивно работают в данном направлении.

Области практического применения генной инженерии Создание трансгенных растений Еще 10 лет тому назад биотехнология растений заметно отставала в своем развитии, но за последние 3 года наблюдается быстрый выброс на рынок трансгенных растений с новыми полезными признаками. Трансгенные растения в США в 1996 году занимали площадь 3 млн. акров, в 1997 году площадь увеличилась до 15 млн. акров, в 1998 году – до 60 млн. акров, а в прошлом году до 80 млн. акров. Поскольку основные трансгенные формы кукурузы, сои, хлопчатника с устойчивостью к гербицидам и насекомым хорошо себя зарекомендовали, есть все основания ожидать, что площадь под генноиженерные растения в 2001 году увеличатся в 4 -5 раз. В апреле 1998 года доля в процентах трансгенных форм растений в сельском хозяйстве составило: кукуруза – 6, соя – 12, хлопчатник – 15, томаты –

Другая проблема возникла с медицинским лечением. Несмотря на огромные достижение современной медицины, производимые сегодня лекарственные препараты столь дороги, что ¾ населения земли сейчас полностью полагаются на традиционные донаучные методы лечения, прежде всего на неочищенные препараты растительного происхождения. В развитых странах лекарственные средства на 25% состоят из природных веществ, выделенных из растений. Открытия последних лет (противоопухолевые препараты: таксол, подофиллотоксин) свидетельствуют о том, что растения еще долго будут оставаться источником полезных биологически-активных веществ (БТА), и что способности растительной клетки к синтезу сложных БТА все еще значительно превосходят синтетические способности инженера-химика. Вот почему ученые взялись за проблему создания трансгенных растений. Отсчёт истории генетической инженерии растений принято вести с 1982 года, когда впервые были получены генетически трансформированные растения. Метод трансформации основывается на природной способности бактерий Agrobacterium tumefaciens генетически модифицировать растения. Реконструированные штаммы Agrobactrium, содержащие неонкогенные варианты Ti-плазмид и обладающие повышенной вирулентностью, стали основой одного из наболее популярных методов трансформации. 98

Первоначально трансформация применялась для генно-инженерных двудольных растений, однако работы последних лет свидетельствуют, что этот метод эффективен и в отношении кукурузы, риса, пшеницы. Другим широко распространённым методом трансформации, является технология, основанная на обстреле ткани микрочастицами золота (или других тяжелых металлов), покрытыми раствором ДНК. Все выращиваемые ныне коммерческие сорта получены с помощью названных выше двух методов. Современный арсенал методов трансформации, однако, довольно обширен и включает такие подходы, как введение ДНК в голые клетки (протопласты), электропорация клеток, микроинъекций ДНК в клетки, прокалывание клеток путём встряхивания их в суспензии микроигл, опосредованная вирусами инфекции и так далее. Генетические изменённые растения с устойчивостью к различным классам гербицидов в настоящее время являются наиболее успешным биотехнологическим продуктом. Дело в том, что биотехнология позволила совершить такой прыжок, так как оказалось возможным генетически изменять устойчивость растений к тем или иным гербицидам либо путем введения генов, кодирующих белки, нечувствительные к данному классу гербицидов, либо за счет введения генов, обеспечивающих ускоренный метаболизм гербицидов растений. 99

К настоящему времени клонированы гены, кодирующие нечувствительные к действию гербицидов ферменты-мишени, что дало возможность получать трансгенные растения, устойчивые к таким гербицидам, как глифостат и хлорсульфуроновым, и имидазолиноновым гербицидом. Изолированы также гены, которые кодируют ферменты деградации некоторых гербицидов, что позволило получить трансгенные растения устойчивые к фосфинотрицину и далапону. В 1997 году устойчивая к Roundup соя, распространяемая компанией "As Grow", была признана в США сельскохозяйственным продуктом года. Ученые пошли далее. Так как множество растений подвержены нападению и поеданию со стороны насекомых, то ученые генной инженерии провели эксперимент с давно известной бактерией Bacillus-Thiringiensis, которая продуцирует белок, оказалось она является очень токсичной для многих видов насекомых, но в то же время безопасна для млекопитающих. , белок (дельта-эндотаксин, CRY- белок) продуцируется различными штамами Bacillus-Thiringiensis. Это прототаксин который расщепляется в кишечнике насекомых, образуя активированный токсин. Активизированный белок специфично связывается с рецепторами средней кишки насекомых, что приводит к образованию пор и лизису клеток кишечного эпителия. 100

Взаимодействие токсинов с рецепторами строго специфично, что усложняет подбор комбинации токсин-насекомое. В природе найдено большое количество штаммов Bacillus-Thiringiensis, чьи токсины действуют только на определенные виды насекомых. Препараты Bacillus- Thiringiensis в течение десятилетий использовались для контроля насекомых на полях. Встраивание гена этого белка в геном растений дает возможность получить трансгенные растения, не поедаемые насекомые. Но этот метод потребовал большой работы со стороны генной инженерии, в плане подборов необходимых штаммов и созданию генноинженерных конструкций, которые дают наибольший эффект для конкретных классов насекомых. Кроме видоспецифичности по действию на насекомых встраивание прокариотических генов дельта-токсинов в геном растений даже под контролем сильных эукариотических промоторов не привело к высокому уровню экспрессии. Предположительно такое явление возникло в связи с тем, что эти бактериальные гены содержат значительно больше адениновых и тиминовых нуклеатидных оснований, чем растительная ДНК. Эта проблема была решена путем создания модефицированных генов, где один из природного гена вырезали и добавили те или иные фрагменты с сохранением доменов, кодирующих активные части дельта-токсинов. Так, например, с помощью таких подходов был получен картофель, устойчивый к колорадскому жуку. В настоящее время так называемый Bt – растения хлопка и кукурузы занимают основную долю в общем объеме генетически модифицированных растений этих культур, которые выращивают на полях США. 101

Перспективы Ожидается что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии. Несколько компаний, например Myriad Genetics, начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак груди, нарушение свертываемости крови, кистозный фибриоз, заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака, болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении. Также, например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети, этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхменую структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные. Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов, вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны. 102

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции. Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии. И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами, а на деле и всеми млекопитающими). Проект определения разнообразия человеческого генома (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами, который был, по слухам, приостановлен, но на самом деле продолжает работу и в настоящее время накапливает новые результаты. В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления. Он может также показать, как человеческие популяции адаптировались к этим заболеваниям. 103

Ученым удалось "прочитать" последовательность нуклеотидов. А вот на расшифровку наследственного аппарата человека уйдут еще многие годы - около половины генов Homo Sapiens до сих пор остаются не раскрытыми. Установление последовательности генов - это первый шаг в понимании генома человека. Ведь представления о функциях установленных генов всего лишь демонстрируют порядок, в котором следуют нуклеотиды в цепочке ДНК. Таким образом, первое глубокое изучение генома человека прояснило гораздо меньше загадок, чем ожидалось. Впрочем, впоследствии это позволило ученым сделать несколько громких открытий: Значительный процент наших генов был сформирован человеческой цивилизацией. Американские ученые выяснили, что около 1800 генов (примерно 7% человеческого генома) изменились в результате естественного отбора за последние 50 тыс. лет, т. е. в процессе развития человеческой цивилизации. Примерно в той же пропорции изменились и геномы кукурузы, после того как люди ее окультурили. Главным образом изменения произошли в генах, отвечающих за белковый обмен и сопротивляемость различным заболеваниям. По мнению ученых, эти изменения можно объяснить развитием сельского хозяйства, ростом городов и увеличением плотности населения. Мутация генов, ответственных за деятельность мозга, ученые связывают с развитием культуры. 105

Люди, проживающие даже в разных уголках земли, отличаются друг от друга только на 0, 1%. Тем не менее, это маленькое расхождение в ДНК обеспечивает достаточно признаков, чтобы определить географических предков индивидуума. А вот гены шимпанзе и человека, чье родство ранее считалось самым близким, совпадают только на 95%. Человек стал человеком 3 миллиона лет назад. Именно тогда предки Homo Sapiens начали ходить вертикально после того, как "отключился" один из генов. Данный ген - Neu 5 Gc - контролирует выработку в организме сиаловой кислоты (один из сахаров). Исследователи предполагают, что мутация произошла где-то в промежутке между появлением общего предка человека и шимпанзе и возникновением уже непосредственных предшественников Homo Sapiens. В организмах животных все клетки покрыты оболочкой из сахаров. У человека этого нет. Специалисты предполагают, что это как-то связано с развитием мозга: на отрезке эволюции, когда предки современного человека отделились от предков шимпанзе, размеры головного мозга у них были примерно одинаковы. 106

Научившись различать цвета, предки человека перестали выбирать партнеров по запаху. Развитие цветового зрения привело к тому, что приматы, обитавшие в восточном полушарии, и появившиеся затем вследствие их развития люди утратили способность распознавать феромоны. Это произошло около 23 млн. лет назад, незадолго до того, как надсемейство человекообразных обезьян, от которых со временем произошли люди, распалось на несколько обособленных групп. Когда и самцы обезьян, обитающих в восточном полушарии, около 23 млн. лет назад приобрели второй ген цветового зрения, автоматически возник новый способ полового отбора. Теперь для сигнализации зрелости и способности самок к воспроизводству стали использоваться не феромоны, а вторичные половые признаки, такие, как яркие цветные участки на коже и др. Особенности фигуры заложены генетически. Генетическая программа организма определяет фигуру и ответственна за вес. На эту закономерность натолкнулись ученые, когда они начали исследовать жировую ткань мышей на наличие склонности к излишнему весу. Было выделено по крайней мере 12 генов, влияющих на различные места накопления жира. Еще три гена играют, по всей видимости, решающую роль в наличие склонности к излишнему весу. Вклад генов в распределение жировых масс оценивается как 50 -60 -процентный. 107

Существует ген, отвечающий за пристрастие к никотину. Две группы ученых провели исследования различных форм гена CYP 2 A 6 - фермента, который содержится главным образом в печени и регулирует никотиновый метаболизм в теле человека. Ранее проведенные исследования показали, что у людей, у которых этот ген не работает, меньше риск получить никотиновую зависимость. Эксперты считают, что у таких людей никотин в течение более долгого времени выводится из организма, поэтому желание выкурить следующую сигарету появляется через более длительный промежуток времени. Алкогольная зависимость также определяется генами. Американские ученые обнаружили ген, который является связующим звеном между алкоголизмом и чувством страха. Опыты доказали, что отсутствие копии определенного гена вызывает у мышей чувство страха и неудержимое влечение к алкоголю. Ученые предполагают, что мыши пытались подавить свой страх при помощи алкоголя, так как частое потребление спирта делало их смелее. Подобная мотивация, возможно, приводит к хроническому алкоголизму и у людей. 108

109