159 баллов по егэ куда можно поступить. Бесплатное образование: как оценить свои шансы поступить на бюджет. Где можно сдать CAE

Нуклеотиды ДНК и РНК
  1. Пуриновые: аденин, гуанин
  2. Пиримидиновые: цитозин, тимин (урацил)

Кодон - триплет нуклеотидов, кодирующих определенную аминокислоту.

таб. 1. Аминокислоты, которые обычно встречаются в белках
Название Сокращенное обозначение
1. Аланин Ala
2. Аргинин Arg
3. Аспарагин Asn
4. Аспарагиновая кислота Asp
5. Цистеин Cys
6. Глутаминовая кислота Glu
7. Глутамин Gln
8. Глицин Gly
9. Гистидин His
10. Изолейцин Ile
11. Лейцин Leu
12. Лизин Lys
13. Метионин Met
14. Фенилаланин Phe
15. Пролин Pro
16. Серии Ser
17. Треонин Thr
18. Триптофан Trp
19. Тирозин Tyr
20. Валин Val

Генетический код, который еще называют аминокислотным кодом, - это система записи информации о последовательности расположения аминокислот в белке с помощью последовательности расположения нуклеотидных остатков в ДНК, которые содержат одно из 4-х азотистых оснований: аденин (А), гуанин (G), цитозин (C) и тимин (Т). Однако, поскольку двунитчатая спираль ДНК не принимает непосредственного участия в синтезе белка, который кодируется одной из этих нитей (т.е. РНК), то код записывается на языке РНК, в котором вместо тимина входит урацил (U). По этой же причине принято говорить, что код - это последовательность нуклеотидов, а не пар нуклеотидов.

Генетический код представлен определенными кодовыми словами, - кодонами.

Первое кодовое слово было расшифровано Ниренбергом и Маттеи в 1961 г. Они получили из кишечной палочки экстракт, содержащий рибосомы и прочие факторы, необходимые для синтеза белка. Получилась бесклеточная система для синтеза белка, которая могла бы осуществлять сборку белка из аминокислот, если в среду добавить необходимую мРНК. Добавив в среду синтетическую РНК, состоящую только из урацилов, они обнаружили, что образовался белок, состоящий только из фенилаланина (полифенилаланин). Так было установлено, что триплет нуклеотидов УУУ (кодон) соответствует фенилаланину. В течение последующих 5-6 лет были определены все кодоны генетического кода.

Генетический код - своеобразный словарь, переводящий текст, записанный с помощью четырех нуклеотидов, в белковый текст, записанный с помощью 20 аминокислот. Остальные аминокислоты, встречающиеся в белке, являются модификациями одной из 20 аминокислот.

Свойства генетического кода

Генетический код имеет следующие свойства.

  1. Триплетность - каждой аминокислоте соответствует тройка нуклеотидов. Легко подсчитать, что существуют 4 3 = 64 кодона. Из них 61 является смысловым и 3 - бессмысленными (терминирующими, stop-кодонами).
  2. Непрерывность (нет разделительных знаков между нуклеотидами) - отсутствие внутригенных знаков препинания;

    Внутри гена каждый нуклеотид входит в состав значащего кодона. В 1961г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его непрерывность (компактость) [показать]

    Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида.

    Одиночная мутация ("+" или "-") в начале гена или двойная мутация ("+" или "-") - портит весь ген.

    Тройная мутация ("+" или "-") в начале гена портит лишь часть гена.

    Четверная "+" или "-" мутация опять портит весь ген.

    Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, что

    1. код триплетен и внутри гена нет знаков препинания
    2. между генами есть знаки препинания
  3. Наличие межгенных знаков препинания - наличие среди триплетов инициирующих кодонов (с них начинается биосинтез белка), кодонов - терминаторов (обозначают конец биосинтеза белка);

    Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

    В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов, или стоп-сигналов: UAA, UAG, UGA. Они терминируют трансляцию.

  4. Колинеарность - соответствие линейной последовательности кодонов мРНК и аминокислот в белке.
  5. Специфичность - каждой аминокислоте соответствуют только определенные кодоны, которые не могут использоваться для другой аминокислоты.
  6. Однонаправленность - кодоны считываются в одном направлении - от первого нуклеотида к последующим
  7. Вырожденность, или избыточность ,- одну аминокислоту может кодировать несколько триплетов (аминокислот – 20, возможных триплетов – 64, 61 из них смысловой, т. е. в среднем каждой аминокислоте соответствует около 3 кодонов); исключение составляет метионин (Met) и триптофан (Trp).

    Причина вырожденности кода состоит в том, что главную смысловую нагрузку несут два первых нуклеотида в триплете, а третий не так важен. Отсюда правило вырожденности кода : если два кодона имеют два одинаковых первых нуклеотида, а их третьи нуклеотиды принадлежат к одному классу (пуриновому или пиримидиновому), то они кодируют одну и ту же аминокислоту.

    Однако из этого идеального правила есть два исключения. Это кодон АUА, который должен соответствовать не изолейцину, а метионину и кодон UGА, который является терминирующим, тогда как должен соответствовать триптофану. Вырожденность кода имеет, очевидно, приспособительное значение.

  8. Универсальность - все перечисленные выше свойства генетического кода характерны для всех живых организмов.
    Кодон Универсальный код Митохондриальные коды
    Позвоночные Беспозвоночные Дрожжи Растения
    UGA STOP Trp Trp Trp STOP
    AUA Ile Met Met Met Ile
    CUA Leu Leu Leu Thr Leu
    AGA Arg STOP Ser Arg Arg
    AGG Arg STOP Ser Arg Arg

    В последнее время принцип универсальности кода был поколеблен в связи c открытием Береллом в 1979 г. идеального кода митохондрий человека, в котором выполняется правило вырожденности кода. В коде митохондрий кодон UGA соответствует триптофану, а AUA - метионину, как того требует правило вырожденности кода.

    Возможно, в начале эволюции у всех простейших организмов был такой же код, как и у митохондрий, а затем он претерпел небольшие отклонения.

  9. Неперекрываемость - каждый из триплетов генетического текста независим друг от друга, один нуклеотид входит в состав только одного триплета; На рис. показана разница между перекрывающимся и неперекрывающимся кодом.

    В 1976г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

    Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D. Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D. Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

  10. Помехоустойчивость - отношение числа консервативных замен к числу радикальных замен.

    Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.

    Так как одна и та же аминокислота может кодироваться разными триплетами, то некоторые замены в триплетах не приводят к замене кодируемой аминокислоты (например UUU -> UUC оставляет фенилаланин). Некоторые замены меняют аминокислоту на другую из того же класса (неполярный, полярный, основной, кислотный), остальные замены меняют и класс аминокислоты.

    В каждом триплете можно провести 9 однократных замен, т.е. выбрать, какую из позиций меняем - можно тремя способами (1-я или 2-я или 3-я), причем выбранную букву (нуклеотид) можно поменять на 4-1=3 других буквы (нуклеотида). Общее количество возможных замен нуклеотидов - 61 по 9 = 549.

    Прямым подсчетом по таблице генетического кода можно убедиться, что из них: 23 замены нуклеотидов приводят к появлению кодонов - терминаторов трансляции. 134 замены не меняют кодируемую аминокислоту. 230 замен не меняют класс кодируемой аминокислоты. 162 замены приводят к смене класса аминокислоты, т.е. являются радикальными. Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляции, а 176 - консервативны. Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны. Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 - консервативны, 102 - радикальны.


Генетический код разных организмов обладает некоторыми общими свойствами:
1) Триплетность. Для записи любой, в том числе и наследственной информации используется определенный шифр, элементом которого является буква, или символ. Совокупность таких символов составляет алфавит. Отдельные сообщения записываются комбинацией символов, которые называются кодовыми группами, или кодонами. Известен алфавит, состоящий всего из двух символов, - это азбука Морзе. В ДНК 4 буквы – первые буквы названий азотистых оснований (А, Г, Т, Ц), значит, генетический алфавит состоит всего из 4 символов. Что же является кодовой группой, или, словом генетического кода? Известно 20 основных аминокислот, содержание которых должно быть записано генетическим кодом, т. е. 4 буквы должны дать 20 кодовых слов. Допустим, слово состоит из одного символа, тогда мы получим только 4 кодовые группы. Если же слово состоит из двух символов, то таких групп будет только 16, а этого явно мало, чтобы закодировать 20 аминокислот. Следовательно, в кодовом слове должно быть минимум 3 нуклеотида, что даст 64 (43) сочетания. Такого количества триплетных сочетаний вполне достаточно для кодирования всех аминокислот. Таким образом, кодон генетического кода – это триплет нуклеотидов.
2) Вырожденность (избыточность) – свойство генетического кода состоящее с одной стороны, в том, что он содержит избыточные триплеты, т. е. синонимы, а с другой – «бессмысленные» триплеты. Поскольку код включает 64 сочетания, а кодируются только 20 аминокислот, то некоторые аминокислоты кодируются несколькими триплетами (аргинин, серин, лейцин – шестью; валин, пролин, аланин, глицин, треонин – четырьмя; изолейцин – тремя; фенилаланин, тирозин, гистидин, лизин, аспарагин, глутамин, цистеин, аспарагиновая и глутаминовая кислоты – двумя; метионин и триптофан – одним триплетом). Некоторые кодовые группы (УАА, УАГ, УГА) вообще не несут смысловой нагрузки, т. е. являются «бессмысленными» триплетами. «Бессмысленные», или nonsense, кодоны выполняют функцию терминаторов цепей – знаков препинания в генетическом тексте – служат сигналом окончания синтеза белковой цепи. Такая избыточность кода имеет большое значение для повышения надежности передачи генетической информации.
3) Неперекрываемость. Кодовые триплеты никогда не перекрываются, т. е. всегда транслируются вместе. При считывании информации с молекулы ДНК невозможно использование азотистого основания одного триплета в комбинации с основаниями другого триплета.
4) Однозначность. Нет случаев, когда один и тот же триплет соответствовал бы более чем одной кислоте.
5) Отсутствие разделительных знаков внутри гена. Генетический код считывается с определенного места без запятых.
6) Универсальность. У различных видов живых организмов (вирусов, бактерий, растений, грибов и животных) одинаковые триплеты кодируют одни и те же аминокислоты.
7) Видовая специфичность. Количество и последовательность азотистых оснований в цепи ДНК у разных организмов различные.

Благодаря процессу транскрипции в клетке осуществляется передача информации от ДНК к белку: ДНК - и-РНК - белок. Генетическая информация, содержащаяся в ДНК и в и-РНК, заключена в последовательности расположения нуклеотидов в молекулах. Каким же образом происходит перевод информации с "языка" нуклеотидов на "язык" аминокислот? Такой перевод осуществляется с помощью генетического кода. Код, или шифр,- это система символов для перевода одной формы информации в другую. Генетический код - это система записи информации о последовательности расположения аминокислот в белках с помощью последовательности расположения нуклеотидов в информационной РНК. Насколько важна именно последовательность расположения одних и тех же элементов (четырех нуклеотидов в РНК) для понимания и сохранения смысла информации, можно убедиться на простом примере: переставив буквы в слове код, мы получим слово с иным значением - док. Какими же свойствами обладает генетический код?

1. Код триплетен. В состав РНК входят 4 нуклеотида: А, Г, Ц, У. Если бы мы пытались обозначить одну аминокислоту одним нуклеотидом, то 16 из 20 аминокислот остались бы не зашифрованы. Двухбуквенный код позволил бы зашифровать 16 аминокислот (из четырех нуклеотидов можно составить 16 различных комбинаций, в каждой из которых имеется два нуклеотида). Природа создала трехбуквенный, или триплетный, код. Это означает, что каждая из 20 аминокислот зашифрована последовательностью трех нуклеотидов, называемых триплетом или кодоном. Из 4 нуклеотидов можно создать 64 различные комбинации по 3 нуклеотида в каждой (4*4*4=64). Этого с избытком хватает для кодирования 20 аминокислот и, казалось бы, 44 кодона являются лишними. Однако это не так.

2. Код вырожден. Это означает, что каждая аминокислота шифруется более чем одним кодоном (от двух до шести). Исключение составляют аминокислоты метионин и триптофан, каждая из которых кодируется только одним триплетом. (Это видно из таблицы генетического кода .) Тот факт, что метионин кодируется одним триплетом АУТ, имеет особый смысл, который вам станет понятен позже ( 16).

3. Код однозначен. Каждый кодон шифрует только одну аминокислоту. У всех здоровых людей в гене, несущем информацию о бета-цепи гемоглобина , триплет ГАА или ГАГ, I стоящий на шестом месте, кодирует глутаминовую кислоту. У больных серповидноклеточной анемией второй нуклеотид в этом триплете заменен на У. Как видно из таблицы, триплеты ГУА или ГУГ, которые в этом случае образуются, кодируют аминокислоту валин. К чему приводит такая замена, вы уже знаете из раздела о ДНК .

4. Между генами имеются "знаки препинания". В печатном тексте в конце каждой фразы стоит точка. Несколько связанных по смыслу фраз составляют абзац. На языке генетической информации таким абзацем являются оперон и комплементарная ему и-РНК. Каждый ген в опероне кодирует одну полипептидную цепочку - фразу. Так как в ряде случаев по матрице и-РНК последовательно создается несколько разных полипептидных цепей, они должны быть отделены друг от друга. Для этого в генетическом коде существуют три специальные триплета - УАА, УАГ, УГА, каждый из которых обозначает прекрдщение синтеза одной полипептидной цепи. Таким образом, эти триплеты выполняют функцию знаков препинания. Они находятся в конце каждого гена. Внутри гена нет "знаков препинания". Поскольку генетический код подобен языку, разберем это свойство на примере такой составленной из триплетов фразы: жил был кот тих был сер мил мне тот кот. Смысл написанного понятен, несмотря на отсутствие "знаков препинания. Если же мы уберем в первом слове одну букву (один нуклеотид в гене), но читать будем также тройками букв, то получится бессмыслица: илб ылк отт ихб ылс ерм илм нет отк от Нарушение смысла возникает и при выпадении одного или двух нуклеотидов из гена. Белок, который будет считываться с такого испорченного гена, не будет иметь ничего общего с тем белком, который кодировался нормальным геном.

6. Код универсален. Генетический код един для всех живущих на Земле существ. У бактерий и грибов, пшеницы и хлопка, рыб и червей, лягушки и человека одни и те же триплеты кодируют одни и те же аминокислоты.

В обмене веществ организма ведущая роль принадлежит белкам и нуклеиновым кислотам.
Белковые вещества составляют основу всех жизненно важных структур клетки, обладают необычайно высокой реакционной способностью, наделены каталитическими функциями.
Нуклеиновые кислоты входят в состав важнейшего органа клетки - ядра, а также цитоплазмы, рибосом, митохондрий и т. д. Нуклеиновые кислоты играют важную, первостепенную роль в наследственности, изменчивости организма, в синтезе белка.

План синтеза белка хранится в ядре клетки, а непосредственно синтез происходит вне ядра, поэтому необходима служба доставки закодированного плана из ядра к месту синтеза. Такую службу доставки исполняют молекулы РНК.

Процесс начинается в ядре клетки: раскручивается и открывается часть «лестницы» ДНК. Благодаря этому буквы РНК образуют связи с открытыми буквами ДНК одной из нитей ДНК. Фермент переносит буквы РНК, чтобы соединить их в нить. Так буквы ДНК «переписываются» в буквы РНК. Новообразованная цепочка РНК отделяется, и «лестница» ДНК снова закручивается. Процесс считки информации с ДНК и синтеза по ее матрице РНК называется транскрипцией , а синтезированная РНК называется информационной или и-РНК .

После дальнейших изменений этот вид закодированной и-РНК готов. и-РНК выходит из ядра и направляется к месту синтеза белка, где буквы и-РНК расшифровываются. Каждый набор из трех букв и-РНК образует «букву», обозначающее одну конкретную аминокислоту.

Другой вид РНК отыскивает эту аминокислоту, захватывает ее с помощью фермента и доставляет к месту синтеза белка. Эта РНК называется транспортной, или т-РНК. По мере прочтения и перевода сообщения и-РНК цепочка аминокислот растет. Эта цепочка закручивается и укладывается в уникальную форму, создавая один вид белка. Примечателен даже процесс укладки белка: на то, чтобы с помощью компьютера просчитать все варианты укладки белка среднего размера, состоящего из 100 аминокислот, потребовалось бы 1027 (!) лет. А для образования в организме цепочки из 20 аминокислот требуется не более одной секунды, и этот процесс происходит непрерывно во всех клетках тела.

Гены, генетический код и его свойства.

На Земле живет около 7 млрд людей. Если не считать 25-30 млн пар однояйцовых близнецов, то генетически все люди разные : каждый уникален, обладает неповторимыми наследственными особенностями, свойствами характера, способностями, темпераментом.

Такие различия объясняются различиями в генотипах -наборах генов организма; у каждого он уникален. Генетические признаки конкретного организма воплощаются в белках - следовательно, и строение белка одного человека отличается, хотя и совсем немного, от белка другого человека.

Это не означает , что у людей не встречается совершенно одинаковых белков. Белки, выполняющие одни и те же функции, могут быть одинаковыми или совсем незначительно отличаться одной-двумя аминокислотами друг от друга. Но не существует на Земле людей (за исключением однояйцовых близнецов), у которых все белки были бы одинаковы .

Информация о первичной структуре белка закодирована в виде последовательности нуклеотидов в участке молекулы ДНК, гене – единице наследственной информации организма. Каждая молекула ДНК содержит множество генов. Совокупность всех генов организма составляет его генотип . Таким образом,

Ген – единица наследственной информации организма, которой соответствует отдельный участок ДНК

Кодирование наследственной информации происходит с помощью генетического кода , который универсален для всех организмов и отличается лишь чередованием нуклеотидов, образующих гены, и кодирующих белки конкретных организмов.

Генетический код состоит из троек (триплетов) нуклеотидов ДНК, комбинирующихся в разной последовательности (ААТ, ГЦА, АЦГ, ТГЦ и т.д.), каждый из которых кодирует определенную аминокислоту (которая будет встроена в полипептидную цепь).

Собственно кодом считается последовательность нуклеотидов в молекуле и-РНК , т.к. она снимает информацию с ДНК (процесс транскрипции ) и переводит ее в последовательность аминокислот в молекулах синтезируемых белков (процесс трансляции ).
В состав и-РНК входят нуклеотиды А-Ц-Г-У, триплеты которых называются кодонами : триплет на ДНК ЦГТ на и-РНК станет триплетом ГЦА, а триплет ДНК ААГ станет триплетом УУЦ. Именно кодонами и-РНК отражается генетический код в записи.

Таким образом, генетический код - единая система записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов . Генетический код основан на использовании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода:

1. Генетический код триплетен . Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав белков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот остаются незакодированными ). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, должно быть не менее трех. В этом случае число возможных триплетов нуклеотидов составляет 43 = 64.

2. Избыточность (вырожденность ) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими триплетами (поскольку аминокислот 20, а триплетов - 64), за исключением метионина и триптофана, которые кодируются только одним триплетом. Кроме того, некоторые триплеты выполняют специфические функции: в молекуле и-РНК триплеты УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп -сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Однозначность кода - одновременно с избыточностью коду присуще свойство однозначности : каждому кодону соответствует только одна определенная аминокислота.

4. Коллинеарность кода, т.е. последовательность нуклеотидов в гене точно соответствует последовательности аминокислот в белке.

5. Генетический код неперекрываем и компактен , т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп -сигналов (терминирующих кодонов ).

6. Генетический код универсален , т. е. ядерные гены всех организмов одинаковым образом кодируют информацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Существуют таблицы генетического кода для расшифровки кодонов и- РНК и построения цепочек белковых молекул.

Реакции матричного синтеза.

В живых системах встречается реакции, неизвестные в неживой природе - реакции матричного синтеза.

Термином "матрица" в технике обозначают форму, употребляемую для отливки монет, медалей, типографского шрифта: затвердевший металл в точности воспроизводит все детали формы, служившей для отливки. Матричный синтез напоминает отливку на матрице: новые молекулы синтезируются в точном соответствии с планом, заложенным в структуре уже существующих молекул.

Матричный принцип лежит в основе важнейших синтетических реакций клетки, та-ких, как синтез нуклеиновых кислот и белков. В этих реакциях обеспечивается точная, строго специфичная последовательность мономерных звеньев в синтезируемых полимерах.

Здесь происходит направленное стягивание мономеров в определенное место клетки - на молекулы, служащие матрицей, где реакция протекает. Если бы такие реакции происходили в результате случайного столкновения молекул, они протекали бы бесконечно медленно. Синтез сложных молекул на основе матричного принципа осуществляется быстро и точно. Роль матрицы в матричных реакциях играют макромолекулы нуклеиновых кислот ДНК или РНК .

Мономерные молекулы , из которых синтезируется полимер, - нуклеотиды или аминокислоты - в соответствии с принципом комплементарности располагаются и фиксируются на матрице в строго определенном, заданном порядке.

Затем происходит "сшивание" мономерных звеньев в полимерную цепь , и готовый полимер сбрасывается с матрицы.

После этого матрица готова к сборке новой полимерной молекулы. Понятно, что как на данной форме может производиться отливка только какой-то одной монеты, одной буквы, так и на данной матричной молекуле может идти "сборка" только какого-то одного полимера.

Матричный тип реакций - специфическая особенность химизма живых систем. Они являются основой фундаментального свойства всего живого - его способности к воспроизведению себе подобного.

Реакции матричного синтеза

1. Репликация ДНК - реплика́ция (от лат. replicatio - возобновление) - процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской молекулы ДНК. В ходе последующего деления материнской клетки каждая дочерняя клетка получает по одной копии молекулы ДНК, которая является идентичной ДНК исходной материнской клетки. Этот процесс обеспечивает точную передачу генетической информации из поколения в поколение. Репликацию ДНК осуществляет сложный ферментный комплекс, состоящий из 15-20 различных белков, называемый реплисомой . Материалом для синтеза служат свободные нуклеотиды, имеющиеся в цитоплазме клеток. Биологический смысл репликации заключается в точной передаче наследственной информации от материнской молекулы к дочерним, что в норме и происходит при делении соматических клеток.

Молекула ДНК состоит из двух комплементарных цепей. Эти цепи удерживаются слабыми водородными связями, способными разрываться под действием ферментов. Молекула ДНК способна к самоудвоению (репликации), причем на каждой старой половине молекулы синтезируется новая ее половина.
Кроме того, на молекуле ДНК может синтезироваться молекула и-РНК, которая затем переносит полученную от ДНК информацию к месту синтеза белка.

Передача информации и синтез белка идут по матричному принципу, сравнимому с работой печатного станка в типографии. Информация от ДНК многократно копируется. Если при копировании произойдут ошибки, то они повторятся во всех последующих копиях.

Правда, некоторые ошибки при копировании информации молекулой ДНК могут исправляться - процесс устранения ошибок называется репарацией . Первой из реакций в процессе передачи информации является репликация молекулы ДНК и синтез новых цепей ДНК.

2. Транскрипция (от лат. transcriptio - переписывание) - процесс синтеза РНК с использованием ДНК в качестве матрицы, происходящий во всех живых клетках. Другими словами, это перенос генетической информации с ДНК на РНК.

Транскрипция катализируется ферментом ДНК-зависимой РНК-полимеразой. РНК-полимераза движется по молекуле ДНК в направлении 3" → 5". Транскрипция состоит из стадий инициации, элонгации и терминации . Единицей транскрипции является оперон, фрагмент молекулы ДНК, состоящий из промотора, транскрибируемой части и терминатора . и-РНК состоит из одной цепи и синтезируется на ДНК в соответствии с правилом комплементарности при участии фермента, который активирует начало и конец синтеза молекулы и-РНК.

Готовая молекула и-РНК выходит в цитоплазму на рибосомы, где происходит синтез полипептидных цепей.

3. Трансляция (от лат. translatio - перенос, перемещение) - процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК, мРНК), осуществляемый рибосомой. Иными словами, это процесс перевода информации, со-держащейся в последовательности нуклеотидов и-РНК, в последовательность амино-кислот в полипептиде.

4. Обратная транскрипция - это процесс образования двуцепочечной ДНК на основании информации из одноцепочечной РНК. Данный процесс называется обратной транскрипцией, так как передача генетической информации при этом происходит в «обратном», относительно транскрипции, направлении. Идея обратной транскрипции вначале была очень непопулярна, так как противоречила центральной догме молекулярной биологии, которая предполагала, что ДНК транскрибируется в РНК и далее транслируется в белки.

Однако в 1970 году Темин и Балтимор независимо друг от друга открыли фермент, названный обратной транскриптазой (ревертазой) , и возможность обратной транскрипции была окончательно подтверждена. В 1975 году Темину и Балтимору была присуждена Нобелевская премия в области физиологии и медицины. Некоторые вирусы (такие как вирус иммунодефицита человека, вызывающий ВИЧ-инфекцию), имеют возможность транскрибировать РНК в ДНК. ВИЧ имеет РНК-геном, который встраивается в ДНК. В результате, ДНК вируса может быть объединена с геномом клетки-хозяина. Главный фермент, ответственный за синтез ДНК из РНК, называется ревертазой . Одной из функций ревертазы является создание комплементарной ДНК (кДНК) из вирусного генома. Ассоциированный фермент рибонуклеаза расщепляет РНК, а ревертаза синтезирует кДНК из двойной спирали ДНК. кДНК интегрируется в геном клетки-хозяина с помощью интегразы. Результатом является синтез вирусных протеинов клеткой-хозяином , которые образуют новые вирусы. В случае с ВИЧ так же программируется апоптоз (смерть клетки) Т-лимфоцитов. В иных случаях клетка может остаться распространителем вирусов.

Последовательность матричных реакций при биосинтезе белков можно представить в виде схемы.

Таким образом, биосинтез белка – это один из видов пластического обмена, в ходе которого наследственная информация, закодированная в генах ДНК, реализуется в определенную последовательность аминокислот в белковых молекулах.

Молекулы белков по существу представляют собой полипептидные цепочки , составленные из отдельных аминокислот. Но аминокислоты недостаточно активны, чтобы соединиться между собой самостоятельно. Поэтому, прежде чем соединиться друг с другом и образовать молекулу белка, аминокислоты должны активироваться . Эта активация происходит под действием особых ферментов.

В результате активирования аминокислота становится более лабильной и под действием того же фермента связывается с т-РНК . Каждой аминокислоте соответствует строго специфическая т-РНК , которая находит «свою» аминокислоту и переносит ее в рибосому.

Следовательно, в рибосому поступают различные активированные аминокислоты, соединенные со своими т-РНК . Рибосома представляет собой как бы конвейер для сборки цепочки белка из поступающих в него различных аминокислот.

Одновременно с т-РНК, на которой «сидит» своя аминокислота, в рибосому поступает «сигнал » от ДНК, которая содержится в ядре. В соответствии с этим сигналом в рибосоме синтезируется тот или иной белок.

Направляющее влияние ДНК на синтез белка осуществляется не непосредственно, а с помощью особого посредника – матричной или информационной РНК (м-РНК или и-РНК ), которая синтезируется в ядр е под влиянием ДНК, поэтому ее состав отражает состав ДНК. Молекула РНК представляет собой как бы слепок с формы ДНК. Синтезированная и-РНК поступает в рибосому и как бы передает этой структуре план - в каком порядке должны соединяться друг с другом поступившие в рибосому активированные аминокислоты, чтобы синтезировался определенный белок. Иначе, генетическая информация, закодированная в ДНК, передается на и- РНК и далее на белок .

Молекула и-РНК поступает в рибосому и прошивает ее. Тот ее отрезок, который находится в данный момент в рибосоме, определенный кодоном (триплет) , взаимо-действует совершенно специфично с подходящим к нему по строению триплетом (антикодоном) в транспортной РНК, которая принесла в рибосому аминокислоту.

Транспортная РНК со своей аминокислотой подходит к определенному кодону и-РНК и соединяется с ним; к следующему, соседнему участку и- РНК присоединяется другая т-РНК с другой аминокислотой и так до тех пор, пока не будет считана вся цепочка и-РНК, пока не нанижутся все аминокислоты в соответствующем порядке, образуя молекулу белка. А т-РНК, которая доставила аминокислоту к определенному участку полипептидной цепи, освобождается от своей аминокислоты и выходит из рибосомы.

Затем снова в цитоплазме к ней может присоединиться нужная аминокислота, и она снова перенесет ее в рибосому. В процессе синтеза белка участвует одновременно не одна, а несколько рибосом - полирибосомы.

Основные этапы передачи генетической информации:

1. Синтез на ДНК как на матрице и-РНК (транскрипция)
2. Синтез в рибосомах полипептидной цепи по программе, содержащейся в и-РНК (трансляция) .

Этапы универсальны для всех живых существ, но временные и пространственные взаимоотношения этих процессов различаются у про- и эукариотов.

У прокариот транскрипция и трансляция могут осуществляться одновременно, поскольку ДНК находится в цитоплазме. У эукариот транскрипция и трансляция строго разделены в пространстве и времени: синтез различных РНК происходит в ядре, после чего молекулы РНК должны покинуть пределы ядра, пройдя через ядерную мембрану. Затем в цитоплазме РНК транспортируются к месту синтеза белка.

К серии статей, описывающих происхождение ГК, можно относиться как к расследованию событий, о которых у нас осталось очень немало следов. Однако для понимания этих статей необходимо немного приложить усилий для вникания в молекулярные механизмы синтеза белка. Данная статья является вступительной для серии автопубликаций, посвященных возникновению генетического кода, и с неё лучше всего начинать знакомство с этой темой.
Обычно генетический код (ГК) определяют как способ (правило) кодирования белка на первичной структуре ДНК или РНК. В литературе чаще всего пишут, что это - однозначное соответствие последовательности из трёх нуклеотидов в гене одной аминокислоте в синтезируемом белке или месту окончания синтеза белка. Однако в таком определении есть две ошибки. При этом подразумеваются 20, так называемых канонических аминокислот, которые входят в состав белков всех без исключения живых организмов. Эти аминокислоты являются мономерами белка. Ошибки следующие:

1) Канонических аминокислот не 20, а только 19. Аминокислотой мы можем называть вещество, которое одновременно содержит аминогруппу -NH 2 и карбоксильную группу - COOH. Дело в том, что мономер белка - пролин - аминокислотой не является, поскольку в нём вместо аминогруппы присутствует иминогруппа, поэтому пролин правильней называть иминокислотой. Однако в дальнейшем во всех статьях, посвящённых ГК, для удобства я буду писать о 20 аминокислотах, подразумевая указанный ньюанс. Структуры аминокислоты приведены на рис. 1.

Рис. 1. Структуры канонических аминокислот. Аминокислоты имеют константные части, обозначенные на рисунке чёрным цветом, и вариабельные (или радикалы), обозначенные красным.

2) Соответствие аминокислот кодонам не всегда является однозначным. О нарушении случаев однозначности см. ниже.

Возникновение ГК означает возникновение кодируемого синтеза белка. Это событие является одним из ключевых для эволюционного формирования первых живых организмов.

Структура ГК представлена в круговой форме на рис. 2.



Рис. 2. Генетический код в круговой форме. Внутренний круг - первая буква кодона, второй круг - вторая буква кодона, третий круг - третья буква кодона, четвертый круг - обозначения аминокислот в трехбуквенном сокращении; П - полярные аминокислоты, НП - неполярные аминокислоты. Для наглядности симметрии важен избранный порядок символов U - C - A - G .

Итак, приступим к описанию основных свойств ГК.

1. Триплетность. Каждая аминокислота кодируется последовательностью из трёх нуклеотидов.

2. Наличие межгенных знаков препинания. К межгенным знакам препинания относятся последовательности нуклеиновой кислоты, на которых трансляци я начинается или заканчивается.

Трансляци я может начаться не с любого кодона, а только со строго определённого - стартового . К стартовому кодону относится триплет AUG , с которого начинается трансляци я. В этом случае этот триплет кодирует или метионин, или другую аминокислоту - формилметионин (у прокариот), который может включаться только в начале синтеза белка. В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов , или стоп-сигналов : UAA, UAG, UGA. Они терминируют трансляци ю (так называется синтез белка на рибосоме).

3. Компактность, или отсутствие внутригенных знаков препинания. Внутри гена каждый нуклеотид входит в состав значащего кодона.

4. Неперекрываемость. Кодоны не перекрываются друг с другом, каждый имеет своё упорядочённое множестов нуклеотидов, которое не перекрывается с аналогичными множествами соседних кодонов.

5. Вырожденность. Обратное соответствие в направлении аминокислота-кодон неоднозначно. Это свойство называется вырожденностью. Серия - это множество кодонов, кодирующих одну аминокислоту, другими словами, это группа эквивалентных кодонов . Представим себе кодон в виде XYZ. Если XY определяет “смысл ” (т.е. аминокислоту), то кодон называется сильным . Если же для определения смысл а кодона нужен определенный Z, то такой кодон называется слабым .

Вырожденность кода тесно связана с неоднозначностью спаривания кодон-антикодон (под антикодоном подразумевается последовательность из трёх нуклеотидов на тРНК , которая может комплементарно спариваться с кодоном на матричной РНК (см. более подробно об этом две статьи: Молекулярные механизмы обеспечения вырожденности кода и Правило Лагерквиста. Физико-химическое обоснование симметрий и соотношений Румера ). Один антикодон на тРНК может узнавать отодного до трёх кодонов на мРНК.

6. Однозначность. Каждый триплет кодирует лишь одну аминокислоту или является терминатором трансляци и.

Известно три исключения.

Первое. У прокариот в первой позиции (заглавная буква) он кодирует формилметионин, а в любой другой - метионин.В начале гена формилметионин кодируется как обычным метиониновым кодоном AUG , так и ещё валиновым кодоном GUG или лейциновым UUG , которые внутри гена кодируют валин и лейцин, соответственно.

Во многих белках формилметионин отщепляется, либо удаляется формильная группа, в результате чего формилметионин превращается в обычный метионин.

Второе. В 1986 году сразу несколько групп исследователей обнаружили, что на мРНК терминирующий кодон UGA может кодировать селеноцистеин (см. рис. 3) при условии, что за ним следует особая последовательность нуклеотидов.

Рис. 3. Структура 21-й аминокислоты - селеноцистеина.

У E. coli (это латинское название кишечной палочки) селеноцистеил-тРНК в процессе трансляци и распознает в мРНК кодон UGA, но лишь в определенном контекст е: для узнавания UGA-кодона как осмысл енного важна последовательность длиной в 45 нуклеотидов, расположенная вслед за UGA-кодоном.

Рассмотренный пример показывает, что при необходимости живой организм может изменять смысл стандартного генетического кода. В этом случае генетическая информация, заключенная в генах, кодируется более сложным образом. Смысл кодона определяется в контекст е с определенной протяженной последовательностью нуклеотидов и при участии нескольких высокоспецифических белковых факторов. Важно, что селеноцистеиновая тРНК обнаружена в представителях всех трёх ветвей жизни (архей, эубактерий и эукариот), что указывает на древность происхождения селеноцистеинового синтеза, и возможно на присутствие его ещё в последнем универсальном общем предке (о нём речь пойдёт в других статьях). Скорей всего селеноцистеин встречается у всех без исключения живых организмов. Но в каждом отдельном организме селеноцистеин встречается не более, чем в паред есятков белков. Он входит в состав активных центров ферментов, в ряде гомологов которых на аналогичной позиции может функционировать обычный цистеин.

До недавнего времени считалось, что кодон UGA может считываться либо как селеноцистеин, либо кактерминальный, но недавно было показано, что у инфузории Euplotes кодон UGA кодирует или цистеин, илиселеноцистеин. См. " Генетический код допускает разночтения "

Третье исключение. У некоторых прокариот (5 видов архей и одной эубактерии - в Википедии информация сильно устарела) встречается особая кислота - пирролизин (рис. 4). Она кодируется триплетом UAG , который в каноническом коде служит терминатором трансляци и. Предполагается, что в этом случае, подобно случаю с кодированием селеноцистеина, считывание UAG как пирролизинового кодона происходит благодаря особой структуре на мРНК. Пирролизиновая тРНК содержит антикодон CTA и аминоацилируется АРСаз ой 2-го класса (про классификацию АРСаз см. статью "Кодазы помогают понять, как возник генетический код ").

UAG в качестве стоп-кодона используется редко, а если и используется, то часто за ним следует другой стоп-кодон.

Рис. 4. Структура 22-й аминокислоты пирролизина.

7. Универсальность. После того, как в середине 60-х годов прошлого века расшифровка ГК была завершена, долгое время считалось, что код одинаков во всех организмах, что указывает на единство происхождения всего живого на Земле.

Попробуем понять, почему ГК универсален. Дело в том, что если бы в организме изменилось хотя бы одно правило кодирования, то это привело бы к тому, что изменилась структура значительной части белков. Такое изменение было бы слишком кардинальным и поэтому практически всегда летальное, так как изменение смысл а только одного кодона может затронуть в среднем 1/64 часть всех аминокислотных последовательностей.

Отсюда следует одна очень важная мысль - ГК почти не менялся со времени своего формирования более 3,5 млрд. лет назад. А, значит, его структура несёт в себе след его возникновения, и анализ этой структуры может помочь понять, как именно мог возникнуть ГК.

В действительности ГК может несколько отличаться у бактерий, митохондрий, ядерный код некоторых инфузорий и дрожжей. Cейчас насчитывают не менее 17 генетических кодов, отличающихся от канонического на 1-5 кодонов Суммарно во всех известных вариантах отклонений от универсального ГК используются 18 различных замен смысл а кодона. Больше всего отклонений от стандартного кода известно у митохондрий - 10. Примечательно, что митохондрии позвоночных, плоских червей, иглокожих, кодируются разными кодами, а плесневых грибков, простейших и кишечнополостных - одним.

Эволюционная близость видов - отнюдь не гарант того, чтобы у них были сходные ГК. Генетические коды могут различаться даже у разных видов микоплазм (одни виды имеют канонический код, а другие - отличающиеся). Аналогичная ситуация наблюдается и для дрожжей.

Важно отметить, что митохондрии - потомки симбиотических организмов, которые приспособились жить внутри клеток. Они имеют сильно редуцированный геном , часть генов переселилась в ядро клетки. Поэтому изменения ГК в них становятся уже не столь кардинальными.

Обнаруженные позднее исключения представляют особый интерес с точки зрения эволюции, поскольку могу помочь пролить свет на механизмы эволюции кода.

Таблица 1.

Митохондриальные коды у различных организмов.

Кодон

Универсальный код

Митохондриальные коды

Позвоночные

Беспозвоночные

Дрожжи

Растения

UGA

STOP

Trp

Trp

Trp

STOP

AUA

Ile

Met

Met

Met

Ile

CUA

Leu

Leu

Leu

Thr

Leu

AGA

Arg

STOP

Ser

Arg

Arg

AGG

Arg

STOP

Ser

Arg

Arg

Три механизма смены аминокислоты, кодируемой кодом.

Первый - когда какой-то кодон не используется (или почти не используется) каким-то организмом в силу неравномерности встречаемости каких-то нуклеотидов (GC -состав), или комбинаций нуклеотидов. В результате такой кодон может вовсе исчезнуть из употребления (например, благодаря потере соответствующей тРНК ), а в дальнейшем может использоваться для кодирования другой аминокислоты без нанесения существенного ущерба организму. Этот механизм возможно отвечает за появление некоторых диалектов кодов у митохондрий.

Второй - превращение стоп-кодона в смысл овой. В этом случае часть у части транслируемых белков могут появиться дополнения. Однако ситуацию частично спасает то, что многие гены часто заканчиваются не одним, а двумя стоп-кодонами, поскольку возможны ошибки трансляци и, при которых стоп-кодоны считываются как аминокислоты.

Третий - возможно неоднозначное считывание определённых кодонов, как это имееют место у некоторых грибов.

8 . Связность. Группы эквивалентных кодонов (то есть кодонов, кодирующих одну и ту же аминокислоту) называются сериями . ГК содержит 21 серию, включая стоп-кодоны. В дальнейшем для определенности любая группа кодонов будет называться связной, если от каждого кодона этой группы можно перейти ко всем другим кодонам этой же группы путем последовательных замен нуклеотидов. Из 21 серии связны 18. 2 серии содержат по одному кодону, и лишь 1 серия для аминокислоты серин является несвязной и распадается на 2 две связные подсерии.


Рис. 5. Графы связности для некоторых кодовых серий. а - связная серия валина; б - связная серия лейцина; серия серина несвязная, распадается на две связных подсерии. Рисунок взят из статьи В.А. Ратнера " Генетический код как система ".

Свойство связности можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

9. Регулярность свойств аминокислот по корням триплетов. Все аминокислоты, кодируемые триплетами скорнем U, являются неполярными, не крайних свойств и размеров, имеюталифатические радикалы. Все триплеты с корнем C имеют сильные основы, ааминокислоты, кодируемые ими, имеют относительно малые размеры. Все триплеты с корнем A имеют слабые основы, кодируют полярные аминокислоты не малых размеров. Кодоны с корнем G характеризуются крайними и аномальнными вариантами аминокислот и серий. Они кодируют самую маленькую аминокислоту (глицин), самую длинную и плоскую (триптофан), самую длинную и «корявую» (аргинин), самую реактивную (цистеин), образует аномальную подсерию для серина.

10. Блочность. Универсальный ГК является «блоковым» кодом. Это означает, что аминокислоты со сходными физико-химическими свойствами, кодируются кодонами, отличающимися друг от друга одним основанием. Блочность кода хорошо видна на следующем рисунке.


Рис. 6. Блочная структура ГК. Белым цветом обозначены аминокислоты с алкильной группой.


Рис. 7. Цветовое представление физико-химических свойств аминокислот, основанное на значениях, описанных в кн книге Стайерса "Биохимия" . Слева - гидрофобность. Справа - способность к формированию альфа-спирали в белке. Красный, жёлтый и голубой цвета обозначают аминокислоты с большой, средней и малой гидрофобностью (слева) или соответствующей степенью способности к формированию альфа-спирали (справа).

Свойство блочности и регулярности также можно объяснить тем, что в период формирования ГК захватывал новые кодоны, которые минимально отличались от уже используемых.

Кодоны с одинаковыми первыми основаниями (приставками кодонов) кодируют аминокислоты с близкими путями биосинтеза . Кодоны аминокислот, принадлежащих к шикиматному , пируватному , аспартатному и глутаматному семействам, имеют в качестве приставок U, G, A и C, соответственно. О путях древнего биосинтеза аминокислот и его связи со свойствами современного кода см. "Древний дублетный генетический код был предопределён путями синтеза аминокислот ". На основе этих данных некоторые исследователи делают вывод о том, что на формирование кода большое влияние оказали биосинтетические взаимоотношения между аминокислотами . Однако сходство биосинтетических путей вовсе не означает сходство физико-химических свойств .

11. Помехоустойчивость. В самом общем виде помехоустойчивость ГК означает, что при случайных точковых мутациях и ошибках трансляци и не очень сильно меняются физико-химические свойства аминокислот.

Замена одного нуклеотида в триплете в большинстве случаев или не приводит к замене кодируемой аминокислоты, или приводит к замене на аминокислоту с той же полярностью.

Один из механизмов, обеспечивающих помехоустойчивость ГК - его вырожденность. Средняя вырожденность равна - число кодируемых сигналов/общее число кодонов, где к кодируемым сигналам относятся 20 аминокислот и знак терминации трансляци и. Усредненная вырожденность для всех аминокислот и знака терминации составляет три кодона на кодируемый сигнал.

Для того, чтобы количественно оценить помехоустойчивость, введём два понятия. Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными .

Каждый триплет допускает 9 однократных замен. Всего кодирующих аминокислоты триплетов 61. Поэтому количество возможных замен нуклеотидов для всех кодонов -

61 x 9 = 549. Из них:

23 замены нуклеотидов приводят к появлению стоп-кодонов.

134 замены не меняют кодируемую аминокислоту.
230 замен не меняют класс кодируемой аминокислоты.
162 замены приводят к смене класса аминокислоты, т.е. являются радикальными.
Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляци и, а 176 - консервативны.
Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны.
Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 -консервативны, 102 - радикальны.

На основе этих расчётов получим количественную оценку помехоустойчивости кода, как отношение числа консервативных замен к числу радикальных замен. Оно равно 364/162=2.25

При реальной оценке вклада вырожденности в помехоустойчивость необходимо учитывать частоту встречаемости аминокислот в белках, которая варьирует в разных видах.

В чем причина помехоустойчивости кода? Большинство исследователей считают, что это свойство является следствием селекции альтернативных ГК .

Стивен Фриленд и Лоренс Херст генерировали случайные такие коды и выясняли, что только один из ста альтернативных кодов обладает не меньшей помехоустойчивостью по сравнению с универсальным ГК.
Еще более интересный факт обнаружился, когда эти исследователи ввели дополнительное ограничение, с тем чтобы учесть реально существующие тенденции в характере мутирования ДНК и появлении ошибок при трансляци и. При таких условиях лучше канонического кода оказался ТОЛЬКО ОДИН КОД ИЗ МИЛЛИОНА ВОЗМОЖНЫХ.
Столь беспрецедентную жизнестойкость генетического кода проще всего объяснить тем, что он сформировался в результате естественного отбора. Возможно когда-то в биологическом мире существовало множество кодов, каждый со своей чувствительностью к ошибкам. Организм, лучше справлявшийся с ними, имел больше шансов выжить, и канонический код просто победил в борьбе за существование. Это предположение кажется вполне реальным - ведь мы знаем, что альтернативные коды действительно существуют. Подробнее о помехоустойчивости см. Закодированная эволюция (С.Фриленд, Л. Херст "Закодированная эволюция".//В мире науки. - 2004, №7).

В заключение, предлагаю посчитать число возможных генетических кодов, которые можно сгенерировать для 20 канонических аминокислот. Почему-то это число нигде мне не попадалось. Итак, нам необходимо, чтобы в генерируемых ГК были обязательно 20 аминокислот и стоп-сигнал, кодируемые ХОТЯ БЫ ОДНИМ КОДОНОМ.

Мысленно будем нумеровать кодоны в каком-то порядке. Рассуждать будем следующим образом. Если у нас имеется ровно 21 кодон, то тогда каждая аминокислота и стоп-сигнал будут занимать ровно по одному кодону. В этом случае возможных ГК будет 21!

Если будет 22 кодона, то появляется лишний кодон, который может иметь один из любых 21 смысл ов, причём этот кодон может располагаться на любом из 22 мест, тогда как остальные кодоны имеют ровно по одному разному смысл у, как и для случая 21 кодонов. Тогда получим число комбинаций 21!х(21х22).

Если кодонов будет 23, то рассуждая аналогично, получим, что 21 кодон имеют ровно по одному разных смысл ов (21! вариантов), а два кодона - по 21 разных смысл а (21 2 смысл ов при ФИКСИРОВАННОМ положении этих кодонов). Число различных положений для этих двух кодонов будет 23х22. Общее число вариантов ГК для 23 кодонов - 21!х21 2 х23х22

Если кодонов будет 24 - то число ГК будет равно 21!х21 3 х24х23х22,...

....................................................................................................................

Если кодонов будет 64, то число возможных ГК будет 21!х21 43 х64!/21! = 21 43 х64! ~ 9.1х10 145