Код в коде: раскрыт второй генетический код. Биосинтез белка и нуклеиновых кислот

ГЕНЕТИЧЕСКИЙ КОД, система записи наследственной информации в виде последовательности оснований нуклеотидов в молекулах ДНК (у некоторых вирусов - РНК), определяющая первичную структуру (расположение аминокислотных остатков) в молекулах белков (полипептидов). Проблема генетического кода была сформулирована после доказательства генетической роли ДНК (американские микробиологи О. Эйвери, К. Мак-Леод, М. Маккарти, 1944) и расшифровки её структуры (Дж. Уотсон, Ф. Крик, 1953), после установления того, что гены определяют структуру и функции ферментов (принцип «один ген - один фермент» Дж. Бидла и Э. Тейтема, 1941) и что существует зависимость пространственной структуры и активности белка от его первичной структуры (Ф. Сенгер, 1955). Вопрос о том, как комбинации из 4 оснований нуклеиновых кислот определяют чередование 20 обычных аминокислотных остатков в полипептидах, впервые поставил Г. Гамов в 1954 году.

На основании эксперимента, в котором исследовали взаимодействия вставок и выпадений пары нуклеотидов, в одном из генов бактериофага Т4 Ф. Крик и другие учёные в 1961 году определили общие свойства генетического кода: триплетность, т. е. каждому аминокислотному остатку в полипептидной цепи соответствует набор из трёх оснований (триплет, или кодон) в ДНК гена; считывание кодонов в пределах гена идёт с фиксированной точки, в одном направлении и «без запятых», то есть кодоны не отделены какими-либо знаками друг от друга; вырожденность, или избыточность, - один и тот же аминокислотный остаток могут кодировать несколько кодонов (кодоны-синонимы). Авторы предположили, что кодоны не перекрываются (каждое основание принадлежит только одному кодону). Прямое изучение кодирующей способности триплетов было продолжено с использованием бесклеточной системы синтеза белка под контролем синтетической матричной РНК (мРНК). К 1965 году генетический код был полностью расшифрован в работах С. Очоа, М. Ниренберга и Х. Г. Кораны. Раскрытие тайны генетического кода явилось одним из выдающихся достижений биологии в 20 веке.

Реализация генетического кода в клетке происходит в ходе двух матричных процессов - транскрипции и трансляции. Посредником между геном и белком является мРНК, образующаяся в процессе транскрипции на одной из нитей ДНК. При этом последовательность оснований ДНК, несущая информацию о первичной структуре белка, «переписывается» в виде последовательности оснований мРНК. Затем в ходе трансляции на рибосомах последовательность нуклеотидов мРНК считывается транспортными РНК (тРНК). Последние имеют акцепторный конец, к которому присоединяется аминокислотный остаток, и адаптерный конец, или антикодон-триплет, который узнаёт соответствующий кодон мРНК. Взаимодействие кодона и анти-кодона происходит на основании комплементарного спаривания оснований: Аденин (А) - Урацил (U), Гуанин (G) - Цитозин (С); при этом последовательность оснований мРНК переводится в аминокислотную последовательность синтезирующегося белка. Различные организмы используют для одной и той же аминокислоты разные кодоны-синонимы с разной частотой. Считывание мРНК, кодирующей полипептидную цепь, начинается (инициируется) с кодона AUG, соответствующего аминокислоте метионину. Реже у прокариот инициирующими кодонами служат GUG (валин), UUG (лейцин), AUU (изолейцин), у эукариот - UUG (лейцин), AUA (изолейцин), ACG (треонин), CUG (лейцин). Это задаёт так называемую рамку, или фазу, считывания при трансляции, то есть далее всю нуклеотидную последовательность мРНК считывают триплет за триплетом тРНК до тех пор, пока на мРНК не встретится любой из трёх кодонов-терминаторов, часто называемых стоп-кодонами: UAA, UAG, UGA (таблица). Считывание этих триплетов приводит к завершению синтеза полипептидной цепи.

Кодоны AUG и стоп-кодоны стоят соответственно в начале и в конце участков мРНК, кодирующих полипептиды.

Генетический кода квазиуниверсален. Это значит, что существуют небольшие вариации в значении некоторых кодонов у разных объектов, и это касается, прежде всего, кодонов-терминаторов, которые могут быть значащими; например, в митохондриях некоторых эукариот и у микоплазм UGA кодирует триптофан. Кроме того, в некоторых мРНК бактерий и эукариот UGA кодирует необычную аминокислоту - селеноцистеин, а UAG у одной из архебактерий - пирролизин.

Существует точка зрения, согласно которой генетический кода возник случайно (гипотеза «замороженного случая»). Более вероятно, что он эволюционировал. В пользу такого предположения говорит существование более простого и, по-видимому, более древнего варианта кода, который считывается в митохондриях согласно правилу «два из трёх», когда аминокислоту определяют только два из трёх оснований в триплете.

Лит.: Crick F. Н. а. о. General nature of the genetic code for proteins // Nature. 1961. Vol. 192; The genetic code. N. Y., 1966; Ичас М. Биологический код. М., 1971; Инге-Вечтомов С. Г. Как читается генетический код: правила и исключения // Современное естествознание. М., 2000. Т. 8; Ратнер В. А. Генетический код как система // Соросовский образовательный журнал. 2000. Т. 6. № 3.

С. Г. Инге-Вечтомов.

Выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Белки практически всех живых организмов построены из аминокислот всего 20 видов. Эти аминокислоты называют каноническими. Каждый белок представляет собой цепочку или несколько цепочек аминокислот, соединённых в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства.

C

CUU (Leu/L)Лейцин
CUC (Leu/L)Лейцин
CUA (Leu/L)Лейцин
CUG (Leu/L)Лейцин

В некоторых белках нестандартные аминокислоты, такие как селеноцистеин и пирролизин , вставляются рибосомой, прочитывающей стоп-кодон, что зависит от последовательностей в мРНК . Селеноцистеин сейчас рассматривается в качестве 21-й, а пирролизин 22-й аминокислот, входящих в состав белков.

Несмотря на эти исключения, у всех живых организмов генетический код имеет общие черты: кодон состоят из трёх нуклеотидов, где два первых являются определяющими, кодоны транслируются тРНК и рибосомами в последовательность аминокислот.

Отклонения от стандартного генетического кода .
Пример Кодон Обычное значение Читается как:
Некоторые виды дрожжей рода Candida CUG Лейцин Серин
Митохондрии, в частности у Saccharomyces cerevisiae CU(U, C, A, G) Лейцин Серин
Митохондрии высших растений CGG Аргинин Триптофан
Митохондрии (у всех без исключения исследованных организмов) UGA Стоп Триптофан
Митохондирии млекопитающих, дрозофилы , S. cerevisiae и многих простейших AUA Изолейцин Метионин = Старт
Прокариоты GUG Валин Старт
Эукариоты (редко) CUG Лейцин Старт
Эукариоты (редко) GUG Валин Старт
Прокариоты (редко) UUG Лейцин Старт
Эукариоты (редко) ACG Треонин Старт
Митохондрии млекопитающих AGC, AGU Серин Стоп
Митохондрии дрозофилы AGA Аргинин Стоп
Митохондрии млекопитающих AG(A, G) Аргинин Стоп

История представлений о генетическом коде

Тем не менее в начале 60-х годов XX века новые данные обнаружили несостоятельность гипотезы «кода без запятых». Тогда эксперименты показали, что кодоны, считавшиеся Криком бессмысленными, могут провоцировать белковый синтез в пробирке, и к 1965 году был установлен смысл всех 64 триплетов. Оказалось, что некоторые кодоны просто-напросто избыточны, то есть целый ряд аминокислот кодируется двумя, четырьмя или даже шестью триплетами.

См. также

Примечания

  1. Genetic code supports targeted insertion of two amino acids by one codon. Turanov AA, Lobanov AV, Fomenko DE, Morrison HG, Sogin ML, Klobutcher LA, Hatfield DL, Gladyshev VN. Science. 2009 Jan 9;323(5911):259-61.
  2. Кодон AUG кодирует метионин, но одновременно служит стартовым кодоном - с первого AUG-кодона мРНК как правило начинается трансляция.
  3. NCBI: «The Genetic Codes», Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell
  4. Jukes TH, Osawa S, The genetic code in mitochondria and chloroplasts. , Experientia. 1990 Dec 1;46(11-12):1117-26.
  5. Osawa S, Jukes TH, Watanabe K, Muto A (March 1992). «Recent evidence for evolution of the genetic code ». Microbiol. Rev. 56 (1): 229–64. PMID 1579111 .
  6. SANGER F. (1952). «The arrangement of amino acids in proteins.». Adv Protein Chem. 7 : 1-67. PMID 14933251 .
  7. М. Ичас Биологический код. - Мир, 1971.
  8. WATSON JD, CRICK FH. (April 1953). «Molecular structure of nucleic acids; a structure for deoxyribose nucleic acid.». Nature 171 : 737-738. PMID 13054692 .
  9. WATSON JD, CRICK FH. (May 1953). «Genetical implications of the structure of deoxyribonucleic acid.». Nature 171 : 964-967. PMID 13063483 .
  10. Crick FH. (April 1966). «The genetic code - yesterday, today, and tomorrow.». Cold Spring Harb Symp Quant Biol. : 1-9. PMID 5237190 .
  11. G. GAMOW (February 1954). «Possible Relation between Deoxyribonucleic Acid and Protein Structures.». Nature 173 : 318. DOI :10.1038/173318a0 . PMID 13882203 .
  12. GAMOW G, RICH A, YCAS M. (1956). «The problem of information transfer from the nucleic acids to proteins.». Adv Biol Med Phys. 4 : 23-68. PMID 13354508 .
  13. Gamow G, Ycas M. (1955). «STATISTICAL CORRELATION OF PROTEIN AND RIBONUCLEIC ACID COMPOSITION. ». Proc Natl Acad Sci U S A. 41 : 1011-1019. PMID 16589789 .
  14. Crick FH, Griffith JS, Orgel LE. (1957). «CODES WITHOUT COMMAS. ». Proc Natl Acad Sci U S A. 43 : 416-421. PMID 16590032 .
  15. Hayes B. (1998). «The Invention of the Genetic Code.» (PDF reprint). American Scientist 86 : 8-14.

Литература

  • Азимов А. Генетический код. От теории эволюции до расшифровки ДНК. - М.: Центрполиграф, 2006. - 208 с - ISBN 5-9524-2230-6 .
  • Ратнер В. А.Генетический код как система - Соросовский образовательный журнал, 2000, 6, № 3, с.17-22.
  • Crick FH, Barnett L, Brenner S, Watts-Tobin RJ. General nature of the genetic code for proteins - Nature, 1961 (192), pp. 1227-32

Ссылки

  • Генетический код - статья из Большой советской энциклопедии

Wikimedia Foundation . 2010 .

Генетический код - это способ кодирования последовательности аминокислот в молекуле белка с помощью последовательности нуклеотидов в молекуле нуклеиновой кислоты. Свойства генетического кода вытекают из особенностей этого кодирования.

Каждой аминокислоте белка сопоставляется в соответствие три подряд идущих нуклеотида нуклеиновой кислоты - триплет , или кодон . Каждый из нуклеотидов может содержать одно из четырех азотистых оснований. В РНК это аденин (A), урацил (U), гуанин (G), цитозин (C). По-разному комбинируя азотистые основания (в данном случае содержащие их нуклеотиды) можно получить множество различных триплетов: AAA, GAU, UCC, GCA, AUC и т. д. Общее количество возможных комбинаций - 64, т. е. 4 3 .

В состав белков живых организмов входит около 20 аминокислот. Если бы природа «задумала» кодировать каждую аминокислоту не тремя, а двумя нуклеотидами, то разнообразия таких пар не хватило бы, так как их оказалось бы всего 16, т.е. 4 2 .

Таким образом, основное свойство генетического кода - его триплетность . Каждая аминокислота кодируется тройкой нуклеотидов.

Поскольку возможных разных триплетов существенно больше, чем используемых в биологических молекулах аминокислот, то в живой природе было реализовано такое свойство как избыточность генетического кода. Многие аминокислоты стали кодироваться не одним кодоном, а несколькими. Например, аминокислота глицин кодируется четырьмя различными кодонами: GGU, GGC, GGA, GGG. Избыточность также называют вырожденностью .

Соответствие между аминокислотами и кодонами отражают в виде таблиц. Например, таких:

По отношению к нуклеотидам генетический код обладает таким свойством как однозначность (или специфичность ): каждый кодон соответствует только одной аминокислоте. Например, кодоном GGU можно закодировать только глицин и больше никакую другую аминокислоту.

Еще раз. Избыточность - это про то, что несколько триплетов могут кодировать одну и ту же аминокислоту. Специфичность - каждый конкретный кодон может кодировать только одну аминокислоту.

В генетическом коде нет специальных знаков препинания (если не считать стоп-кодонов, обозначающих окончание синтеза полипептида). Функцию знаков препинания выполняют сами триплеты - окончание одного обозначает, что следом начнется другой. Отсюда следуют следующие два свойства генетического кода: непрерывность и неперекрываемость . Под непрерывность понимают считывание триплетов сразу друг за другом. Под неперекрываемостью - то, что каждый нуклеотид может входить в состав только одного триплета. Так первый нуклеотид следующего триплета всегда стоит после третьего нуклеотида предшествующего триплета. Кодон не может начаться со второго или третьего нуклеотида предшествующего кодона. Другими словами, код не перекрывается.

Генетический код обладает свойством универсальности . Он един для всех организмов на Земле, что говорит о единстве происхождения жизни. При этом встречаются очень редкие исключения. Например, некоторые триплеты митохондрий и хлоропластов кодируют другие, а не обычные для них, аминокислоты. Это может говорить о том, что на заре развития жизни существовали немного различные вариации генетического кода.

Наконец, генетический код обладает помехоустойчивостью , которая является следствием такого его свойства как избыточность. Точечные мутации , иногда происходящие в ДНК , обычно приводят к замене одного азотистого основания на другое. При этом изменяется триплет. Например, было AAA, после мутации стало AAG. Однако подобные изменения не всегда приводят к изменению аминокислоты в синтезируемом полипептиде, так как оба триплета из-за свойства избыточности генетического кода могут соответствовать одной аминокислоте. Учитывая, что мутации чаще вредны, свойство помехоустойчивости полезно.

Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

- единая система записи наследственной ин­формации в молекулах нуклеиновых кислот в виде последова­тельности нуклеотидов. Генетический код основан на использо­вании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода следующие:

1. Генетический код триплетен. Триплет (кодон) - последовательность трех нуклеотидов, кодирующая одну аминокислоту. Поскольку в состав бел­ков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот оста­ются незакодированными). Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, оказыва­ется равным трем. (В этом случае число возможных триплетов нуклеотидов составляет 4 3 = 64).

2. Избыточность (вырожденность) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими трип­летами (поскольку аминокислот 20, а триплетов - 64). Исключение составляют метионин и триптофан, которые кодируются только одним триплетом. Кроме того, некоторые триплеты вы­полняют специфические функции. Так, в молекуле иРНК три из них УАА, УАГ, УГА - являются терминирующими кодонами, т. е. стоп-сигналами, прекращающими синтез полипептидной цепи. Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Одно­временно с избыточностью коду присуще свойство однозначнос­ти, которое означает, что каждому кодону соответствует только одна определенная аминокислота.

4. Код коллинеарен, т.е. по­следовательность нуклеотидов в гене точно соответствует после­довательности аминокислот в белке.

5. Генетический код непере­крываем и компактен, т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп-сигналов (терминирующих кодонов). Например, в иРНК следующая последовательность азотистых оснований АУГГУГЦУУААУГУГ будет считываться только такими трип­летами: АУГ, ГУГ, ЦУУ, ААУ, ГУГ, а не АУГ, УГГ, ГГУ, ГУГ и т. Д. или АУГ, ГГУ, УГЦ, ЦУУ и т. д. или еще каким-либо образом (допустим, кодон АУГ, знак препинания Г, кодон УГЦ, знак пре­пинания У и Т. п.).

6. Генетический код универсален, т. е. ядер­ные гены всех организмов одинаковым образом кодируют инфор­мацию о белках вне зависимости от уровня организации и систематического положения этих организмов.