Генетический код

Генетический код клетки

Генетический код

Ранее мы подчёркивали, что нуклеотиды имеют важную для формирования жизни на Земле особенность ― при наличии в растворе одной полинуклеотидной цепочки спонтанно происходит процесс образования второй (параллельной) цепочки на основании комплементарного соединения родственных нуклеотидов. Одинаковое число нуклеотидов, в обоих цепочках и их химическое родство, является непременным условием для осуществления такого рода реакций.

Однако при синтезе белка, когда информация с иРНК реализуется в структуру белка никакой речи о соблюдении принципа комплементарности идти не может.

Это связано с тем, что в иРНК, и в синтезированном белке различно не только число мономеров, но и, что особенно важно, отсутствует структурное сходство между ними (с одной стороны нуклеотиды, с другой аминокислоты).

Понятно, что в этом случае возникает необходимость создания нового принципа точного перевода информации с полинуклеотида в структуру полипептида. В эволюции такой принцип был создан и в его основу был заложен генетический код.

Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.

Свойства генетического кода

Генетический код имеет несколько свойств:

  1. Триплетность.
  2. Вырожденность или избыточность.
  3. Однозначность.
  4. Полярность.
  5. Неперекрываемость.
  6. Компактность.
  7. Универсальность.

Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.

Триплетность

Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет ― наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон ― наименьшая функциональная единица генетического кода.

Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см.

далее). Как видно из определения, триплет ― это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов).

Кодон ― характеризует элементарную смысловую единицу генома ― три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.

Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 43 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).

Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую-либо аминокислоту, их называют смысловые кодоны. Три триплета не кодируют.

Таблица 1.

Как пользоваться этой таблицей, смотрите в этом видео:

Стоп-кодоны

Кодоны информационной РНК и соответствующие им аминокислоты являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три ― УАА, УАГ, УГА, их ещё называют «бессмысленные» (нонсенс кодоны).

В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называют нонсенс-мутация.

Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться ― синтезироваться будет только первая (до стоп-сигнала) часть белка.

У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается.

В результате формируется молекула гемоглобина, лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» ― Средиземное море, где эта болезнь впервые обнаружена).

Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.

Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции.

Неканонические значения кодонов

По крайней мере у 16 типов организмов генетический код отличается от канонического.

Например многие виды зелёных водорослей Acetabularia транслируют стандартные стоп-кодоны UAG и UAA в аминокислоту глицин, а гриб Candida интерпретирует РНК-кодон CUG не как лейцин, а как серин.

А у митохондрий пекарских дрожжей (Saccharomyces cerevisiae) четыре из шести кодонов, обычно транслирующихся в лейцин, кодируют треонин.
Существование таких вариаций свидетельствует о возможной эволюции генетического кода.

Представители всех трёх доменов живых организмов иногда прочитывают стандартный стоп-кодон UGA как 21-ю аминокислоту селеноцистеин, не относящуюся к 20 стандартным. Селеноцистеин образуется при химической модификации серина на стадии, когда последний ещё не отсоединился от тРНК в составе рибосомы.

Аналогично у представителей двух доменов (архебактерий и бактерий) стоп-кодон UAG прочитывается как 22-я аминокислота пирролизин.

Вырожденность, или избыточность

61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования.

Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами.

Исследования показали, что природа использовала последний вариант.

Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов.

Так, аминокислота лейцин может кодироваться шестью триплетами — УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин — двумя и только триптофан и метионин кодируются одним кодоном.

Свойство, которое связано с записью одной и той же информации разными символами носит название вырожденность.

Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках. И это, скорее всего, не случайно.

Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами.

Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.

Необходимо отметить, что термин вырожденность используется в молекулярной генетике и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют «вырожденностью третьего основания». Последняя особенность сводит до минимума эффект мутаций.

Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент — гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части ― глобина, который кодируется соответствующим геном.

Кроме белка в молекулу гемоглобина входит ген, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона, который может кодировать новую аминокислоту в полипептидной цепи гемоглобина.

В триплете, в результате мутации может быть заменён любой нуклеотид ― первый, второй или третий.

Мутации в гемоглобине

Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около 400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только 100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых.

300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше «вырожденность третьего основания», когда замена третьего нуклеотида в триплете, кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту.

Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам.

Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.

Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка — глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные a-цепи и две b-цепи.

Замена в гене, кодирующем b-цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного.

Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” — приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту — тирозин. Фенотипически это проявится в тяжёлом заболевании.

Гистидин, тирозин

Аналогичная замена в 63 положении b-цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении b-цепи является причиной тяжелейшего заболевания — серповидно-клеточной анемии. Не будем продолжать печальный список.

Глутаминовая кислота и лизин

Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю.

Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в b-цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин.

Глутаминовая кислота и лизин сходны по физико-химическим свойствам — они обе гидрофильны. Валин — гидрофобная аминокислота.

Поэтому, замена гидрофильной глутаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глутаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина — у больных возникает легкая форма малокровия.

Урацил и цитозин

В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту ― гистидин.

В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.

Однозначность

Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон ― аминокислота генетический код однозначен, в направлении аминокислота ― кодон ― неоднозначен (вырожденный).

И в этом случае необходимость однозначности в генетическом коде очевидна.

При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией.

Метаболизм клетки перешёл бы в режим работы «один ген ― несколько полипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.

Полярность

Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка.

Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы.

В то время, когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).

Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.

Неперекрываемость

Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.

Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона.

Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) или пять (если общими являются два нуклеотида). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.

Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся.

Неперекрываемость генетического кода связана с ещё одним свойством ― считывание информации начинается с определённой точки ― сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ.

Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.

Компактность

Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.

Универсальность

Код един для всех организмов, живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.

Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.

Краткие сведения

Генетический код ― это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке. Генетический код имеет несколько свойств.

  1. Триплетность. Триплет состоит из трёх нуклеотидов. 61 кодон ― смысловые, т.е. кодируют какую-либо аминокислоту, три ― бессмысленные, т.е. не кодируют аминокислоты.
  2. Вырожденность или избыточность. Одна аминокислота может кодироваться несколькими кодонами.
  3. Однозначность. Один кодон кодирует только одну аминокислоту.
  4. Полярность. Считывание информации с ДНК и с иРНК происходит только в одном направлении.
  5. Неперекрываемость. Генетический код является не перекрывающимся.
  6. Компактность. Между кодонами нет знаков препинания.
  7. Универсальность. Код един для всех живущих на земле организмов.

Источник: https://novstudent.ru/geneticheskiy-kod-kletki/

Биология в лицее

Генетический код

Генетический код

Генетический код — это свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов в молекуле ДНК.

Реализация генетической информации в живых клетках (то есть синтез белка, закодированного в ДНК) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза иРНК на матрице ДНК) и трансляции (синтез полипептидной цепи на матрице иРНК).

В ДНК используется четыре нуклеотида — аденин (А), гуанин (Г), цитозин (Ц), тимин (T). Эти «буквы» составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменен урацилом (У). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности «букв».

В нуклеотидной последовательности ДНК имеются кодовые «слова» для каждой аминокислоты будущей молекулы белка — генетический код. Он заключается в определенной последовательности расположения нуклеотидов в молекуле ДНК.

Три стоящих подряд нуклеотида кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

В настоящее время код ДНК полностью расшифрован, и мы можем говорить об определенных свойствах, характерных для этой уникальной биологической системы, обеспечивающей перевод информации с «языка» ДНК на «язык» белка.

Носителем генетической информации является ДНК, но так как непосредственное участие в синтезе белка принимает иРНК — копия одной из нитей ДНК, то чаще всего генетический код записывают на “языке РНК”.

Аминокислота Кодирующие триплеты РНК
АланинГЦУ ГЦЦ ГЦА ГЦГ
АргининЦГУ ЦГЦ ЦГА ЦГГ АГА АГГ
АспарагинААУ ААЦ
Аспарагиновая кислотаГАУ ГАЦ
ВалинГУУ ГУЦ ГУА ГУГ
ГистидинЦАУ ЦАЦ
ГлицинГГУ ГГЦ ГГА ГГГ
ГлутаминЦАА ЦАГ
Глутаминовая кислотаГАА ГАГ
ИзолейцинАУУ АУЦ АУА
ЛейцинЦУУ ЦУЦ ЦУА ЦУГ УУА УУГ
ЛизинААА ААГ
МетионинАУГ
ПролинЦЦУ ЦЦЦ ЦЦА ЦЦГ
СеринУЦУ УЦЦ УЦА УЦГ АГУ АГЦ
ТирозинУАУ УАЦ
ТреонинАЦУ АЦЦ АЦА АЦГ
ТриптофанУГГ
ФенилаланинУУУ УУЦ
ЦистеинУГУ УГЦ
СТОПУГА УАГ УАА 

Свойства генетического кода

  • Триплетность

Три стоящих подряд нуклеотида (азотистых оснований) кодируют «имя» одной аминокислоты, то есть каждая из 20 аминокислот зашифрована значащей единицей кода — сочетанием из трех нуклеотидов, называемых триплет или кодон.

Триплет (кодон) — последовательность из трех нуклеотидов (азотистых оснований) в молекуле ДНК или РНК, определяющая включение в молекулу белка в процессе ее синтеза определенной аминокислоты.

  • Однозначность (дискретность)

Один триплет не может кодировать две разные аминокислоты, шифрует только одну аминокислоту. Определенный кодон соответствует только одной аминокислоте.

  • Избыточность (вырожденность)

Каждая аминокислота может определяться более, чем одним триплетом. Исключение — метионин и триптофан. Другими словами — одной и той же аминокислоте может соответствовать несколько кодонов.

Одно и то же основание не может одновременно входить в два соседних кодона.

  • Полярность

Некоторые триплеты не кодируют аминокислоты, а являются своеобразными «дорожными знаками», которые определяют начало и конец отдельных генов, (УАА, УАГ, УГА), каждый из которых означает прекращение синтеза и расположен в конце каждого гена, поэтому мы можем говорить о полярности генетического кода.

  • Универсальность

У животных и растений, у грибов, бактерий и вирусов один и тот же триплет кодирует один и тот же тип аминокислоты, то есть генетический код одинаков для всех живых существ.

 Другими словами, универсальность — способность генетического кода работать одинаково в организмах разного уровня сложности от вирусов до человека. Универсальность кода ДНК подтверждает единство происхождения всего живого на нашей планете.

На использовании свойства универсальности генетического кода основаны методы генной инженерии.

Из истории открытия генетического кода

Впервые идея о существовании генетического кода сформулирована А. Дауном и Г. Гамовым в 1952 — 1954 годах. Учёные показали, что последовательность нуклеотидов, однозначно определяющая синтез той или иной аминокислоты, должна содержать не менее трёх звеньев. Позднее было доказано, что такая последовательность состоит из трех нуклеотидов, названных кодоном или триплетом.

Вопросы о том, какие нуклеотиды ответственны за включение определенной аминокислоты в белковую молекулу и какое количество нуклеотидов определяет это включение, оставались нерешенными до 1961 года.

Теоретический разбор показал, что код не может состоять из одного нуклеотида, поскольку в этом случае только 4 аминокислоты могут кодироваться.

Однако код не может быть и дуплетным, то есть комбинация двух нуклеотидов из четырехбуквенного «алфавита» не может охватить всех аминокислот, так как подобных комбинаций теоретически возможно только 16 (42 = 16).

Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трех последовательных нуклеотидов, когда число возможных комбинаций составит 64 (43 = 64).

< Предыдущая страница “Клеточное ядро”

Следующая страница “Транскрипция и трансляция” >

Источник: http://biolicey2vrn.ru/index/geneticheskij_kod/0-797

Генетический код

Генетический код

Генетический, или биологический, код является одним из универсальных свойств живой природы, доказывающим единство ее происхождения. Генетический кодэто способ кодирования последовательности аминокислот полипептида с помощью последовательности нуклеотидов нуклеиновой кислоты (информационной РНК или комплиментарного ей участка ДНК, на котором синтезируется иРНК).

Встречаются другие определения. Генетический код — это соответствие каждой аминокислоте (входящей в состав белков живого) определенной последовательности трех нуклеотидов. Генетический код — это зависимость между основаниями нуклеиновых кислот и аминокислотами белка.

В научной литературе под генетическим кодом не понимают последовательность нуклеотидов в ДНК у какого-либо организма, определяющую его индивидуальность. Неверно считать, что у одного организма или вида код один, а у другого — другой. Генетический код — это то, как кодируются аминокислоты нуклеотидами (т. е.

принцип, механизм); он универсален для всего живого, одинаков для всех организмов. Поэтому некорректно говорить, например, «Генетический код человека» или «Генетический код организма», что нередко используется в околонаучной литературе и фильмах.

В данных случаях обычно имеется в виду геном человека, организма и др.

Разнообразие живых организмов и особенностей их жизнедеятельности обусловлено в первую очередь разнообразием белков. Специфическое строение белка определяется порядком и количеством различных аминокислот, входящих в его состав.

Последовательность аминокислот пептида зашифрована в ДНК с помощью биологического кода. С точки зрения разнообразия набора мономеров, ДНК более примитивная молекула, чем пептид. ДНК представляет собой различные варианты чередования всего четырех нуклеотидов.

Это долгое время мешало исследователям рассматривать ДНК как материал наследственности.

Как кодируются аминокислоты нуклеотидами

1) Нуклеиновые кислоты (ДНК и РНК) — это полимеры, состоящие из нуклеотидов. В каждый нуклеотид может входить одно из четырех азотистых оснований: аденин (А, еn: A), гуанин (Г, G), цитозин (Ц, en: C), тимин (T, en: Т). В случае РНК тимин заменяется на урацил (У, U).

При рассмотрении генетического кода принимают во внимание только азотистые основания. Тогда цепочку ДНК можно представить в виде их линейной последовательности. Например:

…AAATGAACTTCA…

Комплиментарный данному коду участок иРНК будет таким:

…UUUACUUGAAGU…

2) Белки (полипептиды) — это полимеры, состоящие из аминокислот. В живых организмах для построения полипептидов используется 20 аминокислот (еще несколько очень редко). Для их обозначения тоже можно использовать одну букву (хотя чаще используют три — сокращение от названия аминокислоты).

Аминокислоты в полипептиде соединены между собой пептидной связью также линейно. Например, пусть имеется участок белка со следующей последовательностью аминокислот (каждая аминокислота обозначается одной буквой):

…MLFRSRWIMVPQHE…

3) Если стоит задача закодировать каждую аминокислоту с помощью нуклеотидов, то она сводится к тому, как с помощью 4 букв закодировать 20 букв. Это можно сделать, сопоставляя буквам 20-ти буквенного алфавита слова, составленные из нескольких букв 4-х буквенного алфавита.

Если одну аминокислоту кодировать одним нуклеотидом, то можно закодировать только четыре аминокислоты.

Если каждой аминокислоте сопоставлять два подряд идущих в цепи РНК нуклеотида, то можно закодировать шестнадцать аминокислот.

Действительно, если имеется четыре буквы (A, U, G, C), то количество их разных парных комбинаций будет 16: (AU, UA), (AG, GA), (AC, CA), (UG, GU), (UC, CU), (GC, CG), (AA, UU, GG, CC). [Скобки используются для удобства восприятия.

] Это значит, что таким кодом (двухбуквенным словом) можно закодировать только 16 разных аминокислот: каждой будет соответствовать свое слово (два подряд идущих нуклеотида).

Из математики формула, позволяющая определить количество комбинаций, выглядит так: ab = n. Здесь n — количество разных комбинаций, a — количество букв алфавита (или основание системы счисления), b — количество букв в слове (или разрядов в числе). Если подставить в эту формулу 4-х буквенный алфавит и слова, состоящие из двух букв, то получим 42 = 16.

Если в качестве кодового слова каждой аминокислоты использовать три подряд идущих нуклеотида, то можно закодировать 43 = 64 разных аминокислот, так как 64 разных комбинации можно составить из четырех букв, взятых по три (например, AUG, GAA, CAU, GGU и т. д.). Это уже больше, чем достаточно для кодирования 20 аминокислот.

Именно трехбуквенный код используется в генетическом коде. Три подряд идущих нуклеотида, кодирующих одну аминокислоту, называются триплетом (или кодоном).

Каждой аминокислоте сопоставляется определенный триплет нуклеотидов. Кроме того, поскольку комбинаций триплетов с избытком перекрывают количество аминокислот, то многие аминокислоты кодируются несколькими триплетами.

Три триплета не кодируют ни одну из аминокислот (UAA, UAG, UGA). Они обозначают конец трансляции и называются стоп-кодонами (или нонсенс-кодонами).

Триплет AUG кодирует не только аминокислоту метионин, но и инициирует трансляцию (играет роль старт-кодона).

Ниже приведены таблицы соответствия аминокислот триплетам нуклеоитидов. По первой таблице удобно определять по заданному триплету соответствующую ему аминокислоту. По второй — по заданной аминокислоте соответствующие ей триплеты.

Рассмотрим пример реализации генетического кода. Пусть имеется иРНК со следующим содержанием:

AUGGAUUCUACCUGGUUAUUGAAAAAUCAGUAG

Разобьем последовательность нуклеотидов на триплеты:

AUG-GAU-UCU-ACC-UGG-UUA-UUG-AAA-AAU-CAG-UAG

Сопоставим каждому триплету кодируемую им аминокислоту полипептида:

Метионин — Аспаргиновая кислота — Серин — Треонин — Триптофан — Лейцин — Лейцин — Лизин — Аспарагин — Глутамин

Последний триплет является стоп-кодоном.

Биосинтез белка и нуклеиновых кислот. Гены, генетический код

Генетический код

В обмене веществ организма ведущая роль принадлежит белкам и нуклеиновым кислотам.

Белковые вещества составляют основу всех жизненно важных структур клетки, обладают необычайно высокой реакционной способностью, наделены каталитическими функциями.

Нуклеиновые кислоты входят в состав важнейшего органа клетки — ядра, а также цитоплазмы, рибосом, митохондрий и т. д. Нуклеиновые кислоты играют важную, первостепенную роль в наследственности, изменчивости организма, в синтезе белка.

План синтеза белка хранится в ядре клетки, а непосредственно синтез происходит вне ядра, поэтому необходима служба доставки закодированного плана из ядра к месту синтеза. Такую службу доставки исполняют молекулы РНК.

Процесс начинается в ядре клетки: раскручивается и открывается часть «лестницы» ДНК. Благодаря этому буквы РНК образуют связи с открытыми буквами ДНК одной из нитей ДНК. Фермент переносит буквы РНК, чтобы соединить их в нить.

Так буквы ДНК «переписываются» в буквы РНК. Новообразованная цепочка РНК отделяется, и «лестница» ДНК снова закручивается.

Процесс считки информации с ДНК и синтеза по ее матрице РНК называется транскрипцией, а синтезированная РНК называется информационной или и-РНК.

После дальнейших изменений этот вид закодированной и-РНК готов. и-РНК выходит из ядра и направляется к месту синтеза белка, где буквы и-РНК расшифровываются. Каждый набор из трех букв и-РНК образует «букву», обозначающее одну конкретную аминокислоту.

Другой вид РНК отыскивает эту аминокислоту, захватывает ее с помощью фермента и доставляет к месту синтеза белка. Эта РНК называется транспортной, или т-РНК. По мере прочтения и перевода сообщения и-РНК цепочка аминокислот растет. Эта цепочка закручивается и укладывается в уникальную форму, создавая один вид белка.

Примечателен даже процесс укладки белка: на то, чтобы с помощью компьютера просчитать все варианты укладки белка среднего размера, состоящего из 100 аминокислот, потребовалось бы 1027 (!) лет.

А для образования в организме цепочки из 20 аминокислот требуется не более одной секунды, и этот процесс происходит непрерывно во всех клетках тела.

Гены, генетический код и его свойства.

На Земле живет около 7 млрд людей. Если не считать 25—30 млн пар однояйцовых близнецов, то генетически все люди разные: каждый уникален, обладает неповторимыми наследственными особенностями, свойствами характера, способностями, темпераментом.

Такие различия объясняются различиями в генотипах—наборах генов организма; у каждого он уникален. Генетические признаки конкретного организма воплощаются в белках — следовательно, и строение белка одного человека отличается, хотя и совсем немного, от белка другого человека.

Это не означает, что у людей не встречается совершенно одинаковых белков. Белки, выполняющие одни и те же функции, могут быть одинаковыми или совсем незначительно отличаться одной-двумя аминокислотами друг от друга. Но не существует на Земле людей (за исключением однояйцовых близнецов), у которых все белки были бы одинаковы.

Информация о первичной структуре белка закодирована в виде последовательности нуклеотидов в участке молекулы ДНК, гене – единице наследственной информации организма. Каждая молекула ДНК содержит множество генов. Совокупность всех генов организма составляет его генотип. Таким образом,

Ген – единица наследственной информации организма, которой соответствует отдельный участок ДНК

Кодирование наследственной информации происходит с помощью генетического кода, который универсален для всех организмов и отличается лишь чередованием нуклеотидов, образующих гены, и кодирующих белки конкретных организмов.

Генетический код состоит из троек (триплетов) нуклеотидов ДНК, комбинирующихся в разной последовательности (ААТ, ГЦА, АЦГ, ТГЦ и т.д.), каждый из которых кодирует определенную аминокислоту (которая будет встроена в полипептидную цепь).

Собственно кодом считается последовательность нуклеотидов в молекуле и-РНК, т.к.

она снимает информацию с ДНК (процесс транскрипции) и переводит ее в последовательность аминокислот в молекулах синтезируемых белков (процесс трансляции).

В состав и-РНК входят нуклеотиды А-Ц-Г-У, триплеты которых называются кодонами: триплет на ДНК ЦГТ на и-РНК станет триплетом ГЦА, а триплет ДНК ААГ станет триплетом УУЦ. Именно кодонами и-РНК отражается генетический код в записи.

Таким образом, генетический код — единая система записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов. Генетический код основан на использовании алфавита, состоящего всего из четырех букв-нуклеотидов, отличающихся азотистыми основаниями: А, Т, Г, Ц.

Основные свойства генетического кода:

1. Генетический код триплетен. Триплет (кодон) — последовательность трех нуклеотидов, кодирующая одну аминокислоту.

Поскольку в состав белков входит 20 аминокислот, то очевидно, что каждая из них не может кодироваться одним нуклеотидом (поскольку в ДНК всего четыре типа нуклеотидов, то в этом случае 16 аминокислот остаются незакодированными).

Двух нуклеотидов для кодирования аминокислот также не хватает, поскольку в этом случае могут быть закодированы только 16 аминокислот. Значит, наименьшее число нуклеотидов, кодирующих одну аминокислоту, должно быть не менее трех. В этом случае число возможных триплетов нуклеотидов составляет 43 = 64.

2. Избыточность (вырожденность) кода является следствием его триплетности и означает то, что одна аминокислота может кодироваться несколькими триплетами (поскольку аминокислот 20, а триплетов — 64), за исключением метионина и триптофана, которые кодируются только одним триплетом.

Кроме того, некоторые триплеты выполняют специфические функции: в молекуле и-РНК триплеты УАА, УАГ, УГА — являются терминирующими кодонами, т. е. стоп-сигналами, прекращающими синтез полипептидной цепи.

Триплет, соответствующий метионину (АУГ), стоящий в начале цепи ДНК, не кодирует аминокислоту, а выполняет функцию инициирования (возбуждения) считывания.

3. Однозначность кода – одновременно с избыточностью коду присуще свойство однозначности: каждому кодону соответствует только одна определенная аминокислота.

4. Коллинеарность кода, т.е. последовательность нуклеотидов в гене точно соответствует последовательности аминокислот в белке.

5. Генетический код неперекрываем и компактен, т. е. не содержит «знаков препинания». Это значит, что процесс считывания не допускает возможности перекрывания колонов (триплетов), и, начавшись на определенном кодоне, считывание идет непрерывно триплет за триплетом вплоть до стоп-сигналов (терминирующих кодонов).

6. Генетический код универсален, т. е. ядерные гены всех организмов одинаковым образом кодируют информацию о белках вне зависимости от уровня организации и систематического положения этих организмов.

Существуют таблицы генетического кода для расшифровки кодонов и- РНК и построения цепочек белковых молекул.

Реакции матричного синтеза.

В живых системах встречается реакции, неизвестные в неживой природе — реакции матричного синтеза.

Термином “матрица” в технике обозначают форму, употребляемую для отливки монет, медалей, типографского шрифта: затвердевший металл в точности воспроизводит все детали формы, служившей для отливки. Матричный синтез напоминает отливку на матрице: новые молекулы синтезируются в точном соответствии с планом, заложенным в структуре уже существующих молекул.

Матричный принцип лежит в основе важнейших синтетических реакций клетки, та-ких, как синтез нуклеиновых кислот и белков. В этих реакциях обеспечивается точная, строго специфичная последовательность мономерных звеньев в синтезируемых полимерах.

Здесь происходит направленное стягивание мономеров в определенное место клетки — на молекулы, служащие матрицей, где реакция протекает.

Если бы такие реакции происходили в результате случайного столкновения молекул, они протекали бы бесконечно медленно. Синтез сложных молекул на основе матричного принципа осуществляется быстро и точно.

Роль матрицы в матричных реакциях играют макромолекулы нуклеиновых кислот ДНК или РНК.

Мономерные молекулы, из которых синтезируется полимер, — нуклеотиды или аминокислоты — в соответствии с принципом комплементарности располагаются и фиксируются на матрице в строго определенном, заданном порядке.

Затем происходит “сшивание” мономерных звеньев в полимерную цепь, и готовый полимер сбрасывается с матрицы.

После этого матрица готова к сборке новой полимерной молекулы. Понятно, что как на данной форме может производиться отливка только какой-то одной монеты, одной буквы, так и на данной матричной молекуле может идти “сборка” только какого-то одного полимера.

Матричный тип реакций — специфическая особенность химизма живых систем. Они являются основой фундаментального свойства всего живого — его способности к воспроизведению себе подобного.

Реакции матричного синтеза

1. Репликация ДНК — реплика́ция (от лат. replicatio — возобновление) — процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской молекулы ДНК.

В ходе последующего деления материнской клетки каждая дочерняя клетка получает по одной копии молекулы ДНК, которая является идентичной ДНК исходной материнской клетки. Этот процесс обеспечивает точную передачу генетической информации из поколения в поколение.

Репликацию ДНК осуществляет сложный ферментный комплекс, состоящий из 15—20 различных белков, называемый реплисомой. Материалом для синтеза служат свободные нуклеотиды, имеющиеся в цитоплазме клеток.

Биологический смысл репликации заключается в точной передаче наследственной информации от материнской молекулы к дочерним, что в норме и происходит при делении соматических клеток.

Молекула ДНК состоит из двух комплементарных цепей. Эти цепи удерживаются слабыми водородными связями, способными разрываться под действием ферментов.

Молекула ДНК способна к самоудвоению (репликации), причем на каждой старой половине молекулы синтезируется новая ее половина.

Кроме того, на молекуле ДНК может синтезироваться молекула и-РНК, которая затем переносит полученную от ДНК информацию к месту синтеза белка.

Передача информации и синтез белка идут по матричному принципу, сравнимому с работой печатного станка в типографии. Информация от ДНК многократно копируется. Если при копировании произойдут ошибки, то они повторятся во всех последующих копиях.

Правда, некоторые ошибки при копировании информации молекулой ДНК могут исправляться — процесс устранения ошибок называется репарацией. Первой из реакций в процессе передачи информации является репликация молекулы ДНК и синтез новых цепей ДНК.

2. Транскрипция (от лат. transcriptio — переписывание) — процесс синтеза РНК с использованием ДНК в качестве матрицы, происходящий во всех живых клетках. Другими словами, это перенос генетической информации с ДНК на РНК.

Транскрипция катализируется ферментом ДНК-зависимой РНК-полимеразой. РНК-полимераза движется по молекуле ДНК в направлении 3' → 5'. Транскрипция состоит из стадий инициации, элонгации и терминации.

Единицей транскрипции является оперон, фрагмент молекулы ДНК, состоящий из промотора, транскрибируемой части и терминатора.

и-РНК состоит из одной цепи и синтезируется на ДНК в соответствии с правилом комплементарности при участии фермента, который активирует начало и конец синтеза молекулы и-РНК.

Готовая молекула и-РНК выходит в цитоплазму на рибосомы, где происходит синтез полипептидных цепей.

3. Трансляция (от лат. translatio — перенос, перемещение) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК, мРНК), осуществляемый рибосомой. Иными словами, это процесс перевода информации, со-держащейся в последовательности нуклеотидов и-РНК, в последовательность амино-кислот в полипептиде.

4. Обратная транскрипция — это процесс образования двуцепочечной ДНК на основании информации из одноцепочечной РНК.

Данный процесс называется обратной транскрипцией, так как передача генетической информации при этом происходит в «обратном», относительно транскрипции, направлении.

Идея обратной транскрипции вначале была очень непопулярна, так как противоречила центральной догме молекулярной биологии, которая предполагала, что ДНК транскрибируется в РНК и далее транслируется в белки.

Однако в 1970 году Темин и Балтимор независимо друг от друга открыли фермент, названный обратной транскриптазой (ревертазой), и возможность обратной транскрипции была окончательно подтверждена. В 1975 году Темину и Балтимору была присуждена Нобелевская премия в области физиологии и медицины.

Некоторые вирусы (такие как вирус иммунодефицита человека, вызывающий ВИЧ-инфекцию), имеют возможность транскрибировать РНК в ДНК. ВИЧ имеет РНК-геном, который встраивается в ДНК. В результате, ДНК вируса может быть объединена с геномом клетки-хозяина. Главный фермент, ответственный за синтез ДНК из РНК, называется ревертазой.

Одной из функций ревертазы является создание комплементарной ДНК (кДНК) из вирусного генома. Ассоциированный фермент рибонуклеаза расщепляет РНК, а ревертаза синтезирует кДНК из двойной спирали ДНК. кДНК интегрируется в геном клетки-хозяина с помощью интегразы. Результатом является синтез вирусных протеинов клеткой-хозяином, которые образуют новые вирусы.

В случае с ВИЧ так же программируется апоптоз (смерть клетки) Т-лимфоцитов. В иных случаях клетка может остаться распространителем вирусов.

Последовательность матричных реакций при биосинтезе белков можно представить в виде схемы.

Таким образом, биосинтез белка – это один из видов пластического обмена, в ходе которого наследственная информация, закодированная в генах ДНК, реализуется в определенную последовательность аминокислот в белковых молекулах.

Молекулы белков по существу представляют собой полипептидные цепочки, составленные из отдельных аминокислот. Но аминокислоты недостаточно активны, чтобы соединиться между собой самостоятельно. Поэтому, прежде чем соединиться друг с другом и образовать молекулу белка, аминокислоты должны активироваться. Эта активация происходит под действием особых ферментов.

В результате активирования аминокислота становится более лабильной и под действием того же фермента связывается с т-РНК. Каждой аминокислоте соответствует строго специфическая т-РНК, которая находит «свою» аминокислоту и переносит ее в рибосому.

Следовательно, в рибосому поступают различные активированные аминокислоты, соединенные со своими т-РНК. Рибосома представляет собой как бы конвейер для сборки цепочки белка из поступающих в него различных аминокислот.

Одновременно с т-РНК, на которой «сидит» своя аминокислота, в рибосому поступает «сигнал» от ДНК, которая содержится в ядре. В соответствии с этим сигналом в рибосоме синтезируется тот или иной белок.

Направляющее влияние ДНК на синтез белка осуществляется не непосредственно, а с помощью особого посредника – матричной или информационной РНК (м-РНК или и-РНК), которая синтезируется в ядре под влиянием ДНК, поэтому ее состав отражает состав ДНК. Молекула РНК представляет собой как бы слепок с формы ДНК.

Синтезированная и-РНК поступает в рибосому и как бы передает этой структуре план — в каком порядке должны соединяться друг с другом поступившие в рибосому активированные аминокислоты, чтобы синтезировался определенный белок.

Иначе, генетическая информация, закодированная в ДНК, передается на и- РНК и далее на белок.

Молекула и-РНК поступает в рибосому и прошивает ее. Тот ее отрезок, который находится в данный момент в рибосоме, определенный кодоном (триплет), взаимо-действует совершенно специфично с подходящим к нему по строению триплетом (антикодоном) в транспортной РНК, которая принесла в рибосому аминокислоту.

Транспортная РНК со своей аминокислотой подходит к определенному кодону и-РНК и соединяется с ним; к следующему, соседнему участку и- РНК присоединяется другая т-РНК с другой аминокислотой и так до тех пор, пока не будет считана вся цепочка и-РНК, пока не нанижутся все аминокислоты в соответствующем порядке, образуя молекулу белка. А т-РНК, которая доставила аминокислоту к определенному участку полипептидной цепи, освобождается от своей аминокислоты и выходит из рибосомы.

Затем снова в цитоплазме к ней может присоединиться нужная аминокислота, и она снова перенесет ее в рибосому. В процессе синтеза белка участвует одновременно не одна, а несколько рибосом — полирибосомы.

Основные этапы передачи генетической информации:

1. Синтез на ДНК как на матрице и-РНК (транскрипция)
2. Синтез в рибосомах полипептидной цепи по программе, содержащейся в и-РНК (трансляция).

Этапы универсальны для всех живых существ, но временные и пространственные взаимоотношения этих процессов различаются у про- и эукариотов.

У прокариот транскрипция и трансляция могут осуществляться одновременно, поскольку ДНК находится в цитоплазме. У эукариот транскрипция и трансляция строго разделены в пространстве и времени: синтез различных РНК происходит в ядре, после чего молекулы РНК должны покинуть пределы ядра, пройдя через ядерную мембрану. Затем в цитоплазме РНК транспортируются к месту синтеза белка.

Источник: http://in-natura.ru/biosintez-belka-i-nukleinovyih-kislot-genyi-geneticheskiy-kod/

Как учёные генетический код взламывали

Генетический код

Заранее извиняюсь перед теми, кто и без моих напоминаний знает принцип синтеза белка, потому что в этом посте я снова (раз в четвертый наверно) буду писать о кодонах и рибосомах. Будем считать, что повторение всё-таки мать учения, да и в рамках подготовки к следующему циклу постов будет не лишним. Всем моим подписчикам привет и поехали.

1. Клетки, белки и слово из трёх букв

Дарвин открыл эволюцию видов в 19 веке, однако ещё целых сто лет учёные не могли понять, где и как записаны наследуемые признаки. Только с развитием технологий удалось найти в клетках сложные органические молекулы – белки, и разобрать их по кирпичикам.

(Картинка для привлечения внимания, ибо по данным статистики если пост начинать с фото живого существа, а не схемы, то его прочитают на 146% больше человек. И белочка такая: чо?)

На самом деле вот они, белкИ:

А вот из чего белки состоят, где каждый кружок это отдельная аминокислота:

Оценивая сложность молекул-белков, а также универсальность их строения, учёные где-то в середине 20 века начали всерьёз задумываться – а не они ли те самые переносчики наследственной информации и основа строения генов? (сами гены на тот момент никто не наблюдал, они были открыты чисто теоретически).  Предположение казалось не лишённым смысла, пока…

…вот этим ребята, Уотсон и Крик, не обнаружили в самом сердце клетки структуру, во всех отношениях подходящую под носителя наследственности – дезоксирибонуклеиновую кислоту или ДНК.

У этой длинной спиральной молекулы оказалось свойство, сделавшее её идеальной основой жизни: две разделённые половинки двойной спирали сами катализировали образование двух копий исходной молекулы за счёт простейшего принципа.

Оказалось, что генетический код представляет собой последовательность “букв” (их более строгое наименование — “азотистые основания” или “нуклеотиды”). Таких букв в ДНК-алфавите всего четыре: А, Т, Г и Ц.

Их полные названия — аденин, тимин, гуанин и цитозин, но эти химические термины для нас здесь не важны.

Важно то, что в связи с ограничениями, накладываемыми формой молекул ДНК и структурой связей в них, А может образовывать пару только с Т, а Ц — только с Г.

Если оторвать цепочки двойной спирали одну от другой, на каждой из них будут рядком торчать неспаренные буквы. С каждой буквой А может связаться только Т, а с каждой буквой Ц — только Г, и так далее.

Азотистые основания не только дополняют друг друга, но и испытывают настоящую потребность найти себе пару. Только одно может сделать тусклую химическую жизнь буквы Т светлее — постоянная близость с буквой А. Стоит их совместить, и все их связи запоют в чудесной гармонии.

Это химическое явление — настоящий “основной инстинкт”, неотъемлемое свойство азотистых оснований.

Оно делает из цепочек ДНК нечто большее, чем пассивные матрицы: каждое основание обладает своего рода магнетизмом, притяжением к своему “альтер эго”.

Стоит разделить цепочки, и они самопроизвольно сольются снова или, если им помешать, смогут послужить матрицами, обладающими неодолимой тягой к соединению с другой “второй половиной”, неотличимой от прежней.

2. Задача для криптологов!

Молекулы ДНК состоят из последовательностей, составленных из всего четырех букв, расположенных на первый взгляд в случайном порядке.

Было не так уж сложно догадаться, что этот порядок должен каким-то образом кодировать белки.

А ключевое слово здесь – двадцать. Двадцать разных молекул, называемых аминокислотами, использует любая форма жизни для формирования белков. Если хотите, это можно назвать одним из ключевых характеристик земной формы жизни.

Когда количество нуклеотидов и аминокислот определилось (опять же, спасибо Уотсону и Крику), задача сразу стала ясной. Все свелось к математической головоломке: четыре буквы в молекулах ДНК (А Г Т Ц) должны были кодировать двадцать аминокислот:

Это позволяло отбросить возможность прямой транслитерации, при которой одна ДНК-буква соответствовала бы одной аминокислоте.

Дублетный код (АА, АГ, АТ, АЦ, ГА, ГГ и т.д.) тоже был невозможен, потому что кодировал бы не более шестнадцати аминокислот: 42 = 16.

Аналогия из мира компьютеров: чтобы получить 256 разных символов (стандартная кодировка), при наличии двух “букв” (0 и 1), нужна длина, равная восьми (28 = 256) – то есть классический байт.

Получается, минимальное число букв было три, то есть код мог быть триплетным (ААА, ААГ, ААТ, ААЦ, АГА, АГГ, АГТ и т.д.).

Каждая группа из трех ДНК-букв могла кодировать одну аминокислоту. Но такой код казался очень уж расточительным. Из четырех букв можно составить шестьдесят четыре триплета (43 = 64), а значит, потенциально триплетами можно было закодировать шестьдесят четыре аминокислоты. Так почему же аминокислот было только двадцать?

Секрет этого фокуса должен был объяснить смысл 4-буквенного “алфавита”, организованного в 64 3-буквенных “слова”, кодирующие 20 аминокислот. И за неимением экспериментальных данных о реальной природе кода, учёным пришлось проявить смекалку.

Попытка номер РАЗ

Не случайно, наверное, первым, кому удалось дать хоть какой-то ответ, стал не биолог, а энергичный американский физик российского происхождения Георгий Гамов, больше известный своими теориями, касающимися Большого взрыва.

Гамов считал ДНК в буквальном смысле матрицей для синтеза белков. Он полагал, что аминокислоты вкладываются в ромбовидные борозды между оборотами спирали.

Но его теория генетического кода была в основе нумерологической, и когда он узнал, что белки вообще не синтезируются в ядре, а значит, в ходе синтеза не могут непосредственно контактировать с ДНК, это не произвело на него особого впечатления. Этот факт лишь делал его идею более абстрактной.

Суть его предположения состояла в том, что код перекрывается. Это дает большое преимущество, которое обожают криптографы: максимизация плотности информации.

Представьте себе последовательность АТЦГТЦ. Первое слово, или, если использовать более строгий термин, первый кодон, будет АТЦ, второй — ТЦГ, третий — ЦГТ, и так далее.

Здесь важно то, что перекрывающиеся кодоны всегда ограничивали бы число аминокислотных последовательностей. Например, если АТЦ кодирует определенную аминокислоту, за ней может следовать только аминокислота, кодон которой начинается с букв ТЦ, а следующей аминокислоте должен соответствовать кодон, начинающийся с буквы Ц.

Если изучить все возможные варианты, окажется, что очень многие триплеты просто недопустимы: они не могут входить в состав этого перекрывающегося кода, потому что в нем буква А всегда должна стоять рядом с Т, Т — рядом с Ц, и так далее.

И сколько триплетов у нас останется для кодирования аминокислот? Ровно двадцать! — сказал Гамов с торжеством фокусника, вынимающего кролика из шляпы.

Эта остроумная идея была первой из многих, безжалостно опровергнутых фактами. Перекрывающиеся коды оказались невозможны из-за накладываемых ими самими ограничений. Во-первых, они предполагают, что некоторые аминокислоты в белках должны всегда стоять рядом.

Вторая серьезная проблема состояла в том, что при перекрывающемся коде любая точечная мутация (в которой одна буква заменяется другой) неизбежно приводила бы к изменению больше чем одной аминокислоты в белке, а экспериментальные данные свидетельствовали о том, что при таких мутациях меняется лишь одна аминокислота.

Стало ясно, что генетический код не перекрывается. Предположение Гамова о перекрывании кода было опровергнуто задолго до того, как стал известен настоящий код. Криптографы начали подозревать, что мать-природа упустила возможность воспользоваться некоторыми известными им трюками.

Попытка номер ДВА

Следующую попытку разгадать загадку кода предпринял Крик (да да, тот самый который несколько абзацев назад ДНК открывал).

Он высказал идею настолько красивую, что ее немедленно все приняли, хотя самого автора и смущала нехватка доказательств. Крик воспользовался новыми открытиями, сделанными в нескольких молекулярно-биологических лабораториях.

Итак, неактивная ДНК сидит в ядре. Когда нужно синтезировать какой-либо белок, соответствующий участок ДНК используется для создания молекулы-матрицы. Она физически выходит из ядра и достигает ожидающих ее снаружи специальных молекул-рибосом, синтезирующих этот белок, используя матрицу (называемую матричной РНК или мРНК или иРНК).

Крика теперь интересовало вот что: как точная последовательность букв молекулы матричной РНК переводится в последовательность аминокислот в белке?

Крик крепко задумался. Он предположил, что матричная РНК транслируется с помощью набора особых молекул — адаптеров, по одной на каждую аминокислоту. Адаптеры тоже должны состоять из РНК, у каждого из них должен быть антикодон, способный узнавать соответствующий кодон матричной РНК и связываться с ним.

Принцип этого связывания, как считал Крик, должен быть точно таким же, как в ДНК: Ц образует пару с Г, А — с Т, и так далее. Адаптеры действительно были открыты несколько лет спустя, и оказалось, что они действительно состоят из РНК, как и предсказывал Крик.

Теперь их называют транспортными РНК (тРНК).

(на картинке растущая полипептидная цепь это белок, и вас не должна смущать появившаяся буква У (урацил) – в матричной РНК она заменяет Т (тимин) и имеет то же ключевое свойство присоединять А (аденин))

Но здесь Крик пошел по ложному пути. Крик представлял себе, что матричная РНК просто сидит в цитоплазме, а ее кодоны торчат, как соски свиноматки, и к каждому из них может “присосаться” транспортная РНК.

Рано или поздно молекулы тРНК свяжутся с мРНК по всей длине, расположившись одна за другой, и с каждой из них будет связана, как хвост поросенка, соответствующая аминокислота, готовая соединиться с соседними аминокислотами и образовать белковую цепочку.

На фото формирование полипоросячей цепочки на основе свиноматрицы: соски это кодоны, поросячьи рты – антикодоны, сам поросёнок – тРНК, хвостики – аминокислоты. Давайте представим что соски именные, и их 20 видов для 20 видов поросят. А поросячью хвостики тоже разные и их можно связывать. (Уииии!)

Но вернёмся к нашим баранам (белки, свиньи, бараны, просто не могу остановиться…). Итак, ключевая проблема, по мнению Крика, состояла в том, что тРНК будут прибывать в случайном порядке, по мере их появления рядом с мРНК, и связываться с ближайшим соответствующим кодоном.

Однако если не начинать с начала и не заканчивать в конце, как они узнают, где начинается и где заканчивается один кодон? Как они смогут найти правильную рамку считывания?

Если последовательность содержит фрагмент АТЦ ГТЦ, то одна тРНК может связаться с кодоном АТЦ, а другая — с кодоном ГТЦ, но что помешает соответствующей тРНК узнать кодон ЦГТ в середине этого фрагмента и тем самым транслировать совсем не то, что нужно?

Предложенный Криком ответ на этот вопрос предполагал категорический запрет подобных вещей. Раз матрица в целом должна читаться однозначно, значит, не все кодоны должны иметь смысл.

Какие же из них требовалось запретить? Ясно, что последовательности, состоящие только из А, только из Ц, только из Т или только из Г, должны были оказаться под запретом: в цепочке АААААА нельзя найти правильную рамку считывания.

Затем Крик проверил все другие трехбуквенные комбинации. Он рассуждал примерно так: если АТЦ имеет смысл, то все циклические перестановки этих трех букв (ТЦА и ТАЦ) должны быть под запретом. Сколько возможностей это нам оставляет?

(барабанная дробь)

Иииииииии снова двадцать! (Из шестидесяти четырех возможных кодонов AAA, ТТТ, ЦЦЦ и ГГГ исключаются. Остается шестьдесят. Из каждых трех вариантов циклических перестановок допустим только один, значит, делим шестьдесят на три.)

В отличие от перекрывающихся кодов Гамова, код Крика не накладывал никаких ограничений на порядок аминокислот в белке и не предполагал, что точечная мутация будет непременно менять две или три аминокислоты.

Когда была выдвинута эта гипотеза, казалось, она дает прекрасное решение проблемы рамки считывания и при этом сокращает число кодонов с шестидесяти четырех до двадцати, что соответствует числу аминокислот в белках.

Эта гипотеза ничуть не противоречила всем имеющимся на тот момент данным.

И все же она оказалась ошибочной ¯\_(ツ)_/¯

Генетический код как он есть

Спустя несколько лет выяснилось, что искусственно полученная РНК, состоящая из кодонов ААА (“запрещенных” Криком), все же кодирует аминокислоту лизин и может транслироваться в белковую цепочку, состоящую исключительно из лизина.

(фото лизина в молодости)

К середине 60-х годов, когда были усовершенствованы экспериментальные методы, нескольким исследовательским группам удалось шаг за шагом выяснить, что на самом деле представляет собой генетический код.

После всех попыток расшифровать его открывшаяся картина вызывала глубочайшее разочарование.

Оказалось, что никакого изящного нумерологического решения не было, а код просто вырожден (это значит, что в нем полно излишеств).

Три аминокислоты кодируются шестью разными кодонами каждая, в то время как другие кодируются лишь одним или двумя. Все кодоны идут в дело: три кодона означают “стоп” (конец трансляции), а все остальные кодируют ту или иную аминокислоту.

Выходило, что в генетическом коде нет никакого порядка, никакой красоты. Этот пример может служить наглядным опровержением мысли, что красота может служить проводником к научной истине. На первый взгляд, в основе кода не было и никакой структурной логики: между аминокислотами и соответствующими им кодонами не было ни особой химической, ни особой физической связи…

…продолжение следует

P.S. Первоисточник – книга “Лестница жизни” Ника Лейна.

[моё] Наука Генетика Биология ДНК Нуклеоитд Длиннопост

Источник: https://pikabu.ru/story/kak_uchyonyie_geneticheskiy_kod_vzlamyivali_4692952

Генетический код и его свойства

Генетический код

“Самым трудным в проблеме кода было понять, что код существует. На это потребовалось целое столетие.
Когда это поняли, то для того чтобы разобраться в деталях, хватило каких-нибудь десяти лет.”

Ичас М. Биологический код. М.: Мир, 1971

Нуклеотиды ДНК и РНК

  1. Пуриновые: аденин, гуанин
  2. Пиримидиновые: цитозин, тимин (урацил)

Кодон – триплет нуклеотидов, кодирующих определенную аминокислоту.

таб. 1. Аминокислоты, которые обычно встречаются в белках
НазваниеСокращенное обозначение
1. АланинAla
2. АргининArg
3. АспарагинAsn
4. Аспарагиновая кислотаAsp
5. ЦистеинCys
6. Глутаминовая кислотаGlu
7. ГлутаминGln
8. ГлицинGly
9. ГистидинHis
10. ИзолейцинIle
11. ЛейцинLeu
12. ЛизинLys
13. МетионинMet
14. ФенилаланинPhe
15. ПролинPro
16. СерииSer
17. ТреонинThr
18. ТриптофанTrp
19. ТирозинTyr
20. ВалинVal

Генетический код, который еще называют аминокислотным кодом, – это система записи информации о последовательности расположения аминокислот в белке спомощью последовательности расположения нуклеотидных остатков в ДНК, которые содержат одно из 4-х азотистых оснований: аденин (А), гуанин (G), цитозин (C) и тимин (Т).

Однако, поскольку двунитчатая спираль ДНК не принимает непосредственного участия в синтезе белка, который кодируется одной из этих нитей (т.е. РНК), то код записывается на языке РНК, в котором вместо тимина входит урацил (U).

По этой же причине принято говорить, что код – это последовательность нуклеотидов, а не парнуклеотидов.

Генетический код представлен определенными кодовыми словами, – кодонами.

Первое кодовое слово было расшифровано Ниренбергом и Маттеи в 1961 г. Они получили из кишечной палочки экстракт, содержащий рибосомы и прочие факторы, необходимые для синтеза белка.

Получилась бесклеточная система для синтеза белка, которая могла бы осуществлять сборку белка из аминокислот, если в среду добавить необходимую мРНК. Добавив в среду синтетическую РНК, состоящую только из урацилов, они обнаружили, что образовался белок, состоящий только из фенилаланина (полифенилаланин).

Так было установлено, что триплет нуклеотидов УУУ (кодон) соответствует фенилаланину. В течение последующих 5-6 лет были определены все кодоны генетического кода.

Генетический код – своеобразный словарь, переводящий текст, записанный с помощью четырех нуклеотидов, в белковый текст, записанный с помощью 20 аминокислот. Остальные аминокислоты, встречающиеся в белке, являются модификациями одной из 20 аминокислот.

Vse-referaty
Добавить комментарий