Código Genético: características y desciframiento

       

Severo Ochoa

Marshall W. Nirenberg

Har Gobind Khorana

Sydney Brenner

Una vez que Crick (1958) propuso la Hipótesis de la Secuencia ("existe una relación entre la ordenación lineal de nucleótidos en el ADN y la ordenación lineal de aminoácidos en los polipéptidos"), la comunidad científica la admitió y se plantearon dos preguntas:

La primera pregunta conlleva el estudio del desciframiento del código genético y el estudio de sus características. La segunda pregunta consiste en el estudio de los procesos genéticos de la síntesis de proteínas: la transcripción y la traducción.

CARACTERÍSTICAS DEL CÓDIGO GENÉTICO

Las características del código genético fueron establecidas experimentalmente por Fancis Crick, Sydney Brenner y colaboradores en 1961. Las principales características del código genético son las siguientes:

Francis Crick Sydney Brenner

CÓDIGO ORGANIZADO EN TRIPLETES O CODONES

Si cada nucleótido determinara un aminoácido, solamente podríamos codificar cuatro aminoácidos diferentes ya que en el ADN solamente hay cuatro nucleótidos distintos. Cifra muy inferior a los 20 aminoácidos distintos que existen.

Si cada dos nucleótidos codificarán un aminoácido, el número total de dinucleótidos distintos que podríamos conseguir con los cuatro nucleótidos diferentes (A, G, T y C) serían variaciones con repetición de cuatro elementos tomados de dos en dos VR4,2 = 42 = 16. Por tanto, tendríamos solamente 16 dinucleótidos diferentes, cifra inferior al número de aminoácidos distintos que existen (20).

Si cada grupo de tres nucleótidos determina un aminoácido. Teniendo en cuenta que existen cuatro nucleótidos diferentes (A, G, T y C), el número de grupos de tres nucleótidos distintos que se pueden obtener son variaciones con repetición de cuatro elementos (los cuatro nucleótidos) tomados de tres en tres: VR4,3 = 43 = 64. Por consiguiente, existe un total de 64 tripletes diferentes, cifra más que suficiente para codificar los 20 aminoácidos distintos.

El CÓDIGO GENÉTICO ES DEGENERADO

Como hemos dicho anteriormente existen 64 tripletes distintos y 20 aminoácidos diferentes, de manera que un aminoácido puede venir codificado por más de un codón. Este tipo de código se denomina degenerado. Wittmann (1962) induciendo sustituciones de bases por desaminación con nitritos, realizó sustituciones de C por U y de A por G en el ARN del virus del mosaico del tabaco (TMV), demostrando que la serina y la isoleucina estaban determinadas por más de un triplete.

Las moléculas encargadas de transportar los aminoácidos hasta el ribosoma y de reconocer los codones del ARN mensajero durante el proceso de traducción son los ARN transferentes (ARN-t). Los ARN-t tienen una estructura en forma de hoja de trébol  con varios sitios funcionales:

Normalmente el ARN-t adopta una estructura de hoja de trébol plegada en forma de L o forma de boomerang.

Estructura ARN transferente

Estructura ARN transferente

Estructura ARN transferente

Los ARN-t suelen presentar bases nitrogenadas poco frecuentes como son la pseudouridina (ψ), metilguanosina (mG), dimetilguanosina (m2G), metilinosina (mI) y dihidrouridina (DHU, UH2).

El que realiza el reconocimiento del codón correspondiente del ARN-m es el anticodón del ARN-t y no el aminoácido. Mediante un experimento se demostró que era posible transformar el cisteinil-ARN-t mediante tratamiento con hidruro de níquel en alanil-ARN-t. Este tratamiento convierte la cisteína en alanina. De esta manera se consiguió un ARN-t específico de cisteina que en lugar de llevar unida cisteina llevaba unida alanina. Cuando se empleo este ARN-t híbrido para sintetizar proteínas se pudo comprobar que en el lugar en el que debía aparecer cisteina en la secuencia del polipéptido aparecía alanina. Por tanto, el que llevaba a cabo el reconocimiento del codón del ARN-m era el anticodón del ARN-t y no el aminoácido.

La degeneración de l código se explica teniendo en cuenta dos motivos:

Flexibilidad de la 3º base del anticodón, tambaleo: La tercera base del anticodón, la que ocupa la posición 5' no está especialmente confinada de forma que en algunos casos puede emparejarse con distintas bases del codón. En la siguiente gráfica se observa que cuando en la posición 5' del anticodón hay una G, esta guanina puede emparejarse con un uracilo (U) de la posición 3' del codón o con una citosina (C).

Flexibilidad de la tercera base del anticodón, tambaleo

En la siguiente tabla se indican los emparejamientos codón-anticodón permitidos por la regla del tambaleo:

Emparejamientos codón-anticodón permitidos
Extremo 5' del anticodón (ARN-t) Extremo 3' del codón (ARN-m)
G U o C
C sólo G
A sólo U
U A o G
I U, C o A

En la siguiente tabla se indican tres ARN-t de serina que pueden leer cada uno de ellos dos codones diferentes en el ARN-m. Estos tres ARN-t se denominan isoaceptores porque se unen (aceptan) al mismo aminoácido pero están codificados por genes distintos.

Codón ARN-t Anticodón
UCU y UCC ARN-tSer1 AGG + tambaleo
UCA y UCG ARN-tSer2 AGU + tambaleo
AGU y AGC ARN-tSer3 UGG + tambaleo

El código genético es no solapado o sin superposiciones

Un nucleótido solamente forma parte de un triplete y, por consiguiente, no forma parte de varios tripletes, lo que indica que el código genético no presenta superposiciones. Por tanto, el código es no solapado. Wittmann (1962) induciendo mutaciones con ácido nitroso en el ARN del virus del mosaico del tabaco (TMV) pudo demostrar que las  mutaciones habitualmente producían un cambio en un solo aminoácido. El ácido nitroso produce desaminaciones que provocan sustituciones de bases, si el código fuera solapado y un nucleótido formará parte de dos o tres tripletes, la sustitución de un nucleótido daría lugar a dos o tres aminoácidos alterados en la proteína de la cápside del TMV.

Diferencias entre un código solapado y uno no solapado

Código solapado: restricciones en la secuencia de aminoácidos

Otra forma de comprobar que el código es sin superposición es que no hay ninguna restricción en la secuencia de aminoácidos de las proteínas, de manera, que un determinado aminoácido puede ir precedido o seguido de cualquiera de los 20 aminoácidos que existen. Si dos codones sucesivos compartieran dos nucleótidos, cualquier triplete solamente podría ir precedido o seguido por cuatro codones determinados. Por consiguiente, si el código fuera superpuesto, un aminoácido determinado solamente podría ir precedido o seguido de otros cuatro aminoácidos como mucho.

LA LECTURA DEL CÓDIGO GENÉTICO ES "SIN COMAS"

Teniendo en cuenta que la lectura se hace de tres en tres bases, a partir de un punto de inicio la lectura se lleva a cabo sin interrupciones o espacios vacíos, es decir, la lectura es seguida "sin comas". De manera, que si añadimos un nucleótido (adición) a la secuencia, a partir de ese punto se altera el cuadro de lectura y se modifican todos los aminoácidos. Lo mismo sucede si se pierde (deleción) un nucleótido de la secuencia. A partir del nucleótido delecionado se altera el cuadro de lectura y cambian todos los aminoácidos. Si la adición o la deleción es de tres nucleótidos o múltiplo de tres, se añade un aminoácido o más de uno a la secuencia que sigue siendo la misma a partir del la última adición o deleción. Una adición y una deleción sucesivas vuelven a restaurar el cuadro de lectura.

En la siguiente tabla se da un ejemplo con una frase que contiene solamente palabras de tres letras. A partir de la adición de una letra cambia la pauta de lectura y el significado de la frase, lo mismo sucede cuando se pierde una letra. Una adición y una deleción sucesivas recuperan el significado de la frase. Una adición de tres letras añade una palabra pero después se recupera la pauta de lectura y el sentido de la frase.

Secuencia normal: ejemplo con una frase
UNO MAS UNO SON DOS  
Adición de una A después de la primera N: cambia el cuadro de lectura
UNA OMA SUN OSO NDO S
Deleción (pérdida) de la primera O: cambia el cuadro de lectura
UNM ASU NOS OND OS  
Adición de A y deleción de A: se recupera el cuadro de lectura
UNA OMS UNO SON DOS  
Adición de tres letras (AAA)
UNO AAA MAS UNO SON DOS

DESCIFRAMIENTO DEL CÓDIGO GENÉTICO

La asignación de un aminoácido a cada triplete o el desciframiento de la clave genética, se llevó a cabo fundamentalmente gracias al esfuerzo de tres grupos de investigación, el grupo de M. W. Nirenberg, el grupo de S. Ochoa y el equipo de H. G. Khorana. Parece lógico pensar que el desciframiento del código genético se debería haber realizado comparando las secuencia de nucleótidos de un gen y la de aminoácidos del polipéptido codificado por dicho gen. Sin embargo, en la época en la que se realizaron estos trabajos no era posible todavía obtener la secuencia de los ácidos nucleicos.

Severo Ochoa

Marshall W. Nirenberg

Har Gobind Khorana

La mayoría de los trabajos realizados por estos tres grupos de investigación consistieron en sintetizar ARN mensajeros (ARN-m) para utilizarlos posteriormente como mensajeros artificiales en un sistema acelular de traducción "in vitro". Estos sistemas acelulares de traducción "in vitro" procedían de la bacteria E. coli y contenían todo lo necesario para llevar a cabo la traducción: ribosomas, todos los ARN transferentes, aminoácidos, enzimas, etc. Sin embargo, a estos sistemas acelulares se les quitaban los ARN mensajeros de E. coli y se les añadía un ARN sintetizado artificialmente. En estos sistemas acelulares se sintetizaba un polipéptido.

Posteriormente, se comparaba la secuencia del ARN -m sintético utilizado en el experimento con la secuencia de aminoácidos del polipéptido producido.

La puesta a punto de estas técnicas requería poder sintetizar ARN-m de forma enzimática (grupo de Ochoa) o de  forma química (grupo de Khorana) y conseguir un sistema acelular estable para sintetizar proteínas (grupo de Nirenberg).

En esencia, los grupos de investigación anteriormente mencionados realizaron los siguientes tipos de esperimentos:

UTILIZACIÓN DE HOMOPOLÍMEROS

Un homopolímero es un ARN sintético que solamente contiene un tipo de ribonucleótido. Por ejemplo, el ARN sintético UUUUUUUUUUUUU.......

Gruberg-Manago y Ochoa (1955) aislaron a partir de timo de ternera un ezima denominada Polirribonucleótido fosforilasa que tenía la capacidad de sintetizar ARN a partir de ribonucleósidos difosfato y sin necesidad de molde. Este enzima iba tomando al azar los ribonuclkeñosidos del medio para originar un ARN.

Matthei y Nirenberg (1961) consiguieron sintetizar polipéptidos "in vitro" añadiendo un ARN sintético de secuencia conocida a un sistema acelular estable de traducción. Usando la Polirribonucleótido fosforilasa sintetizaron poli-uridílico (poli-U: UUUUUUUUUUUUUU...). Cuando emplearon este ARN sintético en su sistema acelular de traducción daba lugar a la formación de un polipéptido que solamente contenía el aminoácido fenilalanina (Poli-fenilalanina: phe-phe-phe-phe-..). Por tanto, el triplete UUU codificaba para fenilalanina (phe). También comprobaron que el ARN síntético Poli C (Poli-citidílico: CCCCCCCCCC....) daba lugar a un polipéptido que contenía solamente prolina (Poli-prolina: pro-pro-pro-pro-pro-...), por tanto, el codón CCC significaba prolina (pro).

Poco tiempo después, Ochoa sintetizó Poli-adenílico (Poli-A: AAAAAAAAA....) y observó que el polipéptido que aparecía solamente tenía el aminoácido lisina (Poli-lisina: lys-lys-lys-lys-....). Por consiguiente el triplete AAA codificaba para el aminoácido lisina (lys). También corroboró que el Poli-C daba lugar a Poli-prolina. El ARN Poli-guanílico no producía proteína alguna, probablemente debido a que adquiría una estructura terciaría helicoidal que impedía su traducción a proteína.

Triplete Aminoácido
CCC prolina
UUU fenilalanina
AAA lisina

USO DE COPOLÍMEROS

El siguiente paso fue la utilización de copolímeros, es decir, de ARN sintéticos que contenían más de un más de un ribonucleótido distinto. Para ello emplearon la Polirribonucleótido fosforilasa y pusieron en el medio dos ribonucleósidos distintos. Por ejemplo, U y G, de manera que había 5 veces más U que G en el medio (5U:1G). Debido a que el enzima toma los ribonucleósidos difosfato del medio al azar, la probabilidad de que tome un U del medio es 5/6, mientras< que la probabilidad de que tome una G es 1/6. El ARN sintético formado presentaba una secuencia al azar de uracilos y guaninas y aparecían en él ocho tripletes diferentes con las siguientes probabilidades:

Triplete 5’ 3’

Probabilidad Valor relativo

UUU

5/6 x 5/6 x 5/6 = 125/216

100

UUG

5/6 x 5/6 x 1/6 = 25/216

20

UGU

5/6 x 1/6 x 5/6 = 25/216

20

GUU

1/6 x 5/6 x 5/6 = 25/216

20

UGG

5/6 x 1/6 x 1/6 = 5/216

4

GUG

1/6 x 5/6 x 1/6 = 5/216

4

GGU

1/6 x 1/6 x 5/6 = 5/216

4

GGG

1/6 x 1/6 x 1/6 = 1/216

0,08

Cuando se analizó el polipéptido que se sintetizaba con este mensajero sintético, se observó que contenía fenilalanina (phe), cisteina (cys), valina (val), glicina (gly) y triptófano (trp). Tomando como valor 100 el de el aminoácido más frecuente, cys y val presentaban un valor de 20 mientras que trp y gly mostraban un valor de 4 a 5. Se confirmaba que UUU significaba fenilalanina y se deducía que 2U y 1G (UUG, UGU y GUU) codificaban para cisteína y valina. También se deducía que 1U y 2G (UGG, GUG y GGU) codificaban para triptófano y glicina. Sin emabrgo, no era posible asignar un triplete concreto para cisteína y valina, o para triptófano y glicina. Parece raro, que en estos experimentos no detectaran el aminoácido leucina (leu) que esta codificado por el triplete UUG, tampoco dedujeron que el aminoácido valina estaba codificado por 1U y 2 G (GUG). Uno e los problemas, de estos experimentos radica en asignar el valor 100 al aminoácido más frecuente y comparar las proporciones de aminoácidos obtenidas de esta manera con las de los distintos tripletes del mensajero, ya que el aminoácido más frecuente puede estar codificado por más de un triplete. Oto inconveniente es que los mensajeros sintéticos producidos no presenten la frecuencia de codones esperada por azar.

Este tipo de experimentos fueron realizados por los grupos de Nirenberg y de Ochoa y no rindieron grandes resultados.

EMPLEO DE POLÍMEROS DE SECUENCIA CONOCIDA

La siguiente forma de abordar el desciframiento de la clave genética fue utilizar ARN mensajeros sintéticos de secuencia conocida obtenidos por métodos de síntesis química o enzimática. Estos métodos fueron empleados por Khorana y col. (1965).

Utilizando el Poli-UCde 116 residuos de longitud, ARN mensajero sintético en el que se repite muchas veces seguidas el dinucleótido UC (UCUCUCUCUCUCUC...) obtuvieron un polipéptido que contenía los residuos de serina y leucina en secuencia alternada (ser-leu-ser-leu-ser-leu-ser-leu-....). El Poli-UC contiene dos tripletes diferentes, UCU y CUC, por consiguiente uno de ellos codifica serina y el otro leucina, pero no se puede determinar cuál a cuál.

También se emplearon los mensarejos sintéticos Poli-AC, Poli-AG y Poli-UG que codificacban para los siguientes aminoácidos:

ARN sintético Codones Polipéptido sintetizado Aminoáciods
Poli- AC (ACACACAC..) ACA y CAC thr-his-thr-his-thr-his treonina e histidina
Poli-AG (AGAGAGAG..) AGA y GAG arg-glu-glu-arg-glu-arg arginina y glutámico
Poli-UG (UGUGUGUG..) UGU y GUG cys-val-cys-val-cys-val- cisteína y valina
Poli-UC (UCUCUCUC..) UCU y CUC ser-leu-ser-leu-ser-leu- serina y leucina

En 1965, Nishimura y colaboradores utilizaron el Poli-AAG, mensajero sintético en el que se repite muchas veces seguidas el trinucleótido AAG (AAGAAGAAGAAGAAG...) y encontraron la aparición de tres polipéptidos distintos en el sistema acelular de traducción, detectaron Poli-lisina (lys-lys-lys-lys-...), Poli-arginina (arg-arg-arg-arg-..) y Poli-glutamato (glu-glu-glu-glu-..). Estos resultados además de confirmar que el código genético se compone de grupos de tres bases o codones, indican que en los sistemas acelulares de traducción, la iniciación de la traducción del mensajero puede realizarse por cualquier ribonucleótido. Si comienza por la primea A, se repite AAG-AAG-AAG-.., si la tradución comienza por la segunda A, se repite AGA-AGA-AGA-AGA-..., y si la traducción comienza por la G, se repite el triplete GAA-GAA-GAA-GAA-GAA-....

El punto de iniciación de la lectura de los mensajeros sintéticos en su sistema acelular de traducción "in vitro",  en ausencia de triplete de iniciación (AUG), puede ser cualquier ribonucleótido.

En el ejemplo de la figura, dependiendo del punto de iniciación aparece un polipéptido distinto, cuando comienza por la primera A se sintetiza Poli-lys, en la segunda A se produce Poli-arg y en cuando se inicia en la G aparece Poli-glu.

   

Naturalmente, en este experimento no se sabe cuál de los tres aminoácidos corresponde a cada uno de los tres tripletes

ARN sintético Codones Polipéptido sintetizado Aminoácidos
Poli- AAG AAG, AGA y GAA Poli-lys, Poli-arg, Poly-glu lys, arg y glu
AAGAAGAAGAAG.. AAG Poli- lys: lys-lys-lys-lys-.. lisina
AGAAGAAGAAGA.. AGA Poli-arg: arg-arg-arg arg-.. arginina
GAAGAAGAAGAA.. GAA Poli-glu: glu-glu-glu-glu-.. glutámico

TÉCNICA DE INCORPORACIÓN DE ARN TRASNFERENTES

En esta técnica se utilizan ARN mensajeros sintéticos de secuencia conocida con la siguiente estructura: los grupos de Khorana y Nirenberg emplearon trinucleótidos, mientras que el equipo de Matthei utilizaba oligonucleótidos del tipo ABCCCCCCCCCCC.... (el tercer nucleótido estaba repetido 100 veces). En este último caso solamente se analiza en primer triplete, ABC.

En todos los casos, en lugar de analizar los polipéptidos sintetizados, se analiza la especificidad con que el ARN transferente (ARN-t) con o sin su aminoácido correspondiente se incorpora al ribosoma. Dicha especificidad viene determinada por la secuencia de ribonucleótidos del ARN-m sintético empleado.

Para averiguar el ARN-t que es capaz de unirse en el ribosoma al trinucleótido analizado, es necesario marcar radiactivamente uno de los ARN-t de todos los utilizados. Se lleva a cabo esta operación marcadndo radiactivamente cada vez un ARN-t distinto.

Con este sistema fue posible descifrar todos los tripletes que aún no habían sido descifrados.

El código genético es universal

El desciframiento del código genético se ha realizado fundamentalmente en la bacteria E. coli, por tanto, cabe preguntarse si el código genético de esta bacteria es igual que el de otros organismos tanto procarióticos como eucarióticos. Los experimentos realizados hasta la fecha indican que el código genético nuclear es universal, de manera que un determinado triplete o codón lleva información para el mismo aminoácido en diferentes especies. Hoy día existen muchos experimentos que demuestran la universalidad del código nuclear, algunos de estos experimentos son:

El desciframiento del código genético dio como resultado la siguiente asignación de aminoácidos a los 64 tripletes.

    SEGUNDA BASE    
    U C A G    
P

R

I

M

E

R

A

 

B

A

S

E

U UUU Phe UCU Ser UAU Tyr UGU Cys U T

E

R

C

E

R

A

 

B

A

S

E

UUC Phe UCC Ser UAC Tyr UGC Cys C
UUA Leu UCA Ser UAA FIN UGA FIN A
UUG Leu UCG Ser UAG FIN UGG Trp G
C CUU Leu CCU Pro CUA His CGU Arg U
CUC Leu CCC Pro CAC His CGC Arg C
CUA Leu CCA Pro CAA Gln CGA Arg A
CUG Leu CCG Pro CAG Gln CGG Arg G
A AUU Ile ACU Thr AAU Asn AGU Ser U
AUC Ile ACC Thr AAC Asn AGC Ser C
AUA Ile ACA Thr AAA Lys AGA Arg A
AUG Met ACG Thr AAG Lys AGG Arg G
G GUU Val GCU Ala GAU Asp GGU Gly U
GUC Val GCC Ala GAC Asp GGC Gy C
GUA Val GCA Ala GAA Glu GGA Gly A
GUG Val GCG Ala GAG Glu GGG Gly G

El código genético nos indica que aminoácido corresponde a cada triplete o codón del ARN mensajero.

El código genético mitocondrial es la única excepción a la universalidad del código, de manera que en algunos organismos los aminoácidos determinados por el mismo triplete o codón son diferentes en el núcleo y en la mitocondria.

Excepciones a la Universalidad del Código

Organismo Codón Significado en Código Nuclear Significado en Código Mitocondrial
Todos UGA FIN Trp
Levadura CUX Leu Thr
Drosophila AGA Arg Ser
Humao, bovino AGA, AGC Arg FIN
Humano, bovino AUA Ile Met (iniciación)
Ratón AUU, AUC, AUA Ile Met (iniciación)