27/12/09

CAPITULO 12. ESTRUCTURA DEL RNA 12.1

Estructura primaria

12.2

Estructura secundaria

12.3

Duplexes híbridos ADN-ARN

12.4

Estructura terciaria del RNA.

12.4

ARN de transferencia (estructura secundaria y terciaria)

12.5

Interacciones aparareamiento codón-anticodón

12.6

La estructura del ribosoma

-1 -

27/12/09

12.1 ESTRUCTURA PRIMARIA DEL ARN El RNA es una cadena nucleotídica formada por enlaces fosfodiester 5’->3’. Esto es, algo identico a lo que se tenía en el ARN. La diferencia fundamental, a parte de la existencia de uridina en lugar de timidina, es la existencia de ribosa, en lugar de 2’deoxyribosa. La existencia de un grupo OH en 2’ abre una posibilidad nueva. Esto es, porque no es el enlace fosfodiester 5’->2’, en lugar de 5’->3’?. La primera respuesta que se nos puede ocurrir es que el enlace fosfodiester es más estable en 3’ que no en 2’. Esto es falso, se ha visto experimental, y teóricamente que la unión 5’->2’ es incluso más estable que la 5’->3’ y que puede formar hélices como las uniones 5’->3’. Por que entonces es el enlace 5’->3’ el que existe in vivo?. La verdad no se sabe muy bien, pero se especula que pueda ser un efecto evolutivo ligado al hecho de que las uniones 5’->2’ tienen una tendencia superior a formar hélices de orden superior (p.ej triples hélices) que las que tienen los enlaces 5’->3’ standard. Señalar que recientemente se han encontrado polímeros de RNA con unión 5’>2’. Un ejemplo es el 5’->2’ polyA RNA (3 a 8 A) que se da catalizado por la proteína interferón. El interferón sabéis que es una molécula proteica que se da como respuesta a la infección vírica, y que es responsable de la defensa antiviral del organismo. La síntesis del fragmento poliA (5’->2’) induce una “interferón-induced ribonuclease” que es la que rompe y degrada el RNAm vírico. Es decir, que el enlace 5’->2’ no es el más abundante, pero es teóricamente posible, y biológicamente relevante. La similitud estructural a nivel de estructura primaria del RNA y el RNA es muy elevada, y los cambios de propiedades debido al cambio ribosa->deoxyribosa y T->U son pequeños. De hecho las diferencias de secuencia más relevantes entre RNA y DNA es que la presencia de bases anómalas (no codificantes) en el ARN es mucho más abundante que no en el DNA, especialmente en lo que hace referencia al RNA(t). 12.2

ESTRUCTURA SECUNDARIA DEL ARN

La presencia del grupo 2’-OH introduce pequeñas modificaciones en la preferencia conformacional del azúcar, pero suficiente para que prevalezca la -2 -

27/12/09 conformación C3’-endo (zona Norte), como ya se discutió en el capítulo anterior. De hecho, el puckering de la ribosa en el RNA es más rígido que el correspondiente de la 2’deoxy-ribosa en el RNA y prácticamente el 100% de la población es Norte. Los enlaces glycosidicos están todos en conformación anti. La conformación global del RNA se adapta muy bien a lo que conocemos como conformación A. De hecho, la estructura del A-RNA es muy parecida a la del A-DNA, con forma de doble hélice y apareamientos del tipo Watson-Crick. Disposición general de la hélice, surcos,..., son idénticos a los que se tenían en el A-DNA. En condiciones de alta fuerza iónica la forma A cambia a una formar denominada A’, esta es un hélice aún más compacta que la hélice A, ya que tiene 12 pares de bases por vuelta de hélice. El RNA aparece en general (in vivo) como una cadena sencilla, por lo que para adoptar estructuras de doble cadena debe replegarse sobre el mismo y seleccionar el trozo complementario que le de máxima estabilidad. Es por ello que en la estructura del RNA encontramos hairpins, regiones hairpins alternados, bulges, internal loops y todo tipo de estructuras anómalas (véase más adelante). El RNA tiene tendencia a formar estructuras 3-D complejas, lo que le permite tener una serie de funcionalidades propias de proteínas (p.ej el RNA ribosomal, RNA de transferencia o los ribozimas).

Figura 1. Estructura tipo A característica de un RNA.

-3 -

27/12/09

También señalar que se ha detectado la presencia de RNA en triples hélices, se han descrito sobre todo en motivos pirimidina y parecen tener una estructura similar a las de DNA, aunque aún no hay ninguna descripción a alta resolución de las mismas. Una característica interesante que diferencia a nivel de estructura secundaria a DNA y RNA es su flexibilidad. El DNA en la forma B es más flexible que el RNA o el DNA en la forma B. Por ejemplo, lo que tenéis en la Figura 2 es un histograma de las poblaciones de diversas conformaciones de propeller twist en estructuras de A-DNA (izq), B-DNA (centro) y RNA y es evidente que los perfiles son más anchos para la forma B que para A.

Figura 2. Representación en histograma de la población de propeller twist en estructuras de A-DNA, B-DNA y RNA resueltas por rayos X y depositadas en PDB. Lo mismo se ve cuando se realizan dinámicas moleculares de DNA y en RNA. Esto lo podéis ver por ejemplo en las Figura 3 donde se han representado las poblaciones de “inclination” y “twist” que eran visitadas por B-DNA y RNA en una dinámica de 10 ns de d(GCGCAATTGCGC)2 y r(GCGCAAUUGCGC)2.

-4 -

27/12/09

Figura 3. Perfil de inclination (arriba) y twist (abajo) visitado durante MD para RNA (gráfica de la izquierda) y DNA (derecha).

12.3

DUPLEX DNA-RNA

El DNA y el RNA pueden formar duplexes (una hélice DNA, otra de RNA). Estas estructuras tienen una enorme importancia en la vida de la célula. i) Se forman cuando la transcriptasa reversa forma DNA a partir de RNA. ii) Cuando la RNA polimerasa forma RNAm a partir de DNA. iii) Se forman durante la replicación de los primers en los fragmentos de Okazaki. La estructura del híbrido DNA-RNA es la de una doble hélice con las características generales de un A-RNA, o del A’-RNA. Típicamente se detectan 11-12 pares de bases por vuelta de hélice. Parece que no todos los azucares se encuentran en conformación N, sino que al menos una parte de las deoxyribosas de la cadena de DNA se encuentran en conformación S o E. Los complejos DNA-RNA son muy estables, de hecho más estables incluso que los DNA-RNA Esta gran estabilidad también se intenta aprovechar con fines terapeúticos en estrategías de RNA-antisense. La idea aquí es similar a la comentada más arriba para los antigene, pero ahora atacando directamente el RNAm. De hecho, la estrategia antisense saca ventaja de la existencia de un enzima la H-RNAase que degrada los híbridos DNA·RNA, rompiendo la cadena de RNA, pero

-5 -

27/12/09 no la de DNA. Este enzima protege a la célula de la formación de complejos no productivos de RNA y resulta muy útil en terapia antisense porque degradaría el RNAm diana manteniendo el DNA foráneo que hemos añadido, lo que produciría que este DNA actuara como catalizador de la degradación. La pega de todas estas estrategias “antisense” son varias, y muchas de ellas comunes con las estrategias anti-sense. Primero, no es fácil que el fragmento de DNA pase la membrana; segundo: el DNA se degrada con facilidad dentro de la célula; tercero no es siempre fácil seleccionar el trozo de RNA(m) diana del híbrido; por último no es simple hacer estable en sangre el RNA. Existe en la actualidad un enorme esfuerzo tendente a generar RNA resistentes, y con mejor biodisponibilidad para ello se modifican los extremos 5’ y 3’ (punto de ataque de muchas nucleasas), y también se intenta crear RNA donde los fosfatos se sustituyen por otros grupos. Paralelamente se está trabajando mucho en el desarrollo de métodos teóricos de predicción de estructura secundaria del RNA que nos permitan determinar la mejor región para formación del híbrido. Las estrategias antisentido se han visto reforzadas claramente por el descubrimiento de la maquinaria de procesamiento de los RNAi, que se aprovecha para silenciar RNAs patógenos por incorporación a la célula de fragmentos de RNA doble cadena complementario en una de sus dos cadenas a la secuencia diana del RNA a inhibir. Este RNA(d) es reconocido por sistemas proteicos (RISC fundamentalmente) que separa las 2 cadenas usando una de moled para reconocer y degradar la cadena de RNA diana. Los problemas de RNAi son similares a los de los métodos anti-sense más tradicionales.

12.4

CARACTERÍSTICAS DE LA ESTRUCTURA TERCIARIA DEL RNA

El RNA intenta siempre que puede recuperar una estructura dúplex donde se formen el máximo de puentes de hidrógeno pero al ser cadena sencilla esto conduce a: i) formación de puentes de hidrógeno e interacciones no canónicas, algunas de ellas muy estables y ii) abundancia de motivos como loops, buldges,.., también algunos de ellos

-6 -

27/12/09 muy estables y conservados en diferentes RNAs. Esto da una estructura secundaria compleja (Figura 4) que se repliega después en el espacio con gran especificidad. La estructura terciaria del RNA es mucho más rica y compleja que la del DNA y en cierto sentido recuerda a la de las proteínas.

Figura 4. Estructura secundaria del 165rRNA de E-Coli. Leotis/Westhof fueron los primeros en racionalizar los tipos de contactos de puente de hidrógeno de las bases que se clasifican según el lado del contacto: WatsonCrick/Hoogsteen/Sugar Edge (Figura 5), algunos de estos motivos implican que se adopten conformaciones syn respecto al enlace glicosídico. Los loops son muy prevalentes en las estructura terciarias del RNA y suelen estar conservados. Son regiones flexibles, pero en función de su conformación mayoritaria se clasifican según la longitud del loop y según si las bases no apareadas se mantienen stackeadas (stacked-in) respecto a la doble cadena o salen hacia el exterior (looped-out). En algunas ocasiones (por ejemplo comúnmente en tRNAs) se produce la interacción de loops que disponen bases proyectadas hacia el exterior y que permiten la formación de motivos conservados como los “kissing loops” (Figura 6).

-7 -

27/12/09

Figura 5. Clasificación de Leontis/Westhof de los apareamientos entre pares de bases que se ven en el DNA (extraído de “A.Liljas et al., Textbook

of

structural

Biology;

Wold

Scientific 2010”

Figura 6. Loops comunes en RNA. De izquierda a derecha tri, tetra y penta-loops. De arriba abajo conformaciones stacked-in o looped-out. La última figura representa una estructura esquemática de un kissing-loops motif.

Al ir analizando (de una manera similar a como se hizo hace tiempo con las proteínas) las estructruras de RNAs se ha encontrado la aparición de algunos motivos que son recurrentes, estables y conservados. Por ejemplos los tetraloops son muy prevalentes, especialmente los GNRA (N: purina cualquiera R: pirimidina y A cualquier base) y en menor medida los ANYA y los UNCG. También son comunes los internal loops y bulges, que suelen ser puntos que sirven para pivotar movimientos de cuerpo rígido de stems (el bulge sería como el codo en un brazo). Las junctions son también abundantes, especialmente las de 3-way, asi como los pseudoknots y una estructura llamada K-turn que implica un cambio muy brusco en la estructura y que está muy conservada en, por ejemplo, RNA ribosomales.

-8 -

27/12/09 12.5

RNA DE TRANSFERENCIA

Es uno de los RNA in vivo de los que se conoce su estructura secundaria y terciaria. Existen numerosos tRNA lógico si pensamos en los aminoácidos diferentes que estos tienen que transportar. No obstante, todos ellos tienen una estructura general común que es lo que explica que puedan integrarse en un proceso común: la síntesis de proteínas. Estructura Secundaria En la actualidad se habla de familias de tRNA todas ellas son en general similares, con pequeñas diferencias en algunas zonas. La forma general se ha asimilado a una hoja de trébol. En él distinguimos: 

El aceptor stem (tallo). Tiene 7 pares de bases y termina en el sitio de unión del aminoácido que es SIEMPRE el triplete 5’-CCA-3’ donde el extremo 3’ (A) esta con el 3OH’ sin fosforilar (donde se unirá el aminoácido).



El T-stem de 5 pares de bases que termina en el T-loop.



El “extra loop” o “variable loop” que es un fragmento muy variable de un RNA(t) a otro, varia en longitud (de 3 a 21 nucleótidos) y composición.



El “D-stem” tiene entre 3 y 5 pares de bases y termina en el “D-loop” que tiene una longitud variable de 7 a 11 nucleótidos.



Finalmente el “anticodon stem” tiene 5 pares de bases y acaba siempre en el anticodon loop donde están las 3 bases del codón que reconocen al triplete (codón) de bases del RNA(m).

Figura 7. Estructura del RNA(t) -9 -

27/12/09

Algunas características son comunes a los diferentes tRNA como es la estructura secundaria común o la presencia de bases no codificantes como pseudouridina o dihydrouridina, lysidina, inosina,... También el tamaño es relativamente constante (entre 74 y 95), lo que contrasta con el resto de los ácidos nucleicos. Son comunes en los diferentes tRNA la lóngitud del tallo aceptor y anticodón, y gran parte de la secuencia del loop T (también llamando pseudoruidine loop). Otros detalles tales como el tamaño del D stem (dihydrouridine stem), el tamaño del loop estra, y la composición concreta del dehydrouridine loop varían de una familia a otra. La diferencia de tamaño entre diferentes RNAs se debe a los nucleótidos extras en el D-loop y stem, así como en el extra loop. Todos los tRNA tienen una serie de nucleótidos comunes. Así, todos tienen en el extremo 3’ la secuencia ----CCA sin fosfato en el extremo (3’). El hidroxilo no esterificado del extremo 3’ será el que se une a un aminoácido. Destacar, que aparte de estos existen otros nucleótidos constantes, sobre todo los vitales para mantener la estructura terciaria del RNA muy definida. Por último comentar que el RNA(t), al igual que los RNA(m) se procesa eliminándose fragmentos de cadena (splicing) y produciéndose otras modificaciones. Por ejemplo, el extremo CCA solo se inserta después del procesado del RMA(t), antes era UU. Es decir que los RNA(t) tal como hemos descritos son RNA(t) maduros, justo los que hacen su función biológica. Estructura terciaria del tRNA El tRNA se repliega en el espacio dando una estructura terciaria en forma de L, que es estabilizada por interacciones de stacking entre las bases, interacciones de van der Waals, y puentes de hidrógeno, básicamente del tipo Hoogsteen. Nota: estos puentes de hidrógeno son entre zonas alejadas de la cadena, no confundirlos con los A:U, o G:C que son de tipo Watson-Crick, y que son los que forman la estructura secundaria. De hecho, el RNA(t) tiene una enorme cantidad de pares no canónicos (véase Figura 8).

- 10 -

27/12/09 Señalar finalmente que interacciones de grupos fosfatos y de grupos 2-OH’ parecen colaborar también a la estabilización, p.ej. con interacciones del tipo 2-OH’---N(Ade).

Figura 8. Esquemas de algunas de las interacciones existentes en RNA(t). Como consecuencia de todo el conjunto de interacciones comentado el tRNA adopta una estructura terciaria muy compacta y estable, pero con un grado de flexibilidad y de variabilidad conformacional dependiente de la secuencia, que es la que le posibilidad de ejercer las diversas funciones biológicas (recordar que cada Aa se reconoce por un tRNA diferente).

12.5

INTERACCIONES CODON-ANTICODON EL tRNA debe “cargar” un

aminoácido

que

es

el

que

se

corresponde con su codón. Existen 20 aminoácidos, y entre 60 y 70 tRNA, luego existirán varios tRNA que llevan el

mismo

degeneración

aminoácido del

código

dada genético

(véase Figura 9: El código genético usual a la derecha del texto)

- 11 -

27/12/09

La reacción de adición de un aminoácido a un tRNA se realiza por medio de la acilación en el extremo 3’ (el CCA-OH). Esta reacción esta catalizada por la aminoacil acil transferasas. Existen unas 20 diferentes amonoacil acil transferasas, tantas como diferentes aminoácidos. Estos enzimas cuentan con al menos 2 dominios, uno “lee” el anticodon y el otro el aminoácido. Tienen que ser muy específicos en cargar el Aa porque sino el error puede ser muy grave y pensad que no es trivial distinguir un aminoácido de otro (pensar por ejemplo en Leu, Ile, Val.,...). Por eso estos enzimas tienen un mecanismo de doble lectura. Por ejemplo en la primera lectura miran que el residuo no sea más grande de la cuenta, y en la segunda que no sea más pequeño. El caso es que consiguen un nivel de fiabilidad muy elevada. El mecanismo de acilación sugerido para el enzima se muestra en la Figura 8 y consta de: i) reacción con ATP, ii) El aminoácido activado por el ATP interacciona con el OH libre en el extremo 3’ de la adenosina final del tRNA.

Figura 10. Esquema de la unión de un aminoácido al RNA(t). Una vez tenemos cargado el tRNA con el aminoácido que corresponde, el tRNA debe ser capaz de reconocer el triplete de bases del RNam (codon). Como ya sabéis eso se realiza dentro del complejo sistema del ribosoma y será un tema. Básicamente la idea es de ir poniendo el nuevo RNA(t) cargado en contacto con el péptido que se esta

- 12 -

27/12/09 sintetizando. Eso facilitará la formación del enlace peptídico y la liberación del RNA descargado. El proceso seguirá hasta que llegue un codon de finalización UAA, UAG y UGA que no tiene RNA(t) cargado y eso producirá la liberación del péptido y la disociación del polisoma.

Figura 11. Esquema de la síntesis de proteínas en un ribosoma.

El reconocimiento codón-anticodón (3 bases mRNA con 3 bases del tRNA) se da por medio de puentes de hidrógeno diferentes. Los 2 primeros nucleótidos forman interacciones muy específicas tipo Watson-Crick. El apareamiento del tercer nucleótido es más flexible y no siempre es Watson-Crick. Además es posible que el tercer nucleótido del codon llegue a aparearse con un nucleótido que no es complementario. Esto es totalmente coherente con el caracter del código genético, donde existen diversos codones que codifican para el mismo aminoácido.

- 13 -

27/12/09 12.6

EL RIBOSOMA Es un ejemplo paradigmático de estructura cuaternaria formado por un gran

número de structuras complejas de RNAs (los RNA ribosómicos) de estructura muy definida y muy conservados y unas proteínas que hacen como de nexo de unión entre ellos. El ribosoma es la máquina de producción de proteínas y se encarga de a partir de la información del RNAm sintetizar la cadena de polipétidos. El ribosoma es posiblemente una estructura muy antigua propia de un mundo basado en el RNA. Encontramos ribosomas en todos los organismos tanto procariotas como eucariotas, y también en orgánulos específicos caso de las mitocondrias y los cloroplastos. Cada uno de estos ribosomas es diferente. Ribosomas procariotas. Tiene una masa de unos 2500 kD: Tienen dos subunidades, conocidas por sus coeficientes de sedimentacion: i) Subunidad grande (50S). Esta formada por 2 RNA ribosomales y 34 proteínas básicas que estabilizan la estructura. ii) Subunidad pequeña (30S). Formada por un solo tipo de RNA ribosomal y 21 proteínas. Ribosomas eucariotas. Son mas grandes (unos 4200 kD), tienen también dos subunidades: i) Subunidad grande (60S). Esta formada por 3 RNA ribosomales y 49 proteínas básicas que estabilizan la estructura. ii) Subunidad pequeña (40S). Est formada por 1 RNA ribosomal y 33 proteínas. Los ribosomas mas conocidos son los procariotas. Se describieron en baja resolución pr microscopia electrónica y recientemente por cristalofgrafia de rayos X, el primero en resolverse por técnicas de cristalografía fue el de Archea (2000) y unos años después (2005) el de E.Coli.

Los

primeros

trabajos

fueron

merecedores del premio Nobel de Química 2009. La Figura 12 a la izquierda representa la estructura tridimensional del RNA procariota.

- 14 -

27/12/09 El ribosoma procariota es una partícula de unos 200 Angstroms de diametro con una composicion de 65% RNA y 35% proteinas. El ribosoma eucariota es claramente mayor y tiene una proporcion mayor de proteínas. Toda la parte relacionada con el reconocimiento de RNAm es debido a los rRNA y se piensa que las proteínas de hecho solo tienen un papel estructural y de interacción no específica con los RNAt. Los largísimos

Rna

ribosomales

formas

diferentes

dominios

que

se

mueven

independientemente durante pasos del proceso de síntesis de péptidos. Se situan definiendo el core de la estructura mientras que las proteínas on mas pequeñas y periféricas.

Figura 13. Estructura de la subunidad pequema (izquierda) y grande (derecha) del ribosoma procariota.

- 15 -