RMN de proteinas • Ahora mas o menos conocemos las tecnicas que se utilizan en la determinacion de redes de acoples (estructura quimica) y distancias internucleares (estructura 3D, conformacion). • Vamos a ver como se utilizan en el estudio de estructura 3D y preferencias conformacionales de macromoleculas, en particular proteinas. Vamos a tratar de cubrir en dos calses algo para lo que se han escrito muchos libros… • Hay ciertas cosas que tenemos que mencionar antes de hacer una analisis de las tecnicas de RMN de proteinas: 1) La informacion que obtenemos no es ni mejor ni peor que los datos de rayos-X. Nos da una imagen que puede ser considerada complemetaria a la cristalografica. En ciertos aspectos experimentales es mas rapido que los rayos-X. 2) Una de las razones por las cuales es mas rapido es que no necesitamos cristales. Esto nos da dos ventajas. Primero, no tenemos que esperar por los cristales, y segundo, podemos hacerlo aunque la muestra no cristalize (esto se da mucho con peptidos flexibles, oligosacaridos, etc.). 3) Nos da la estructura 3D en agua, que es el solvente donde ocurren las reacciones biologicas (las enzimas y las drogas interactuan en agua). 4) Nos da informacion sobre la dinamica de la molecula. No es una imagen estatica. Breve resumen de estructura de proteinas • Antes de ver como determinamos la estructura 3D de una proteina por RMN, vamos a repasar un poco de bioquimica… • Las proteinas/peptidos estan armados de 20 aminoacidos. Esto nos va a hacer la vida mas facil… • La estructura quimica de la proteina es la secuencia de aminoacidos que la forman. Siempre la escribimos del NH2 libre al COOH libre: H O AA2 Hα N H residuo O N N AA1 Hα H N O AA3 Hα H grupo peptidico • Esto es la estructura primaria. Vemos claramente que entre entre cada AA tenemos grupos C=O. Osea, el sistema de espines de cada AA esta aislado del de los otros. • Por esta razon el espectro 1H de la proteina es, en principio, una superposicion de los espectros de los AA aislados. Sin embargo, hay pequeñas desviaciones de corriemientos quimicos causadas por una estructura definida, y esto es lo que nos permite estudiarlas por RMN… Estructura de proteinas (continuado) • La forma en que los residuos de la proteina se organizan localmente es la estructura secundaria. Los elementos mas comunes de estructura secundaria son la α-helice y la hoja plegada β (paralela o antiparalela): • Otro elemento importante de estructura secundaria es el bucle β (β-turn), ya que le permite a la cadena cambiar de direccion: Las basicas de la RMN de proteinas • La estructura terciaria es como todo se acomoda (o no) en solucion, o como los distintos elementos de estructura secundaria se organizan espacialmente entre ellos. Aromaticos agua • Lo primero que tenemos que saber es donde aparecen los picos de los 1Hs de los aminoacidos en el espectro: HCα Iminas Amidas 10 9 8 7 6 5 4 3 HCβ, γ, δ, ... 2 1 0 • Como estan muy cerca unos de otros, despues de 3 o 4 aminoacidos necesitamos hacer espectroscopia 2D para poder resolver las señales. • Como dijimos antes, no hay conexion entre los distintos AAs: No podemos determinar cual es cual. Para poder determinar la estructura de una proteina por RMN necesitamos saber la estructura primaria de la proteina. • El primer paso a seguir es asignar todas las señales del espectro 1H a los protones de todos los aminoacidos de la proteina. Asignacion de sistemas de espines • Para hacer esto, nos valemos de los espectros 1H 1D (si es un peptido), COSY, y TOCSY. Ya hemos visto como un TOCSY nos permite identificar todo un sistema de espines. • En proteinas, cada aminoacido nos va a dar una linea independiente en el TOCSY empezando en el NH y llendo hasta el ultimo proton de su cadena lateral. • Las unicas excepciones son Phe, Tyr, Trp, e His, donde el sistema de espines de la cadena lateral esta dividido en dos por un carbono cuaternario. • Con suerte podemos asignar todas las señales a aminoacidos, pero lo mas probable es que nos queden algunas sin asignar porque esten solapadas. Si pasa esto necesitamos mas dimensiones y/o proteina marcada (mas luego…). • De cualquier manera, una vez que todos los sistemas de espines estan identificados, tenemos que ‘atarlos’ unos a otros y determinar su posicion en la estructura primaria. • Tenemos dos formas de hacer esto. Una es el metodo de asignacion secuencial, y el otro el metodo de cadena principal. • Los dos metodos se basan en que hay correlaciones NOE caracteristicas de 1Hs del residuo i a los de residuos (i ± n). Patrones NOE caracteristicos • Las mas simples de identificar son correlaciones interesiduales y secuenciales, que corresponden con NOEs entre protones de un residuo a protones de residuos (i ± 1): dαα dαN H O AA2 Hα N dNN H O N N AA1 Hα N H O dNβ, dNγ, … Hα AA3 H dαα dαβ, dαγ, … • Aparte de estos, regiones de estructura secundaria definida van a dar NOE caracteristicos. En α-helices y hojas β: i+4 dαβ(i, i+3) dαN(i, i+3) dNN(i, i+3) dαN (i, i+4) i-1 C i+3 i+2 i+1 i dα(i)N(j) N C d α(i)α (j) N(j) ) i ( dN N N C N C Asignacion secuencial • En el metodo de asignacion secuencial tratamos de atar sistemas de espines por medio de conectividades NOE secuenciales (de un residuo a residuos i + 1 y/o i - 1). • La idea es elejir un residuo cuyas señales esten bien resueltas en el TOCSY y despues buscar en el NOESY correlaciones NOE secuenciales de sus protones a protones en otros sistemas de espines. • Estas son generalmente correlaciones dNN, dαN, and dβN. En este momento tambien podemos buscar correlaciones dβδ para establecer la identidad de los residuos aromaticos, Asn, Arg, Gln, etc… • Despues de encontrar esos, volvemos al TOCSY para identificar a que residuo corresponden las correlaciones que vimos en el NOESY. Esos protones van a estar en residuos i ± 1. • Hacemos esto hasta que se nos acaban los residuos (i.e., hasta que llegamos a una punta de la cadena peptidica), o hasta que tenemos mucho solapamiento. • Como podemos tener muchos puntos de partida y direcciones, el metodo se ‘valida’ a si mismo automaticamente. • Se han propuesto varios algoritmos para hacer esto de forma computarizada. Cada uno de estos metodos tiene pros y contras, pero todos requieren de un usuario ‘capaz’… Asignacion secuencial (continuado) • Esto lo podemos ver en un diagrama simple (no encontre nada muy lindo entre lo mio…). • Digamos que estamos miarando cuatro lineas en el TOCSY que corresponden a Ala, Asn, Gly y Leu. Tambien sabemos que tenemos Ala-Leu-Gly en el peptido, y no en otro orden. TOCSY NOESY HC HC Gly Gly Asn Asn Ala Leu Ala NH Leu NH • En el TOCSY vemos todos los espines. En el NOESY tenemos correlaciones intraresiduales ( ) e interesiduales ( ) que nos permiten determinar que residuos contiguos en la cadena peptidica. Metodo de cadena principal • Este metodo fue propuesto por Wüthrich (el abuelo del RMN de proteinas y ganador del Nobel en Quimica del 2003 por su trabajo en el area). Ya hemos visto que regiones de estructura secundaria definidas dan patrones de NOE regulares. • ¿Qut tal si, en vez de hacer la asignacion secuencial y perder tiempo en regiones que tengan estructura indefinida, nos concentramos en buscar estos patrones de NOE regulares? • Esto es exactamente lo que hace este metodo. Buscamos patrones de NOE ciclicos, que se dan generalmente cuando tenemos estructura secundaria definida. • Cuando encontramos estos patrones de NOE, tratamos de correlacionarlos con fragmentos de la estructura primaria de la proteina/peptido. Es ideal para hacer por computadora: - El programa primero busca α-helices (busca correlaciones dαβ(i, i+3), dαN(i, i+3), dNN(i, i+3), dαN (i, i+4), etc…). - Despues que elimina todos los picos correspondienes a helices, busca hojas β (regiones en que las conectividades son de cosas que estan alejadas una de otra en la estructura primaria). - Despues de eliminar estos, busca bucles y regiones de estructura indefinida. Estructura secundaria y terciaria • A pesar de que el metodo de cadena principal encuentra patrones de estructura secundaria, el fin es identificar los residuos en el espectro (i.e., asignar sistemas de espines). Todavia hay que buscar la estructura secundaria/terciaria. • Si usamos el metodo de cadena principal, ya tenemos casi todo el trabajo hecho (casi el 90 %), porque las regiones de estructura secundaria definida (α-helices, hojas β) ya las tenemos identificados. • Si usamos el metodo secuencial tenemos casi todos los NOE entre el residuo i e i + 1 y i - 1, o de rango corto. Solo nos queda buscar correlaciones NOE de rango medio (i + 2, 3, y 4) y de rango largo (> i + 5). • La cantidad y tipo de NOEs de rango largo obviamente dependera de la estructura secundaria/terciaria del peptido. • Estos NOEs son agrupados en tablas. Se les asigna un valor dependiendo de la intensidad de la correlacion (i.e., el volumen del cross-peak) usando una referencia interna de intensidad, como ser un NOE entre 1Hs del CH2 de una Phe). • Como en las macromoleculas podemos tener distintos procesos de relajacion compitiendo, los NOEs no tienen un valor unico. Generalmente los agrupamos como fuertes, medios, y debiles. • Luego vamos a ver como los convertimos a ‘distancias’ ... Lo que el NOE nos dice y lo que no nos dice • Ahora tenemos casi todo: Los sistemas de espines identificados, sus NOEs secuenciales, medios, y largos medidos, y sus intensidades tabuladas. • A esta altura vamos a tener algunos conflictos en las asignaciones. En particular, hay casos en los cuales vamos a ver ciertos NOE pero no otros que ‘tendrian’ que estar alli… • Esto es debido a que los NOE no solo dependen de la distancia entre dos protones, pero tambien de la dinamica entre ellos (osea, el grado de movimiento de uno con respecto al otro). Esto va a ser importante en peptidos chicos, porque en estos casos tenemos mucha movilidad en las cadenas laterales y en el esqueleto peptidico. • Lo mas importante a tener en cuenta siempre es que no ver un NOE no significa que dos protones esten a mas de 5 Å. • A su vez, un NOE puede surgir de un promedio de conformeros del peptido. Podemos ver algo como NOE medio (1.8 a 3.3 Å), cuando en realidad es una mezcla de NOE fuerte (1.8 a 2.7 Å) y ausencia de correlacion: Aparente: Real: dij < 3 Å dij > 6 Å dij ~ 3 Å Acoples y angulos diedros • Hasta ahora hemos visto como usar algunos datos de RMN para obtener parametros estructurales usados en la determinacion de estructuras 3D de macromoleculas en solucion. • En particular, los NOE nos permiten determinar distancias aproximadas entre protones cercanos. Son muy utiles si los vemos entre protones que estan en residuos que esten distantes uno de otro en la estructura primaria. • Sin embargo, los NOE no nos permiten, en general, decir nada acerca de la conformacion de enlaces con libre rotacion. Para determinar esto podemos usar acoples 3J que se observan en peptidos (o azucares, ADN, y ARN). Se pueden usar acoples 3J/2J homo/heteronucleares, pero nos vamos a concentrar en el acople 3J homonuclear. • Estos incluyen 3JNα, que nos da informacion acerca de la conformacion del esqueleto peptidico (φ), y 3Jαβ, que esta relacionado con la conformacion de la cadena lateral (χ): H φ 3J Nα 3J αβ ω N φ χ O χ ψ Hβ Hβ AA Hα N H Acoples y angulos diedros (continuado) • Como vimos, la constante de acoplamiento 3J esta relacionada con el angulo diedro por la ecuacion de Karplus. • Como vimos antes, la ecuacion es una suma de cosenos, y dependiendo de la topologia (H-N-C-H or H-C-C-H) tenemos distintos parametros: 3J 3J 2 Nα = 9.4 cos ( φ - 60 ) - 1.1 cos( φ - 60 ) + 0.4 2 αβ = 9.5 cos ( ψ - 60 ) - 1.6 cos( ψ - 60 ) + 1.8 3J (Hz) • Los parametros han sido derivados de moleculas rigidas y datos de rayos-X. Graficamente: φ - 60 Acoples y angulos diedros (…) • ¿Como medimos las 3J? Si tenemos pocos aminoacidos, directamente del 1D. Tambien las podemos medir de espectros HOMO2DJ, o de espectros tipo COSY de alta resolucion (MQF-COSY y E-COSY). • El problema mas grande de la ecuacion de Karplus es que introduce ambiguedades. Si tenemos acoples 3JNα menores de 4 Hz y los pongo en la grafica vemos que podemos tener hasta 4 valores posibles para el angulo φ: 9.4 5.0 ~ -60 ~0 ~110 ~170 4.0 0.0 φ - 60 • En estos casos podemos hacer dos cosas. Una es tratar de determinar la estructura usando solo NOEs y despues confirmar lo que nos da con los acoples J. Esto anda bien, pero estamos ‘tirando’ informacion util… Acoples y angulos diedros (…) • Otra cosa que se puede hacer es usar solo los angulos que son mas comunes que conocemos de estructuras de rayos-X. Para φ, los angulos ‘estandar’ tienen valores negativos de ~ -60 y ~ -170). Usando rangos: 3J Nα < 5 Hz -80 < φ < -40 3J Nα > 8 Hz -150 < φ < 170 (-190) • Para las cadenas laterales tenemos also similar, pero en este caso hay que elegir entre tres posibles rotameros (como en etano…). Como se pueden medir dos acoples 3Jαβ (hay 2 protones β), nos permiten elegir el conformero adecuado: N Hβ1 N Hβ2 N Cγ Hβ2 Hβ1 C’ Hα Cγ Cγ C’ Hα C’ Hα Hβ1 Hβ2 3J 3J αβ1 < 5 (o vice versa) αβ2 > 8 3J 3 αβ1 ~ Jαβ2 < 5 Introduccion al modelado molecular • Ahora tenemos casi toda la informacion estructural que podemos sacar por RMN de nuestra muestra: tablas de NOEs con distintas intensidades (distancias), constantes de acople 3J, y rangos de angulos derivados de los acoples 3J. • Tenemos que ver como usar toda esta informacion para obtener una ‘imagen’ de la molecula en solucion. • Contrario a los rayos-X, con los que ‘vemos’ la densidad electronica de la molecula y pueden ser considerados como un metodo directo, con RMN solo obtenemos informacion indirecta acerca de la estructura, y esta informacion la dan unos pocos atomos (basicamente los 1Hs…). • Por lo tanto nos valemos de un modelo teorico para representar a la macromolecula. En general, esto es un modelo molecular generado por computadora. • Este puede tener distintos grados de complejidad: - ab initio: Solo considera orbitales atomicos/moleculares y resolvemos la ecuacion de Schröedinger. No necesita parametros. Computacionalemte caro (10 - 100 atomos). - Semiempirico: Usamos algunos parametros para representar a los orbitales atomicos/moleculares (100 - 500 atomos). - Mecanica Molecular: Usamos un potencial parametrizado simple tipo masa-y-resorte (todo lo demas…). Modelado molecular (continuado) • Aca estamos lidiando con proteinas (miles de atomos), osea que usamos mecanica molecular (MM). • El corazon de la MM es el campo de fuerza (force field) o las ecuaciones que describen la energia del sistema en funcion de las coordenadas xyz. En general es una suma de distintos terminos de energia: Etotal = EvdW + Een + Ean + Etor + Eelec + … • Cada termino depende de una forma u otra con la geometria del sistema. Por ejemplo, Een, o potencial de enlace del sistema (bond stretching), es: Een = Σi Keni * ( ri - roi )2 • Las distintas constantes (Kbs, ro, etc., etc.) son los parametros del campo de fuerza, y se obtienen a partir de datos experimentales (rayos-X, microondas) o calculos a alto nivel de teoria (ab initio o semiempiricos). • Distintos campos de fuerza incluyen distintos terminos, y necesitamos uno que tenga aquellos que representen bien a nuestro sistema (proteinas). Incorporacion de datos de RMN • Lo bueno de los campos de fuerza para MM es que si tenemos una funcion que relacione nuestros datos experimentales con las coordenadas xyz la podemos sumar directamente a la ecuacion del potencial total del sistema. • Esto es lo que hacemos con los datos derivados de RMN. Para NOEs usamos rangos de distancias en vez de valores unicos porque podemos tener otros fenomenos de relajacion en juego, y/o promediado de NOEs: NOE fuerte NOE medio NOE debil 1.8 - 2.7 Å 1.8 - 3.3 Å 1.8 - 5.0 Å • La funcion de energia potencial relacionada con estos rangos es una funcion cuadratica de base plana: ENOE = KNOE * ( rcalc - rmax )2 si rcalc > rmax ENOE = 0 si rmax > rcalc > rmin ENOE = KNOE * ( rmin - rcalc )2 si rcalc < rmin • Cuanto mas lejos este la distancia calculada en el modelo teorico (rcalc) del rango determinado experimentalmente, mas grande la penalizacion. Estas son restricciones de NOE. Incorporacion de datos de RMN (continuado) • De manera similar podemos incluir restricciones en el rango de angulos o constantes de acoplamiento: EJ = KJ * ( Jcalc - Jmax )2 EJ = 0 si Jcalc > Jmax si Jmax > Jcalc > Jmin EJ = KJ * (Jcalc - Jmin )2 si Jcalc < Jmin • Graficamente, las funciones tienen este aspecto: E rmin rmax Jmin Jmax φmin 0 Rcalc, φcalc, o Jcalc φmax Optimizacion de estructuras • Ahora tenemos todas las funciones incluidas en el potencial de la molecula, incluyendo interacciones covalentes (enlace, angulos, y torsiones), no covalentes (vdW, electroestatica), y restricciones NOE y 3J derivadas de RMN. • Para obtener un modelo estructural del peptido decente hay que minimizar la energia del sistema, lo que implica encontrar un conforermo de baja energia (o el de mas baja energia) o una familia de conformeros de baja energia. • En una funcion con la cantidad de variables que tenemos en un peptido esto es laborioso, porque tenemos una superficie de n dimensiones (cada uno de las variables que estamos optimizando). Para φ y ψ en un disacarido: E (Kcal/mol) ψ φ • Tenemos picos (maximos) y valles (minimos) de energia. Optimizacion de estructuras (continuado) • Minimizar la funcion implica ‘bajar’ en la (hiper)superficie de energia de la molecula. Para esto neceitamos calcular las derivadas CRA xyz (las variables) de todos los atomos: ∂E ∂xyz total >0 Etotal ∂E ∂xyz total <0 Etotal • Esto nos permite ver como vamos ‘para abajo’ para todas las variables, y por lo tanto determinar que direccion hay que tomar para minimizar la energia del sistema. • La minimizacion solo ‘baja.’ Podemos tener muchos minimos locales en la superficie, y si solo usamos minimizaciones el sistema puede quedar atrapado en uno de estos. Esto es lo que sucede en proteinas, donde tenemos cientos de grados de libertad (considerando solo enlaces con libre rotacion…). • En estos casos necesitamos otros metodos para encontrar el minimo de energia. Uno de estos metodos es la dinamica molecular (DM). • Como tenemos la funcion potencial del sistema, le podemos dar energia (por ejemplo, ‘elevar’ la temperatura) y ver como evoluciona. Un aumento de temperatura implica mas energia cinetica y la posibilidad de superar barreras energeticas. Dinamica molecular y enfriamineto simulado • En las DMs ‘calentamos’ el sistema a una temperatura fisicamente ‘razonable,’ ~ 300 K. La energia por mol a esta temperatura es ~ RT, donde R es la constante de Boltzmann (por mol). Si hacemos los numeros, esto es ~ 0.5 Kcal/mol. • Esto puede ser suficiente para ciertas barreras, pero no para otras que seguramente vamos a tener en el sistema. Para estos casos necesitamos un metodo de busqueda conformacional mas drastico, como ser el templado simulado. • ‘Calentamos’ el sistema a temperaturas ridiculamente altas (2000 K), y despues lo dejamos enfriar lentamente. La idea es que este proceso permite que el sistema pase por barreras energeticas considerables, y al enfriarse produzca conformeros estables y de baja energia. Conformeros ‘calientes’ T Conformeros ‘frios’ Tiempo (generalmente ps) Geometria de distancia • Otro metodo compleatmente diferente a la DM y al TS es la geometria de distancias. Vamos a presentar solo lo que nos da pero no como funciona. • Basicamente, randomizamos las coordenadas xyz de los atomos del peptido dandoles limites altos y bajos por fuera de los cuales los atomos no pueden estar. Aca incluimos los enlaces y las restricciones de RMN. • Esto nos da una matriz de distancias limite, que es optimizada por medio de un algoritmo SIMPLEX (desigualdades de trinagulos), lo que se conoce como suavizado de la matriz. Las estructuras que salen de esto no estan optimizadas, y generalmente las mejoramos por DM y/o minimizacion. • Este esquema da un resumen de como los distintos metodos hacen que la estructura se mueva en la superficie de energia potencial del sistema: ME DM TS GD Presentacion de resultados • La idea es samplear el espacio conformacional al que la proteina tiene acceso bajo los efectos de las restricciones estructurales que obtuvimos de los NOE y los acoples. • Las estructuras que obtenemos por estos metodos que no muestren violaciones grandes de las restricciones que incluimos se dicen ser consistentes con los datos de RMN. • Como ninguna de estas estructuras se puede descartar, lo que hacemos es presentarlas como un set de estructuras de baja energia superimpuestas en las regiones mas rigidas: N-termini C-termini • En esta solo mostramos los atomos pesados del esqueleto peptidico. A pesar de que no lo buscamos, la flexibilidad de ciertas regiones indica una falta de restricciones NOE, y refleja que esa parte de la molecula es flexible en solucion.