RMN de proteinas

Anuncio
RMN de proteinas
• Ahora mas o menos conocemos las tecnicas que se utilizan
en la determinacion de redes de acoples (estructura quimica)
y distancias internucleares (estructura 3D, conformacion).
• Vamos a ver como se utilizan en el estudio de estructura
3D y preferencias conformacionales de macromoleculas, en
particular proteinas. Vamos a tratar de cubrir en dos calses
algo para lo que se han escrito muchos libros…
• Hay ciertas cosas que tenemos que mencionar antes de
hacer una analisis de las tecnicas de RMN de proteinas:
1) La informacion que obtenemos no es ni mejor ni peor que
los datos de rayos-X. Nos da una imagen que puede ser
considerada complemetaria a la cristalografica. En ciertos
aspectos experimentales es mas rapido que los rayos-X.
2) Una de las razones por las cuales es mas rapido es que no
necesitamos cristales. Esto nos da dos ventajas. Primero,
no tenemos que esperar por los cristales, y segundo, podemos hacerlo aunque la muestra no cristalize (esto se da
mucho con peptidos flexibles, oligosacaridos, etc.).
3) Nos da la estructura 3D en agua, que es el solvente donde
ocurren las reacciones biologicas (las enzimas y las drogas
interactuan en agua).
4) Nos da informacion sobre la dinamica de la molecula. No
es una imagen estatica.
Breve resumen de estructura de proteinas
• Antes de ver como determinamos la estructura 3D de una
proteina por RMN, vamos a repasar un poco de bioquimica…
• Las proteinas/peptidos estan armados de 20 aminoacidos.
Esto nos va a hacer la vida mas facil…
• La estructura quimica de la proteina es la secuencia de
aminoacidos que la forman. Siempre la escribimos del NH2
libre al COOH libre:
H
O
AA2 Hα
N
H
residuo
O
N
N
AA1 Hα
H
N
O
AA3 Hα
H
grupo
peptidico
• Esto es la estructura primaria. Vemos claramente que entre
entre cada AA tenemos grupos C=O. Osea, el sistema de
espines de cada AA esta aislado del de los otros.
• Por esta razon el espectro 1H de la proteina es, en principio,
una superposicion de los espectros de los AA aislados. Sin
embargo, hay pequeñas desviaciones de corriemientos quimicos causadas por una estructura definida, y esto es lo que
nos permite estudiarlas por RMN…
Estructura de proteinas (continuado)
• La forma en que los residuos de la proteina se organizan localmente es la estructura secundaria. Los elementos mas
comunes de estructura secundaria son la α-helice y la hoja
plegada β (paralela o antiparalela):
• Otro elemento importante de estructura secundaria es el
bucle β (β-turn), ya que le permite a la cadena cambiar de
direccion:
Las basicas de la RMN de proteinas
• La estructura terciaria es como todo se acomoda (o no) en
solucion, o como los distintos elementos de estructura secundaria se organizan espacialmente entre ellos.
Aromaticos
agua
• Lo primero que tenemos que saber es donde aparecen los
picos de los 1Hs de los aminoacidos en el espectro:
HCα
Iminas Amidas
10
9
8
7
6
5
4
3
HCβ, γ, δ, ...
2
1
0
• Como estan muy cerca unos de otros, despues de 3 o 4
aminoacidos necesitamos hacer espectroscopia 2D para
poder resolver las señales.
• Como dijimos antes, no hay conexion entre los distintos AAs:
No podemos determinar cual es cual. Para poder determinar
la estructura de una proteina por RMN necesitamos saber la
estructura primaria de la proteina.
• El primer paso a seguir es asignar todas las señales del
espectro 1H a los protones de todos los aminoacidos de la
proteina.
Asignacion de sistemas de espines
• Para hacer esto, nos valemos de los espectros 1H 1D (si es
un peptido), COSY, y TOCSY. Ya hemos visto como un
TOCSY nos permite identificar todo un sistema de espines.
• En proteinas, cada aminoacido nos va a dar una linea independiente en el TOCSY empezando en el NH y llendo hasta
el ultimo proton de su cadena lateral.
• Las unicas excepciones son Phe, Tyr, Trp, e His, donde
el sistema de espines de la cadena lateral esta dividido en
dos por un carbono cuaternario.
• Con suerte podemos asignar todas las señales a aminoacidos, pero lo mas probable es que nos queden algunas sin
asignar porque esten solapadas. Si pasa esto necesitamos
mas dimensiones y/o proteina marcada (mas luego…).
• De cualquier manera, una vez que todos los sistemas de
espines estan identificados, tenemos que ‘atarlos’ unos a
otros y determinar su posicion en la estructura primaria.
• Tenemos dos formas de hacer esto. Una es el metodo de
asignacion secuencial, y el otro el metodo de cadena
principal.
• Los dos metodos se basan en que hay correlaciones NOE
caracteristicas de 1Hs del residuo i a los de residuos (i ± n).
Patrones NOE caracteristicos
• Las mas simples de identificar son correlaciones interesiduales y secuenciales, que corresponden con NOEs entre
protones de un residuo a protones de residuos (i ± 1):
dαα
dαN
H
O
AA2 Hα
N
dNN
H
O
N
N
AA1 Hα
N
H
O
dNβ, dNγ, …
Hα
AA3
H
dαα
dαβ, dαγ, …
• Aparte de estos, regiones de estructura secundaria definida
van a dar NOE caracteristicos. En α-helices y hojas β:
i+4
dαβ(i, i+3)
dαN(i, i+3)
dNN(i, i+3)
dαN (i, i+4)
i-1
C
i+3
i+2
i+1
i
dα(i)N(j)
N
C
d α(i)α
(j)
N(j)
)
i
(
dN
N
N
C
N
C
Asignacion secuencial
• En el metodo de asignacion secuencial tratamos de atar sistemas de espines por medio de conectividades NOE secuenciales (de un residuo a residuos i + 1 y/o i - 1).
• La idea es elejir un residuo cuyas señales esten bien resueltas en el TOCSY y despues buscar en el NOESY correlaciones NOE secuenciales de sus protones a protones en otros
sistemas de espines.
• Estas son generalmente correlaciones dNN, dαN, and dβN. En
este momento tambien podemos buscar correlaciones dβδ
para establecer la identidad de los residuos aromaticos, Asn,
Arg, Gln, etc…
• Despues de encontrar esos, volvemos al TOCSY para identificar a que residuo corresponden las correlaciones que vimos
en el NOESY. Esos protones van a estar en residuos i ± 1.
• Hacemos esto hasta que se nos acaban los residuos (i.e.,
hasta que llegamos a una punta de la cadena peptidica), o
hasta que tenemos mucho solapamiento.
• Como podemos tener muchos puntos de partida y direcciones, el metodo se ‘valida’ a si mismo automaticamente.
• Se han propuesto varios algoritmos para hacer esto de forma
computarizada. Cada uno de estos metodos tiene pros y contras, pero todos requieren de un usuario ‘capaz’…
Asignacion secuencial (continuado)
• Esto lo podemos ver en un diagrama simple (no encontre
nada muy lindo entre lo mio…).
• Digamos que estamos miarando cuatro lineas en el TOCSY
que corresponden a Ala, Asn, Gly y Leu. Tambien sabemos
que tenemos Ala-Leu-Gly en el peptido, y no en otro orden.
TOCSY
NOESY
HC
HC
Gly
Gly
Asn
Asn
Ala
Leu
Ala
NH
Leu
NH
• En el TOCSY vemos todos los espines. En el NOESY tenemos correlaciones intraresiduales ( ) e interesiduales ( )
que nos permiten determinar que residuos contiguos en la
cadena peptidica.
Metodo de cadena principal
• Este metodo fue propuesto por Wüthrich (el abuelo del RMN
de proteinas y ganador del Nobel en Quimica del 2003 por su
trabajo en el area). Ya hemos visto que regiones de estructura secundaria definidas dan patrones de NOE regulares.
• ¿Qut tal si, en vez de hacer la asignacion secuencial y perder
tiempo en regiones que tengan estructura indefinida, nos
concentramos en buscar estos patrones de NOE regulares?
• Esto es exactamente lo que hace este metodo. Buscamos
patrones de NOE ciclicos, que se dan generalmente cuando
tenemos estructura secundaria definida.
• Cuando encontramos estos patrones de NOE, tratamos de
correlacionarlos con fragmentos de la estructura primaria de
la proteina/peptido. Es ideal para hacer por computadora:
- El programa primero busca α-helices (busca correlaciones
dαβ(i, i+3), dαN(i, i+3), dNN(i, i+3), dαN (i, i+4), etc…).
- Despues que elimina todos los picos correspondienes a
helices, busca hojas β (regiones en que las conectividades
son de cosas que estan alejadas una de otra en la estructura primaria).
- Despues de eliminar estos, busca bucles y regiones de estructura indefinida.
Estructura secundaria y terciaria
• A pesar de que el metodo de cadena principal encuentra
patrones de estructura secundaria, el fin es identificar los
residuos en el espectro (i.e., asignar sistemas de espines).
Todavia hay que buscar la estructura secundaria/terciaria.
• Si usamos el metodo de cadena principal, ya tenemos casi
todo el trabajo hecho (casi el 90 %), porque las regiones de
estructura secundaria definida (α-helices, hojas β) ya las
tenemos identificados.
• Si usamos el metodo secuencial tenemos casi todos los NOE
entre el residuo i e i + 1 y i - 1, o de rango corto. Solo nos
queda buscar correlaciones NOE de rango medio (i + 2, 3,
y 4) y de rango largo (> i + 5).
• La cantidad y tipo de NOEs de rango largo obviamente dependera de la estructura secundaria/terciaria del peptido.
• Estos NOEs son agrupados en tablas. Se les asigna un valor
dependiendo de la intensidad de la correlacion (i.e., el volumen del cross-peak) usando una referencia interna de intensidad, como ser un NOE entre 1Hs del CH2 de una Phe).
• Como en las macromoleculas podemos tener distintos procesos de relajacion compitiendo, los NOEs no tienen un valor
unico. Generalmente los agrupamos como fuertes, medios,
y debiles.
• Luego vamos a ver como los convertimos a ‘distancias’ ...
Lo que el NOE nos dice y lo que no nos dice
• Ahora tenemos casi todo: Los sistemas de espines identificados, sus NOEs secuenciales, medios, y largos medidos, y
sus intensidades tabuladas.
• A esta altura vamos a tener algunos conflictos en las asignaciones. En particular, hay casos en los cuales vamos a ver
ciertos NOE pero no otros que ‘tendrian’ que estar alli…
• Esto es debido a que los NOE no solo dependen de la distancia entre dos protones, pero tambien de la dinamica entre
ellos (osea, el grado de movimiento de uno con respecto al
otro). Esto va a ser importante en peptidos chicos, porque en
estos casos tenemos mucha movilidad en las cadenas laterales y en el esqueleto peptidico.
• Lo mas importante a tener en cuenta siempre es que no ver
un NOE no significa que dos protones esten a mas de 5 Å.
• A su vez, un NOE puede surgir de un promedio de conformeros del peptido. Podemos ver algo como NOE medio (1.8
a 3.3 Å), cuando en realidad es una mezcla de NOE fuerte
(1.8 a 2.7 Å) y ausencia de correlacion:
Aparente:
Real:
dij < 3 Å
dij > 6 Å
dij ~ 3 Å
Acoples y angulos diedros
• Hasta ahora hemos visto como usar algunos datos de RMN
para obtener parametros estructurales usados en la determinacion de estructuras 3D de macromoleculas en solucion.
• En particular, los NOE nos permiten determinar distancias
aproximadas entre protones cercanos. Son muy utiles si los
vemos entre protones que estan en residuos que esten distantes uno de otro en la estructura primaria.
• Sin embargo, los NOE no nos permiten, en general, decir nada acerca de la conformacion de enlaces con libre rotacion.
Para determinar esto podemos usar acoples 3J que se observan en peptidos (o azucares, ADN, y ARN). Se pueden usar
acoples 3J/2J homo/heteronucleares, pero nos vamos a concentrar en el acople 3J homonuclear.
• Estos incluyen 3JNα, que nos da informacion acerca de la
conformacion del esqueleto peptidico (φ), y 3Jαβ, que esta relacionado con la conformacion de la cadena lateral (χ):
H
φ
3J
Nα
3J
αβ
ω
N
φ
χ
O
χ
ψ
Hβ
Hβ
AA
Hα
N
H
Acoples y angulos diedros (continuado)
• Como vimos, la constante de acoplamiento 3J esta relacionada con el angulo diedro por la ecuacion de Karplus.
• Como vimos antes, la ecuacion es una suma de cosenos, y
dependiendo de la topologia (H-N-C-H or H-C-C-H) tenemos
distintos parametros:
3J
3J
2
Nα = 9.4 cos ( φ - 60 ) - 1.1 cos( φ - 60 ) + 0.4
2
αβ = 9.5 cos ( ψ - 60 ) - 1.6 cos( ψ - 60 ) + 1.8
3J
(Hz)
• Los parametros han sido derivados de moleculas rigidas y
datos de rayos-X. Graficamente:
φ - 60
Acoples y angulos diedros (…)
• ¿Como medimos las 3J? Si tenemos pocos aminoacidos,
directamente del 1D. Tambien las podemos medir de espectros HOMO2DJ, o de espectros tipo COSY de alta resolucion (MQF-COSY y E-COSY).
• El problema mas grande de la ecuacion de Karplus es que
introduce ambiguedades. Si tenemos acoples 3JNα menores
de 4 Hz y los pongo en la grafica vemos que podemos tener
hasta 4 valores posibles para el angulo φ:
9.4
5.0
~ -60
~0
~110
~170
4.0
0.0
φ - 60
• En estos casos podemos hacer dos cosas. Una es tratar de
determinar la estructura usando solo NOEs y despues confirmar lo que nos da con los acoples J. Esto anda bien, pero
estamos ‘tirando’ informacion util…
Acoples y angulos diedros (…)
• Otra cosa que se puede hacer es usar solo los angulos que
son mas comunes que conocemos de estructuras de
rayos-X. Para φ, los angulos ‘estandar’ tienen valores negativos de ~ -60 y ~ -170). Usando rangos:
3J
Nα < 5 Hz
-80 < φ < -40
3J
Nα > 8 Hz
-150 < φ < 170 (-190)
• Para las cadenas laterales tenemos also similar, pero en este
caso hay que elegir entre tres posibles rotameros (como en
etano…). Como se pueden medir dos acoples 3Jαβ (hay 2
protones β), nos permiten elegir el conformero adecuado:
N
Hβ1
N
Hβ2
N
Cγ
Hβ2
Hβ1
C’
Hα
Cγ
Cγ
C’
Hα
C’
Hα
Hβ1
Hβ2
3J
3J
αβ1 < 5 (o vice versa)
αβ2 > 8
3J
3
αβ1 ~ Jαβ2 < 5
Introduccion al modelado molecular
• Ahora tenemos casi toda la informacion estructural que podemos sacar por RMN de nuestra muestra: tablas de NOEs con
distintas intensidades (distancias), constantes de acople 3J, y
rangos de angulos derivados de los acoples 3J.
• Tenemos que ver como usar toda esta informacion para obtener una ‘imagen’ de la molecula en solucion.
• Contrario a los rayos-X, con los que ‘vemos’ la densidad
electronica de la molecula y pueden ser considerados como
un metodo directo, con RMN solo obtenemos informacion indirecta acerca de la estructura, y esta informacion la dan
unos pocos atomos (basicamente los 1Hs…).
• Por lo tanto nos valemos de un modelo teorico para representar a la macromolecula. En general, esto es un modelo
molecular generado por computadora.
• Este puede tener distintos grados de complejidad:
- ab initio: Solo considera orbitales atomicos/moleculares
y resolvemos la ecuacion de Schröedinger. No necesita parametros. Computacionalemte caro (10 - 100 atomos).
- Semiempirico: Usamos algunos parametros para representar a los orbitales atomicos/moleculares (100 - 500 atomos).
- Mecanica Molecular: Usamos un potencial parametrizado
simple tipo masa-y-resorte (todo lo demas…).
Modelado molecular (continuado)
• Aca estamos lidiando con proteinas (miles de atomos), osea
que usamos mecanica molecular (MM).
• El corazon de la MM es el campo de fuerza (force field) o
las ecuaciones que describen la energia del sistema en funcion de las coordenadas xyz. En general es una suma de
distintos terminos de energia:
Etotal = EvdW + Een + Ean + Etor + Eelec + …
• Cada termino depende de una forma u otra con la geometria
del sistema. Por ejemplo, Een, o potencial de enlace del sistema (bond stretching), es:
Een = Σi Keni * ( ri - roi )2
• Las distintas constantes (Kbs, ro, etc., etc.) son los parametros del campo de fuerza, y se obtienen a partir de datos experimentales (rayos-X, microondas) o calculos a alto nivel de
teoria (ab initio o semiempiricos).
• Distintos campos de fuerza incluyen distintos terminos, y
necesitamos uno que tenga aquellos que representen bien
a nuestro sistema (proteinas).
Incorporacion de datos de RMN
• Lo bueno de los campos de fuerza para MM es que si tenemos una funcion que relacione nuestros datos experimentales con las coordenadas xyz la podemos sumar directamente a la ecuacion del potencial total del sistema.
• Esto es lo que hacemos con los datos derivados de RMN.
Para NOEs usamos rangos de distancias en vez de valores
unicos porque podemos tener otros fenomenos de relajacion
en juego, y/o promediado de NOEs:
NOE fuerte
NOE medio
NOE debil
1.8 - 2.7 Å
1.8 - 3.3 Å
1.8 - 5.0 Å
• La funcion de energia potencial relacionada con estos rangos
es una funcion cuadratica de base plana:
ENOE = KNOE * ( rcalc - rmax )2
si
rcalc > rmax
ENOE = 0
si
rmax > rcalc > rmin
ENOE = KNOE * ( rmin - rcalc )2
si
rcalc < rmin
• Cuanto mas lejos este la distancia calculada en el modelo teorico (rcalc) del rango determinado experimentalmente, mas
grande la penalizacion. Estas son restricciones de NOE.
Incorporacion de datos de RMN (continuado)
• De manera similar podemos incluir restricciones en el rango
de angulos o constantes de acoplamiento:
EJ = KJ * ( Jcalc - Jmax )2
EJ = 0
si Jcalc > Jmax
si Jmax > Jcalc > Jmin
EJ = KJ * (Jcalc - Jmin )2
si Jcalc < Jmin
• Graficamente, las funciones tienen este aspecto:
E
rmin
rmax
Jmin
Jmax
φmin
0
Rcalc, φcalc, o Jcalc
φmax
Optimizacion de estructuras
• Ahora tenemos todas las funciones incluidas en el potencial
de la molecula, incluyendo interacciones covalentes (enlace,
angulos, y torsiones), no covalentes (vdW, electroestatica), y
restricciones NOE y 3J derivadas de RMN.
• Para obtener un modelo estructural del peptido decente hay
que minimizar la energia del sistema, lo que implica encontrar un conforermo de baja energia (o el de mas baja energia)
o una familia de conformeros de baja energia.
• En una funcion con la cantidad de variables que tenemos
en un peptido esto es laborioso, porque tenemos una superficie de n dimensiones (cada uno de las variables que estamos optimizando). Para φ y ψ en un disacarido:
E
(Kcal/mol)
ψ
φ
• Tenemos picos (maximos) y valles (minimos) de energia.
Optimizacion de estructuras (continuado)
• Minimizar la funcion implica ‘bajar’ en la (hiper)superficie
de energia de la molecula. Para esto neceitamos calcular
las derivadas CRA xyz (las variables) de todos los atomos:
∂E
∂xyz
total
>0
Etotal
∂E
∂xyz
total
<0
Etotal
• Esto nos permite ver como vamos ‘para abajo’ para todas
las variables, y por lo tanto determinar que direccion hay
que tomar para minimizar la energia del sistema.
• La minimizacion solo ‘baja.’ Podemos tener muchos minimos
locales en la superficie, y si solo usamos minimizaciones el
sistema puede quedar atrapado en uno de estos. Esto es lo
que sucede en proteinas, donde tenemos cientos de grados
de libertad (considerando solo enlaces con libre rotacion…).
• En estos casos necesitamos otros metodos para encontrar
el minimo de energia. Uno de estos metodos es la dinamica
molecular (DM).
• Como tenemos la funcion potencial del sistema, le podemos
dar energia (por ejemplo, ‘elevar’ la temperatura) y ver como
evoluciona. Un aumento de temperatura implica mas energia
cinetica y la posibilidad de superar barreras energeticas.
Dinamica molecular y enfriamineto simulado
• En las DMs ‘calentamos’ el sistema a una temperatura fisicamente ‘razonable,’ ~ 300 K. La energia por mol a esta temperatura es ~ RT, donde R es la constante de Boltzmann (por
mol). Si hacemos los numeros, esto es ~ 0.5 Kcal/mol.
• Esto puede ser suficiente para ciertas barreras, pero no para
otras que seguramente vamos a tener en el sistema. Para
estos casos necesitamos un metodo de busqueda conformacional mas drastico, como ser el templado simulado.
• ‘Calentamos’ el sistema a temperaturas ridiculamente altas
(2000 K), y despues lo dejamos enfriar lentamente. La idea
es que este proceso permite que el sistema pase por barreras energeticas considerables, y al enfriarse produzca conformeros estables y de baja energia.
Conformeros
‘calientes’
T
Conformeros
‘frios’
Tiempo (generalmente ps)
Geometria de distancia
• Otro metodo compleatmente diferente a la DM y al TS es la
geometria de distancias. Vamos a presentar solo lo que
nos da pero no como funciona.
• Basicamente, randomizamos las coordenadas xyz de los
atomos del peptido dandoles limites altos y bajos por fuera
de los cuales los atomos no pueden estar. Aca incluimos los
enlaces y las restricciones de RMN.
• Esto nos da una matriz de distancias limite, que es optimizada por medio de un algoritmo SIMPLEX (desigualdades de
trinagulos), lo que se conoce como suavizado de la matriz.
Las estructuras que salen de esto no estan optimizadas, y
generalmente las mejoramos por DM y/o minimizacion.
• Este esquema da un resumen de como los distintos metodos
hacen que la estructura se mueva en la superficie de energia
potencial del sistema:
ME
DM
TS
GD
Presentacion de resultados
• La idea es samplear el espacio conformacional al que la
proteina tiene acceso bajo los efectos de las restricciones
estructurales que obtuvimos de los NOE y los acoples.
• Las estructuras que obtenemos por estos metodos que no
muestren violaciones grandes de las restricciones que incluimos se dicen ser consistentes con los datos de RMN.
• Como ninguna de estas estructuras se puede descartar, lo
que hacemos es presentarlas como un set de estructuras de
baja energia superimpuestas en las regiones mas rigidas:
N-termini
C-termini
• En esta solo mostramos los atomos pesados del esqueleto
peptidico. A pesar de que no lo buscamos, la flexibilidad de
ciertas regiones indica una falta de restricciones NOE, y
refleja que esa parte de la molecula es flexible en solucion.
Descargar