TESIS DOCTORAL INTERACCIONES COOPERATIVAS Y EFECTOS CONTEXTUALES EN DOMINIOS SH3 Y WW Ana MªZafra Ruano Granada, 2014 Editor: Editorial de la Universidad de Granada Autor: Ana María Zafra Ruano D.L.: GR 2230-2014 ISBN: 978-84-9083-303-2 UNIVERSIDAD DE GRANADA FACULTAD DE CIENCIAS DEPARTAMENTO DE QUÍMICA FÍSICA Memoria presentada para aspirar al grado de Doctor en Química Fdo: Ana Mª Zafra Ruano Granada, a 3 de Octubre de 2014 Vº Bº DIRECTORES DE LA TESIS Dra. Irene Luque Fernández Profesora Titular Departamento de Química Física Universidad de Granada Dr. Javier Ruiz Sanz Profesor Titular Departamento de Química Física Universidad de Granada El doctorando Ana María Zafra Ruano y los directores de la tesis Irene Luque Fernández y Javier Ruiz Sanz garantizamos, al firmar esta tesis doctoral, que el trabajo ha sido realizado por el doctorando bajo la dirección de los directores de la tesis y hasta donde nuestro conocimiento alcanza, en la realización del trabajo, se han respetado los derechos de otros autores a ser citados, cuando se han utilizado sus resultados o publicaciones. En Granada, a 3 de Octubre de 2014 Director/es de la Tesis Irene Luque Fernández Javier Ruiz Sanz Fdo.: Doctorando Ana Mª Zafra Ruano Fdo.: Decía Pedro Casaldáliga “Al final del camino me dirán: ¿Has vivido? ¿Has amado? Y yo, sin decir nada, abriré el corazón lleno de nombres”. Y ahora, llegado el final de esta etapa, toca abrir el corazón y dar las gracias a todos aquellos que de un modo u otro han estado presentes durante todos estos años. En primer lugar agradecérselo a mis jefes, Irene y Javi, por la confianza que han puesto en mi y porque a ellos les debo todo lo que he aprendido estos años. Gracias a Irene por haber despertado en mi el gusanillo de la investigación, por haberme abierto las puertas del laboratorio cuando todavía era estudiante de Química y por todo el apoyo y las oportunidades que me has dado para crecer como científica. Gracias a Javi por tu ayuda siempre que la he necesitado (tanta ha sido que no olvidaré el día que te pusiste a ayudarme a limpiar cacharros con las infinitas purificaciones de los mutantes), gracias por tu paciencia infinita conmigo, por preocuparte siempre de que todo esté bien y por estar ahí en todo momento. Agradecerle también a Pedro Luis por haberme transmitido la pasión por la termodinámica, por mostrarme que la ciencia y la química tienen una gran historia que merece ser contada, por haberme dado la oportunidad de compartir docencia y por nunca perder ese entusiasmo por la enseñanza. Gracias a Jose por estar siempre dispuesto a ayudarme en lo que he necesitado y por tus consejos para la ciencia y la vida. A Eva también por tu ayuda incondicional, por tu cercanía y apoyo durante todo este tiempo. A Salva, siempre genio y figura, gracias por todo lo vivido, desde los karaokes y las meriendas en tu casa hasta enseñarme cómo montar un circuito para las prácticas de bioquímica. Gracias por tu generosidad, por las risas y por ser un buen amigo. A Mª del Mar, aquella chica que volvía de Alemania cuando yo entré en el laboratorio y a la que a menudo se le escapaba alguna palabra en alemán que me hacía dudar si realmente era alemán o almeriense profundo, gracias por tu apoyo y tu afecto. Gracias a Araceli, porque nos ha tratado siempre como a sus “niños”, por preocuparte por nosotros, por estar dispuesta a echarnos una mano en lo que hemos necesitado, por tu confianza, por tu interés y cariño. A Jose Miguel por ayudarme siempre con la fotocopiadora, porque por mucho doctorado que esté haciendo, nunca sabré hacer bien la fotocopia del D.N.I. Gracias también por tu gestión con las facturas, por no matarme cuando te llenaba la mesa con ellas y por tu ayuda con todo el tema de papeleos en general. A Anabel agradecerte siempre tu cercanía, tu cariño y tu apoyo en todo momento. Gracias al resto de profesores del departamento, a Enrique, Quico, Bea, Isa, Mercedes, Jose Manuel y Antonio Parody, por el interés mostrado durante estos años. Parte de esta tesis y de lo que aprendí cuando empecé se lo debo a Jose Manuel, gracias por haber sido mi maestro en este mundo de la biofísica, por todos los buenos ratos que hemos pasado en el laboratorio y fuera de él, por creer en mi aunque yo sigo pensando que soy la misma gorriona a la que enseñabas hace 6 años, gracias por hacerme reír, por tu cariño y por tu amistad. Gracias a Carles porque, aunque nadie se lo crea, él me enseñó a hacer geles de poliacrilamida y pruebas de expresión. A Manu y a Bertrand, por estar siempre dispuestos a echarme una mano en el laboratorio. A Pedro, por amenizarme los experimentos con buena música, por tu preocupación, por tu ayuda y tu constancia, estoy segura de que llegarás a ser un gran científico. A Fátima, por todo lo vivido y por ser fundadora de Quémica Fúsica. A Fran, infinitas gracias por tu ayuda en el laboratorio, sobre todo con los dominios WW, por poner siempre un toque de humor al laboratorio, por dejarme siempre una canción pegadiza en la mente y sobre todo por tu amistad. A David, gran científico y mejor amigo, por estar siempre dispuesto a echar una mano a quien lo necesita, por ser un aventurero de la ciencia y de la vida, por piropearnos siempre de buena mañana aunque las ojeras nos lleguen al suelo, gracias. A Javi Murciano, por nuestras conversaciones sobre lo humano y lo divino, por tu confianza y ayuda, por saber ver siempre el lado bueno de las cosas. Gracias a Jose Luis y Lorena, el día que os fuisteis se quedó un hueco muy grande en el laboratorio, gracias por cuidarme, por las batallas con las espadas de goma espuma, por haberme hecho sentir parte de vuestra familia, porque a pesar de la distancia y el tiempo la amistad permanece, gracias por tanto cariño y sobre todo por uno de los regalos más bonitos que jamás me han hecho, ser la tita de Emma. A mi Mª Ángéles, por la amistad desde primero de carrera, por nuestros viajes, por tu apoyo y cariño, por ser ejemplo de superación y valentía, por todas las risas dentro y fuera del laboratorio, por todo lo vivido y lo que queda por vivir y compartir. A Sara, creo que podría escribir otro libro para darte las gracias por tantas cosas. Gracias sobre todo por ser una grandísima amiga, por estar siempre ahí aunque ahora nos separen unos cuantos kilómetros, por tu entrega y tu ayuda en el laboratorio (sobre todo arreglando el ITC), por tantos viajes y tantas experiencias vividas como las “turistas”, por tirar de mi cuando las fuerzas aflojaban, por venir a cuidarme cuando estaba enferma. Gracias por todas las risas durante estos años, por entenderme siempre, parte de esta tesis también es tuya. A mi compañeros del otro labo, a Noel, Encarni, Ángel, Roci, Sisi, Héctor, Álvaro y en especial a Inma por tu amistad y cariño. A Adela, por alegrarme las mañanas con tus “buenos días princesa”, por ser mi compañera en los conciertos de Ismael Serrano, por tus palabras de ánimo, por toda la alegría que desprendes y tu amistad. A Sergio, por sacarme siempre una carcajada, por tu sentido del humor, por tu apoyo y tus consejos. A Valeria y a Fadia, por las noches delante de una copa de vino intentando arreglar el mundo, por las fiestas sorpresa, por escucharme siempre, por levantarme el ánimo, por estar ahí. Gracias a Asun, por tener siempre unas palabras de apoyo y ánimo y por no faltarte nunca la sonrisa. A Mari Carmen, por tu confianza, tu amistad y tu ayuda. Gracias a mis amigos Iris, Patri, Eli, Macías, Juli, Chema, Fran, Mariví, Ana y Antonio, por ser el motivo de tanta felicidad durante los cinco años de la carrera, por todos los buenos momentos, por el banco de apuntes y exámenes que hicieron que aprobásemos más de una asignatura, por las celebraciones en la calle Tórtola y en Iznalloz y por los reencuentros en los que volvemos a repetir una y otra vez las mismas batallitas con la misma ilusión y siempre nos reímos igual o con más ganas. En especial agradecerles a Ana y a Antonio, mis compañeros de la segunda fila año tras año, asignatura tras asignatura. Gracias a Antonio por venir a rescatarme para tomarnos una cerveza fresquita en el Vini después de un día entero en el laboratorio, por estar siempre dispuesto a escucharme, por preocuparte por mi, por tu gran corazón y por tanto cariño. A Ana, porque parte de lo que soy ahora te lo debo a ti, gracias por abrirme las puertas de tu vida de par en par, gracias a ti he podido conocer a grandes personas y he podido vivir momentos increíbles, por venir a visitarme a Toronto para que se me pasase la morriña, por todos los años de amistad vividos y los que nos quedan a las Anas. Cómo no agradecerles a mis amigos de la vida granadina, a Mayte, Emilio, Robe, Dani, Sara, Rafa, Pili, a Baldo por tus frases humorísticas/filosóficas que te hacen comprender mejor la vida, gracias por vuestro ánimo y cariño. A Marta Marín y Elena, por los desayunos terapéuticos (aunque nos hagamos un lío con los nombres de las cafeterías), por estar siempre dispuestas a escucharme y por vuestras palabras de ánimo. A Elena darte las gracias junto a Migue por haberme ayudado con todos los temas de Canadá, por contar conmigo siempre que se ha planeado una excursión, gracias por vuestro apoyo incondicional. Gracias a mis “Trinis”, a Pilar, Enri, Merche, Nazaret, Belén por todo el cariño durante estos años, por haber hecho de la residencia mi casa pero sobre todo agradecer a Loli haberme cuidado tanto los años que estuve viviendo allí. Agradecerles a Mª Ángeles y Alberto, por darme la oportunidad de enseñarles lo poco que sé a las niñas del hogar de menores, gracias por vuestra entrega y testimonio. A las residentes, a Rocío, Consuelo, Edu (siempre serás una más de nosotras), a Inma, por los años de convivencia y amistad, por los cafés y los reencuentros navideños, por ser grandes amigas. A los monitores del campamento, a María, Mercedes, Javi, Curro, Marina, Jorge, Elena, Rocío, Fernando y Paco, por vuestra amistad y por hacerme sentir siempre parte de Málaga. A Currito, porque quién nos iba a decir que en aquel viaje a Sevilla iba a conocer a tan tremendo personaje que al final sería un buen amigo, tenemos muchos cafés y conciertos pendientes. A mis amigos del instituto a Ascen, Encarni, Mariló y en especial a Isa por tantos años de amistad, por acordarte siempre de mi para ver cómo estoy, por acogerme en tu piso después de las fiestas, por tus palabras de ánimo estos meses, por nuestros momentos detectivescos, por todos los momentos vividos para los cuales también necesitaría otro libro para agradecerte. Quería dedicarle también mi agradecimiento a toda la gente que conocí durante mi estancia en Toronto. A Pilar, mi compañera de fatigas y alegrías durante la estancia. Por los desayunos para aclararnos con los miles de papeles que había que entregar, por los correos informándome al detalle sobre cómo iba a ser mi llegada a Toronto y la vida y el frío canadiense. Por haber sido un gran apoyo durante estos tres meses, por los fines de semana en los que Toronto o Hamilton se volvían un poco más granadinos. Gracias por descubrirme los maravillosos cafés del Tim Hortons, por las charlas por Skype cuando la nostalgia nos invadía, por compartir cada domingo ese ratito de fe, hoy puedo decir que de Canadá me traje a una gran amiga. Agradecerles cómo no a Mar y a Pedro, por brindarme siempre su ayuda, por hacerme sentir como en casa cuando estuve allí, por vuestros consejos y por los ratitos tan buenos que hemos pasado en el Peppers y por conseguir que nos pusieran tapas en Toronto, sois geniales. Gracias a esa pequeña colonia de españoles que fueron como mi familia, a Miren, Roci, Eugenia, Davinia, Oswaldo, María, Olsen, Matt y Ryan que aunque canadienses de pro, una vez que cantaron la melodía del Mercadona tuvieron para mi la nacionalidad española. I would like to thanks to my supervisor in The Hospital for Sick Children, Daniela Rotin for give me this opportunity, thanks to my lab mates Avi, Frozan, Ruth, Chong, Chen, Anthony and Natasha for try to understand my English, for your help and friendship. Nunca supe de la existencia del “potluck” hasta que llegué al hospital, gracias a todas por vuestra acogida, por vuestro interés y por los almuerzos tan deliciosos y sobre todo a Esther por haberme hecho sentir una más en el departamento. A Roni, por nuestros piques futboleros (la próxima final del mundial de fútbol será España-México), gracias por tu afecto y por nuestras conversaciones. Agradecerle cómo no a mi vecino del laboratorio de al lado, Ismael, sus visitas mañaneras sustituyendo al café de media mañana español, por las charlas gastronómicas y por todas las risas que hacían que se sobrellevase mejor el horrible tiempo canadiense. Si en algún lugar soy feliz en esta ciudad es en ese rincón entre San Juan de Dios y San Jerónimo. Gracias a la pequeña y a la vez gran familia que he encontrado allí, a Dolo, Carmen y Miguel Castro, Pablete, Loli, Juan Carlos y Antonio Jesús por vuestro cariño, por vuestra ayuda y confianza. Agradecerle cómo no a Carlos la confianza puesta en mi, por acercarme a Dios con tus palabras, por tus chistes malos y por tu entrega en el santuario. A mis catecúmenos (Caro, Juan Carlos, Iara, Mapero, María, Nacho, Migue, Martola…y así podría enumerar hasta 25 personajillos), gracias por tanto bien como aportáis a mi vida, a Richar porque no he podido encontrar mejor compi, por tu ayuda cada viernes y por todos esos abrazos que acaban con los días tristes. Durante los tres meses de estancia no faltaba un día en el recibiese un mensaje de Marian mandándome ánimos o acordándose de mi en momentos importantes, gracias por tenerme presente, por tu forma de ver la vida y por la alegría con la que me recibes cada vez que nos encontramos. Gracias a Lourdes por las largas charlas arreglando el mundo y nuestras vidas camino al curso de voluntariado, por tu emoción cada vez que me preguntas por la tesis, por el empeño y esfuerzo que pones en cada cosa que haces para que salga bien. Gracias a Bea, María y Caro, por escucharme siempre, por los paseos por Granada, por nuestras conversaciones, por vuestra forma de ver la vida con tanto entusiasmo. Siempre he dicho que el al menos una vez en la vida hay que hacer el Camino de Santiago porque en él siempre descubres a grandes personas, yo descubrí en mi último camino a tres grandes peregrinas. Gracias a Mª Luisa, Navarrete y Paula por seguir caminando juntas en el camino de la vida, por ser apoyo en los momentos de cansancio, por hacerme reír hasta tener agujetas en la barriga. Gracias a María y a Jesús, por ser testimonio de amor y bondad, por compartir conmigo vuestros momentos de felicidad, por las risas y por vuestras palabras de ánimo y vuestra amistad. Hace dos años una parte de mi se fue hasta California, gracias a mis chaparritas Estefani y Marilou por todo lo vivido y compartido durante vuestra estancia en Granada, porque abrir el buzón es motivo de felicidad cuando me encuentro alguna de vuestras cartas y postales. Gracias a Charo por abrirnos las puertas de tu casa cuando apenas nos conocíamos, por no perder nunca la sonrisa, por sentir que siempre estás cerca. A Sonia, por saber como me siento sólo con mirarme a la cara, por los raticos del trío lalala con Emi rescatándome de la rutina de la escritura de tesis, gracias amigas. Gracias a Samu, corazón con patas y alegría de vivir en estado puro, gracias por las risas, por los viajes en el coche fantástico, por estar siempre planeando algo que hacer, por los buenos momentos delante de una cerveza, por tu presencia y por estar siempre dispuesto a escucharme. Gracias a mis amigos del pueblo, a Fátima, Funes, JuanMa, Mª Paz, Justa y Blanca, por haber compartido desde la plastilina hasta los botellines de cerveza. Gracias por comprender mis ausencias, por las conversaciones terapéuticas, por tantos años de amistad. Finalmente, dar las gracias a mi familia, a mis tíos y primos, por interesarse por mi y darme ánimos. A mis abuelos, Miguel y Ana, por sentir su protección aunque no estén ya con nosotros. A mis abuelos Manuel a María, a mi abuelo Manuel por haberme enseñado a disfrutar de las pequeñas cosas de la vida, a mostrarme que una simple lata podría ser el mejor juguete y más ruidoso que se podía tener, por enseñarme a cuidar y valorar la naturaleza que nos rodea. A mi abuela María, ejemplo de mujer fuerte y luchadora, por haber sido mi otra madre, por tanto amor entregado siempre sin esperar nada a cambio, te quiero abuela. A mis padres, Manuel y María, a los que les debo algo tan grande como es la vida, por ser para mi ejemplo de amor, entrega, lucha, sencillez y humildad. Gracias por haberme dejado libertad a la hora de decidir sobre mi vida, por enseñarme que las cosas que uno quiere hay que ganarlas con esfuerzo, que siempre hay que sonreír aunque la vida a veces se complique, por aguantarme cuando estoy insoportable, por cuidarme siempre, por haber sido mi apoyo durante estos últimos meses. Esta tesis no hubiese sido posible sin vosotros, por eso es vuestra. Os quiero. Muchos son los nombres que se habrán quedado en el tintero, gracias a todos aquellos que de un modo u otro habéis sido partícipes de todo lo vivido estos años. Gracias a Dios por haberlos puesto a todos ellos en mi camino, por ser luz, apoyo y consuelo. Es una fortuna saber que hay sitios en los que te están esperando con los brazos abiertos. Una fortuna es escuchar consejos de quien te quiere, porque salen de una cabeza que piensa en frío y un corazón que siente como el tuyo. Una fortuna es tener cerca a alguien que considera que debe devolver al mundo lo bueno que recibió. Una fortuna es conocer a esa persona que transforma obligación en devoción, que sonríe y llora con la misma sinceridad, que no es infalible pero saca fuerzas a diario para seguir al pie del cañón. Una fortuna es poder volver a ver a quien echabas de menos y recordar viejos tiempos, sin descuidar el presente y teniendo la certeza de que aún os quedan grandes planes por llevar a cabo. Hoy me siento afortunada por tener grandes tesoros como vosotros. “Vosotros sois sal de la tierra y luz del mundo” Mt 5 A mis padres, Manuel y María A mi abuela María ÍNDICE CAPÍTULO 1.- INTRODUCCIÓN 37 1.1. Introducción 37 1.2. Dominios modulares 38 1.2.1. Reconocimiento de secuencias ricas en prolina 39 1.2.2. Dominios SH3 42 1.2.2.1. Importancia plegamiento biológica, estructura, estabilidad y 42 1.2.2.2. Reconocimiento de ligandos ricos en prolina 45 1.2.3. 51 Dominios WW 1.2.3.1. Importancia biológica, estructura y plegamiento 51 1.2.3.2. Interacción de los dominios WW con ligandos ricos en prolina 54 1.3. Familia de las quinasas de tirosina 56 1.3.1. Quinasa de tirosina cAbl 59 1.3.2. Quinasa de tirosina cSrc 64 1.4. Ligasa de ubiquitina humana Nedd4 67 1.5. Cooperatividad y alosterismo 69 1.6. Objetivos 70 CAPÍTULO 2.- MATERIALES Y MÉTODOS 75 2.1. Clonado, expresión y purificación 75 2.1.1. Dominio SH3 de cSrc 75 2.1.2. Dominio SH3 de cAbl 76 2.1.3. Construcciones en tándem de cAbl y cSrc 77 2.1.4. Dominios WW de hNedd4 y su construcción en tándem 78 2.1.5. Obtención de mutantes del dominio SH3 de cSrc y de la construcción en tándem de cAbl 80 2.2. Preparación de las muestras 81 2.2.1. Preparación y determinación de las concentraciones de las disoluciones de proteína 81 2.2.2. Preparación y determinación de las concentraciones de las disoluciones de ligando 83 2.3. Espectroscopía de fluorescencia 84 2.3.1. Introducción 84 2.3.2. Experimentos de titulación espectroscopía de fluorescencia proteína-ligando mediante 84 2.3.3. Análisis de un experimento de titulación proteína-ligando mediante espectroscopía de fluorescencia 85 2.4. Calorimetría Diferencial de Barrido 87 2.4.1. Introducción 87 2.4.2. Realización del experimento calorimétrico 89 2.4.3. Cálculo de la capacidad calorífica molar parcial de la proteína 89 2.4.4. Análisis de las trazas calorimétricas según la termodinámica de equilibrio. El modelo de equilibrio de dos estados 91 2.5. Calorimetría Isotérmica de Titulación 94 2.5.1. Introducción 94 2.5.2. Diseño del experimento de ITC 95 2.5.3. Realización de los experimentos de ITC 97 2.5.4. Formulación y análisis de los experimentos de ITC 98 2.5.4.1. Modelo de unión de un ligando a una macromolécula con “n” sitios idénticos e independientes 98 2.5.4.2. Modelo de unión de un ligando a una macromolécula con “m” clases de sitios diferentes e independientes 102 CAPÍTULO 3.- Transmisión de información a través de efectos alostéricos en el domino SH3 de cSrc 109 3.1. Introducción 109 3.2. Resultados y discusión 111 3.2.1. Identificación de la red de interacciones cooperativas en el dominio SH3 de cSrc 111 3.2.2. Comprobación experimental de la predicción de las redes alostéricas 115 3.2.2.1. Selección de los mutantes del dominio SH3 de cSrc 115 3.2.2.2. Caracterización del equilibrio conformacional de los mutantes del dominio SH3 de cSrc 116 3.2.2.3. Influencia de la unión del ligando en la energética de unión 120 3.2.3. Src Impacto de las mutaciones sobre los niveles de fosforilación de 126 3.2.4. Robustez de la red alostérica 127 3.3. Conclusiones 133 CAPÍTULO 4.- Estudio de la distribución conformacional de cAbl y su modulación por interacciones intramoleculares 137 4.1. Introducción 137 4.2. Resultados y discusión 139 4.2.1. Construcciones de la quinasa de cAbl y cSrc 139 4.2.2. Equilibrio conformacional del tándem SH3SH2 de Abl y Src 141 4.2.3. Influencia del conector C2Q en el equilibrio conformacional del tándem cAblSH3SH2 148 4.2.4. Papel del conector C3-2 en el equilibrio conformacional del tándem SH3SH2 156 4.2.5. Influencia del conector C2Q y las mutaciones en el conector C3-2 de cAbl en la energética de unión 160 4.3. Conclusiones 166 CAPÍTULO 5.EFECTOS CONTEXTUALES EN LA ESPECIFICIDAD Y AFINIDAD DE UNIÓN EN LOS DOMINIOS WW DE hNedd4 171 5.1. Introducción 171 5.2. Resultados y discusión 173 5.2.1. Construcciones en tándem de los dominios WW de hNedd4 173 5.2.2. Estudio del equilibrio conformacional de los dominios WW individuales de hNedd4 174 5.2.3. Equilibrio conformacional de los dominios WW de hNedd4 en tándem 176 5.2.4. Estudio de la especificidad de unión en los dominios WW de hNedd4 178 5.2.5. Influencia de los efectos contextuales en la especificidad de unión de los dominios WW de hNedd4 183 5.3. Conclusiones 191 CAPÍTULO 6.- RESUMEN Y CONCLUSIONES 195 6.1. Resumen 195 6.2. Conclusiones 197 CHAPTER 6.- SUMMARY AND CONCLUSSIONS 203 6.1. Summary 203 6.2. Conclusions 204 BIBLIOGRAFÍA 209 APÉNDICE 233 ABREVIATURAS ABREVIATURAS ADN Ácido desoxirribonucleico ARN Ácido ribonucléico Abs Abosrbancia CD Dicroísmo Circular Cp Capacidad calorífica molar parcial de una proteína Cp,ap Capacidad calorífica aparente de una proteína Cp,app Capacidad calorífica aparente de exceso bruto de una proteína Cp,D Capacidad calorífica molar parcial del estado desnaturalizado Cp,N Capacidad calorífica molar parcial del estado nativo Cp,prot Capacidada calorífica de protonación de una proteína Cp,s Capacidad calorífica molar parcial del disolvente DSC Calorimetría Diferencial de Barrido Da Dalton EDTA Ácido etilendiamino tetracético FM Intensidad de fluorescencia de la proteína libre FML Intensidad de fluorescencia del complejo proteína-ligando GST Glutation-S Transferasa IPTG Isopropil β-D-tiogalactopiranósido ITC Calorimetría Isotérmica de Titulación Ka Constante de equilibrio de asociación KD Constante de equilibrio de desplegamiento Kd Constante de equilibrio de disociación Ki Constante de equilibrio de unión tras una inyección LB Medio de cultivo bacteriano Laura Bertani [L] Concentración de ligando libre [L]T Concentración de ligando total [L]b Concentración de ligando unido [L]0 Concentración de ligando en la jeringa [M]T Concentración de macromolécula total [M]i Concentración de macromolécula total tras cada inyección “i” MALDI-TOF “Matriz-Assisted Laser Desorption/Ionization Time-ofFlight” N Estado nativo de la proteína n Número de sitios de unión de un ligando a una proteína PDB Banco de datos de proteínas (“Protein Data Bank”) PCR Reacción en cadena de la polimerasa q Función de partición qi Calor liberado o absorbido en una inyección Q(N) Calor total acumulado en N inyecciones RMN Resonancia Magnética Nuclear RMSD Desviación cuadrática media “Root Mean Square Deviation” rpm Revoluciones por minuto SDS Luaril sulfato sódico SDS-PAGEElectroforesis en gel de poliacrilamida en presencia de lauril sulfato sódico T Temperatura Tf Temperatura de fusión del oligonucleótido Tm Temperatura de transición a la que ΔGD = 0 Tr Temperatura de referencia Ts Temperatura máxima de estabilidad TEV Virus del mosaico del tabaco (“Tobacco Etch Virus”) t Tiempo u.a Unidades arbitrarias para la intensidad de fluorescencia UV Ultravioleta Vc Volumen de la célula del calorímetro Vin Volumen de inyección Vp Volumen específico parcial de la proteína Vs Volumen específico parcial del disolvente ΔCp Cambio de capacidad calorífica de desnaturalización a presión constante ΔCp,ap Cambio de la capacidad calorífica aparente de desnaturalización a presión constante ΔCp,int Cambio de capacidad calorífica intrínseca de unión ΔCp,p Cambio de la capacidad calorífica de protonación ΔGap Cambio de energía libre aparente de Gibbs de la formación del complejo ΔGab Cambio de energía libre de Gibbs de la conformación abierta ΔGcd Cambio de energía libre de Gibbs de la conformación cerrada ΔGC2Q-ab Cambio de la energía libre de Gibbs de la interacción entre el conector C2Q y el dominio SH3 en la conformación abierta ΔGC2Q-cd Cambio de la energía libre de Gibbs de la interacción entre el conector C2Q y el dominio SH3 en la conformación cerrada ΔGC2Q-pd Cambio de la energía libre de Gibbs de la interacción entre el conector C2Q y el dominio SH3 en los estados parcialmente desplegados ΔGD Cambio de energía libre de Gibbs de desplegamiento ΔGmáx Cambio de energía libre de Gibbs en el máximo de la curva de estabilidad ΔG2 Cambio de la energía libre de Gibbs para el dominio SH2 ΔG3 Cambio de la energía libre de Gibbs para el dominio SH3 ΔHap Entalpía aparente de unión ΔHD Entalpía de desplegamiento de una proteína ΔHp Entalpía de protonación de las cadenas laterales ΔHm Cambio de entalpía a la temperatura Tm ΔHexp Entalpía de van’t Hoff o experimental ΔHcal Entalpía calorimétrica Δh(T) Función de entalpía específica promedio <H> Entalpía molar parcial del sistema Δms Cantidad de disolvente desplazado por la proteína en disolución dentro de la célula calorimétrica ΔSap Entropía aparente de unión ΔSD Entropía de desplegamiento de una proteína ΔSm Cambio de entropía a la temperatura Tm Θ Fracción de saturación Centro de masas espectral Capítulo 1 Introducción Introducción CAPÍTULO 1.- INTRODUCCIÓN 1.1. Introducción En 1838 el químico holandés Mulder descubrió que ciertas sustancias derivadas de los aminoácidos constituían la materia básica en el organismo de plantas y animales y las llamó proteínas, término propuesto por el químico sueco Berzelius que proviene del vocablo griego Proteus, dios griego que adoptaba múltiples formas o Prota, que significa “lo primero”. La mayoría de los procesos biológicos celulares dependen de las proteínas, las cuales presentan funciones muy diversas como ayudar a mantener la integridad de las células, conectar diferentes elementos dentro de ellas, ser responsables del transporte y regulación de nutrientes y generar, transformar y transferir impulsos nerviosos entre otras muchascompetencias (Pawson 1995). Dentro de su funcionalidad, las proteínas establecen una compleja red de interacciones que es fundamental para una correcta comunicación celular. Cualquier disrupción en esta red puede derivar en el desarrollo de numerosas patologías humanas como cáncer, diabetes o trastornos en el sistema inmunológico y cardiovascular. Por este motivo, es necesaria una comprensión profunda y detallada de estas interacciones que nos permita predecir y modular la respuesta fisiológica, incluso patológica, de la célula ante un estímulo específico, facilitando así el desarrollo de nuevas estrategias de diseño molecular que puedan ser utilizadas en el tratamiento de algunas de estas enfermedades. La revolución en el campo de la genómica y la proteómica en la última década, ha dado lugar a la profundización en el estudio del reconocimiento molecular de las proteínas. La secuenciación del genoma humano, junto con el de varios organismos modelo y agentes patógenos, ha proporcionado miles de nuevos genes y proteínas que deben ser caracterizados tanto estructural como funcionalmente. De igual manera, es necesario analizar e identificar sus interacciones con otras moléculas de la célula con el fin de avanzar hacia la comprensión y el control de los mecanismos de regulación celular. Además, muchas de estas proteínas identificadas en el genoma constituyen dianas potenciales para el desarrollo y diseño de nuevos agentes terapéuticos contra una gran variedad de enfermedades cuyas interacciones hay que 37 analizar y validar. El proceso de unión de estos nuevos compuestos debe racionalizarse por lo que es necesario profundizar en la interrelación existente entre la estructura, la estabilidad de la proteína y sus características funcionales e incorporar al proceso de diseño no sólo aspectos estructurales, sino también consideraciones termodinámicas y dinámicas (estabilidad y cooperatividad), genéticas y funcionales, las cuales son frecuentemente ignoradas en las estrategias de diseño tradicionales (Velazquez Campoy and Freire 2005; Lafont et al. 2007; Freire 2008). 1.2. Dominios modulares Los procesos celulares (transducción de señales, control del citoesqueleto, ciclo celular, síntesis de proteínas, rutas metabólicas, replicación del ADN, etc.) están dirigidos por una compleja red de interacciones proteína-proteína. Cualquier distorsión en esta red de interacciones puede traducirse en serias alteraciones celulares que se reflejan en el desarrollo de enfermedades humanas tales como SIDA, cáncer, Parkinson, Alzheimer, etc. Esta organización celular se establece a través de un lenguaje molecular, llevado a cabo en muchas ocasiones por pequeños dominios modulares que reconocen secuencias específicas en sus dianas y que se encuentran altamente conservados y presentes en las diferentes familias de proteínas, en número variable y distintas combinaciones (Pawson 1995; Pawson and Scott 1997; Pawson and Nash 2000; Pawson et al. 2002). Estos dominios han proporcionado a la naturaleza un mecanismo muy eficiente para el control de la actividad celular ya que los distintos módulos contribuyen a: la localización de enzimas y sustratos para crear cascadas específicas de señalización, la regulación alostérica de la función de la proteína, así como al reconocimiento de las diferentes modificaciones posttranslacionales o incluso a la intercomunicación entre distintas rutas de señalización. Los dominios modulares son generalmente de pequeño tamaño (entre 30 y 150 aminoácidos) y se encuentran plegados en estructuras compactas y estables caracterizadas por uno o más sitios de unión. Estos dominios se clasifican atendiendo a la homología en su estructura y secuencia, así cada familia de dominios reconoce pequeñas secuencias de entre 3 y 6 aminoácidos muy específicas y conservadas en sus proteínas diana. Por ejemplo, los dominios SH3 se unen a secuencias 38 Introducción ricas en prolina, los dominios SH2 reconocen restos de tirosina fosforilada y los dominios PDZ interaccionan con secuencias correspondientes a extremos carboxilo terminal (Cohen et al. 1995; Jelen et al. 2003; Mayer 2006). Estas secuencias consenso están flanqueadas por restos aminoacídicos adicionales que interaccionan con elementos variables en el sitio de unión del dominio y que parecen ser responsables de la especificidad de unión dentro de cada familia. De este modo, las interacciones mediadas por dominios modulares presentan dos características especialmente interesantes: por un lado, reconocen epítopos que constituyen secuencias continuas en las proteínas que los contienen, lo que simplifica notablemente la identificación in silico de dianas fisiológicamente relevantes para cada dominio a nivel de los distintos proteomas (Brannetti and HelmerCitterich 2003; Reiss and Schwikowski 2004; Neduva et al. 2005); y por otro lado, estos dominios presentan sitios de unión cóncavos con superficies de interacción pequeñas (en torno a 1000 Å2) lo que facilita el diseño de moléculas de pequeño tamaño que bloqueen estas interacciones,haciendo de estos dominios atractivas dianas para el desarrollo de agentes terapéuticos. 1.2.1. Reconocimiento de secuencias ricas en prolina Dentro de las distintas familias de dominios modulares, los módulos de reconocimiento de secuencias ricas en prolina (MRP) son los más ampliamente representados en el genoma humano debido a las propiedades específicas que confiere la prolina (Creamer 1998; Stapley and Creamer 1999; Kay et al. 2000; Creamer and Campbell 2002; Zarrinpar et al. 2003a; Adzhubei et al. 2013). Su bajo número de grados de libertad rotacional en relación a los demás aminoácidos hace que la tendencia a formar parte de estructuras secundarias como hélices alfa o láminas beta sea baja, por lo que estas secuencias ricas en prolina se encuentran con frecuencia en la superficie molecular, requisito imprescindible para cualquier secuencia implicada en interacciones proteína-proteína. Además, la estructura adoptada con mayor frecuencia cuando se presentan dos o más restos de prolina consecutivos es la denominada hélice de poliprolina II (PPII), que consiste en una hélice a izquierdas con tres aminoácidos por vuelta. Esta conformación adoptada por las secuencias ricas en prolina reduce notablemente el coste entrópico de la interacción. 39 Actualmente se conocen seis familias de MRP: los dominios SH3 (Src Homology 3), los dominios WW (que toman su nombre de dos restos Trp muy conservados), los dominios EVH1 (Enabled Vasolidator-stimulated-protein Homology), los dominios GYF (denominados así porque contienen la secuencia característica Gly-TyrPhe), los dominios UEV (Ubiquitin E2 Variant) y la profilina (Ball et al. 2005; Li 2005). Cada una de estas familias de MRP (Figura 1.1) reconoce secuencias canónicas diferentes que se caracterizan por contener al menos un resto de prolina (Sudol 1998; Macias et al. 2002). En general, los distintos MRP contienen al menos un bolsillo hidrofóbico formado por restos aromáticos muy conservados dentro de cada familia en el que se acomoda un dipéptido del tipo xP, donde x es frecuentemente un resto hidrofóbico. Contiguo a estos bolsillos suele encontrarse otro más variable que es el que interacciona con los restos del ligando adyacentes a la secuencia central, que serían los responsables de la especificidad en las interacciones entre los distintos miembros de una misma familia. Las interacciones de estos dominios con las secuencias ricas en prolina presentan afinidades moderadas o bajas, cuyas constantes de disociación varían entre 1 y 500 μM. Esta baja afinidad de unión hace favorable la formación de complejos esenciales en la señalización intracelular donde la rápida unión y disociación forma parte del proceso de transducción de señales. 40 Introducción Figura1.1. Ejemplos de las familias de dominios modulares, como son los dominios SH3, WW, GYF, EVH1, UEV, y la familia de proteínas de profilina, que reconocen secuencias ricas en prolina, formando diferentes complejos con ligandos tipo PPII. En todos los casos, los ligandos (representados como estructura de varillas) se unen a cada domino a través de un sitio de unión hidrofóbico formado por restos aromáticos muy conservados entre los miembros de cada familia de dominios. Aunque se postula que las divergencias entre los dominios de una misma familia son suficientes para establecer redes de interacciones de alta especificidad (Zarrinpar et al. 2003b), con frecuencia se ha detectado un elevado grado de promiscuidad para alguno de estos dominios puesto que reconocen un número considerable de dianas con 41 afinidades comparables. A la vista de esta aparente paradoja se ha propuesto la existencia de dos tipos de especificidad: una especificidad intrínseca encriptada en cada pareja dominio-ligando y una especificidad contextual en la que factores como la localización subcelular o el efecto cooperativo de interacciones múltiplesdesempeñan un papel importante (Ladbury and Arold 2000; Mayer 2001). Nuestro grupo de investigación lleva trabajando desde la última década en la caracterización termodinámica y estructural de numerosas interacciones de ligandos tanto naturales como de diseño con dominios SH3 y WW, lo que ha permitido avanzar enormemente en la comprensión de estas interacciones y en los determinantes de la afinidad y especificidad de unión. De este modo, se ha demostrado la importancia de regiones distantes al sitio de unión, como el lazo distal y el lazo RT, en la distribución conformacional de dominios SH3, afectando a la energética de unión. Además, tanto los dominios WW como los dominios SH3 presentan un nivel de especificidad intrínseca más elevado para secuencias peptídicas derivadas de proteínas o dianas víricas que el observado para péptidos de diseño o derivados mediante expresión en fagos o secuencias extraídas de proteínas celulares, en las que los efectos contextuales parecen tener más peso. En este contexto, la investigación llevada a cabo en este trabajo se centra en identificar las regiones que forman las redes cooperativas de transmisión de información a larga distancia y el estudio de los determinantes moleculares y los factores contextuales (secuencias de conexión entre dominios y dominios adicionales) que influyen en la cooperatividad estructural, así como en la afinidad y especificidad de unión en los dominios modulares SH3 y WW. 1.2.2. Dominios SH3 1.2.2.1. Importancia biológica, estructura, estabilidad y plegamiento Los dominios SH3 son los módulos de reconocimiento más ampliamente representados en el proteoma, con más de 1500 dominios identificados hasta el momento (Mayer 2001; Macias et al. 2002; Zarrinpar et al. 2003a). Estos módulos forman parte de proteínas muy diversas presentes en eucariotas, tales como las quinasas de tirosina Abl, Yes, Src, Fyn, Lyn, Hck, Lck, Nck, proteínas de unión a actina, Bem1, cdc25, cortactina, la subunidad del canal de calcio beta1B2, Grb2, 42 Introducción miosina, la subunidad reguladora de PI3K, espectrina, la proteína ZO-1, etc. (Kay et al. 2000; Mayer 2001; Zarrinpar et al. 2003a). Los dominios SH3 actúan generalmente como sitios de anclaje para el reclutamiento de sustratos y la formación de complejos supramoleculares que conducen a la modificación enzimática de algunos componentes. En ocasiones desempeñan también un papel esencial en la regulación de la actividad enzimática de las proteínas que los contienen mediante el establecimiento de interacciones intramoleculares con otros elementos de la molécula (Barila and Superti-Furga 1998; Arold et al. 2001; Brasher et al. 2001; Brabek et al. 2002). Este es el caso de las quinanas de tirosina de la familia Src, algunos de cuyos miembros, especialmente Src y Yes, están relacionados con el desarrollo de procesos cancerígenos. Además de cáncer, los dominios SH3 están implicados en otras patologías importantes como el SIDA (Lyn, Hck, Lck), leucemia (Abl), osteoporosis (Src), o procesos inflamatorios, alérgicos y asmáticos (Dalgarno et al. 1997; Skorski et al. 1998). Su importancia biológica, su pequeño tamaño (en torno a 60 residuos) y la relativa simplicidad de sus protocolos de expresión y purificación, han convertido a los dominios SH3 en candidatos ideales para su estudio estructural y energético. Gracias a esto, el número de estructuras tridimensionales para dominios SH3 ha crecido exponencialmente en la última década, tanto en su estado libre como formando complejos con ligandos peptídicos (Candel et al. 2007; Martin-Garcia et al. 2007; Martin-Garcia et al. 2012a; Bacarizo and Camara-Artigas 2013; Liu et al. 2013; Ortega Roldan et al. 2013), pudiendo citar así más de 700 estructuras depositadas hasta la fecha en el banco de datos de proteínas (Protein Data Bank, PDB). Los dominios SH3 presentan un plegamiento característico como podemos observar detalladamente en la Figura 1.2. Éste consiste en una estructura tipo barril β constituida por cinco hebras antiparalelas, denominadas β1, β2, β3, β4 y β5, dispuestas en dos láminas β ortogonales entre sí, una de menor tamaño formada por las hebras β2β1-β5 y otra de mayor tamaño formada por las hebras β2-β3-β4. Las cinco hebras están conectadas por tres lazos de longitud variable denominados RT, n-Src y distal, de modo que el lazo RT conecta las dos primeras hebras β1 y β2, el lazo n-Src las hebras β2 y β3, y el lazo 43 distal conecta las hebras β3 y β4. Finalmente, la conexión entre las hebras β4 y β5 se realiza mediante una vuelta de hélice 310. El equilibrio conformacional y la estabilidad de los dominios SH3 han sido caracterizados de forma extensiva por varios grupos de investigación, incluido el nuestro, que mediante el uso de técnicas espectroscópicas y calorimétricas han establecido que el equilibrio de plegamiento de estos dominios puede describirse adecuadamente según el modelo de dos estados (Martinez et al. 1998; Filimonov et al. 1999; Martinez and Serrano 1999; Sadqi et al. 1999; Casares et al. 2004; Casares et al. 2007b). Figura 1.2. Representación de la estructura tridimensional del dominio SH3 de c-Yes resuelta por cristalografía de Rayos X (Martin-Garcia et al. 2007) y depositada en Protein Data Bank (PDB) bajo el código 2hda. Las cinco hebras beta se representan como β1, β2, β3, β4 y β5 (amarillo), la hélice 310, que conecta las hebras β4 y β5, aparece en rojo. El lazo n-Src que conecta las hebras β2 y β3, el lazo RT que conecta las hebras β1 y β2, y el lazo distal que conecta las hebras β3 y β4, se indican en verde. Los restos aromáticos más conservados que son importantes para la unión de los ligandos se indican en representación de varillas en el código de colores indicado en el texto. 44 Introducción 1.2.2.2. Reconocimiento de ligandos ricos en prolina Las interacciones entre dominios SH3 y sus ligandos naturales se caracterizan por tener afinidades moderadas con constantes de disociación generalmente en el intervalo de 1 y 200 µM, lo que refleja la necesidad de establecer interacciones dinámicas de carácter transitorio en el contexto de las redes celulares de transducción de señales. Los ligandos de los dominios SH3 contienen generalmente una secuencia canónica del tipo xPxxP, donde x es normalmente un aminoácido hidrofóbico, y adoptan una conformación en hélice de poliprolina II (PPII) en el complejo. Como se ilustra en la Figura 1.3, el sitio de unión de los dominios SH3 consiste en una hendidura poco profunda que contiene dos bolsillos hidrofóbicos constituidos por las cadenas laterales de residuos que se encuentran muy conservados en estos dominios (los dos residuos de tirosina del motivo ALYDY, el primer triptófano del motivo WW situado en la hebra β3, el residuo de prolina de la hebra β4 (P) y el residuo de la tirosina en la secuencia SNY de la hélice 310). Figura 1.3. Representación esquemática del sitio de unión del dominio SH3. En la figura se representa el sitio de unión modelado con un ligando tipo PxxP en orientación tipo I. El sitio de unión contiene dos bolsillos hidrofóbicos xP formados por restos aromáticos conservados (amarillo) y un bolsillo de especificidad adyacente que es más variable (verde). Las letras P en el ligando indican las posiciones en su secuencia consenso, P0x1x2P3. Cada uno de los bolsillos hidrofóbicos acomoda uno de los dipéptidos del tipo xP de la secuencia consenso, como se muestra en la Figura 1.3, de modo que cada resto prolina de la secuencia canónica se intercala entre dos o más restos aromáticos. Los restos adyacentes a la secuencia central xPxxP interaccionan con un tercer bolsillo responsable de la especificidad de unión delimitado por los lazos RT y n-Src, más 45 variables en secuencia entre los miembros de las familias SH3 (Zarrinpar et al. 2003a; Ball et al. 2005). Este modo de unión se caracteriza por la escasez de interacciones polares en los complejos, ya que generalmente éstas se limitan a dos puentes de hidrógeno muy conservados, establecidos entre el Trp en la hebra β3 y la Tyr en la hélice 310 con los carbonilos de algunos restos prolina de los ligandos, y a un puente salino, presente en algunos tipos de complejos, establecido entre un resto de aspártico conservado en el dominio SH3 y un resto de arginina en el ligando. En la Figura 1.4 se ilustra, a modo de ejemplo, este puente salino establecido entre el residuo de Asp99 del dominio cSrc-SH3 y el resto Arg6 del ligando VSL12. Figura 1.4. Estructura en disolución del complejo formado por el domino cSrc-SH3 y el ligando VSL12. El dominio SH3 de cSrc se muestra en estructura tipo cinta, y el ligando VSL12 en estructura de varillas. Los restos cargados Asp99 en la proteína y Arg6 en el ligando, se representan en estructura de varillas en colores verde oliva y verde oscuro respectivamente, y el puente salino que forman como una línea discontinua. PDB: 1qwf. Debido a la pseudosimetría de la conformación PPII los ligandos ricos en prolina pueden unirse al dominio con dos orientaciones diferentes (Figura1.5): 1) Tipo I, el ligando va desde el extremo N al C terminal y está caracterizado por una secuencia consenso [R/K]x#PxxP. 2) Tipo II, el ligando se orienta desde el extremo C al N terminal y su secuencia consenso es xPx#Px[R/K]. Con frecuencia # suele ser un resto hidrofóbico y x puede ser cualquier 46 Introducción aminoácido. Así la orientación del ligando se determina por las interacciones que establecen los restos que flanquean a la secuencia consenso xPxxP, en particular por la posición del aminoácido básico implicado en el puente salino situado dos posiciones anterior al motivo xPxxP en los ligandos de tipo I y dos restos posterior a este motivo en los ligandos de tipo II (Feng et al. 1994; Lim et al. 1994). Además, la orientación del ligando puede también venir dictada por la conformación de la cadena lateral de un resto de triptófano altamente conservado de la hebra β3 del dominio SH3 que forma interacciones de van der Waals (Fernandez-Ballester et al. 2004). Figura 1.5.Representación esquemática de la unión de ligandos de tipo I (arriba) y tipo II (abajo) al domino SH3, tomada de la referencia (Mayer 2001). Los dominios SH3 pueden clasificarse en tres clases diferentes de acuerdo a su especificidad de unión: 1) Dominios SH3 que se caracterizan por tener un puente salino entre un resto del ligando cargado positivamente (Arg o Lys) y un resto cargado negativamente en la superficie del dominio. En estos casos se observan con frecuencia complejos tipo I y tipo II, como es el caso del dominio SH3 de cSrc que puede unir tanto el péptido RPPPLP como el reverso PPVPPR (Sparks et al. 1996; Kang et al. 2000). Esta situación se representa en la Figura 1.6 para los complejos del dominio cSrc-SH3 con los ligandos VSL12 (tipo I) y APP12 (tipo II); 2) Dominios que interaccionan con el motivo canónico xPxxP pero que no presentan el puente salino como ocurre con el dominio SH3 de Abl (Musacchio et al. 1994; Pisabarro et al. 47 1998); 3) Dominios descubiertos recientemente que interaccionan con secuencias no canónicas que no contienen el motivo consenso y que presentan modos de unión alternativos o incluso que no contienen ningún resto de prolina (Kang et al. 2000; Ghose et al. 2001; Liu et al. 2003). Lo cierto es que cada vez es mayor el número de epítopos que contienen secuencias diferentes a la secuencia canónica xPxxP original, ampliando el rango de acción de los dominios SH3 en determinados procesos celulares, lo que hace necesario un estudio más profundo de estos casos para conocer mejor sus peculiaridades. Figura 1.6. Representación superficial del dominio cSrc-SH3 formando un complejo con el ligando VSL12 (panel izquierdo) y el ligando APP12 (panel derecho). El resto Asp99 del dominio SH3, el cual está implicado en el puente salino con el resto de Arg en los ligandos (Arg6 en VSL12 y Arg7 en APP12), se ha representado en color rosa. Los ligandos se han mostrado en estructura de varilla y coloreados en un esquema de colores en arco iris (Azul: N-terminal; rojo C-terminal). La implicación de los dominios SH3 en el desarrollo de importantes patologías como cáncer, SIDA y Parkinson entre otras, además de la evolución de numerosos virus que utilizan el reconocimiento de secuencias ricas en prolina por parte de estos dominios para su proliferación, los hace atractivas dianas para el diseño de moléculas con la capacidad de bloquear o modular las interacciones entre estos dominios y sus dianas, lo que se ha consolidado como una estrategia viable para el desarrollo de nuevos fármacos específicos para el tratamiento de estasenfermedades (Stauffer et al. 1997; Kardinal et al. 2000; Vidal et al. 2001; Lee et al. 2002; Oneyama et al. 2002; Gril et al. 2007). 48 Introducción Sin embargo, el diseño de ligandos de alta afinidad y especificidad para dominios SH3 se ha revelado como un reto especialmente complejo, debido a la baja afinidad de los ligandos naturales y al complicado balance entre especificidad y promiscuidad que caracteriza las interacciones mediadas por estos dominios (Cesareni et al. 2002; Tong et al. 2002; Landgraf et al. 2004). Hasta la fecha son numerosos los grupos de investigación que han dirigido sus esfuerzos hacia la identificación y diseño de ligados de alta afinidad para dominios SH3. Para ello, se han empleado diversas estrategias como el uso de bibliotecas de compuestos sintéticos, la sustitución sistemática de las distintas posiciones del ligando por alanina (Ren et al. 1993; Feng et al. 1994; Yu et al. 1994), técnicas de expresión en fagos (Cheadle et al. 1994; Rickles et al. 1995; Tong et al. 2002; Ferguson et al. 2004; Karkkainen et al. 2006), la utilización de elementos no peptídicos en los ligandos (Combs et al. 1996; Feng et al. 1996; Panni et al. 2002), e incluso la incorporación de D-aminoácidos (Schumacher et al. 1996). En todos los casos los avances han sido muy limitados, aunque el uso de métodos de química combinatorial junto con el uso de bibliotecas de péptidos donde las prolinas clave han sido modificadas, ha proporcionado algunos ligandos de alta afinidad para dominios SH3 (Nguyen et al. 1998; Aghazadeh and Rosen 1999; Nguyen et al. 2000). La aplicación de técnicas de diseño racional mediante el uso de algoritmos computacionales sustentados exclusivamente en la información estructural, ha proporcionado también algunos resultados satisfactorios, como los obtenidos por el grupo del Dr. Luis Serrano (CRG, Barcelona), que ha conseguido varias secuencias de alta afinidad y especificidad para el dominio SH3 de Abl (Pisabarro et al. 1994; Pisabarro and Serrano 1996). Sin embargo, el éxito de estas metodologías de diseño racional ha sido modesto debido a que considerar la afinidad de unión, determinada por la energía de Gibbs, como único criterio, constituye una visión muy limitada del proceso de unión, ya que no proporciona información alguna sobre la naturaleza y magnitud de las fuerzas que lo dirigen (es decir, las contribuciones entálpica y entrópica) y, en muchos casos, impide un avance significativo en el desarrollo de nuevos ligandos o en la comprensión de la especificidad de unión. Trabajos llevados a cabo por varios grupos de investigación como el del Dr. Freire, han puesto de manifiesto la importancia de incorporar estas consideraciones termodinámicas al proceso de diseño (Luque and Freire 1998; Luque et al. 1998; Velazquez-Campoy and Freire 2001; Luque and Freire 2002; Luque et 49 al. 2002; Velazquez-Campoy et al. 2004; Velazquez Campoy and Freire 2005; Velazquez-Campoy and Freire 2006). Según los estudios termodinámicos realizados sobre las interacciones mediadas por los dominios SH3 y de acuerdo con la información estructural, el reconocimiento de ligandos ricos en prolina por los dominios SH3 está basado fundamentalmente en la intercalación de los restos prolina del ligando entre los aminoácidos aromáticos e hidrofóbicos del sitio de unión del dominio, con muy pocas interacciones polares. Es de esperar, por tanto, que este tipo de interacciones presenten un patrón termodinámico dominado por el efecto hidrofóbico, que vendría determinado por un componente entrópico. Sin embargo, el reconocimiento de ligandos ricos en prolina por los dominios SH3 está gobernado por una entalpía de unión favorable a la que se opone una contribución entrópica desfavorable (Renzoni et al. 1996; Ferreon and Hilser 2004; Palencia et al. 2004; Martin-Garcia 2009). Este comportamiento termodinámico no se puede racionalizar fácilmente considerando exclusivamente las interacciones directas entre superficies hidrofóbicas, lo que apunta hacia una mayor complejidad en el reconocimiento de estos ligandos de la inicialmente supuesta a partir del análisis de los datos estructurales. Nuestro grupo de investigación ha aportado nuevos avances en el campo del reconocimiento de ligandos ricos en prolina por los dominios SH3. Por un lado, el análisis detallado de la estructura cristalográfica del complejo Abl-SH3/p41 que ha permitido identificar un conjunto de cinco moléculas de agua que participan en una compleja red de puentes de hidrógeno y que median las interacciones entre el ligando y un grupo de aminoácidos del dominio (Palencia et al. 2004). Por otro lado, los resultados del análisis termodinámico, estructural y de dinámica molecular revelan que estas moléculas de agua enterradas en la interfase de unión del complejo Abl-SH3/p41 juegan un papel determinante y contribuyen significativamente al patrón termodinámico observado (Palencia 2008; Palencia et al. 2010). Posteriormente, se han analizado estructuras cristalográficas de los dominios SH3 disponibles en Protein Data Bank (PDB), lo que ha permitido observar cómo la presencia de moléculas de agua en el sitio de unión se repetía en todos los dominios, permitiendo identificar patrones de hidratación comunes (Martin-Garcia et al. 2012b; Zafra-Ruano and Luque 2012). Algunas de estas moléculas de agua forman parte estructural del sitio de unión y 50 Introducción juegan un papel importante en la formación del complejo, por lo que su presencia en la interfase de unión de dominios SH3 abre un amplio campo de posibilidades en el diseño y optimización de los ligandos en cuanto a especificidad de unión. También, en nuestro grupo de investigación, se ha desarrollado un algoritmo para el análisis automatizado de hidratación interfacial mediante dinámica molecular (Corbi-Verge 2012). En este sentido, también hay que tener en cuenta algunos trabajos que han demostrado la importancia de la dinámica molecular, en particular de los lazos RT y n-Src, en la especificidad de unión (Roberts 1999; Wang et al. 2001; Yuzawa et al. 2004). Se ha propuesto que la redistribución conformacional del estado nativo inducida por la unión del ligando es un factor a tener en cuenta en el patrón termodinámico anómalo observado en el reconocimiento de ligandos ricos en prolina por los dominios SH3 (Wang et al. 2001). De hecho, estudios de intercambio hidrógeno/deuterio en el dominio SH3 de espectrina, llevados a cabo en nuestro grupo de investigación, indican que bajo condiciones nativas el dominio SH3 puede considerarse como un conjunto estadístico de estados conformacionales y presenta, además, una elevada cooperatividad estructural, lo que significa que cualquier cambio energético local puede transmitirse eficientemente al resto de la molécula (Casares et al. 2007a; Casares et al. 2007b). Los estudios termodinámicos realizados también en nuestro grupo de investigación con el dominio SH3 de cSrc, demuestran que mutaciones en los residuos cercanos al sitio de unión no provocan cambios significativos en los parámetros termodinámicos de unión, sin embargo, los mayores efectos se observan en las mutaciones llevadas a cabo en el lazo distal (Martin-Garcia 2009). Estos resultados confirman, por tanto, la complejidad de las interacciones y la necesidad de profundizar en la comprensión de los distintos factores que determinan el comportamiento termodinámico para estos sistemas. 1.2.3. Dominios WW 1.2.3.1. Importancia biológica, estructura y plegamiento 51 Otros módulos de reconocimiento que aparecen ampliamente representados en distintos sistemas biológicos son los dominios WW (Hu et al. 2004). El nombre de estos dominios deriva de dos restos triptófano muy conservados (Trp17 y Trp39) que aparecen espaciados entre 20 y 22 restos en sus secuencias. Los dominios WW se encuentran relacionados con diversas funciones involucradas en la regulación de la transcripción, procesamiento de ARN, reconocimiento de ubiquitina, tráfico de proteínas, receptores de señalización y control del citoesqueleto (Kay et al. 2000; Sudol and Hunter 2000; Sudol et al. 2001; Macias et al. 2002). La alteración en alguna de estas funciones da lugar al desarrollo de enfermedades como el síndrome de hipertensión de Liddle, distrofia muscular, enfermedades de Alzheimer y Huntington y cáncer (Pereboev et al. 2001; Sze et al. 2004; Rotin and Schild 2008; Bellomaria et al. 2010). Además, algunos de estos dominios están implicados en el desarrollo de infecciones víricas, como Ébola o la leucemia humana (Timmins et al. 2003; Bouamr et al. 2004). La relación de estos dominios con todas estas enfermedades hace que sean atractivas dianas para el desarrollo de nuevos agentes terapéuticos. Los dominios WW presentan una estructura común y muy compacta formada por tres hebras beta denominadas β1, β2 y β3 que se encuentran conectadas por dos lazos cuya extensión es variable y que constituyen una lámina beta antiparalela. Estos lazos van a contribuir a la especificidad y afinidad de unión de los ligandos (Figura 1.7). Los dominios WW contienen aproximadamente 40 aminoácidos y son considerados los dominios modulares de proteínas naturales más pequeños que existen con un plegamiento simple en lámina β (Sudol et al. 2001). Sin embargo, la información estructural disponible para los dominios WW es mucho más limitada que para los dominios SH3. Hasta el momento, existen unas 25 estructuras determinadas por RMN de complejos y de dominios WW libres y muy pocas estructuras cristalográficas. 52 Introducción Figura 1.7. Estructura del dominio WW1 de la proteína Yap65 determinada por RMN, formada por las tres hebras beta β1, β2 y β3 (amarillo). Los dos triptófanos (Trp17 y Trp39) que se encuentran altamente conservados y dan nombre a estos dominios se representan como estructura de varillas. PDB: 1jmq. Actualmente, los estudios de plegamiento de dominios WW son escasos y, en general, se limitan a experimentos realizados mediante técnicas espectroscópicas que proporcionan una información muy limitada. Su equilibrio conformacional ha sido descrito según un modelo de dos estados, no obstante, se trata de experimentos puntuales y en general poco informativos en cuanto a la cooperatividad del equilibrio de plegamiento. Las caracterizaciones cinéticas del plegamiento llevadas a cabo con distintos dominios WW son más numerosas y completas, aunque describen diferentes comportamientos para estos dominios (Crane et al. 2000; Ferguson et al. 2001a; Ferguson et al. 2001b; Jager et al. 2001; Petrovich et al. 2006; Sharpe et al. 2007). Debido al enorme interés que ha suscitado el plegamiento de pequeños dominios modulares y debido a la escasa información disponible sobre la termodinámica de plegamiento de dominios WW, nuestro grupo de investigación ha realizado una caracterización termodinámica detallada y completa del equilibrio conformacional de algunos dominios WW, utilizando diversas técnicas y metodologías de análisis (Cobos et al. 2009; Bexiga 2011). Los resultados presentados para los distintos dominios WW, están de acuerdo con la hipótesis de que los equilibrios de dos estados y “downhill” no constituyen dos clases separadas claramente sino que son los límites extremos de una serie de posibles comportamientos determinados por la altura de las barreras energéticas, la cual puede ser modulada por las condiciones experimentales (Mi et al. 2011). El bajo valor de la entalpía específica de desplegamiento refleja la baja cooperatividad de este dominio. Además, 53 los valores anómalos de la TS (temperatura de máxima estabilidad) reflejan la necesidad de una elevada plasticidad y flexibilidad en el estado nativo, necesarias para acomodar ligandos de gran longitud en el sitio de unión. 1.2.3.2. Interacción de los dominios WW con ligandos ricos en prolina El sitio de unión de los dominios WW lo constituye una superficie cóncava que contiene una serie de restos aromáticos expuestos, cuya disposición origina un bolsillo hidrofóbico donde se acomodan los péptidos con conformación PPII. Este bolsillo está formado por dos restos aromáticos altamente conservados (Tyr28 en la hebra β2 y Trp39 en la hebra β3) entre los que se inserta el dipéptido xP, de un modo similar al observado en los dominios SH3 (Figura 1.8). Además, existe otro bolsillo de especificidad que se localiza en el lazo que conecta la segunda y tercera hebra, y varía de un dominio WW a otro dependiendo del tipo de ligando que reconozca. Así se justifica que esta clase de dominios sea la que presente mayor similitud con los dominios SH3, existiendo ejemplos de ambos dominios no relacionados evolutivamente que han convergido hacia un mecanismo común para el reconocimiento de secuencias en conformación PPII (Sudol et al. 1995; Zarrinpar and Lim 2000; Zarrinpar et al. 2003a). Figura 1.8. Representación esquemática del modo de unión mostrado por dominios WW de la clase I. En la figura se representa el sitio de unión modelado con un ligando tipo PPxY. El sitio de unión contiene un bolsillo hidrofóbico xP formado por restos aromáticos conservados (amarillo) y el bolsillo de especificidad adyacente que es más variable dependiendo del tipo de ligando que reconozca el dominio (verde). Las letras P en el ligando indican las posiciones en su secuencia P0P-1x-2Y-3. 54 Introducción Según la secuencia y especificidad de unión con los ligandos ricos en prolina que reconocen, los dominios WW pueden clasificarse en cuatro subfamilias o clases (Macias et al. 2000; Schleinkofer et al. 2004). Los dominios WW de clase I que reconocen la secuencia consenso PPxY. La clase II que interacciona con secuencias consenso PPLP, muy parecidas a las características de los SH3, también con un bolsillo de especificidad hidrofóbico de tipo xP (denominado xP2). La clase III que interacciona con secuencias que contienen una prolina precedida por fosfoserina o fosfotreonina, del tipo p(S/T)P. Y finalmente, la clase IV que es la subfamilia más heterogénea donde, independientemente de los ligandos que puedan reconocer, se agrupan los dominios que tienen las secuencias más diferentes incluyendo aquellos que no conservan el Trp39 que forma el bolsillo xP. Existen otros criterios relacionados con la especificidad de unión, que hacen que actualmente la clasificación de los dominios WW siga siendo motivo de controversia. Algunos autores proponen que el motivo de unión de la clase II debe ser definido como PPxPP (Macias et al. 2002), otros han sugerido un quinto grupo posible para algunos dominios que reconocen secuencias flanqueadas o interrumpidas por los aminoácidos arginina o lisina, del tipo R/LPPP(R) (Bedford et al. 1998; Bedford et al. 2000), o incluso para aquellos que puedan unir a tirosinas fosforiladas en la secuencia consenso (Otte et al. 2003). El modo de unión característico de los dominios WW de clase I es el más común y mejor estudiado, a este grupo pertenecen los dominios empleados en los estudios de interacción presentados en este trabajo. Las dos prolinas de la secuencia consenso PPxY del ligando se acomodan en el bolsillo hidrofóbico xP frente a los restos aromáticos conservados Tyr28 y Trp39. El bolsillo de especificidad se ha denominado bolsillo xY por ser donde se acomoda la tirosina del motivo. Esta cavidad está formada por restos situados al final de la segunda hebra y en la mitad de la tercera hebra. Estos son un aminoácido alifático (Leu, Ile o Val), un resto histidina en la posición 32, un residuo hidrofílico en la posición 35 (Glu, Lys o Arg) y una treonina en la posición 37. El análisis mutacional de los residuos semiconservados en las posiciones 30 y 35 demuestran que la sustitución de éstos no afecta significativamente a la interacción (Toepert et al. 2001). En cambio, los aminoácidos estrictamente conservados, His32 y Thr37, resultan fundamentales para la unión del motivo PPxY (Kasanov et al. 2001; Toepert et al. 2001) ya que la His32 55 interacciona con la Tyr de ligando y la Thr37 establece un puente de hidrógeno con una de las prolinas del motivo de unión (Pires et al. 2001; Ball et al. 2005). Al igual que los dominios SH3, los dominios WW pueden unir los ligandos con dos orientaciones. La orientación parece venir determinada por restos que no son de prolina dentro de la secuencia consenso que reconoce cada clase, como por ejemplo el resto Tyr en la secuencia PPxY de la clase I. Sin embargo, los restos adyacentes que componen la secuencia consenso parecen ser más importantes tanto para la afinidad como para la especificidad de unión, lo que indica que estos dominios tienen un epítopo de reconocimiento muy corto (Zarrinpar and Lim 2000; Pires et al. 2001). Esta característica podría justificarse en base al pequeño tamaño de los dominios WW y a la reducida superficie que exponen para interaccionar con los ligandos. Estudios de unión de ligandos ricos en prolina, realizados por fluorescencia, indican que el valor de las constantes de disociación varían generalmente entre 3 y 350 µM (Macias et al. 1996; Nguyen et al. 1998; Pires et al. 2001; Pires et al. 2005; Kanelis et al. 2006). En nuestro grupo de investigación hemos sido capaces de obtener a través de técnicas de expresión en fagos ligandos de alta afinidad, con constantes de disociación en el orden de nM y que han sido empleados en este trabajo para el estudio de su especificidad de unión con los dominios WW de la proteína hNedd4. Dado que el diseño eficaz de estos ligandos requiere una profunda comprensión de las fuerzas que dirigen las interacciones entre los dominios WW y sus dianas, nos hemos propuesto, dentro de los objetivos de este trabajo, investigar la influencia de elementos adicionales de la proteína en el equilibrio conformacional evaluando el impacto de las interacciones cooperativas en la estabilidad de la proteína y la energética de unión, así como establecer las preferencias de un ligando por diferentes dominios WW. 1.3. Familia de las quinasas de tirosina Como se ha mencionado anteriormente, la base del complejo entramado funcional de los diferentes procesos celulares se basa en el reconocimiento específico entre proteínas y en su 56 Introducción activación/desactivación transitoria. Con frecuencia, este proceso se lleva a cabo mediante la fosforilación o desfosforilación de un residuo que tenga un grupo hidroxilo libre (-OH), normalmente serina, treonina o tirosina. Las proteínas encargadas de transferir ese grupo fosfato desde el adenosín trifosfato (ATP) al residuo de la proteína substrato se denominan quinasas. Las quinasas de tirosina son el grupo más diverso y amplio dentro de la familia de las quinasas ya que están implicadas en diferentes procesos celulares relacionados con la expresión de genes, rutas metabólicas, crecimiento y diferenciación celular, transporte de membrana y apoptosis. De este modo, han evolucionado para desarrollar su función como interruptores moleculares con la mayor eficiencia posible, lo que las convierte en unas maquinarias moleculares muy complejas (Pawson and Nash 2003). Las quinasas de tirosina poseen una estructura común (Figura 1.9) que consiste en un dominio catalítico formado por dos lóbulos: el lóbulo que se encuentra en el extremo N-terminal (lóbulo N), formado por cinco hebras beta y una hélice alfa, y el lóbulo situado en el extremo C-terminal (lóbulo C) que está compuesto principalmente por hélices alfa y es donde se encuentra la zona de reconocimiento del sustrato peptídico y el centro activo. El ATP se une a la zona situada entre ambos lóbulos, cerca del sitio de unión de las secuencias diana de la quinasa. Unido al dominio catalítico se encuentra el dominio SH2 que reconoce pequeñas secuencias aminoacídicas que contienen fosfotirosina, seguido por el dominio SH3 que reconoce secuencias ricas en prolina (Hubbard and Till 2000; Huse and Kuriyan 2002). 57 Figura 1.9. Superposición de las estructuras de las quinasas de tirosina. En verde se muestra cSrc y cAbl en azul. En el genoma humano la familia de las quinasas de tirosina tiene alrededor de 90 miembros que se pueden dividir en quinasas de tirosina receptoras, relacionadas con la unión extracelular de ligandos, y las quinasas de tirosina no receptoras que se encargan de la localización subcelular de proteínas a través de los dominios modulares (Hubbard and Till 2000; Manning et al. 2002). El descubrimiento de las quinasas de tirosina no receptoras, cSrc y cAbl, desencadenó un gran interés científico debido al poderoso efecto que éstas tienen en el comportamiento celular. El hallazgo de estos oncogenes virales dio pie a la necesidad de la comprensión de sus mecanismos ya que revelaría los principios que gobiernan la regulación celular y la oncogénesis. Así pues, el esfuerzo investigador se centró inicialmente en entender el mecanismo catalítico de las quinasas de tirosina. Uno de los mecanismos más estudiados de la regulación de las quinasas de tirosina consiste en la fosforilación del llamado lazo de activación, situado en el dominio catalítico, en el que la carga negativa del grupo fosfato compensa una carga positiva situada en el motivo DFG, muy conservado en este lazo, aumentando así la actividad catalítica de la proteína (Cowan-Jacob 2006). Numerosos estudios han demostrado que el dominio catalítico de las quinasas de tirosina se 58 Introducción encuentra muy conservado, tanto a nivel estructural (Figura 1.9) como en sus mecanismos de regulación (Huse and Kuriyan 2002). Además, se han descubierto otros eventos de fosforilación que pueden desactivar la quinasa o cambiar el sitio de fosforilación, estando los dominios que acompañan al dominio catalítico especialmente implicados en su regulación (Huse and Kuriyan 2002; Cowan-Jacob 2006). En particular, los dominios SH2 y SH3 que tienen la capacidad de reconocer motivos con una secuencia específica y están relacionados con el mecanismo de regulación de la actividad enzimática. De este modo, se ha comprobado cómo la eliminación de los dominios SH3 y SH2 provoca la desregulación de la actividad de cAbl, y la ausencia de cada dominio modifica de forma característica el comportamiento de cAbl in vivo (Pendergast 2002).Así, los mecanismos de reconocimiento de sustrato y los de regulación de la actividad no tienen lugar únicamente en el dominio catalítico (Mayer and Baltimore 1993; Birge et al. 1996; Yadav and Miller 2008). Conocer el mecanismo de regulación de cSrc y cAbl se ha convertido en uno de los principales retos biomédicos actuales, pues no solamente permitiría entender con mayor detalle cómo funciona uno de los elementos clave en la señalización celular, sino que, además, sería de gran ayuda para desarrollar nuevas terapias contra las formas oncogénicas de estas quinasas. Estas terapias son especialmente necesarias en el caso de la leucemia crónica mieloide, donde es común que los pacientes desarrollen resistencia a los fármacos actuales, ya que dichas formas resistentes, al contrario de lo que cabría esperar, no sólo presentan mutaciones en el sitio activo de cAbl, sino también en los dominios SH2, SH3 y otras zonas de la quinasa (Nagar 2007; Sherbenou et al. 2010). 1.3.1. Quinasa de tirosina cAbl cAbl fue una de las primeras quinasas de tirosina identificadas. En un estudio sobre ratones se descubrió cómo el producto del gen tumoral (oncogén) del virus del linfosarcoma de Abelson (vAbl), era también la forma alterada de la quinasa celular cAbl, con capacidad para transformar las células sanas en tumorales, apareciendo así un nuevo término, proto-oncogén (Abelson and Rabstein 1970; Colicelli 2010). Posteriormente, se descubrió que una modificación en la región N-terminal de cAbl, generada por una translocación cromosómica, 59 provocaba una fusióncon el gen BCR dando lugar a la formación de una proteína denominada BCR-Abl. Esta fusión provocaba una disrupción en el mecanismo que mantenía a cAbl en su forma inactiva aumentando la actividad quinasa y dando lugar al desarrollo de la leucemia mieloide crónica (CML) (Goff et al. 1980; Wang et al. 1984; Pendergast and Witte 1987). La estructura de cAbl consiste en un extremo N-terminal o Ncap que se transcribe en dos isoformas, cAbl-1a y cAbl-1b. La isoforma cAbl-b se caracteriza por tener una mayor longitud que cAbl-a (15 residuos más) y por la adición de un grupo miristoílo. Esta región carece de estructura y está seguida por un dominio de reconocimiento de secuencias ricas en prolina (SH3) y un dominio de reconocimiento de fosfotirosina (SH2), que se conecta a través de una larga secuencia al dominio catalítico (SH1). Por último, en el extremo C-terminal existe una extensa región donde se hallan varios dominios de unión al citoesqueleto, y que reconocen secuencias señal para la nucleación, secuencias ricas en prolina y otras de reconocimiento de ADN (Figura 1.10) (Pendergast 2002). Figura 1.10. Esquema de la organización de dominios de las diferentes formas de quinasas de tirosina de Abl. Cada dominio se encuentra representado en un color, siendo el gris el color utilizado para resaltar las partes que han sido alteradas en las formas oncogénicas. El asterisco azul marca la localización de los residuos fosforilados. En su conformación autoinhibida, el dominio SH2 interacciona directamente con el lóbulo C del dominio catalítico, dejando su sitio de unión parcialmente oculto. A partir de un completo estudio estructural de la isoforma cAbl-1b, se demostró también que el grupo miristoílo de la región NCap se encuentra interaccionando con el dominio catalítico, 60 Introducción insertado en una cavidad del lóbulo C. Aunque no fue posible determinar la posición de la mayor parte de la secuencia de NCap, debido a su naturaleza desestructurada, se propuso que esta unión induciría un cambio conformacional que facilitaría el acoplamiento del dominio SH2 al dominio catalítico. Por otro lado, el dominio SH3 interacciona con el conector que enlaza el dominio SH2 con el dominio quinasa (C2Q). Esta secuencia queda enterrada entre el sitio de reconocimiento de secuencias ricas en prolina del dominio SH3 y el lóbulo N del dominio catalítico (Nagar et al. 2006). De la quinasa de tirosina cAbl aún no ha sido posible conseguir información estructural detallada de su conformación activa para tener un mejor conocimiento de su mecanismo de regulación, aunque gracias a técnicas biofísicas como la Dispersión de Rayos X de Ángulo Bajo (Small Angle X-ray Scattering, SAXS) tenemos algunas pistas de los movimientos y cambios conformacionales relacionados con la activación de cAbl (Figura 1.11) (Nagar et al. 2006). La interacción del conector C2Q con el dominio SH3, aunque débil, parece ser uno de los componentes críticos de la regulación de la actividad de cAbl, como sugiere su activación en presencia de proteínas con motivos poliprolina (Barila et al. 2000; Shishido et al. 2000; Miyoshi-Akiyama et al. 2001) y los estudios de actividad con mutantes donde se ha eliminado el dominio SH3 (Franz et al. 1989) o se ha disminuido la afinidad de la secuencia C2Q mediante la mutación de las prolinas 242 y 249 por ácido glutámico (Pluk et al. 2002). Estas prolinas son responsables de que esta secuencia adopte una conformación similar a la hélice PPII típica de las secuencias reconocidas por los dominios SH3 (Barila and Superti-Furga 1998). 61 Figura 1.11.Esquema de la regulación de la quinasa de tirosina cAbl. a) Organización de los dominios de cAbl cuando se encuentra en la forma autoinhibida según la información cristalográfica disponible. C2Q y C3-2 corresponden a los conectores que unen el dominio SH2 con el dominio quinasa y los dominios SH3-SH2 respectivamente. b) Organización de los dominios más probable cuando la quinasa de tirosina cAbl se encuentra activa de acuerdo con la estructura de baja resolución obtenida por SAXS (dispersión de rayos X de ángulo bajo) (Nagar et al. 2006). Otros indicios de la importancia de la interacción del dominio SH3 en el mecanismo de activación de cAbl provienen de la posibilidad de bloquear la interacción del dominio con la secuencia C2Q mediante la fosforilación de algunos de los residuos de tirosina tanto del dominio SH3 como del conector C2Q (Hantschel and Superti-Furga 2004). Hasta la fecha se han descrito cuatro puntos de fosforilación en esta región de cAbl, la tirosina 89 y la 134 en el sitio de unión del dominio SH3 y la tirosina 245 y la 251 en el conector C2Q. La fosforilación de cualquiera de estos cuatro residuos parece tener efectos positivos en la activación de cAbl, probablemente al bloquear el reconocimiento de la secuencia C2Q por parte del dominio SH3, lo que impediría que la quinasa adoptase la conformación autoinhibida. Sorprendentemente, ninguna de estas posiciones es accesible en la conformación inactiva de cAbl, lo que sugiere que la fosforilación debería ocurrir después de la activación de la quinasa por otro estímulo. Aunque todas las fosforilaciones impedirían que cAbl volviese a su forma autoinhibida, la fosforilación en el sitio de unión del dominio SH3 debe tener un papel 62 Introducción diferente ya que, a su vez, dificulta el reconocimiento de sustratos clásicos por parte de este dominio modular (Hantschel and SupertiFurga 2004). La activación in vivo de cAbl mediante el dominio SH3 en la célula, como la de todas las proteínas implicadas en los procesos de señalización, debe ser transitoria, es decir, una vez que cAbl ha fosforilado el sustrato debe volver rápidamente a la conformación inhibida. Existen evidencias que indican que en este proceso, la secuencia que conecta los dos dominios modulares (C3-2) es un elemento clave que podría estar actuando como un muelle entre la conformación autoinhibida y la activa, modulando el cambio de orientación relativa de los dominios SH3 y SH2 (Brasher et al. 2001). Los primeros indicios de la importancia de esta secuencia interdominio provienen de un estudio de mutagénesis aleatoria en la secuencia de cAbl, donde se detectó que la sustitución de la S140 en el segmento C3-2 por una isoleucina producía la activación de cAbl, tanto in vivo como in vitro. Un estudio posterior en el que se mutó el mismo residuo y sus residuos colindantes L141 y E142 por glicina, dio lugar a una construcción con mayor actividad que el mutante S140I. En ambos casos, aunque la quinasa cAbl se encontraba activa, la capacidad del dominio SH3 de unir motivos poliprolina no sólo se vio afectada, sino que parecía aumentar (Brasher et al. 2001). Además, se han descrito formas de BCR-ABL que presentan mutaciones en el residuo S140 resistentes a Gleevec (imatinib mesilato), uno de los fármacos que inhiben la actividad catalítica de Bcr-Abl (Azam et al. 2003). Por lo tanto, se ha propuesto que la secuencia C3-2 se encuentra involucrada en los mecanismos que permiten la liberación del dominio SH3 de la secuencia C2Q, permitiendo así el reconocimiento de otros ligandos. El papel del dominio SH2 en el mecanismo de regulación está aún por determinar (Pendergast 2002; Colicelli 2010). Aunque las interacciones que establece el dominio SH2 con el dominio catalítico son importantes para la correcta regulación de cAbl, parece que su misión principal está más relacionada con el reconocimiento de sustratos para el dominio catalítico. Como podemos observar, la actividad enzimática de cAbl está regulada por un gran número de mecanismos, como son la fosforilación 63 de algunos de sus restos de tirosina, sus interacciones intramoleculares, su interacción con otras proteínas, e incluso, su propia localización celular (Smith and Mayer 2002). Esto sugiere que el funcionamiento de la actividad de cAbl depende de que todos los elementos de la proteína, aunque de distinta naturaleza, colaboren entre sí para llevar a cabo su función, es decir, estas proteínas deben poseer una elevada cooperatividad entre sus elementos. Los fármacos que se han desarrollado para tratar enfermedades relacionadas con el mal funcionamiento de la regulación de cAbl como la leucemia crónica mieloide (CML), actúan bloqueando el centro activo del dominio catalítico, pero no es raro que los pacientes dejen de responder al tratamiento por el desarrollo de resistencia al fármaco (Azam et al. 2003). El análisis de las formas resistentes reveló que, como hemos mencionado anteriormente, no todas las mutaciones que inducían resistencia se encontraban en el dominio catalítico, sino que aparecían agrupadas en el dominio SH3, en el dominio SH2 y en las regiones interdominio (Gorre et al. 2002; Azam et al. 2003; Ernst et al. 2011). Estos resultados, sumados a la baja especificidad que tienen los fármacos, generalmente basados en homología con la molécula de ATP, revelan la importancia de enfocar los estudios a la comprensión de los mecanismos de regulación de esta quinasa de tirosina para el desarrollo de nuevas terapias anticancerígenas (Dietrich et al. 2010; Zhang et al. 2010). 1.3.2. Quinasa de tirosina cSrc Francis Peyton Rous descubrió en 1911 el virus causante del sarcoma en pollos (virus del sarcoma de Rous, RSV), al oncogén responsable se le llamó vSrc. Más tarde, en 1976, J. Michael Bishop y Harold E. Varmus descubrieron que en el genoma de pollos sanos se encontraba un gen (cSrc) con una alta homología en secuencia con vSrc, y que fue el primer proto-oncogén en ser identificado (Stehelin et al. 1977; Hunter and Sefton 1980). La estructura de cSrc consiste en un dominio N-terminal asociado a la membrana (SH4), y que se encuentra unido a un grupo miristoílo, necesario para la unión de la proteína a la membrana plasmática. Le sigue un dominio único y poco conservado dentro de la familia de las Src quinasas, a continuación un dominio SH3, el cual 64 Introducción media las interacciones proteína-proteína a través de la unión de ligandos ricos en prolina, un dominio SH2 que reconoce secuencias que contienen fosfotirosina, un conector SH2-quinasa, el dominio quinasa que se encuentra altamente conservado y que posee actividad catalítica, al cual también se le conoce como SH1, y finalmente una región Cterminal (Figura1.12.) Figura 1.12. Representación esquemática de la estructura de las quinasas de tirosina cSrc y vSrc. Cada dominio se encuentra representado por un color y el asterisco verde marca la zona donde se encuentran los residuos fosforilados, la Tyr426 se encuentra en el dominio quinasa y la Tyr527 en el dominio C-terminal. Como se puede observar, la única diferencia entre ambas quinasas es que vSrc carece del dominio C-terminal, causa por la cual siempre permanece en la conformación activa. cSrc se encuentra normalmente en su estado inactivo o cerrado, en el cual el dominio SH2 está unido a la Tyr527 fosforilada, situada en el extremo C-terminal. El dominio SH3 se une al conector SH2-quinasa y la Tyr416 se encuentra defosforilada. La activación de cSrc puede ocurrir a través de la unión de un ligando al dominio SH3, por la existencia de un ligando de alta afinidad con una fosfotirosinaque se una al dominio SH2 o la defosforilación de la Tyr527 en el extremo Cterminal, este paso provoca la disrupción de las interacciones intramoleculares de los dominios SH2 y SH3 apareciendo así un estado conformacional abierto que da lugar a la autofosforilación de la Tyr416, activándose por completo cSrc (Roskoski 2004) (Figura 1.13). Estos hechos hacen que cSrc integre de una forma eficiente distintas señales, permitiendo que actúe como adaptador y regulador en la interacción proteína-proteína. 65 vSrc, a diferencia de su homólogo cSrc, carece de la región Cterminal por lo que la proteína se encuentra siempre en su conformación activa. Su actividad descontrolada es la causante de la transformación de las células sanas a células tumorales, de forma que mutaciones en el gen cSrc están relacionadas con el desarrollo de procesos tumorales como cáncer de mama, colon o cerebral (Falsone et al. 2004; Sen and Johnson 2011). Figura 1.13. a) Estructura de cSrc en su conformación cerrada, en su forma inactiva el dominio SH3 se une al conector y el dominio SH2 a la Tyr527 fosforilada. b) Conformación activa de cSrc, en este caso el dominio SH3 no se encuentra unido al conector, al igual que el dominio SH2 no se encuentra unido a la Tyr527 ya que no está fosforilada (Meng and Roux 2013). Aunque el mecanismo de regulación no está completamente detallado tanto para cSrc como para cAbl, en general, el dominio catalítico se mantiene en su conformación autoinhibida mediante el establecimiento de interacciones intramoleculares, en las que juegan un papel destacado los dominios SH2 y SH3 (Mayer and Baltimore 1994; Yadav and Miller 2007; Panjarian et al. 2013). Esto pone de manifiesto que, aunque modulares, las estructuras de cAbl y cSrc son altamente cooperativas. Por lo tanto, conocer en profundidad los mecanismos de regulación de estas quinasas es esencial para el desarrollo de nuevos fármacos contra sus formas oncogénicas. 66 Introducción 1.4. Ligasa de ubiquitina humana Nedd4 Como se ha mencionado anteriormente, las quinasas de tirosina controlan funciones básicas en la célula como la división y diferenciación celular, expresión de genes, transporte de membrana, etc. La regulación adecuada de estos procesos es crítica ya que cualquier perturbación en la señalización da lugar a numerosas enfermedades (Lemmon and Schlessinger 2010). Uno de los mecanismos para la correcta regulación de las quinasas de tirosina es a través de receptores relacionados con la ubiquitinación (Bache et al. 2004). Nedd4 (Neural precursor celldevelopmentallydownregulated 4) pertenece a la familia de las ligasas de ubiquitina tipo E3-Hect (Homologous E6-AP Cterminus) y fue identificada en 1992 en un cribado de genes relacionados con la desregulación en el desarrollo del sistema nervioso central en embriones de ratones (Kumar et al. 1992). La estructura de Nedd4 consiste en un dominio C2 en el extremo N-terminal y un dominio de unión a lípidos que media la localización de proteínas en membrana, este dominio sugiere que la ligasa Nedd4 se encarga de marcar proteínas de membrana con ubiquitina, aunque se ha observado que también realiza el etiquetado de proteínas citoplasmáticas y nucleares. Además, Nedd4 contiene entre uno y cuatro dominios WW en su región central que unen a motivos PY, y un dominio HECT en el extremo C-terminal (Figura 1.14) (Harvey and Kumar 1999; Ingham et al. 2005). Figura 1.14.Representación esquemática de la estructura de la ligasa Nedd4 humana (hNedd4). Contiene un dominio C2 (verde), cuatro dominios WW (violeta) y un dominio HECT (azul). Nedd4 está implicado en procesos de degradación proteosómica, transporte de proteínas desde la región trans-Golgi a la membrana celular o en la internalización de proteínas de membrana para su posterior reciclaje o degradación lisosómica. Uno de los sustratos mejor caracterizados de Nedd4 es el canal epitelial de sodio (ENaC). Este canal lo podemos encontrar en tejido de riñones, pulmón y colon (Garty and Palmer 1997) y tiene un papel importante en la homeostasis de sodio y en la presión sanguínea. ENaC está compuesto por tres subunidades homólogas (α, β, y γ), cada una de éstas contiene 67 un motivo PY en su extremo C-terminal el cual se une con el dominio WW3 de Nedd4 (Staub et al. 1996). La importancia de la regulación de ENaC por Nedd4 se pone de manifiesto cuando aparecen mutaciones en los motivos PY de las subunidades β y γ, dando lugar al desarrollo del síndrome de Liddle, una forma de hipertensión hereditaria causada por una elevada actividad de ENaC (Shimkets et al. 1994; Abriel et al. 1999). Además, los dominios WW de la ubiquitina ligasa humana Nedd4 han sido identificados como dianas celulares de algunos dominios L víricos (Martin-Serrano et al. 2001; Freed 2002; Demirov and Freed 2004). Estos dominios L (del inglés “late domains”) son pequeñas secuencias muy conservadas que se localizan en las poliproteínas Gag de algunos retrovirus como el de la leucemia humana o el VIH, en proteínas estructurales de algunos filovirus como el del Ébola y radovirus como el de la estomatitis vesicular, cuya presencia e integridad son imprescindibles para el correcto desarrollo de las últimas etapas en el ciclo de vida vírico (Pornillos et al. 2002). Los distintos tipos de dominios L contienen distintas secuencias muy conservadas denominadas tipo P(T/S)AP, PPxY e YPDL. La amplia distribución de estas secuencias entre distintos tipos de virus, junto con el hecho de que estos motivos en ocasiones son intercambiables, ha llevado a plantear una estrategia común de los virus para su liberación de la célula huésped (Parent et al. 1995; Puffer et al. 1998; Martin-Serrano et al. 2001). Es importante mencionar que los tres motivos característicos de los dominios L se han relacionado con las secuencias consenso propias de módulos de reconocimiento proteína-proteína: dominios SH3 (PxxP) (Mayer and Eck 1995; Dalgarno et al. 1997), dominios WW (PxxP o PPxY) (Sudol 1996b; Sudol 1996a) y proteínas adaptadoras AP1 y AP2 (YxxL) (Ohno et al. 1995; Puffer et al. 1998). Existen muchas evidencias experimentales que indican que los dominios L no actúan directamente en la morfogénesis del virión, sino que su principal función es reclutar la maquinaria celular necesaria para el ensamblaje del virus y para su liberación. El reconocimiento de pequeños epítopos que han desarrollado organismos sencillos como los virus ha hecho que el diseño de moléculas con capacidad para bloquear o modular las interacciones entre los dominios L y sus dianas sea una estrategia viable en el desarrollo de nuevos fármacos específicos para el tratamiento de numerosas enfermedades y antivirales de amplio 68 Introducción espectro (Stauffer et al. 1997; Kardinal et al. 2000; Lee et al. 2002; Oneyama et al. 2002; Okumura et al. 2008). 1.5. Cooperatividad y alosterismo Numerosos estudios han demostrado que bajo condiciones nativas las proteínas se comportan como un conjunto estadístico de estados conformacionales caracterizados por una elevada cooperatividad estructural (Hilser et al. 1998; Casares et al. 2007b). Esta cooperatividad conecta el comportamiento de los diferentes aminoácidos que componen la proteína, por lo que, cualquier cambio energético puede transmitirse de manera eficiente al resto de la molécula. De este modo, cualquier interacción que ocurra en una zona específica de la proteína puede transmitirse hacia regiones distantes del sitio de unión traduciéndose así como señales directas para activar o inhibir otras zonas, modular interacciones con otras moléculas o establecer una red de comunicación intramolecular. El modo en que estas interacciones se propagan a través de la estructura completa de la proteína es lo que se conoce como alosterismo (Monod et al. 1965; Koshland et al. 1966; Tsai et al. 2008). Existen numerosos ejemplos de proteínas que se encuentran reguladas a través de mecanismos alostéricos como es el caso de la activación e inactivación de las quinasas de tirosina cSrc y cAbl (Engen et al. 2008; Panjarian et al. 2013) o la interacción de proteínas víricas con proteínas celulares que están mediadas por cambios conformacionales inducidas por un ligando como en la proteína HIV-1 (Leavitt et al. 2004). Una cuestión fundamental es conocer cómo, perturbando en una zona concreta, se transmite la señal a través de toda la proteína hasta zonas alejadas del sitio de unión afectando a la propia actividad de la proteína. Puesto que la naturaleza del alosterismo es fundamentalmente termodinámica, la comunicación a larga distancia podría estar relacionada no sólo con cambios en la conformación principal (contribución entálpica), sino también en cambios en las fluctuaciones dinámicas (contribución entrópica) (Wand 2001; Tsai et al. 2008). Actualmente existen numerosos métodos con los que estudiar cómo se propaga el efecto alostérico a nivel atómico. La combinación de métodos experimentales como espectrometría de masas, 69 cristalografía de Rayos X, RMN, resonancia en superficie de plasma (SPR), calorimetría isotérmica de titulación (ITC) o numerosos métodos bioquímicos y métodos computacionales, han conducido a la comprensión de los mecanismos alostéricos de varios sistemas (Meyer and Peters 2003; de Azevedo and Dias 2008; Lenaerts et al. 2008; Kitova et al. 2012; Cubrilovic et al. 2013). Entender los mecanismos de regulación alostérica tiene una gran importancia ya que puede ser usado en numerosos campos, como el diseño de agentes farmacológicos. Hasta hace algunos años, los fármacos se diseñaban exclusivamente para imitar o inhibir los ligandos que se unían a los sitios de unión de sus proteínas diana.Pero los sitios activos se encuentran bajo una gran presión evolutiva para mantener su función y, para algunas enzimas como las quinasas, es muy difícil desarrollar inhibidores que se unan únicamente a un miembro de la familia y no al resto. Sin embargo, uno de los principales beneficios del diseño de fármacos que actúen sobre sitios alostéricos es principalmente la especificidad ya que no son sitios muy conservados. Actualmente, se han descubierto varias moléculas que actúan en zonas alejadas del sitio de unión de manera selectiva, potenciando o inhibiendo su actividad fisiológica sin afectar directamente al proceso de señalización celular (Jahnke et al. 2005; Mian et al. 2012). 1.6. Objetivos El objetivo principal de esta Tesis es obtener información sobre la cooperatividad en dominios SH3 y WW así como de la influencia de otros elementos tanto intrínsecos como extrínsecos sobre el equilibrio conformacional y la energética de unión, lo que nos permitirá evaluar los efectos contextuales en la especificad de unión y en la afinidad proporcionando información relevante para el diseño racional de inhibidores con función terapéutica. Los objetivos específicos que se pretenden alcanzar en este trabajo son los siguientes: 1. Evaluar la influencia de la redistribución conformacional inducida en el dominio SH3 de cSrc por la unión del ligando en la termodinámica de unión e identificar aquellas regiones que contribuyen más significativamente a estos efectos así como las 70 Introducción redes cooperativas de transmisión de información y su conservación o variabilidad en los distintos dominios. 2. Estudiar el intercambio de información intermolecular a través de la influencia de los dominios SH3SH2 y SH3SH2-C2Q en la regulación de la actividad quinasa en las oncoproteínas cAbl y cSrc. 3. Investigar la influencia de elementos adicionales en el equilibrio conformacional y la energética de unión de ligandos de los dominios WW aislados y en tándem. 71 Capítulo 2 Materiales y métodos Materiales y Métodos CAPÍTULO 2.- MATERIALES Y MÉTODOS 2.1. Clonado, expresión y purificación 2.1.1. Dominio SH3 de cSrc El plásmido pET15b que contiene el gen del dominio SH3 de cSrc de pollo ha sido cedido por el laboratorio del Dr. Ernesto Freire (Universidad Johns Hopkins, Baltimore, EEUU). Este dominio se ha expresado en células E. Coli BL21-DE3 (NOVAGEN) con una cola de histidinas (6xHis tag) en el extremo N-terminal y con un sitio de reconocimiento para la proteasa trombina, lo que permite eliminar la cola de histidinas del dominio tras su purificación. Dicha expresión se indujo con IPTG 1mM cuando la densidad óptica del cultivo celular a 600 nm alcanzó valores entre 0.6 y 0.8 y se dejó crecer durante toda la noche a 37ºC. Una vez pasado este tiempo, las células se recogieron por centrifugación a 7000 rpm, a 4ºC durante 10 minutos (centrífuga HETTICH modelo Roto Super 40, rotor A6.9) y posteriormente se resuspendieron en tampón fosfato sódico 50 mM, cloruro sódico 0.3 M, pH 8.0 (Tampón de Equilibrado de Columna; TEC). Las células resuspendidas fueron lisadas mediante prensa French (AMINCO) a una presión de 1200 psi y a continuación se ultracentrifugaron (BECKMAN Optima LE-80, rotor 45Ti) a 30000 rpm, durante 30 minutos y a 4ºC. El sobrenadante resultante se pasó por una columna de afinidad con 5 mL de resina Ni-NTA (QUIAGEN) previamente equilibrada con 50 mL de TEC y se llevaron a cabo sucesivos lavados de 50 mL de TEC con distintas concentraciones de imidazol (0, 20 mM y 50 mM). Por último, la proteína se eluyó con 50 mL de TEC con imidazol 500 mM. Las fracciones que contenían la proteína se dializaron frente a TEC para eliminar el imidazol y a continuación se llevóa cabo el corte con trombina (SIGMA) a temperatura ambiente durante 4 horas en una relación de peso aproximada 50:1. La trombina fue eliminada adicionando resina benzamidinsefarosa (AMERSHAM BIOSCIENCES). Los productos de la hidrólisis fueron sometidos a una segunda etapa de cromatografía de afinidad en Ni-NTA, de modo que la cola de histidinas y la proteína no hidrolizada quedaron retenidas en la columna mientras que la proteína sin cola fue eluida en las primeras fracciones, las cuales se concentraron hasta 2-3 mg·mL-1 y se almacenaron a -20ºC en el mismo tampón. En estas condiciones, el dominio SH3 de cSrc es estable durante varios meses. Las 75 diferentes etapas de la purificación así como la pureza final fueron controladas mediante electroforesis en gel de poliacrilamida (SDS-page) al 16 %. Además, la pureza de la proteína (superior al 99%) y su correcto peso molecular se comprobaron mediante espectrometría de masas en el Centro de Instrumentación Científica de la Universidad de Granada. 2.1.2. Dominio SH3 de cAbl El gen del dominio SH3 de cAbl, contenido en el plásmido pET3d, fue ofrecido por el Dr. Luis Serrano (CRG, Barcelona). Dicho dominio fue reclonadoen el plásmido pBAT4 en nuestro laboratorio, con la finalidad de optimizar su expresión. El dominio SH3 de cAbl fue expresado en células E. Coli BL21-DE3 (NOVAGEN) añadiendo como agente inductor de la expresión IPTG 1mM cuando la densidad óptica a 600 nm alcanzó un valor entre 0.6 y 0.8. Las células se recogieron por centrifugación a 7000 rpm, durante 10 minutos y a 4ºC (centrífuga HETTICH modelo Roto Super 40, rotor A6.9) y posteriormente se resuspendieron en tampón Tris 100 mM, pH 9.0. Una vez resuspendidas, las células se lisaron en un prensa French (AMINCO) a una presión de 1200 psi y a continuación se ultracentrifugaron (BECKMAN Optima LE80, rotor 45 Ti) a 30000 rpm, durante 30 minutos y a 4ºC. El dominio SH3 de Abl se precipitó del sobrenadante resultante añadiendo sulfato amónico muy lentamente y con agitación hasta una saturación del 75%. El precipitado con sulfato amónico, obtenido por ultracentrifugación a 30000 rpm, durante 30 minutos y a 4ºC, se redisolvió en tampón fosfato sódico 10 mM, cloruro sódico 500 mM, pH 6.5. La solución se pasó por un filtro de 0.45 micras y se sometió a una etapa de cromatografía de exclusión molecular utilizando una columna Hi-Load Superdex-75 26/60 (AMERSHAM BIOSCIENCIES). El equilibrado y la elución de la proteína se realizó en el mismo tampón utilizado para resuspender el precipitado de sulfato amónico. La pureza de las proteínas se controló mediante electroforesis en gel de poliacrilamida (SDS-page) al 16% y mediante espectrometría de masas siendo ésta superior al 99%. Para su almacenamiento, la proteína se concentró hasta 11 mg·mL-1en el mismo tampón, se congeló rápidamente en nitrógeno líquido y se mantuvo a 20ºC hasta su utilización. 76 Materiales y Métodos 2.1.3. Construcciones en tándem de cAbl y cSrc Las construcciones en tándem de cSrc y cAbl se reclonaron en el vector pETM11 (TOP Gene Technologies, Quebec, Canadá). Estos clones fueron expresados en células E. Coli BL21-DE3 (NOVAGEN) con una cola de histidinas (6xHis tag) en el extremo N-terminal y con un sitio de reconocimiento para la proteasa TEV, lo que permite eliminar la cola de histidinas del dominio tras su purificación. Dicha expresión fue inducida con IPTG 1mM cuando la densidad óptica del cultivo celular a 600 nm alcanzó valores entre 0.6 y 0.8 para las construcciones de cSrc. En el caso de las construcciones de cAbl, la inducción se realiza desde el principio ya que se ha observado en diferentes pruebas de expresión que ésta es la misma que cuando la densidad óptica a 600 nm se encuentra entre 0.6 y 0.8. Una vez que se añadió el agente inductor a los cultivos, se dejaron crecer durante toda la noche a 37ºC. Pasado este tiempo, las células se recogieron por centrifugación a 7000 rpm, a 4ºC durante 10 minutos (centrífuga HETTICH modelo Roto Super 40, rotor A6.9) y posteriormente se resuspendieron en tampón fosfato sódico 50 mM, cloruro sódico 0.3 M, pH 8.0 (Tampón de Equilibrado de Columna; TEC). Las células resuspendidas fueron lisadas mediante prensa French (AMINCO) a una presión de 1200 psi y a continuación se ultracentrifugaron (BECKMAN Optima LE-80, rotor 45Ti) a 30000 rpm, durante 30 minutos y a 4ºC. El sobrenadante resultante se pasó por una columna cargada con 5 mL de resina Ni-NTA (QUIAGEN) previamente equilibrada con 50 mL de TEC y se llevaron a cabo sucesivos lavados de 50 mL de TEC con distintas concentraciones de imidazol (0, 20 mM y 50 mM). Por último, la proteína se eluyó con 50 mL de TEC con imidazol 500 mM. Las fracciones que contenían la proteína se dializaron frente al tampón recomendado para la hidrólisis con la proteasa TEV (50 mM TrisHCl, 0.5 mM EDTA, 1 mM DTT, pH 8.0) y se incubaron durante toda la noche a temperatura ambiente con 1 µL de proteasa TEV por cada mL de disolución de proteína por hidrolizar. Los productos de la digestión se volvieron a dializar frente al tampón TEC y se sometieron a una segunda etapa de cromatografía de afinidad en Ni-NTA, de modo que la cola de histidinas y la proteína no hidrolizada quedaron retenidas en la columna mientras que la proteína sin cola se eluyó en las primeras fracciones. Las diferentes etapas de la purificación así como la pureza final fueron controladas mediante electroforesis en gel de poliacrilamida (SDS- 77 page) al 16 %. Además, la pureza de la proteína (superior al 99%) y su correcto peso molecular se comprobaron mediante espectrometría de masas en el Centro de Instrumentación Científica de la Universidad de Granada. Para su almacenamiento, las proteínas se concentraron hasta 3 mg·mL-1 y se conservaron a 4ºC para su uso inmediato, ya que el proceso de congelar/descongelar provoca la aparición de agregados en las muestras. 2.1.4. Dominios WW de hNedd4 y su construcción en tándem Los genes que codifican los dominios WW3 y WW4 de la ligasa de ubiquitina humana Nedd4 (código P46934 de la base de datos SwissProt/TrEMBL) fueron construidos en nuestro laboratorio mediante el método de la reacción en cadena de la polimerasa (PCR) a partir de cuatro oligonucleótidos solapantes. La secuencia resultante se diseñó para que cada secuencia de nucleótidos que codifica los dominios WW esté situada entre dos dianas de las enzimas de restricción NcoI y HindIII. El producto de la PCR se digirió con dichas enzimas y se clonó en el plásmido pETM30 (G. Stier, EMBL, Hidelberg, Alemania). En el caso de los genes que codifican los dominios WW1 y WW2 y las construcciones en tándem WW1WW2; WW3WW4; WW2WW3WW4 y WW1WW2WW3WW4 fueron adquiridos en la empresa GENEART AG (Regensburg, Alemania) y reclonados en los vectores pETM30 (construcciones WW1, WW2, WW1WW2 y WW1WW2WW3WW4) y en pETM11 (construcciones WW3WW4 y WW2WW3WW4) en nuestro laboratorio. La identidad e integridad de los genes clonados fueron confirmadas mediante secuenciación de nucleótidos por el Servicio de Secuenciación del Instituto de Parasitología y Biomedicina “López Neyra” del Consejo Superior de Investigaciones Científicas (CSIC), en Granada. Los genes de todos los dominios WW y sus construcciones en tándem fueron expresados en células E. Coli BL21-DE3 (NOVAGEN) como proteínas de fusión a Glutatión-S-Transferasa (GST) (en el caso de las construcciones clonadas en pETM30) y a una cola de histidinas (6xHis Tag) en el extremo N-terminal, con un sitio de reconocimiento para la proteasa TEV. Para inducir la expresión se añadió IPTG 1mM cuando la densidad óptica de los cultivos a 600 nm alcanzó un valor entre 0.6 y 0.8. Las células se recogieron por centrifugación a 7000 rpm y 4ºC durante 10 minutos (centrífuga HETTICH modelo Roto Super 40, rotor A6.9) y 78 Materiales y Métodos posteriormente se resuspendieron en tampón fosfato sódico 50 mM, cloruro sódico 0.3 M, pH 8.0 (Tampón de Equilibrado de Columna; TEC). Las células resuspendidas fueron lisadas mediante prensa French (AMINCO) a una presión de 1200 psi y a continuación se ultracentrifugaron (BECKMAN Optima LE-80, rotor 45Ti) a 30000 rpm, durante 30 minutos y a 4ºC. El sobrenadante resultante se pasó por una columna de afinidad con 5 mL de resina Ni-NTA (QUIAGEN) previamente equilibrada con 50 mL de TEC y se llevaron a cabo sucesivos lavados de 50 mL de TEC con distintas concentraciones de imidazol (0, 20 mM y 50 mM). Por último, la proteína se eluyó con 50 mL de TEC con imidazol 500 mM. Las fracciones que contenían la proteína se dializaron frente al tampón recomendado para la hidrólisis con la proteasa TEV (50 mM Tris-HCl, 0.5 mM EDTA, 1 mM DTT, pH 8.0) y se incubó durante toda la noche a temperatura ambiente con 1 µL de proteasa TEV por cada mL de disolución de proteína por hidrolizar. Los productos de la digestión se volvieron a dializar frente al tampón TEC y se sometieron a una segunda etapa de cromatografía de afinidad en Ni-NTA, de modo que la cola de histidinas, la proteína no hidrolizada, la propia TEV y la GST (en el caso de las proteínas clonadas en pETM30), quedaron retenidas en la columna mientras que la proteína sin cola de histidinas (y sin GST en su caso) se recogió en las primeras fracciones de elución. Las diferentes etapas de la purificación, así como la pureza final, fueron controladas mediante electroforesis en gel de poliacrilamida (SDS-page) al 16 %. Aquellas fracciones que contenían alguna impureza se sometieron a una etapa adicional de cromatografía de exclusión molecular utilizando una columna Hi-Load Superdex-75 26/60 (AMERSHAM BIOSCIENCES) para los dominios WW individuales, o Hi-Load Superdex-200 26/60 (GE Healthcare) en el caso de las construcciones en tándem, equilibradas en TEC. Finalmente, la pureza de la proteína (superior al 99%) y su correcto peso molecular se comprobaron mediante espectrometría de masas. Las fracciones de las proteínas purificadas se concentraron hasta 2-3 mg·mL-1, se congelaron en nitrógeno líquido y se almacenaron a -80ºC. En estas condiciones, las proteínas son estables durante varios meses. 79 2.1.5. Obtención de mutantes del dominio SH3 de cSrc y de la construcción en tándem de cAbl Para la obtención de los mutantes del dominio SH3 de cSrc y de la construcción en tándem de cAbl se ha utilizado el método de mutagénesis dirigida QuikchangeSite-Directed Mutagenesis Kit (STRATAGENE), que permite realizar mutaciones (puntuales y múltiples) en un plásmido de cadena doble (pET15b para los mutantes del dominio SH3 de cSrc y pETM11 para la construcción en tándem de cAbl) de forma sencilla y con más de un 80% de eficacia. Los oligonucleótidos cebadores se diseñaron de acuerdo con la mutación deseada de forma que fuesen complementarios entre sí y con la cadena doble del plásmido, y con longitudes aproximadas de 30 a 40 bases, de modo que su temperatura de fusión (Tf) oscilase entre 73 y 78ºC, ya que elevadas Tf favorecen altas temperaturas de anillamiento (Ta). La Tf de los oligonucleótidos en este caso se estimó de acuerdo con la siguiente ecuación empírica: (2.1.1) donde N es el número total de bases del oligonucleótido y %G/C es el tanto por ciento de Guaninas y Citosinas. Además, se intenta que el triplete que codifica la mutación esté siempre lo más centrado posible en la secuencia del oligonucleótido y que corresponda con el triplete con mayor propensión en E. Coli. La PCR fue diseñada según las recomendaciones del método QuikchangeSite-Directed Mutagenesis Kit (STRATAGENE), que se ilustra en la Figura 2.1. Figura 2.1. Esquema general de los ciclos programados para la realización de las PCRs llevadas a cabo en este trabajo. Debido a la dificultad que presentó la clonación de algunos de los mutantes del dominio SH3 de cSrc como F86L, F86W, L108I, L108V, 80 Materiales y Métodos W119L e I132V, esta se encargargó al laboratorio del Dr. Peter Liu (TOP Gene Technologies, Quebec, Canadá). La purificación de los mutantes procedentes del dominio SH3 de cSrc y del tándem de cAbl se llevó a cabo siguiendo los protocolos anteriormente descritos para las respectivas especies silvestres (Sección 2.1.1 y Sección 2.1.3). 2.2. Preparación de las muestras 2.2.1. Preparación y determinación de las concentraciones de las disoluciones de proteína Las disoluciones tampón empleadas en este trabajo se prepararon a partir de las formas ácida y básica del sistema tamponante, como en el caso del tampón fosfato o añadiendo hidróxido sódico y ácido clorhídrico hasta ajustar al pH deseado para preparar, por ejemplo, los tampones de Pipes e imidazol. Las alícuotas de proteína se dializaron frente a un volumen de tampón unas 500 ó 600 veces mayor que el de la muestra, para lo que se introdujeron en una membrana de diálisis de SPECTRA-POR con un tamaño de poro de 3.5 kDa en el caso del dominio SH3 de cSrc y sus variantes, el dominio SH3 de cAbl y los dominios WW de hNedd4; en el caso de la construcciones en tándem de cAbl y hNedd4 el tamaño de poro usado fue de 12 kDa. Las proteínas se mantuvieron como mínimo el tiempo necesario para alcanzar el equilibrio de la diálisis (unas 8 horas en el caso de las membranas utilizadas) a 4ºC con agitación suave. Transcurrido ese tiempo, se realizó un cambio de tampón de diálisis por tampón fresco, manteniéndose entre 8 y 12 horas aproximadamente en las mismas condiciones de agitación y temperatura. A continuación se extrajo la disolución dializada de proteína de la bolsa de diálisis y se centrifugó (HETTICH zentrifugen EBA 12) a 14000 rpm, a 4ºC durante 10 minutos para eliminar posibles agregados. La determinación de la concentración de las diferentes proteínas se llevó a cabo midiendo la absorbancia a 280 nm y empleando la absortividad molar que aparece en la Tabla 2.1. Los coeficientes de absortividad molar fueron calculados empleando el método de Gill y von Hippel (Gill and von Hippel 1989). 81 Tabla 2.1. Coeficientes de absortividad molar a 280 nm determinados para las proteínas presentes en este trabajo. Proteína Coeficiente de absortividad molar (M-1·cm-1) cSrc-SH3 (+mutantes)* 16500 cAbl-SH3 16800 cAbl SH3SH2 31400 cAbl SH3SH2-C2Q(+mutantes) 39880 cSrc SH2SH3 31400 cSrc SH3SH2-C2Q 36900 hNedd4 WW1 13980 hNedd4 WW2 13980 hNedd4 WW3 11380 hNedd4 WW4 12490 hNedd4 WW1WW2 36440 hNedd4 WW3WW4 23940 hNedd4 WW2WW3WW4 37470 hNedd4 WW1WW2WW3WW4 59930 *Todos los mutantes del dominio SH3 de cSrc tienen el mismo coeficiente de absortividad molar, exceptuando aquéllos en los que está implicado un aminoácido aromático en la mutación como es el caso de los mutantes cSrc-SH3 F86W y W119L, para los que el coeficiente de absortividad molar es 22460 y 10810 M-1·cm-1 respectivamente. 82 Materiales y Métodos 2.2.2. Preparación y determinación de las concentraciones de las disoluciones de ligando Los ligandos peptídicos empleados para los estudios de interacción fueron adquiridos de las casas comerciales JPT (Berlín, Alemania) y Peptide 2.0 (Virgina, Estados Unidos). Para aumentar la estabilidad de los péptidos, éstos se encuentran acetilados y amidados en sus extremos carbono y nitrógeno terminal, respectivamente, ya que de este modo se reduce la carga neta además de imitar cómo se encontrarían realmente los péptidos dentro de la célula. Todos los ligandos de poliprolina con los que hemos trabajado poseen un resto de tirosina en su secuencia, exceptuando el ligando VSL12. Para este ligando, sin cromóforos en su secuencia, hubo que preparar, en primer lugar, una disolución madre muy concentrada (generalmente 5 mg·mL-1) en agua. La concentración exacta de esta disolución se determinó mediante análisis cuantitativo de aminoácidos en el Centro de Investigaciones Biológicas del CSIC en Madrid. A continuación determinamos el coeficiente de extinción molar en agua midiendo la absorbancia a 220 nm para un conjunto de diluciones preparadas por duplicado a partir de la disolución madre concentrada. Representando los valores de absorbancia corregida frente a la concentración de cada dilución obtenemos una línea recta de cuya pendiente determinamos el valor del coeficiente de absortividad molar en agua. El valor de absortividad molar obtenido para VSL12 es 19400 M1 ·cm-1. Para las disoluciones del resto de ligandos que presentan un cromóforo en su secuencia (RLP2, p41, p53bp2, UGR-1 y ÉbolaA) se prepararon disoluciones madre de 5-8 mg·mL-1 en agua y a partir de esta disolución se prepararon, añadiendo las cantidades necesarias de agua y tampón de diálisis, las disoluciones finales a la concentración deseada para cada experimento, corrigiendo posteriormente el pH. Las concentraciones de estos péptidos se determinaron mediante medidas de absorbancia a 274 nm considerando un coeficiente de absortividad molar de 1400 M-1·cm-1 para el aminoácido de tirosina. 83 2.3. Espectroscopía de fluorescencia 2.3.1. Introducción La espectroscopía de fluorescencia puede emplearse para el estudio de procesos de unión de ligandos a las proteínas gracias a la alta sensibilidad del triptófano a los cambios en su entorno próximo, de tal manera que la unión de un ligando hace que se observen cambios en el espectro de emisión. En algunas ocasiones dichos ligandos poseen fluorescencia propia, que puede cambiar cuando se unen a una proteína (Daniel and Weber 1966; Anderson and Weber 1969; Condie and Quay 1983). Sin embargo, el proceso de unión de ligandos se puede seguir aún cuando éstos carezcan de fluorescencia propia, ya que la unión de ligandos a proteínas normalmente induce cambios en la estructura tridimensional de las mismas que, si dan lugar a una alteración del entorno de algún fluoróforo, provocarán cambios en los espectros de fluorescencia. Todos estos cambios en la emisión de fluorescencia a una longitud de onda determinada pueden emplearse para obtener la constante de unión de un determinado proceso. En nuestro caso, las medidas de fluorescencia realizadas nos han sido de gran utilidad para obtener una estimación inicial de la constante de disociación (Kd) de los diferentes ligandos peptídicos (sintéticos y naturales) a los dominios SH3 y WW, sus construcciones en tándem y algunos mutantes, siguiendo las variaciones en la intensidad de fluorescencia y el desplazamiento del máximo de longitud de onda de los triptófanos presentes en estos dominios. 2.3.2. Experimentos de titulación espectroscopía de fluorescencia proteína-ligando mediante Las medidas de fluorescencia se han realizado en un espectrofluorímetro Cary Eclipse (VARIAN, Inc). Para determinar las diferentes constantes de disociación (Kd), se realizaron una serie de experimentos de titulación por adición de volúmenes variables de disoluciones de los diferentes péptidos empleados en este trabajo sobre las diferentes disoluciones de proteínas. Los experimentos se llevaron a cabo preparando una disolución madre de proteína de una concentración no inferior a 50 µM, dializada frente al tampón de diálisis correspondiente al doble de la concentración requerida para el experimento. Por otro lado, y 84 Materiales y Métodos como se ha descrito en la Sección 2.2.2, se preparó una disolución madre de péptido a una concentración entre 5 y 8 mg·mL-1 en agua. A partir de estas disoluciones madre de proteína y de ligando se prepararon, añadiendo las cantidades necesarias de agua y de tampón de diálisis, dos disoluciones con concentraciones finales de 20 µM de proteína y 1.8 mM de ligando. El espectro de la proteína libre se obtuvo utilizando una cubeta de cuarzo para fluorescencia de 3 mm, de pequeño volumen de muestra y termostatizada a 25ºC, en la que se introdujeron 120 µL de la disolución de proteína. A este volumen se le adicionaron progresivamente, mediante jeringas Hamilton de alta precisión, volúmenes crecientes (entre 0.5 y 25 µL) de la disolución de ligando. Tras cada adición, la disolución de muestra se homogeneizó y posteriormente se registraron los espectros de emisión de fluorescencia. Para los ligandos usados en los experimentos de fluorescencia que contienen restos de tirosina en su secuencia, se realizaron experimentos adicionales en los que se recogieron los espectros de fluorescencia, añadiendolos mismos volúmenes de ligando, de una disolución de tampón que se utilizó como blanco para el análisis. Todos los espectros de emisión se registraron a 25ºC, entre 300 y 500 nm, utilizando una longitud de onda de excitación de 280 nm, y rendijas de excitación y emisión entre 5 y 10 nm (en el caso de las construcciones en tándem de hNedd4). 2.3.3. Análisis de un experimento de titulación proteína-ligando mediante espectroscopía de fluorescencia Una vez sustraída la fluorescencia intrínseca del ligando, se normalizó cada espectro por la concentración total de proteína en la cubeta (MT), teniendo en cuenta la dilución de ésta tras cada adición de ligando. De este modo, la señal de intensidad de fluorescencia en cada medida del experimento de titulación viene dada por: (2.3.1) donde Fi,n se refiere a la intensidad de fluorescencia corregida por la fluorescencia debida al ligando y normalizada por la concentración total de proteína (o al área, según el análisis que empleemos); FM es la intensidad de fluorescencia de la proteína libre; FML la intensidad de 85 fluorescencia del complejo ML, y la fracción de saturación en cada punto de la titulación, que se define como: donde MT y LT son las concentraciones totales de proteína y ligando respectivamente. Sustituyendo 2.3.2 en 2.3.1, podemos obtener la ecuación correspondiente al modelo para un sitio de unión al cual se ajustan los datos experimentales: Para el análisis de los datos experimentales lo más frecuente es hacer uso, bien de la intensidad de fluorescencia en el máximo del espectro de emisión de la proteína libre (en nuestro caso 340 nm), o bien del área bajo la curva del mismo espectro. Si representamos cualquiera de éstas frente a la concentración de ligando total en la cubeta (LT) obtenemos la curva característica de unión. Sin embargo, en nuestro caso, hemos observado que para algunos ligandos además de producirse un cambio en la intensidad de fluorescencia también se produce un desplazamiento en la longitud de onda del máximo de emisión. De este modo, para poder analizar los datos hemos utilizado el centro de masas espectral (Mohana-Borges et al. 1999), el cual se define como: donde es el centro de masas en números de onda (cm-1) y Fi es la . Empleando este fluorescencia emitida para cada número de onda método de análisis se consideran simultáneamente tanto los cambios en la intensidad como los desplazamientos en longitud de onda del máximo de emisión tras cada adición de ligando. Si representamos el centro de masas , frente a la concentración de ligando total en la cubeta (LT) obtenemos igualmente la curva de unión, de cuyo ajuste por regresión no lineal de mínimos cuadrados de los puntos que definen dicha curva, empleando la ecuación 2.3.3, podemos obtener el valor de la constante de disociación (Kd). 86 Materiales y Métodos 2.4. Calorimetría Diferencial de Barrido 2.4.1. Introducción La Calorimetría Diferencial de Barrido (Differential Scanning Calorimetry, DSC) es actualmente la técnica más completa para caracterizar la energética de plegamiento-desplegamiento de las proteínas. En general, con esta técnica se estudian los cambios conformacionales inducidos por la temperatura en proteínas, ácidos nucléicos y membranas lipídicas (Sanchez-Ruiz 1995; Cobos et al. 2001; Dragan and Privalov 2002; Garcia-Mira et al. 2002; Ruiz-Sanz et al. 2004; Privalov and Dragan 2007; Streicher and Makhatadze 2007; Candel et al. 2008; Varela et al. 2009; Johnson 2013). Un calorímetro diferencial de barrido registra la capacidad calorífica aparente de una disolución de macromolécula en función de la temperatura. El posterior análisis del termograma, utilizando modelos basados en la termodinámica del equilibrio, puede proporcionar la caracterización termodinámica completa del proceso de desplegamiento térmico de dicha macromolécula. Esto permite obtener la capacidad calorífica parcial absoluta del sistema en función de la temperatura, así como los parámetros termodinámicos asociados, tales como el cambio de entalpía, ΔHD, de entropía, ΔSD, de energía de Gibbs, ΔGD, y de capacidad calorífica, ΔCp, correspondientes a la transición inducida por la temperatura, así como la función de partición y la población de los estados predominantes en los que se encuentra el sistema y sus parámetros termodinámicos característicos. El modelo de equilibrio más simple que existe para el análisis del desplegamiento térmico de proteínas es el modelo de dos estados, el cual supone que las proteínas sólo pueden encontrarse en estado nativo o en estado desplegado. Otros modelos pueden suponer la existencia de intermedios de plegamiento significativamente poblados y/o estados con diferentes grados de asociación (Luque et al. 2002). 87 Figura 2.2. Información contenida en una traza de Calorimetría Diferencial de Barrido (DSC). En trazo continuo negro se representa, a modo de ejemplo, la curva de capacidad calorífica en función de la temperatura del domino N-terminal del represor R69 del fago 434 en acetato sódico 20 mM a pH 4.5 (Ruiz-Sanz et al. 1999). Cp,N y Cp,D representan las capacidades caloríficas de los estados nativo y desnaturalizado en rojo y azul, respectivamente. La Tm corresponde a la temperatura del máximo del pico de la transición. La curva sigmoidal en color naranja representa la función de la capacidad calorífica interna. El área bajo la transición, con rayas naranjas, corresponde al cambio total de entalpía para la temperatura de desnaturalización, ∆Hm,exp o entalpía calorimétrica. En la Figura 2.2 se ha representado un ejemplo de una endoterma de desplegamiento térmico de una proteína con los principales parámetros que pueden determinarse a partir de un análisis calorimétrico. La temperatura del máximo del pico de la transición, Tm, corresponde a la temperatura donde el 50% de las moléculas de proteína se encuentran desnaturalizadas en el caso de una transición de dos estados sin ningún tipo de proceso acoplado de asociación o disociación. El calor de la transición o entalpía calorimétrica correspondiente a la temperatura Tm, ΔHm,exp, es el área de la curva de capacidad calorífica. Las líneas base de pre- y post-transición son las funciones de las capacidades caloríficas dependientes de la temperatura para el estado nativo, Cp,N, y para el estado desplegado, Cp,D, de la proteína. La diferencia entre estas funciones, ΔCp,N-D, es el cambio de capacidad calorífica asociado a la desnaturalización de la proteína. A partir de estos parámetros, se completa la caracterización termodinámica del desplegamiento mediante distintas relaciones matemáticas, de acuerdo con el modelo de equilibrio utilizado para el análisis, pudiendo determinarse parámetros como: el 88 Materiales y Métodos cambio de entalpía, ΔHN-D (T), de entropía, ΔSN-D (T), la energía de Gibbs, ΔGN-D (T), la temperatura máxima de estabilidad, Ts, la temperatura de inversión de entalpía, TH, etc. Una descripción más detallada de los fundamentos y características de esta técnica se puede encontrar en algunas tesis doctorales desarrolladas en nuestro grupo de investigación (Cobos 2002; Casares 2003; Candel 2008), y en numerosas referencias bibliográficas (Sturtevant 1977; Privalov 1979; Privalov 1982; Mateo et al. 1984; Cooper and Johnson 1994a; Freire 1995; Sanchez-Ruiz 1995; Martinez JC 2011). 2.4.2. Realización del experimento calorimétrico Para la realización de todos los experimentos de DSC llevados a cabo en este trabajo se ha empleado un microcalorímetro Cap-DSC (Capillary cell microcalorimeter de MICROCAL INC.), el cual nos permite medir la capacidad calorífica de forma continua, calentando o enfriando a velocidad constante, midiendo la diferencia de capacidad calorífica entre dos células lo más parecidas posible y que contienen la disolución de la muestra objeto de estudio (célula de muestra) y una disolución de referencia (célula de referencia). El experimento calorimétrico se inicia llenando ambas células con el tampón filtrado y desgasificado procedente del último cambio de diálisis y registrando varios barridos de temperatura, para asegurarnos de que éstos son reproducibles. Estas trazas corresponden a la denominada línea base instrumental. A continuación, se llena la célula de muestra con la disolución de proteína y la célula de referencia con la disolución tampón. Una vez que se han llenado ambas células, se realiza el primer barrido de temperatura de la muestra manteniendo las mismas condiciones experimentales. Posteriormente, se realiza un segundo barrido de temperatura de la muestra sin extraer la proteína del calorímetro para comprobar la reversibilidad del proceso de desplegamiento. 2.4.3. Cálculo de la capacidad calorífica molar parcial de la proteína Los ficheros generados por el programa de adquisición de datos del calorímetro contienen el valor de una señal proporcional a la variación de la capacidad calorífica de la disolución de proteína con la temperatura. Con el fin de obtener una caracterización termodinámica completa (Tm, 89 ΔHm,exp, ΔCp,N-D, etc), es necesario realizar un tratamiento de los datos obtenidos. El primer paso es sustraer la línea base instrumental al primer y segundo barrido de temperatura de la disolución de proteína. Así se obtiene la dependencia de la capacidad calorífica aparente de la proteína con la temperatura (Cp,ap), eliminando las posibles contribuciones instrumentales a la capacidad calorífica. A continuación, se expresan los datos brutos (potencia eléctrica frente a temperatura) en términos de capacidad calorífica molar mediante la siguiente ecuación: donde υ es la velocidad de barrido de temperatura, c la concentración de proteína de la disolución y V el volumen de la célula del calorímetro. Existe una diferencia de capacidad calorífica aparente entre la línea base instrumental y el barrido de temperatura de la muestra debido a la diferencia en capacidad calorífica entre la proteína y las moléculas de agua que la proteína desplaza en la disolución. La capacidad calorífica de estas moléculas de disolvente desplazadas presenta un valor mucho mayor que el de las moléculas de la muestra y por tanto, esta diferencia es generalmente negativa. Para corregir este efecto en los datos obtenidos de Cp,ap, debido a la sustracción de la línea base, se obtiene la capacidad calorífica molar parcial, Cp,p: La diferencia de capacidad calorífica aparente, ΔCp,ap, se puede expresar como: donde Δms son las moléculas del disolvente sustituidas, Cp,s la capacidad calorífica del disolvente, mp la masa de la proteína en la célula de muestra y, υp y υs los volúmenes parciales específicos del disolvente y la proteína, respectivamente. Cuando el disolvente es un tampón acuoso diluido, se utilizan los valores del agua pura (1mL·g-1 y 4.186J·K-1·g-1, para el υs y la Cp,s respectivamente) y un valor de 0.73 g·mL-1 para υp, que corresponde a proteínas globulares. Por lo tanto, para convertir Cp,ap en Cp,p, la transformación que se utiliza es: 90 Materiales y Métodos (2.4.4) donde Pm es el peso molecular de la proteína. Además, la medida se ve afectada por un tiempo de respuesta conocido del bloque térmico del instrumento (τ), debido a que la transferencia de calor que se produce en las células del calorímetro no es instantánea. Este desfase temporal entre el calor producido y la señal registrada afecta y distorsiona los termogramas obtenidos, por tanto, es importante corregir el efecto del tiempo de respuesta en el calorímetro (Mayorga et al. 1987): donde ν es la velocidad de barrido de la temperatura. Todas las operaciones de normalización los datos brutos de DSC, hasta obtenerlos en calorífica molar parcial, han sido realizadas MicroCalOrigin, versión 7.0 (Microcal Massachusetts). y tratamiento previo de unidades de capacidad mediante el programa LLC. Northampton, 2.4.4. Análisis de las trazas calorimétricas según la termodinámica de equilibrio. El modelo de equilibrio de dos estados Del análisis de la capacidad calorífica molar parcial de la proteína como una función de la temperatura se pueden obtener los parámetros termodinámicos del proceso de desnaturalización térmica. Para ello, una vez comprobado que dicho proceso es reversible, aplicaremos un modelo de equilibrio. El modelo de equilibrio de dos estados es el modelo más sencillo que se puede utilizar, según el cual, durante el proceso de desplegamiento de la proteína sólo existen dos estados poblados en el equilibrio, que son el estado nativo (N) y el estado desnaturalizado (D). A continuación se describe este modelo que ha sido el utilizado para el análisis de los termogramas. Así, para el equilibrio: La constante de equilibrio aparente par el desplegamiento viene dada por: 91 (2.4.6) La función de partición del sistema se define como: (2.4.7) A partir de la función de partición pueden calcularse las poblaciones de los estados N y D: La entalpía molar parcial del sistema será: donde ∆HD es la diferencia de entalpía de desplegamiento, ∆HD=HD–HN. De esta manera, la capacidad calorífica molar parcial, Cp, se define como: donde Cp,N es la capacidad calorífica molar parcial del estado nativo. Si ahora expresamos las dependencias de KD, ∆HD y ∆SD con la temperatura empleando las relaciones de Kirchhoff y van’tHoff, nos queda: donde , siendo ∆GD la diferencia de energía de Gibbs entre el estado desplegado y el nativo. La ecuación 2.4.11 puede escribirse entonces como: 92 Materiales y Métodos Según los trabajos de Privalov y colaboradores, la función que describe el cambio de capacidad calorífica de desplegamiento de una proteína no es constante, sino que presenta una dependencia no lineal de la temperatura. La función de la capacidad calorífica de una proteína desplegada se puede estimar a partir de su secuencia aminoacídica (Makhatadze and Privalov 1990; Privalov and Makhatadze 1990). Así, la función Cp,D(T), que es la capacidad calorífica molar parcial del estado desnaturalizado, puede describirse como un polinomio de segundo grado. Por otro lado, la función que describe la capacidad calorífica molar parcial del estado nativo Cp,N (T), es prácticamente lineal en el intervalo antes de la transición (Privalov et al. 1989). Así, se obtienen las siguientes ecuaciones para Cp,D, Cp,N y ∆Cp: (2.4.16) (2.4.17) (2.4.18) Para obtener las dependencias de ∆HD y ∆SD con la temperatura integramos las ecuaciones 2.4.12 y 2.4.13: (2.4.19) (2.4.20) donde ∆Hm y ∆Sm son los incrementos de entalpía y entropía de desplegamiento a la temperatura de la transición (Tm). Esta temperatura de transición es aquella a la que fD se hace igual a 0.5, ∆GD se anula y por lo tanto KD se hace igual a 1. En ese punto, el cambio de entropía a la temperatura Tm, ∆Sm, se puede obtener según la ecuación siguiente: 93 Si integramos las ecuaciones de ∆HD(T) y de ∆SD(T) con respecto a la temperatura, obtenemos: (2.4.22) (2.4.23) (2.4.24) Para los ajustes no lineales por mínimos cuadrados de las curvas de Cp se ha utilizado la ecuación del modelo de dos estados 2.3.14, implementada en el programa Origin 7.0 (Microcal Software Inc.). Pero antes es preciso definir todas las magnitudes de las que depende Cp en dicha ecuación en función de la temperatura (2.3.16 a 2.3.18 y 2.3.22 a 2.3.24). De esta manera la Cp queda expresada en función de la temperatura y una serie de parámetros, de cuyo ajuste obtenemos los valores de Tm, ∆Hm, y las dependencias de Cp,N y Cp,D con la temperatura. A partir de aquí, se puede completar la caracterización termodinámica de la proteína calculando las funciones ∆HD (T), ∆SD(T), ∆Cp(T), ∆GD (T). 2.5. Calorimetría Isotérmica de Titulación 2.5.1. Introducción La Calorimetría Isotérmica de Titulación (Isothermal Titration Calorimetry, ITC) es una técnica que mide directamente el calor que se absorbe o se libera en cualquier proceso de interacción intermolecular, como es el caso de asociaciones proteína-ligando, proteína-proteína, etc. Los experimentos de ITC se realizan a presión y temperatura constantes, por lo que el calor medido durante la valoración equivale a la entalpía de este proceso (Wiseman et al. 1989). Si el efecto térmico y la magnitud de la constante de unión son lo suficientemente grandes, se pueden determinar parámetros tales como la constante de equilibrio de asociación, K, el cambio de entalpía de unión, ΔH, así como la estequiometría de la reacción, n. Como consecuencia, se pueden calcular la energía de Gibbs y la entropía de formación del complejo (ΔG y ΔS). Además, si se realizan los experimentos a diferentes temperaturas, es posible determinar el cambio en la capacidad calorífica del proceso ΔCp. 94 Materiales y Métodos Una descripción más detallada de los fundamentos y características de esta técnica se puede encontrar en algunas tesis doctorales desarrolladas en nuestro grupo de investigación (Casares 2003; Palencia 2008), y en varias referencias bibliográficas (Wiseman et al. 1989; Cooper and Johnson 1994b). 2.5.2. Diseño del experimento de ITC El diseño de los experimentos de interacción se lleva a cabo usando una de las plantillas de simulación desarrolladas en nuestro grupo de investigación. Para ello, se utilizan los valores de las constantes de disociación determinadas mediante espectroscopía de fluorescencia (Sección 2.3) o, en algunos casos, la información descrita en bibliografía (afinidad, estequiometría, etc.) y a continuación se optimizan las concentraciones de ligando y proteína necesarias. Para obtener un experimento de ITC adecuado, un parámetro muy útil es el producto K·[MT], cuyo valor debe estar entre 1 y 100, aunque el valor óptimo está entre 10 y 100, el cual es determinante para optimizar la forma de la curva isoterma de unión, que debe ser lo más sigmoidal posible. Dicha curva se obtiene representando el calor por mol de ligando añadido tras cada inyección frente a la relación entre la concentración de ligando total y la concentración de macromolécula total (considerando en este caso que el ligando está en la jeringa de inyección y la macromolécula en la célula de reacción). Otros parámetros utilizados para la optimización son el volumen de inyección y la concentración de ligando, los cuales, junto con la optimización del producto anterior, deben conseguir que se alcance una saturación elevada (por encima del 80%), indicando que casi la totalidad de la proteína que contiene la célula calorimétrica se encuentra unida al ligando (Jelesarov and Bosshard 1999; Velazquez-Campoy et al. 2004; Velazquez-Campoy and Freire 2006). En la Figura 2.3 se muestran las simulaciones de un experimento convencional de ITC, consistente en 20 inyecciones de 5 µL de una disolución de ligando 5 mM sobre un volumen Vc=1.347 mL, que corresponde al volumen de la célula de reacción, de una disolución de macromolécula 1.8·10-4 M, con un único sitio de unión para el ligando. Hemos considerado cuatro posibles valores de la constante de asociación, 2.5·106; 2.5·105; 2.5·104 y 2.5·103 M-1, que abarcan un intervalo desde una afinidad relativamente alta, hasta una afinidad baja. Como puede 95 observarse, cuando el producto de K·[MT] está dentro del intervalo adecuado (10-100) es fácil obtener una isoterma de unión de forma sigmoidal, lo que posibilita que el ajuste por regresión no lineal proporcione parámetros con errores estándar aceptables. Cuando el producto K·[MT] no es tan favorable, bien por tener una constante muy pequeña o muy alta, o bien porque la macromolécula sea poco soluble, no es fácil obtener la isoterma de unión completa (con forma sigmoidal) manteniendo constante el volumen de cada inyección, estas curvas de unión incompletas o sesgadas proporciona parámetros afectados por un elevado error y dependencia mutua. Por esta razón, nuestro grupo de investigación ha prestado especial atención al diseño de experimentos con un perfil de volúmenes de inyección utilizando diferentes volúmenes para cada punto de la valoración, siendo, en general, menores en las primeras inyecciones y aumentando progresivamente de forma no lineal. Otro beneficio de usar un perfil óptimo de volúmenes de inyección es la mejora de la relación señal/ruido en la parte final de la curva, donde los calores debidos a la unión del ligando a la proteína son muy pequeños. Generalmente, en un estudio termodinámico mediante ITC se deben obtener dos termogramas; uno correspondiente a la titulación de la macromolécula con el ligando y un segundo de titulación del ligando con el tampón de diálisis. Este último, representa los calores de la dilución del ligando y los posibles artefactos de inyección que deben sustraerse del termograma principal para obtener los efectos térmicos netos de la interacción macromolécula-ligando. 96 Materiales y Métodos Figura 2.3.Simulación del calor por mol de ligando añadido asociado a cada inyección para un experimento de ITC con los siguientes parámetros experimentales: VC=1.347 mL; [M] inicial en célula de 1.8·10-4 M; 20 inyecciones de 5 μL; [L] en la jeringa de inyección de 5 mM; un solo sitio de unión para el ligando, n de 1 y cuatro posibles valores de la constante de asociación, 2.5·106, 2.5x105, 2.5x104 y 2.5x103 M -1. 2.5.3. Realización de los experimentos de ITC Los experimentos de ITC se han realizado indistintamente utilizando dos microcalorímetros isotérmicos de titulación VP-ITC (MICROCAL INC., Northampton, MA) y MicroCal ITC 200 (GE Healthcare). Las alícuotas de las proteínas se dializaron frente al tampón de diálisis al doble de la concentración requerida para el experimento. Las disoluciones ya dializadas fueron filtradas y desgasificadas para evitar la formación de burbujas, y equilibradas a la temperatura experimental. La disolución de proteína en la célula de muestra fue titulada con el ligando apropiado disuelto en el tampón de diálisis. Las concentraciones de proteína y ligando para cada experimento variaban en función de la constante de unión obtenida anteriormente por espectrometría de fluorescencia, estando éstas entre 10 y 40 µM para las proteínas y entre 0.5 y 3 mM para los ligandos. Los experimentos de titulación se realizaron o bien inyectando un volumen constante de la disolución de ligando cuando las constantes de unión eran relativamente elevadas o usando un perfil de volúmenes de inyección desde 2 hasta 20 µL para poder definir mejor la curva de titulación. De estos experimentos se obtiene el termograma correspondiente a la interacción. Del mismo modo, fue necesario obtener el termograma de la dilución por lo que se tituló el ligando sobre la 97 disolución tampón en ausencia de proteína, utilizando el mismo perfil de volúmenes. 2.5.4. Formulación y análisis de los experimentos de ITC El análisis de las isotermas se realizó mediante el ajuste no lineal por mínimos cuadrados de acuerdo con los modelos de unión de un ligando a una macromolécula con “n” sitios idénticos e independientes o “m” sitios diferentes e independientes, dependiendo del tipo de unión del ligando a la macromolécula. Todos los ajustes de las curvas a los diferentes modelos se realizaron con el programa Origin 7.0 para ITC. 2.5.4.1. Modelo de unión de un ligando a una macromolécula con “n” sitios idénticos e independientes En aquellos casos en los que ni aparece un efecto cooperativo ni la proteína presenta diferentes clases de sitios de unión para el ligando, el comportamiento del sistema interaccionante se describe adecuadamente a través del modelo de unión de un ligando a una macromolécula con “n” sitios idénticos e independientes. El término “idénticos” implica la misma constante de unión microscópica a cualquiera de los “n” sitios, y el término “independientes” que la unión a un sitio cualquiera no modifica la afinidad de los restantes. M + nL MLn El análisis termodinámico estadístico de un proceso de unión con estas características nos demuestra que la función de partición de unión (Z), que describe las poblaciones de los diferentes estados moleculares accesibles del sistema, es: (2.5.1) donde K es la constante de equilibrio por sitio de unión, [L] la concentración de ligando libre y n es el número de sitios de unión de la macromolécula para el ligando. La razón de la concentración de ligando unido, [L]b, con la concentración de macromolécula total, [M]T, conocida está relacionada con la función de como parámetro de unión partición de unión por: 98 Materiales y Métodos donde [L] representa la concentración de ligando libre en equilibrio con las otras especies moleculares que interaccionan en dicho sistema (M, ML, ML2,…, MLn). Un experimento convencional de ITC está constituido por una serie de inyecciones de un determinado volumen de disolución de ligando, constante o variable para cada inyección, separadas cada una por un intervalo de tiempo suficiente para asegurar que se ha alcanzado el equilibrio y se ha transferido o compensado todo el calor liberado o absorbido. En una inyección cualquiera “i” de la serie, el calor liberado o absorbido será: donde Lb representa el ligando unido y ∆Hap es el cambio de entalpía aparente por mol de ligando unido. Si Vc representa el volumen de la célula, que coincide con el volumen inicial de la muestra, la ecuación anterior puede expresarse más explícitamente como: (2.5.5) donde [L]b representa la concentración de ligando unido y [M]T la concentración de proteína en la célula. Si consideramos que el volumen efectivo que interviene en la reacción es aquel que llena la célula, entonces, las concentraciones de macromolécula y ligando actuales en la célula han de corregirse por el volumen desplazado fuera de la célula tras cada inyección. Así la concentración de macromolécula en la célula después de cada inyección i ([M]T,i= [M]+[ML]+[ML2]+…) será: y la concentración total del ligando en la célula de reacción: 99 donde Vin y [L]0 son el volumen de inyección y la concentración en jeringa del ligando. El calor total acumulado después de N inyecciones será: Durante el experimento el valor de la variable [L] no es conocida por lo que operativamente conviene expresarla en función de las variables experimentales [L]T y Q: Sustituyendo [L] en la ecuación 2.5.8 por la expresión 2.5.9 se obtiene una ecuación de segundo grado en Q cuya solución es: (2.5.10) Esta ecuación relaciona el calor total acumulado después de N inyecciones con las variables experimentales Vc, [L]T y [M]T y los parámetros n, K y ∆Hap a determinar en el análisis de los datos de un experimento de ITC convencional. Derivando la ecuación 2.5.10 respecto a [L]T obtendremos una expresión para el calor por mol de ligando añadido asociado a cada inyección: De acuerdo con estas ecuaciones, existen dos formas posibles de analizar los calores experimentales: una en la que se considera el calor por mol de ligando añadido asociado a cada inyección y otra en la que se contempla el calor acumulado. La primera, que es la que se ha utilizado 100 Materiales y Métodos en este trabajo, tiene la ventaja de evitar la propagación de errores experimentales debido a que se puede prescindir de los puntos con error para el análisis, mientras que en el caso de los calores acumulados no es posible. Por tanto, la ecuación 2.5.11 es la que hemos utilizado para el ajuste de los datos experimentales, mediante el módulo para calorimetría isotérmica de titulación del programa Origin 7.0 para ITC. Una vez corregida la línea base, el termograma neto se integra para obtener los calores correspondientes de cada inyección de la titulación y se normalizan por la concentración de ligando total en la célula tras cada inyección. Estos valores del calor transferido por mol de ligando añadido (dQi/dLT,i) representados frente al cociente [L]T/[M]T permiten obtener la isoterma de unión (Figura 2.4). Ajustando dicha curva a la ecuación 2.5.11 mediante regresión no lineal es posible obtener los parámetros n, K y ∆Hap de dicha interacción. El resto de parámetros termodinámicos que caracterizan la interacción se obtienen haciendo uso de las ecuaciones fundamentales ∆G = -RTlnK y ∆G = ∆H - T∆S. Figura 2.4. Dependencia del calor liberado tras la inyección de L a M frente al cociente concentración de ligando total/concentración de proteína total. Los círculos representan los datos experimentales y la línea el ajuste al modelo de “n” sitios de unión idénticos e independientes (ecuación 2.5.11). 101 2.5.4.2. Modelo de unión de un ligando a una macromolécula con “m” clases de sitios diferentes e independientes En este caso, cada clase de sitio de unión se define como sitios diferentes (no idénticos) e independientes de las otras clases para el mismo ligando. El término “sitios diferentes” implica una constante microscópica de equilibrio para cada clase de sitios, y el término “independiente” que la unión a un sitio cualquier no modifica la afinidad de los restantes. La formulación y el desarrollo matemático correspondiente para este modelo de unión, considerando que sólo existen dos clases diferentes de sitios (m=2), n1 y n2, se describe a continuación: Ln2 M+(n1+n2) L M Ln1 La relación de la concentración de ligando unido en cada sitio, [L]b,i, respecto a la concentración de macromolécula total, [M] T: El calor liberado o absorbido en una inyección cualquiera “j”, será: donde ∆Hap,ies el cambio de entalpía aparente por mol de ligando unido para una clase de sitio, i. Por tanto, se puede escribir como: (2.5.14) donde Vc representa el volumen de la célula o volumen inicial de la muestra y [M]T,j la concentración de proteína en la célula en la inyección “j”. Considerando el volumen efectivo de la célula, el volumen de inyección,Vin, y la concentración en jeringa del ligando [L]0, se corrigen la 102 Materiales y Métodos concentraciones de macromolécula, [M]T,j, y ligando, [L]T,i, mediante las siguientes ecuaciones: El calor acumulado después de N inyecciones será: Durante el experimento el valor de la variable [L] no es conocida por lo que operativamente conviene expresarla en función de las variables experimentales ligando unido total y el calor total acumulado Q(N): Sustituyendo y ordenando se obtiene la siguiente ecuación cúbica: (2.5.20) donde se definen: y cuya solución es: 103 (2.5.24) ahora, las expresiones A, B y C agrupan de nuevo los términos a, b y c como: La solución de la ecuación cúbica (2.5.24) nos permite calcular la concentración de ligando libre, [L], tras un número dado de inyecciones. Sustituyendo en la ecuación (2.5.18) se calculan los calores asociados a cada inyección a través de la siguiente ecuación: 104 Transmisión de información a través de efectos alostéricos en el dominio SH3 de cSrc Capítulo 3 CAPÍTULO 3.- Transmisión de información a través de efectos alostéricos en el domino SH3 de cSrc 3.1. Introducción Los dominios SH3 desempeñan un papel importante en los distintos mecanismos de transmisión de señales, por lo que presentan una afinidad de unión moderada que les permite formar complejos transitorios y una especificidad lo suficientemente precisa para discriminar entre sustratos. Durante la última década, nuestro grupo de investigación ha llevado a cabo un extenso análisis termodinámico de la interacción de diversos ligandos naturales y de diseño, con los dominios SH3 de cSrc, cYes y Fyn, con el fin de elucidar los mecanismos que determinan la afinidad y especificidad de unión de estos dominios. cSrc, cYes y Fyn, pertenecen a la familia de las quinasas de tirosina y presentan, en relación al dominio SH3, una identidad del 70% en su secuencia y una elevada homología estructural (Summy and Gallick 2003). A pesar de su alta homología y que el sitio de unión es una de las zonas más conservadas, el estudio termodinámico de la interacción de estos tres dominios con el péptido VSL12 revela diferencias muy significativas en los patrones termodinámicos de unión (Martin-Garcia 2009). El péptido VSL12, cuya secuencia es VSLARRPLPPLP, fue identificado mediante la técnica de expresión en fagos, une a los tres dominios con orientación tipo I y hasta la fecha es uno de los ligandos que presenta mayor afinidad para cualquiera de ellos (Feng et al. 1995). A pesar de su elevada afinidad, la caracterización termodinámica de su interacción con los dominios SH3 de cSrc, cYes y Fyn revela una gran variabilidad en las contribuciones entálpica y entrópica para los tres dominios SH3. Así, cSrc-SH3 se une a VSL12 con un cambio de entalpía muy inferior (20 kJ·mol-1 de diferencia) respecto a Fyn y cYes. Este hecho llama especialmente la atención si tenemos en cuenta que los tres dominios sólo difieren en un residuo en la región del sitio de unión. Con la intención de localizar los residuos responsables de esta diferencia entálpica y así identificar las causas del patrón termodinámico anómalo que presentan los dominios SH3, nuestro grupo de investigación realizó un completo análisis mutacional, donde se sustituyeron de forma sistemática en el dominio SH3 de cSrc todos los restos que difieren en cYes y Fyn. Este análisis reveló que las mutaciones en los residuos 109 cercanos al sitio de unión no provocaban cambios significativos en los parámetros termodinámicos de unión. Sin embargo, los mayores efectos estaban sorprendentemente asociados a las mutaciones en las zonas más alejadas del sitio de unión como en el lazo distal (H122R, R128E y R128K). Dado que tanto el sitio de unión como el ligando no han sido modificados, la variación de entalpía observada no debería de estar relacionada con cambios en las interacciones directas establecidas en la interfaz entre el ligando y el dominio. Tampoco es de esperar efectos asociados a la oclusión de moléculas de agua ni a un comportamiento diferente del ligando para adoptar la conformación en hélice de poliprolina II. Por tanto, la variación observada en los parámetros termodinámicos debería de tener fundamentalmente su origen en la propagación cooperativa de los cambios locales en la posición 128. Estudios de resonancia magnética nuclear han demostrado que cualquier cambio en las interacciones locales del dominio SH3 puede afectar al comportamiento global de la estructura y a la distribución de las poblaciones conformacionales, alterando sus propiedades al reconocer y unir ligandos (Casares 2003; Casares et al. 2007a; Casares et al. 2007b). Por tanto, se puede decir que las mutaciones introducidas en el lazo distal provocan una variación local de interacciones que se propagaría a lo largo del dominio. Esto afectaría a la variación de entalpía de unión al producirse diferentes fenómenos de reorganización, que se manifiestan en las diferencias detectadas en los parámetros termodinámicos de la unión a VSL12. Para determinar la existencia de dicha propagación se realizó un estudio de la influencia del ligando en la dinámica conformacional de los dominios y sus mutantes mediante simulaciones de dinámica molecular, permitiendo evaluar las variaciones en la dinámica conformacional y hacer un seguimiento a nivel molecular de la dinámica de las interacciones diferenciales en cada mutante, con el fin de racionalizar las diferencias observadas en los parámetros energéticos (Corbi-Verge 2012). Del análisis de las distintas trayectorias fue posible extraer información acerca de las interacciones (enlaces de hidrógeno y puentes salinos) intrae inter-moleculares en los distintos dominios y cómo éstas se veían afectadas por la unión del ligando. Este análisis pone de manifiesto que las mutaciones puntuales en la posición 128 inducen cambios significativos en las interacciones electrostáticas que afectan a la dinámica conformacional del dominio libre. 110 Capítulo 3 De igual modo, se han observado diferencias significativas en la red de enlaces de hidrógeno intramoleculares correspondientes a los complejos E128-Fyn/VSL12 y K128-cYes/VSL12 con respecto a R128cSrc/VSL12. En general, se observa que la red de enlaces de hidrógeno intramoleculares en el complejo silvestre difiere considerablemente de la observada para los complejos E128-Fyn/VSL12 y K128-cYes/VSL12, que son bastante similares entre sí. Como se había propuesto a partir de los resultados experimentales, las mutaciones en la posición 128 del lazo distal (R128E y R128K) inducen una reorganización de los puentes de hidrógeno que se propaga a través del dominio y que llega incluso a afectar a las interacciones que establece el dominio con el ligando. Esto indica que el reconocimiento de ligandos por parte de los dominios SH3 esconde una complejidad mayor que la descrita tradicionalmente, donde solamente se tenía en consideración la naturaleza hidrofóbica de la superficie de reconocimiento, jugando un papel determinante factores como el equilibrio conformacional del ligando y del propio dominio SH3, así como la reorganización inducida en las distribuciones conformacionales de ambos como consecuencia de la interacción. Con el fin de profundizar en el estudio de estos fenómenos cooperativos en dominios SH3, establecimos una colaboración con el Dr. Tom Lenaerts (Universidad Libre de Bruselas, Bélgica), quien ha desarrollado un método teórico para la predicción de redes cooperativas en proteínas a partir de la información estructural. La aplicación de esta metodología a los dominios SH3 de la familia Src ha permitido obtener información de relevancia sobre las redes cooperativas de transmisión de información, que ha sido validada experimentalmente como se describe a continuación. 3.2. Resultados y discusión 3.2.1. Identificación de la red de interacciones cooperativas en el dominio SH3 de cSrc El método teórico desarrollado por el Dr. Lenaerts, denominado MCIT (Raimondi et al. 2013), se basa en determinar cómo el acoplamiento conformacional de las cadenas laterales de los residuos de una proteína difiere entre el estado unido y libre. Haciendo uso de los datos estructurales disponibles en las bases de datos y utilizando la teoría de la información y, de un modo más específico, el concepto de información común (Shannon 1997), se puede identificar y cuantificar un 111 conjunto de residuos que interaccionan de forma cooperativa y cuya función es transmitir los cambios alostéricos a través de la estructura del dominio. Para comprender qué residuos se encargan de transmitir la señal de unión de un péptido a través de toda la estructura del dominio SH3 de cSrc, el Dr. Lenaerts ha aplicado éste método analizando las estructuras resueltas por Resonancia Magnética Nuclear (RMN), tanto del domino cSrc-SH3 libre, como unido al ligando RLP2 (RALPPLPRY) (Feng et al. 1994). Una descripción más detallada del método se puede encontrar en (Lenaerts et al. 2008; Lenaerts et al. 2009). Para cada par de residuos se mide el nivel de información común, es decir, la fuerza de acoplamiento entre dos residuos, normalmente en posiciones alejadas en la estructura. En la Figura 3.1 se observa que gran parte de los residuos no experimentan cambios significativos en su acoplamiento. Como era de esperar, la mayoría de efectos significativos ocurren a lo largo de los residuos del sitio de unión. Aunque el impacto de la unión del ligando no está distribuido de forma homogénea, algunos residuos como D99, W118, y Y136 experimentan cambios dinámicos significativos, mientras que hay residuos que muestran un efecto menor como el Y92 o casi nulo como el residuo Y90. Curiosamente, además de los residuos que están en contacto directo con el ligando, otros aminoácidos lejanos al sitio de unión también experimentan cambios en su acoplamiento conformacional con otros residuos de la estructura como son E106 y L108. Los residuos que experimentan un efecto alostérico mayor, denominados grupo informativo, se extraen de los datos de la matriz de la Figura 3.1 usando el algoritmo CAST (Ben-Dor et al. 1999) que genera una serie de elementos altamente acoplados basados en medidas de afinidad. Este grupo informativo se encuentra diferenciado por tres subconjuntos estructurales: 1) Los residuos que pertenecen al sitio de unión Y92, D99, W118 y Y136. Estos aminoácidos se encuentran altamente conservados y forman parte de los tres bolsillos hidrofóbicos situados en el sitio de unión de la mayoría de los dominios SH3. Se incluyen también en este grupo los restos D99 y D117. El residuo D99 tiene un papel importante a la hora de determinar la orientación de los ligandos de clase I y clase II respecto al sitio de unión del dominio SH3 de Src (Feng et al. 1994; Weng et al. 1995). El residuo D117, no forma parte 112 Capítulo 3 de los bolsillos hidrofóbicos pero establece contactos hidrofóbicos con la primera prolina del motivo de unión PxxP, así como con la leucina anterior. Por lo tanto, el residuo D117 puede considerarse dentro del grupo de residuos del sitio de unión, en contacto directo con el ligando. 2) Los residuos F86, L100, F102, L108, W119 e I132, localizados en el núcleo del dominio SH3 y 3) Los residuos que se encuentran expuestos en la superficie de la proteína T85, E106, N113, y H122. Figura 3.1. Matriz de cambios dinámicos. En esta matriz se representa el valor absoluto de la diferencia entre los niveles de información común de las diferentes parejas de residuos en la forma unida y libre del dominio cSrc-SH3. En azul aparecen aquellos residuos que no experimentan ningún cambio en su información común, en azul claro aquellos residuos que no experimentan grandes cambios y en verde y rojo están representados aquellos residuos en los que se percibe un fuerte efecto en el acoplamiento. Los residuos pertenecientes al sitio de unión se recuadran en blanco. La numeración de los residuos corresponde a la secuencia de la proteína completa Src (Uniprot ID: P00523). En la Figura 3.2 se muestra la red de conexión entre los residuos del grupo informativo. El grosor de cada trazo es proporcional a la frecuencia con que se establece contacto entre los residuos, es decir, la frecuencia con la que los dos residuos tienen al menos un par de átomos a una distancia menor de 5 Å. En contacto directo con los residuos del sitio de unión, que se encuentran en contacto directo con el ligando, la red contiene un grupo de residuos a los cuales nos referimos como subgrupo de 113 primer nivel (L100, F102, N113, I132, y W119), y un grupo de residuos que interaccionan con el subgrupo del primer nivel, al cual nos referimos como subgrupo de segundo nivel (F86, E106, L108, y H122). Figura 3.2. Red de conexión de los residuos del grupo informativo del dominio SH3 de cSrc. Las líneas representan el contacto entre las cadenas laterales en, al menos, la mitad del conjunto de estructuras analizadas y con una distancia menor a 5 Å en al menos un par de átomos de los dos residuos. El color de las líneas indica si hay un cambio positivo (rojo) o negativo (azul) en la información común durante el proceso de unión y su grosor representa la magnitud de este cambio. Los círculos en color verde claro corresponden a los residuos del sitio de unión y los verde oscuro los que no pertenecen a éste, mientras que los aminoácidos del ligando se representan en naranja. Se ha observado que entre los residuos del sitio de unión y los residuos del subgrupo de primer nivel, el acoplamiento conformacional es más intenso (líneas rojas) cuando se forma el complejo, sin embargo, entre el primer y el segundo nivel el acoplamiento conformacional es más débil (líneas azules). Esto significa que antes de la unión los residuos del subgrupo de primer nivel están conformacionalmente acoplados a los residuos del subgrupo de segundo nivel. Este acoplamiento se ve perturbado por la unión, relajando el acoplamiento entre estos dos subgrupos y aumentando el acoplamiento entre las cadenas laterales del subgrupo de primer nivel y las del sitio de unión. En este aspecto, el residuo H122, localizado en la lámina β anterior al lazo distal, se diferencia de los otros aminoácidos del subgrupo de segundo nivel, ya que 114 Capítulo 3 durante la unión del péptido su estado conformacional llega a estar más acoplado a algunos residuos en el subgrupo de segundo nivel, por lo que podría considerarse como un tercer nivel. 3.2.2. Comprobación experimental de la predicción de las redes alostéricas 3.2.2.1. Selección de los mutantes del dominio SH3 de cSrc A partir del análisis teórico realizado por el Dr. Tom Lenaerts, y que se ha resumido en el apartado anterior, hemos podido identificar un conjunto de residuos en el dominio SH3 de cSrc, cuyas propiedades conformacionales se encuentran afectadas por la unión del péptido RLP2 debido a interacciones directas o indirectas con otros restos del dominio. Por lo tanto, sería razonable esperar que los cambios en estos residuos pudieran, a su vez, alterar el equilibrio conformacional del dominio y/o traducirse en cambios en las energías de unión y plegamiento. También, si los residuos seleccionados son relevantes, las mutaciones podrían alterar las propiedades funcionales de la célula. De este modo, para validar esta predicción teórica, hemos llevado a cabo el análisis del impacto en la energética de plegamiento e interacción con ligandos de un amplio juego de mutaciones identificadas a partir de los resultados teóricos. Puesto que la mutación de restos en el sitio de unión y en contacto directo con el péptido producirán previsiblemente cambios en la afinidad que no tienen por qué estar relacionado con efectos cooperativos, hemos centrado nuestra atención en los residuos de los subgrupos del primer y segundo nivel, añadiendo otros residuos que nos servirán como control, por ejemplo el residuo S94 que afecta directamente a la estabilidad del dominio y R128 que, como se ha mencionado anteriormente, afecta a la dinámica conformacional del dominio SH3 de cSrc (Martin-Garcia 2009). En total hemos clonado, expresado y purificado un total de 15 mutantes cuyas secuencias se representan en la Figura 3.3. Para cada uno de ellos se ha analizado el efecto de la mutación en la estabilidad estructural del dominio y en su interacción con el ligando RLP2. 115 Figura 3.3. Secuencia del dominio silvestre cSrc-SH3 (wt) y de sus mutantes. Los residuos seleccionados se representan con un código de colores de acuerdo al carácter del aminoácido. Los residuos que se conservan en el dominio han sido sustituidos por puntos. 3.2.2.2. Caracterización del equilibrio conformacional de los mutantes del dominio SH3 de cSrc Para evaluar el impacto de las mutaciones en la estabilidad estructural y las propiedades conformacionales del dominio SH3 de cSrc hemos llevado a cabo la caracterización del proceso de desplegamiento mediante Calorimetría Diferencial de Barrido (DSC) para cada uno de los 15 mutantes obtenidos. De este modo, además de obtener información termodinámica del plegamiento, nos aseguramos de que los dominios mutantes se encuentran correctamente plegados a la temperatura deseada, de modo que los cambios en la energética de unión eventualmente observados no se deban a un plegamiento inducido por la unión del ligando, sino a los efectos cooperativos que se pretenden estudiar. Para poder realizar un análisis termodinámico completo, hemos llevado a cabo experimentos de desnaturalización del dominio silvestre cSrc-SH3 y sus mutantes, en tampón fosfato sódico 50 mM, pH 7.0, condiciones estudiadas anteriormente en nuestro grupo de investigación (MartinGarcia 2009). Todos los experimentos se han realizado a una concentración de 0.5 mg·mL-1. En estas condiciones se observa que el desplegamiento térmico del dominio cSrc-SH3 y de sus mutantes presenta un alto grado de reversibilidad y se ajusta a un modelo de equilibrio de dos estados (Sección 2.4.4). 116 Capítulo 3 En la Figura 3.4 se representan los termogramas obtenidos para todos los mutantes juntos, analizados con un ajuste global de todas las trazas según el modelo de equilibrio de dos estados, suponiendo una dependencia lineal con la temperatura de la capacidad calorífica del estado nativo (Cp, N) y de segundo grado para la capacidad calorífica del estado desplegado (Cp, D). Figura 3.4. a) Dependencia de la capacidad calorífica molar parcial con la temperatura para los mutantes pertenecientes al subgrupo del primer nivel. b) Dependencia de la capacidad calorífica molar parcial con la temperatura para los mutantes pertenecientes al subgrupo del segundo nivel. Los datos se obtienen a partir de los experimentos en fosfato sódico 50 mM, pH 7 y en ambos paneles se representan los termogramas del dominio SH3 de cSrc, usado como referencia los mutantes S94A y R128Q utilizados como control. Los círculos representan los datos experimentales, mientras que las líneas continuas corresponden al ajuste global según el modelo de equilibrio de desplegamiento de dos estados (sección 2.4.4). En la Tabla 3.1 se muestran los parámetros termodinámicos del desplegamiento obtenidos para los mutantes y el dominio cSrc-SH3. 117 Tabla 3.1. Parámetros termodinámicos del desplegamiento térmico del dominio cSrc-SH3 y sus mutantes, obtenidos del análisis de las curvas de DSC mediante el modelo de equilibrio de dos estados. Tm ∆Tm ∆H25ºC ∆∆H25ºC ∆G25ºC ∆∆G25ºC Proteína (oC) (oC) (kJ/mol) (kJ/mol) (kJ/mol) (kJ/mol) cSrc-SH3 20.4±1.0 75.5 0 67.7±12.8 0 0 wt cSrc-SH3 69.6 -5.9 68.4±11.3 0.7±2.6 17.5±0.8 -2.9±0.3 F86L cSrc-SH3 77.9 2.4 99.6±13.2 31.9±1.5 26.4±1.1 6.0±0.2 F86W cSrc-SH3 81.3 5.8 98.4±13.1 30.7±2.3 28.3±1.2 7.9±0.3 S94A cSrc-SH3 68.5 -7.0 55.0±11.1 -12.7±2.9 15.3±0.8 -5.1±0.4 L100V cSrc-SH3 74.1 -1.1 61.9±12.4 -5.8±1.5 18.8±1.0 -1.6±0.2 F102I cSrc-SH3 71.5 -4.0 72.6±11.7 4.9±2.0 19.0±0.9 -1.4±0.3 L108I cSrc-SH3 64.9 -10.6 56.9±11.4 -10.8±5.0 13.9±0.8 -6.5±0.6 L108V cSrc-SH3 77.1 1.6 84.4±12.9 16.7±1.2 23.7±1.0 3.3±0.2 N113S cSrc-SH3 72.6 -2.9 59.9±11.8 -7.8±1.6 17.8±0.9 -2.6±0.2 W119L cSrc-SH3 72.4 -3.1 84.8±12.2 17.1±2.1 21.2±0.9 0.8±0.3 H122R cSrc-SH3 68.8 -6.5 69.8±83.7 2.1±2.6 17.3±0.8 -3.1±0.3 R128E cSrc-SH3 77.5 2.0 72.9±13.3 5.2±1.5 22.2±1.1 1.8±0.2 R128K cSrc-SH3 73.3 -2.2 75.8±12.2 8.1±1.6 20.4±0.9 0.0±0.2 R128Q cSrc-SH3 75.6 0.1 88.7±12. 21.0±1.0 23.5±1.0 3.1±0.2 I132V Los errores en los parámetros termodinámicos se han calculado según el modelo que aparece en el Apéndice I. 118 Capítulo 3 Figura 3.5. Representación en forma de barras de las diferencias de la energía libre de Gibbs de la estabilidad de los diferentes mutantes respecto al dominio silvestre SH3 de cSrc. En azul claro aparecen aquellos mutantes cuya diferencia en valor absoluto oscila entre 0 y 3 kJ·mol-1, en azul aquellos mutantes cuya diferencia en valor absoluto se encuentra entre 3 y 6 kJ·mol-1, y en azul oscuro aquellos mutantes cuya diferencia en valor absoluto está entre 6 y 9 kJ·mol-1. Como se puede observar en la Figura 3.5, la mayoría de las mutaciones puntuales no producen efectos significativos sobre la estabilidad del domino cSrc-SH3. Las mayores diferencias aparecen en las mutaciones F86W, N113S e I132V, en las que se observa un aumento de la estabilidad con respecto al dominio cSrc-SH3 y las mutaciones F86L, L100V y L108V donde se aprecia una disminución en la estabilidad respecto al dominio cSrc-SH3. Uno de los mutantes que fueron seleccionados y que no aparecen en los resultados experimentales es el mutante E106F de cSrc-SH3 que no pudo ser expresado, lo cual confirma la importancia estructural de este residuo previamente descrita (Larson and Davidson 2000). A pesar de estas diferencias, todos los mutantes se encuentran correctamente plegados en las condiciones en las que se lleva a cabo el experimento. Además a 25ºC, temperatura a la cual se van a llevar a cabo los estudios de unión, la población del estado nativo es del 100%. 119 3.2.2.3. Influencia de la unión del ligando en la energética de unión Una vez confirmado que los distintos mutantes del dominio cSrcSH3 se encuentran correctamente plegados, hemos procedido a evaluar el efecto de las diferentes mutaciones sobre la energética de unión al ligando RLP2. En primer lugar, y con el fin de obtener una estimación inicial de las constantes de disociación, hemos realizado el análisis de la interacción de los mutantes con dicho ligando mediante espectroscopía de fluorescencia (Figura 3.6). Estos experimentos se han llevado a cabo en las condiciones estándar de fosfato sódico 20 mM, pH 7.0 y 25ºC. Figura 3.6. Paneles superiores: espectros de fluorescencia tomados tras al inyección del ligando RLP2 sobre a) el dominio cSrc-SH3 y b) sobre el mutante L100V, una vez normalizados con la concentración de proteína, realizados en fosfato sódico 20 mM pH 7.0 a 25ºC. Paneles inferiores: valores del centro de masas (círculos cerrados). La línea continua corresponde al mejor ajuste para el modelo de unión de un ligando a una proteína seguido mediante fluorescencia (Ecuación 2.3.3). Para los mutantes en los que no se produce un cambio significativo con respecto a la constante de disociación medida para el dominio silvestre cSrc-SH3 con el mismo ligando, se han llevado a cabo los experimentos de ITC utilizando las mismas concentraciones de proteína y de ligando, así como los mismos parámetros instrumentales 120 Capítulo 3 (número de inyecciones, etc.) que en el caso del dominio silvestre. Sin embargo, para aquellos en los que se ha observado una variación de la constante de disociación respecto al dominio silvestre, se han optimizado las concentraciones de proteína y ligando mediante simulaciones de las correspondientes curvas de titulación (Sección 2.5.2). Si se representa la entalpía aparente obtenida para el tampón fosfato frente a la entalpía de ionización a distintas temperaturas y se analizan los datos mediante regresión lineal, se obtiene directamente de la ordenada en el origen la entalpía intrínseca de unión. El bajo calor de ionización del tampón fosfato sódico hace que la entalpía intrínseca de unión sea muy cercana a la aparente. De este modo, en las condiciones en las que se han llevado a cabo los experimentos de ITC la entalpía de unión aparente medida experimentalmente puede ser considerada, dentro del error, como el valor de entalpía intrínseca de la interacción (MartinGarcia 2009). En la Figura 3.7 se muestran, a modo de ejemplo, los experimentos de titulación de algunos de los mutantes con el ligando RLP2. Los valores de los parámetros termodinámicos obtenidos del análisis para un sitio de unión de los distintos mutantes se recogen en la Tabla 3.2, junto con los datos obtenidos para el dominio cSrc-SH3. Como se puede observar, en todos los casos el proceso de unión está caracterizado por un patrón termodinámico similar al observado para el dominio cSrc-SH3, de modo que la interacción está gobernada por una entalpía de unión favorable a la que se opone parcialmente una contribución entrópica desfavorable. 121 Figura 3.7. Experimentos de titulación mediante ITC del ligando RLP2 con el dominio cSrc-SH3 y los mutantes F102L, I132V y W119L, en fosfato sódico 20 mM, pH 7.0 y 25ºC. a) Termograma de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando RLP2 sobre los distintos mutantes. b) Isoterma de unión correspondiente al experimento a, obtenida después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos cerrados mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (Ecuación 2.5.11). 122 Capítulo 3 Tabla 3.2. Parámetros termodinámicos obtenidos a partir de los experimentos de ITC para la unión del ligando RLP2 al dominio cSrc-SH3 y sus mutantes, realizados en fosfato sódico 20 mM pH 7.0 a 25 oC. Proteína Kd (µM) ∆Gap (kJ/mol) ∆∆G (kJ/mol) ∆Hap (kJ/mol) ∆∆H (kJ/mol) -T∆Sap (kJ/mol) cSrc-SH3 wt 13.8 -27.6±0.13 0.0 -59.4±0.8 0 31.8 cSrc-SH3 F86L 13.5 -27.8±0.04 -0.2±0.3 -60.6±0.4 -1.2±1.2 32.8 cSrc-SH3 F86W 20.2 -26.8±0.04 0.8±0.3 -54.3±0.3 5.1±1.1 27.5 cSrc-SH3 S94A 18.8 -27.0±0.21 0.6±0.4 -57.9±2.1 1.5±2.9 30.9 cSrc-SH3 L100V* 269.3 -20.4±23.01 7.2±46.4 - - - cSrc-SH3 F102I 52.6 -24.5±0.04 3.1±0.8 -56.9±1.1 2.5±1.9 32.4 cSrc-SH3 L108I 20.6 -26.8±0.08 0.8±0.4 -57.8±1.3 1.6±2.1 31 cSrc-SH3 L108V 20.5 -26.8±0.08 0.8±0.4 -61.9±0.6 -2.5±1.5 35.1 cSrc-SH3 N113S 19.0 -27.0±0.08 0.6±0.4 -58.8±0.8 0.6±1.7 31.8 cSrc-SH3 W119L 72.5 -23.7±0.04 3.9±0.3 -49.3±0.4 10.1±1.3 25.6 cSrc-SH3 H122R 11.0 -28.3±0.04 -0.7±0.3 -60.0±0.8 -0.6±1.7 31.7 cSrc-SH3 R128E 9.3 -28.8±0.13 -1.2±0.5 -59.7±0.8 -0.3±1.7 30.9 cSrc-SH3 R128K 11.3 -28.3±0.08 -0.7±0.4 -58.1±0.3 1.3±1.1 29.8 cSrc-SH3 R128Q 11.4 -28.2±0.08 -0.6±0.4 -61.3±0.4 -1.9±1.3 33.1 cSrcSH3 15.5 -26.5±0.04 1.1±0.3 -57.4±0.4 2.0±1.3 30.9 I132V * Resultado obtenido por espectroscopía de fluorescencia Los errores en los parámetros termodinámicos se han calculado según el modelo que aparece en el Apéndice I. 123 Como se observa en la Figura 3.8, parte de los residuos mutados tienen un impacto significativo en la energética de unión, sobre todo teniendo en cuenta que se trata de restos distantes del sitio de unión. Este es el caso de los residuos L100, F102 y W119, que experimentan una reducción de la afinidad de unión cercana a los 5 kJ·mol-1. El resultado para los mutantes L100V y W119L se encuentra respaldado por un análisis previo del dominio Fyn-SH3 usando la titulación por fluorescencia (Di Nardo et al. 2003), donde se describen efectos significativos en la afinidad de unión del péptido VSLARRPLPPLP, con una longitud de 3 residuos más que nuestro péptido, asociado a esas mutaciones. Figura 3.8. Representación en forma de barras de las diferencias de la energía libre de Gibbs de la unión de los diferentes mutantes respecto al dominio silvestre SH3 de cSrc. La mutación en el residuo F102I muestra un efecto similar al mutante W119L en la energética de unión. En otros casos, como ocurre con la mutación en la posición H122, no se observan efectos importantes en la energética de unión, aunque se hayan realizado otros experimentos de ITC con el mutante H122R y el péptido de mayor longitud VSL12, que han revelado que esta mutación afecta a la entalpía de unión de un modo significativo, subrayando la importancia de la cadena lateral de la histidina cercana al lazo distal. Igual sucede con el residuo R128 que induce una reorganización de los enlaces de hidrógeno y que es la responsable de las diferencias en la energética de unión entre los 124 Capítulo 3 complejos del dominio SH3 de cSrc, Fyn y cYes y el ligando VSL12 y que tampoco aparece dentro del grupo informativo (Martin-Garcia 2009). La ausencia de efectos en la energética de unión para el mutante H122R en combinación con el péptido corto no está todavía aclarada y requiere un análisis en mayor profundidad. De todos modos, los datos estructurales de RMN para los dominios SH3 de cSrc parecen contener la información necesaria par implicar a este residuo en el grupo informativo. Todos estos resultados indican que sólo un subconjunto del grupo informativo juega un papel funcional: los 5 residuos del sitio de unión (incluyendo el residuo D117); L100, F102 y W119 en el subgrupo de primer nivel; y el residuo H122 en el subgrupo de segundo nivel (Figura 3.9). Los residuos N113 e I132 en el primer nivel parecen ser una excepción puesto que, aunque los mutantes N113S e I132V estabilizan fuertemente el dominio, estos no tienen ningún efecto en la energética de unión, lo cual está de acuerdo con los resultados observados para el dominio Fyn-SH3 (Di Nardo et al. 2003). Sin embargo, sería necesario un muestreo más exhaustivo de mutantes, que podría dar lugar a efectos en la unión para esta posición. Figura 3.9. Efecto de la energía de Gibbs en el plegamiento y la unión de los mutantes de cSrc-SH3. Mientras que la mayoría de los mutantes afecta a la estabilidad, sólo unos pocos afectan a la unión, como los mutantes F102I, W119L, y L100V. 125 3.2.3. Impacto de las mutaciones sobre los niveles de fosforilación de Src Para comprender la importancia biológica de los mutantes L100V, F102I y W119L que afectan a la afinidad de unión a través de interacciones cooperativas, se ha estudiado en el laboratorio del Dr. Lenaerts su influencia en la fosforilación de la quinasa Src. Como se ha visto en el Capítulo 1, en ausencia de estímulos, Src adopta una conformación autoinhibida, estabilizada por interacciones intramoleculares de los dominios SH2 y SH3 que mantienen el dominio quinasa en una conformación cerrada (Arold et al. 2001; Boggon and Eck 2004). La activación de la quinasa de Src puede seguirse a través de la fosforilación de la tirosina 416, ya que este residuo se encuentra accesible sólo cuando la proteína está en su conformación abierta. Se ha descrito que mutaciones en el sitio de unión del dominio SH3 (D99N) muestran un efecto limitado sobre la regulación de la actividad de Src (Cary et al. 2002). Sin embargo, la mutación en la posición D99 del dominio SH3 de cSrc provoca un aumento en la fosforilación de Y416, aunque no de forma tan pronunciada como ocurre con el mutante Y527F ya que la desfosforilación de esta tirosina impide las interacciones intramoleculares entre los dominios SH2 y SH3, conduciendo a una conformación abierta que permite la fosforilación de Y416, dando lugar a la activación de la quinasa de Src. Al introducir las tres mutaciones en la quinasa de Src (L100V, F102I y W119L) en células SYF se observa cómo cambian los niveles de fosforilación respecto a la especie silvestre (Figura 3.10). Los mutantes W119L y F102I reducen ligeramente la fosforilación de la quinasa de Src mientras que el efecto del mutante L100V, alejado del sitio de unión, es equivalente al cambio que produce la mutación D99 que se encuentra en el sitio de unión. Considerando que los cambios en la fosforilación de Y416 surge de la ruptura de las interacciones intra e inter-moleculares, estos resultados indican que estos residuos tienen un modesto papel en el comportamiento de Src en su contexto celular. 126 Capítulo 3 Figura 3.10. Efecto de los mutantes W119L, F102I, y L100V en los niveles de fosforilación de Src Y416. Las barras indican la relación entre la proteína fosforilada y la cantidad total de proteína. L100V muestra un efecto similar a la mutación en el residuo D99 del sitio de unión. F102A y W119L reduce el nivel de fosforilación ligeramente. 3.2.4. Robustez de la red alostérica Considerando que el dominio SH3 de cSrc comparte un alto grado de homología (70%) con el dominio SH3 de Fyn, es de esperar que las redes alostéricas de ambos dominios presenten una elevada equivalencia. De hecho, experimentos anteriores con construcciones quiméricas de la quinasa Src en las cuales el dominio SH3 fue reemplazado por el de Fyn, demostraron que la regulación de la proteína a través del extremo Cterminal se mantenía en las quimeras (Erpel et al. 1995), indicando efectos alostéricos similares en ambos dominios. Para comprobar la similitud de las redes alostéricas de los dominios SH3 de cSrc y Fyn, el Dr. Lenaerts ha aplicado su método llevando a cabo un análisis del dominio SH3 de Fyn similar al del dominio SH3 de cSrc, formando un complejo con otro péptido sintético de tipo I que corresponde a los residuos 91-104 de la subunidad p85 de la quinasa PI3 (PPRPLPVAPGSSLT). En la Figura 3.11 se puede observar dónde se encuentran los residuos implicados en la red alostérica del dominio Fyn-SH3, muy similares al grupo informativo de Src (Figura 3.2). 127 Figura 3.11. Conjunto de residuos del dominio SH3 de Fyn más afectados por la unión del ligando. Las líneas representan el contacto entre las cadenas laterales en, al menos, la mitad del conjunto de estructuras analizadas. El color de las líneas indica si hay un cambio positivo (rojo) o negativo (azul) en la información común durante el proceso de unión y su grosor representa la magnitud de este cambio. Los círculos en color verde claro corresponden a los residuos del sitio de unión y los verde oscuro los que no pertenecen a éste, mientras que los aminoácidos del ligando se representan en naranja. Ni el residuo H122 ni el N113, encontrados para cSrc, se detectan en Fyn-SH3, mientras que los residuos T97 y P134, que no participan en el grupo informativo de cSrc, ahora sí que se incluyen para Fyn. El papel del residuo N113 en Src es sustituido por una serina en la posición 114. La cadena lateral más corta para el residuo S114 hace que esté menos afectada por las limitaciones conformacionales de los residuos vecinos y que, por tanto, la transmisión de interacciones cooperativas a través del dominio sea menos efectiva. Como consecuencia, el efecto alostérico causado por el residuo W119 en Src sobre el residuo N113 no se observa en Fyn. Por otro lado, el residuo H122 en Src es reemplazado en Fyn por una arginina (R123), la cual, cuando se reduce el umbral también se une al grupo informativo, algo que no ocurre en el caso del residuo S114. Como se ha mencionado anteriormente, el análisis del dominio Fyn-SH3 identifica también los residuos P134 y T97 como parte de este grupo. La adición de P134 al conjunto de residuos del bolsillo de unión puede deberse a las diferencias entre los péptidos (Feng et al. 1994; Morton et al. 128 Capítulo 3 1996). Lo mismo sucede para el residuo T97, puesto que en unas pocas estructuras (menos del 50%), este residuo interacciona con la prolina que hay después de la arginina en el ligando de tipo I. Al igual que con cSrc-SH3, hemos validado experimentalmente estas predicciones para los mutantes W120L y F103I de Fyn-SH3 ya que en el domino SH3 de cSrc (mutantes W119L y F102I) presentaban una gran influencia sobre la energética de unión. De nuevo evaluamos el impacto de las mutaciones sobre la estabilidad estructural y las propiedades conformacionales del dominio SH3 de Fyn mediante DSC. Los experimentos de desnaturalización térmica se han llevado a cabo en las mismas condiciones que para el dominio SH3 de cSrc y sus mutantes (tampón fosfato sódico 50 mM, pH 7.0 y con una concentración de proteína de 0.5 mg·mL-1). En estas condiciones el desplegamiento térmico del dominio Fyn-SH3 y de sus mutantes presenta un alto grado de reversibilidad. En la Figura 3.12 se representan los termogramas obtenidos para el dominio SH3 de Fyn y sus mutantes junto a su mejor ajuste según el modelo de equilibrio de dos estados (Sección 2.4.4). Como se puede observar, ambos mutantes presentan algún efecto sobre la estabilidad del dominio Fyn-SH3, siendo destacable el efecto desestabilizante del mutante W120L. A pesar de este resultado, ambos mutantes se encuentran correctamente plegados en las condiciones en las cuales se van a llevar a cabo los estudios de unión, donde población del estado nativo es del 100%. 129 Figura 3.12. Dependencia de la capacidad calorífica molar parcial con la temperatura para los mutantes F103I y W120L comparados con el domino SH3 de Fyn, obtenidas a partir de los experimentos en fosfato sódico 50 mM, pH 7.0. Los círculos abiertos representan los datos experimentales, mientras que las líneas continuas corresponden al mejor ajuste al modelo de equilibrio de desplegamiento de dos estados (Sección 2.4.4). Una vez que hemos comprobado que ambos mutantes se encuentran correctamente plegados, hemos evaluado su efecto sobre la energética de unión al ligando RLP2. Igual que con los mutantes del dominio SH3 de cSrc, hemos realizado el análisis de la interacción de los mutantes con el ligando RLP2 mediante espectroscopía de fluorescencia (datos no mostrados), para obtener así una estimación inicial de las constantes de disociación. Estos experimentos se han llevado a cabo en condiciones estándar de tampón fosfato 20 mM, pH 7.0 a 25ºC. En la Figura 3.13 se muestran los experimentos de titulación de los dos mutantes con el ligando RLP2. Los valores de los parámetros termodinámicos obtenidos del análisis para los distintos mutantes aparecen en la Tabla 3.3, junto con los datos obtenidos para el dominio SH3 de Fyn. Como en el caso del dominio cSc-SH3, el proceso está caracterizado por una interacción gobernada por una entropía favorable a la que se opone parcialmente una contribución entrópica desfavorable. 130 Capítulo 3 Figura 3.13. Experimentos de titulación mediante ITC del ligando RLP2 con el dominio Fyn-SH3 y los mutantes F103I y W120L, en fosfato sódico 20 mM, pH 7.0 y 25ºC. a) Termograma de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando RLP2 sobre los distintos mutantes. b) Isoterma de unión correspondiente al experimento A, obtenida después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos cerrados, mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (Ecuación 2.5.11). Del análisis termodinámico tanto de la estabilidad como de la energética de unión, en este caso de los mutantes F103I y W120L, podemos suponer que como en el caso del dominio SH3 de cSrc, algunos residuos tienen influencia sobre la estabilidad mientras que otros afectan a su funcionalidad o afinidad de unión. Por lo tanto, el algoritmo usado puede ser capaz de identificar los residuos más relevantes para el grupo informativo tanto de Src como de Fyn. Por ejemplo, aunque la interacción entre los residuos F103 y E107 en Fyn no ocurra con la misma frecuencia que en Src (en este caso entre los residuos F102 y L108), muestreando el conjunto de estructuras, estos residuos están incluidos en el grupo informativo de ambos. 131 Tabla 3.3. Parámetros termodinámicos obtenidos a partir de los experimentos de ITC para la unión del ligando RLP2 al dominio Fyn-SH3 y sus mutantes, realizados en fosfato sódico 20 mM pH 7.0 a 25 oC. Proteína Fyn-SH3 wt Fyn-SH3 F103I Kd# (µM) ∆Gap (kJ/mol) ∆∆G (kJ/mol) ∆Hap# (kJ/mol) ∆∆H (kJ/mol) -T∆Sap (kJ/mol) 9.0 -28.8 0 -60.2 0 31.4 30.7 -25.8 3.0 -53.2 7.0 27.4 Fyn-SH3 9.5 -28.7 0.1 -62.0 -1.8 33.3 W120L # Los errores en los parámetros termodinámicos se estiman en torno al 5% para la entalpía de unión y al 10% para la constante de disociación En resumen, el análisis teórico y experimental desarrollado en este capítulo ha permitido identificar que, además de los residuos del sitio de unión del dominio SH3 en contacto directo con el ligando, existe un conjunto de 9 residuos del núcleo y fuera de éste (F86, L100, F102, E106, L108, D117, W119, H122 e I132, de acuerdo con la secuencia de Src y la numeración) que parecen jugar un papel importante en el alosterismo de ambos dominios. El Dr. Lenaerts ha analizado con este método diferentes dominios SH3 que poseen distintos niveles de similitud y distinta distancia evolutiva. El consenso en las predicciones confirma la robustez del método, el cual es capaz de identificar patrones específicos incluso usando distintos péptidos y distintas estructuras de RMN obtenidas en distintos laboratorios y en diferentes condiciones. También cabe destacar que las predicciones consensuadas basadas en los dominios SH3 reflejan los sectores evolutivos identificados en (Halabi et al. 2009) a través de un análisis de acoplamiento estadístico en las secuencias de los dominios SH3 de diferentes familias, esto puede ser considerado como una confirmación más de la robustez de estas predicciones. De este modo, el método descrito permitiría conocer los aminoácidos implicados en la red de transmisión de información en una proteína pudiendo conocer la especificidad del alosterismo en un dominio o en una familia de proteínas y los papeles funcionales de cada patrón. Como se verá en el Capítulo 4 de esta Memoria, en el contexto de las quinasas de tirosina existe una elevada cooperatividad, ya no solo intradominio, sino también interdominio, necesaria para el correcto funcionamiento de la proteína (Pellicena and Miller 2001; Yadav and 132 Capítulo 3 Miller 2007). En relación con lo estudiado en este capítulo sería razonable pensar que los procesos de reconocimiento de sustrato por parte de los dominios modulares, fundamentales para los mecanismos de activación de las quinasas, no están regulados solamente por los residuos presentes en la superficie de interacción, sino que la perturbación provocada por la unión del sustrato se propagará de forma cooperativa desde el sitio de unión hacia zonas alejadas de éste. A través de este método se conseguiría conocer un patrón de alosterismo el cual permitiría diseñar ligandos con una alta afinidad y especificidad que abran las puertas al desarrollo de fármacos efectivos para el tratamiento de las patologías en las que estos dominios están implicados (Hassan et al. 2010). 3.3. Conclusiones Del análisis computacional y termodinámico llevado a cabo en este Capítulo se extraen las siguientes conclusiones: 1. Hemos identificado un conjunto de residuos implicados en la transmisión de información desde el sitio de unión hasta otras regiones del dominio. 2. El análisis mutacional nos ha permitido validar experimentalmente las predicciones teóricas, identificando el papel de los residuos predichos. 3. Los experimentos in vivo confirman que los residuos L100, F102 y W119 provocan un cambio funcional moderado pero significativo en los niveles de fosforilación de Src, validando la metodología empleada y poniendo de relevancia la importancia de estos efectos cooperativos intra-dominio para la regulación de las quinasas. 4. La red alostérica predicha por el análisis computacional para el dominio SH3 de cSrc puede ser consistente con estructuras homólogas como se ha demostrado con el dominio Fyn-SH3. 133 Capítulo 4 Estudio de la distribución conformacional de cAbl y su modulación por interacciones intramoleculares Capítulo 4 CAPÍTULO 4.- Estudio de la distribución conformacional de cAbl y su modulación por interacciones intramoleculares 4.1. Introducción En la última década nuestro grupo de investigación ha llevado a cabo una caracterización exhaustiva, tanto termodinámica como estructural del dominio SH3 de diferentes familias de dominios modulares como cSrc, cYes, Fyn o cAbl. Estos estudios han confirmado la importancia de las moléculas de disolvente en la interacción de dominios SH3 con ligandos ricos en prolina y han proporcionado una nueva visión de lo que hasta ahora se había considerado una interacción típicamente hidrofóbica. De hecho, existen determinadas posiciones ocupadas por moléculas de agua, que aparecen en el contexto de la quinasa completa de cAbl, cSrc y Hck (Nagar et al. 2003; Burchat et al. 2006; Cowan-Jacob 2006), lo que podría ser determinante para la funcionalidad de estos dominios in vivo. Además, como hemos descrito en el capítulo anterior, hemos puesto de manifiesto la existencia de redes intramoleculares de interacciones cooperativas que se expanden desde el sitio de unión hasta posiciones alejadas de éste, subrayando la relevancia de la complejidad de las interacciones y el papel que el equilibrio conformacional del propio dominio juega en la determinación del patrón termodinámico de unión. Actualmente, existen en el mercado unos 60 medicamentos basados en el desarrollo de péptidos como moléculas terapéuticas (Kardinal et al. 2000; Lee et al. 2002; Vlieghe et al. 2010). En algunos casos estudiar los dominios de forma aislada es una aproximación demasiado simplista a la hora de desarrollar fármacos, ya que se pierde información tanto de la proteína completa como de la multitud de interacciones que se establecen en el entorno celular, de ahí la importancia de estudiar los posibles efectos contextuales. Por esto motivo, tras haber realizado una caracterización completa del dominio SH3, en nuestro grupo de investigación hemos abordado el estudio de la influencia tanto en el equilibrio conformacional como en la energética de unión de los elementos que componen las quinasas de tirosina de cAbl y cSrc. Como se ha visto detalladamente en la Introducción, a pesar de la abundante información que existe sobre cAbl, su regulación sigue siendo un complicado rompecabezas en el que aún existen muchos interrogantes sin respuesta. Sabemos que cAbl requiere de un estímulo para llevar a cabo su actividad enzimática, que dicha activación conlleva un cambio 137 conformacional y que existen, además de los dominios modulares, numerosos elementos implicados en la regulación de su actividad, lo que nos permite afirmar que se trata de una estructura altamente cooperativa. Sin embargo, aún existen muchos aspectos del mecanismo de su regulación que son desconocidos. En la base de datos PDB (Protein Data Bank) existen dos estructuras cristalográficas resueltas de cAbl que corresponden a los códigos 2ABL y 2FO0. La primera de ellas corresponde a la construcción en tándem de los dos dominios modulares SH2 y SH3, y la segunda, resuelta cinco años después, al tándem SH3SH2 acompañado de otras regiones de cAbl como el dominio catalítico y la región NCap (Nagar et al. 2006). Si se superponen las dos estructuras del tándem SH3SH2, usando el dominio SH2 como referencia, se observa cómo el dominio SH3 se encuentra desplazado en una estructura respecto a la otra (Figura 4.1). Esta diferencia está relacionada con un ligero cambio conformacional en la secuencia de conexión entre los dominios SH3 y SH2 (C3-2), que provoca un cambio en su orientación relativa. Figura 4.1.-Superposición del tándem de los dominios SH3 y SH2 de la estructura cristalográfica con código 2ABL (rojo) y de la estructura 2FO0 (azul). En ambos paneles el tándem ha sido superpuesto usando como referencia el dominio SH2. En el panel de la izquierda se resalta en amarillo la región del conector de ambos dominios que presenta un cambio conformacional. En el panel de la derecha se ha representado la superficie de la interfaz de unión del dominio SH3 en ambas estructuras. La superficie ha sido coloreada en relación con las propiedades de los residuos que la componen: verde para los residuos polares, azul para los básicos, blanco para los apolares y rojo para los ácidos. 138 Capítulo 4 Una hipótesis que planteamos en éste trabajo fue la posibilidad de que el cambio conformacional pudiera deberse a la ausencia de interacciones con elementos reguladores como NCap o la secuencia conectora entre el dominio SH2 y el dominio quinasa (C2Q), desplazando el equilibrio conformacional del tándem hacia una conformación que correspondería a la que adopta cAbl cuando se encuentra en su forma activa. Para confirmar esta hipótesis, hemos llevado a cabo un estudio del equilibrio conformacional y la dinámica del tándem SH3SH2 de cAbl aislado y en el contexto de distintas construcciones que incluyen elementos adicionales de la quinasa, con el fin de evaluar cómo la presencia de estos influye en las propiedades conformacionales del tándem. Como se ha comentado en Capítulo de Introducción, a pesar de la elevada homología existente entre la estructura autoinhibida de cAbl y los miembros de la familia de quinasas de tirosina cSrc, existen pequeñas pero importantes diferencias en su mecanismo de regulación. Por ejemplo, en las quinasa de tirosina de cSrc, el dominio SH2 tienen un papel muy importante en la regulación debido a que en su extremo C-terminal contiene un residuo tirosina, cuya fosforilación permite que ésta sea reconocida por el propio dominio SH2, de tal forma que el extremo Cterminal se repliega sobre la estructura estabilizando la conformación autoinhibida. Sin embargo, en cAbl la ausencia de esta interacción del extremo C-terminal con el dominio SH2 podría estar compensada por un aumento en la afinidad de la secuencia C2Q por el dominio SH3, tal como proponen Enge y colaboradores a partir de los resultados obtenidos en unos experimentos de intercambio hidrógeno/deuterio y de espectrometría de masas con diferentes construcciones de la quinasa cAbl (Chen and Matesic 2007). Con el fin de evaluar si estas diferencias se reflejan en las preferencias conformacionales del tándem SH3SH2 de Src y Abl, hemos abordado un estudio paralelo de las correspondientes construcciones de Src. 4.2. Resultados y discusión 4.2.1. Construcciones de la quinasa de cAbl y cSrc Para estudiar el papel de los distintos elementos reguladores que componen la quinasa de tirosina de cAbl, hemos clonado (Capítulo 2) distintas construcciones tanto de cAbl como de cSrc que se esquematizan 139 en la Figura 4.2. Para cAbl hemos clonado las construcciones: cAblSH3SH2, cAblSH3SH2-C2Q, cAbl-NCapSH3SH2 (Isoformas 1a y 1b) y cAbl-NCapSH3SH2-C2Q (Isoformas 1a y 1b); y para cSrc: cSrcSH3SH2 y cSrcSH3SH2-C2Q. cAblSH3SH2 SENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCEAQTKNGQGWVPSN YITPVNSLEKHSWYGPVSRNAAEYLLSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRI NTASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAP cAblSH3SH2 –C2Q SENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCEAQTKNGQGWVPSN YITPVNSLEKHSWYGPVSRNAAEYLLSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRI NTASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAPKRNKPTVYGVSPNYDK W cAbl-NCapSH3SH2 (1a) MLEICLKLVGCKSKKGLSSSSSCYLEEALQRPVASDFEPQGLSEAARWNSKENLLAGPS ENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCEAQTKNGQGWVPSNY ITPVNSLEKHSWYGPVSRNAAEYLLSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRIN TASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAP cAbl-NCapSH3SH2 (1b) MGQQPGKVLGDQRRPSLPALHFIKGAGKKESSRHGGPHCNVFVEHEALQRPVASDFE PQGLSEAARWNSKENLLAGPSENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNH NGEWCEAQTKNGQGWVPSNYITPVNSLEKHSWYHGPVSRNAAEYLLSSGINGSFLVR ESESSPGQRSISLRYEGRVYHYRINTASDGKLYVSSESRFNTLAELVHHHSTVADGLITT LHYPAP cAbl-NCapSH3SH2-C2Q (1a) MLEICLKLVGCKSKKGLSSSSSCYLEEALQRPVASDFEPQGLSEAARWNSKENLLAGPS ENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNHNGEWCEAQTKNGQGWVPSNY ITPVNSLEKHSWYGPVSRNAAEYLLSSGINGSFLVRESESSPGQRSISLRYEGRVYHYRIN TASDGKLYVSSESRFNTLAELVHHHSTVADGLITTLHYPAPKRNKPTVYGVSPNYDKW cAbl-NCapSH3SH2-C2Q (1b) MGQQPGKVLGDQRRPSLPALHFIKGAGKKESSRHGGPHCNVFVEHEALQRPVASDFE PQGLSEAARWNSKENLLAGPSENDPNLFVALYDFVASGDNTLSITKGEKLRVLGYNH NGEWCEAQTKNGQGWVPSNYITPVNSLEKHSWYHGPVSRNAAEYLLSSGINGSFLVR ESESSPGQRSISLRYEGRVYHYRINTASDGKLYVSSESRFNTLAELVHHHSTVADGLITT LHYPAPKRNKPTVYGVSPNYDKW cSrcSH3SH2 TFVALYDYESRTETDLSFKKGERLQIVNNTEGDWWLAHSLTTGQTGYIPSNYVAPSDS IQAEEWYFGKITRRESERLLLNPENPRGTFLVRESETTKGAYCLSVSDFDNAKGLNVK HYKIRKLDSGGFYITSRTQFSSLQQLVAYYSKHADGLCHRLTNVCPTS cSrcSH3SH2-C2Q TFVALYDYESRTETDLSFKKGERLQIVNNTEGDWWLAHSLTTGQTGYIPSNYVAPSDS IQAEEWYFGKITRRESERLLLNPENPRGTFLVRESETTKGAYCLSVSDFDNAKGLNVK HYKIRKLDSGGFYITSRTQFSSLQQLVAYYSKHADGLCHRLTNVCPTSKPQTQGLAKD AW Figura 4.2. Secuencias de las construcciones cAbl y cSrc .La región NCap se representa en rosa fucsia, el dominio SH3 en azul, el dominio SH2 en verde y el conector C2Q en naranja. El conector entre los dominios SH3 y SH2 se representa en negro. De todas las construcciones clonadas, se pudieron expresar cAblSH3SH2, cAblSH3SH2-C2Q, cSrcSH3SH2 y cSrcSH3SH2-C2Q. Desafortunadamente, para los tándem cAbl-NCapSH3SH2 (Isoformas 1a y 1b) y cAbl-NCapSH3SH2-C2Q (Isoformas 1a y 1b), los niveles de expresión fueron muy bajos lo que unido a la irreversibilidad en el 140 Capítulo 4 plegamiento que presentaban las construcciones cAblSH3SH2 y cAblSH3SH2-C2Q, hizo que se descartara su estudio. Las construcciones cAblSH3SH2, cAblSH3SH2-C2Q, cSrcSH3SH2 y cSrcSH3SH2-C2Q se pudieron expresar y purificar en cantidades y pureza suficientes para abordar su estudio biofísico. 4.2.2. Equilibrio conformacional del tándem SH3SH2 de Abl y Src Como se puede observar en la Figura 4.1, la conformación que adopta el tándem SH3SH2 en la estructura cristalográfica 2ABL deja los sitios de reconocimiento del dominio SH3 en una orientación relativa totalmente diferente a la observada para la estructura 2FO0. Para que el tándem pueda adquirir esta conformación en el contexto de la quinasa completa, es necesario que el dominio SH3 se desplace, dejando de interaccionar con la secuencia C2Q, como se aprecia en la Figura 4.3, donde, de nuevo hemos superpuesto ambas estructuras usando como referencia el dominio SH2. Esta conformación dejaría el sitio de reconocimiento del dominio SH3 libre para reconocer ligandos externos, reforzando la idea de que la conformación en la que se encuentra el tándem SH3SH2 en la estructura cristalográfica 2ABL correspondería a la que éste adopta cuando la quinasa completa se encuentra activa o, en una de sus posibles conformaciones activas. De este modo, clasificaremos la estructura 2ABL como conformación abierta y la estructura de 2FO0 como conformación cerrada. Estudios computacionales y experimentales del tándem SH3SH2 de proteínas pertenecientes a la subfamilia de la quinasa de tirosina cSrc, como son Fyn o Hck, han llegado a la conclusión de que esta construcción puede mantenerse en la conformación observada en su estado inactivo y puede unirse además a enzimas, incluso en ausencia de otros elementos de la quinasa (Fushman et al. 1999; Arold et al. 2001; Ulmer et al. 2002). 141 Figura 4.3. Superposición de la estructura cristalográfica del tándem SH3SH2 aislado (Rojo) con la estructura del tándem SH3SH2 en el contexto de cAbl autoinhibida (Azul). Para el tándem aislado se ha utilizado la estructura cristalográfica con código 2ABL. Para la estructura autoinhibida de cAbl se ha usado la estructura con código 2FO0. La superficie de las interfases de unión de ambos dominios modulares ha sido resaltada en color cian para el dominio SH3 y en verde para el dominio SH2. El dominio catalítico se ha representado en naranja. Para comprobar si cAbl tiene un comportamiento similar a éste, hemos llevado a cabo un estudio termodinámico del equilibrio conformacional de la construcción en tándem SH3SH2 de ambas quinasas. La Calorimetría Diferencial de Barrido (DSC) nos va a proporcionar información sobre la energética del equilibrio de desplegamiento, incluyendo además, la información que aporta la forma de la traza calorimétrica sobre el grado de interacción y cooperatividad conformacional que existe entre los distintos dominios que componen una proteína y cómo se encuentra ésta modulada por la interacción de un ligando (Straume and Freire 1992; Luque and Freire 2002). La caracterización se ha realizado usando distintas condiciones de pH (3; 3.5; 4; 4.5; 5; y 7) con el fin de encontrar las condiciones adecuadas en las que la proteína fuese reversible. Desafortunadamente, no pudimos encontrar la condición en la cual el desplegamiento térmico de ambos dominios fuese simultáneamente reversible, lo que ha imposibilitado el análisis cuantitativo de las trazas calorimétricas y la obtención de parámetros termodinámicos fiables. La única condición en la que, al menos, ambos dominios se encontraban plegados fue a pH7.0. Debido a su baja entalpía de ionización, el fosfato sódico sería un tampón adecuado para el estudio 142 Capítulo 4 calorimétrico de las distintas construcciones tanto de cAbl como de cSrc, sin embargo, dado que el dominio SH2 interacciona con la tirosina fosforilada, la presencia de grupos fosfato podría introducir artefactos en la caracterización de la estabilidad y la cooperatividad estructural. De este modo, hemos llevado a cabo los experimentos en Pipes 50 mM, ya que no presenta ningún fosfato en su composición y también posee una baja entalpía de ionización. A pesar de la irreversibilidad de esta construcción, la comparación de los termogramas nos permite inferir algunos resultados interesantes de forma cualitativa como se describe a continuación. En primer lugar, como referencia hemos obtenido las trazas de DSC correspondientes a los dominios independientes SH3 y SH2 de Abl y a continuación hemos procedido a caracterizar el desplegamiento térmico de las distintas construcciones (Panel a, Figura 4.4). En el termograma obtenido para el tándem de cAbl se muestra claramente la presencia de dos picos, cada uno de los cuales correspondería al desplegamiento de cada uno de los dominios que constituyen el tándem de forma individual. De hecho, la traza calorimétrica del dominio SH3 aislado se corresponde bastante bien con la transición que aparece a mayor temperatura en el termograma del tándem. En cuanto al dominio SH2 parece ser que es más estable cuando está aislado, ya que su Tm se desplaza a temperaturas más altas. En cualquier caso, en el desplegamiento térmico del tándem SH3SH2 de cAbl se distinguen claramente dos transiciones indicando que, a pesar de que pueda existir cierta cooperatividad, los dominios en el tándem se despliegan fundamentalmente de forma independiente. Para cSrc la caracterización del equilibrio conformacional, tanto de los dominios individuales SH3 y SH2 como de su construcción en tándem, se han utilizado las mismas condiciones que para el estudio de cAbl. Al igual que para el tándem cAblSH3SH2, el tándem cSrcSH3SH2 es irreversible a todos los pH, siendo a pH 7.0 la única condición en la que ambos dominios se encontraban plegados. En el Panel b de la Figura 4.4 se observa un comportamiento muy distinto entre cSrc y cAbl, ya que en el termograma de cSrcSH3SH2 tenemos un único pico muy agudo, lo que indica que ambos dominios se despliegan de un modo cooperativo. Estos datos podrían estar relacionados con estudios computacionales previos que indican que esta construcción puede permanecer en su forma autoinhibida sin necesidad de otros elementos reguladores. 143 Figura 4.4. Dependencia de la capacidad calorífica molar parcial con la temperatura para a) cAbl y b) cSrc. En azul oscuro se representa el dominio SH2, en violeta el dominio SH3, en fucsia el tándem SH3SH2 y en verde la suma de las capacidades caloríficas de ambos dominios y la contribución a ésta de los aminoácidos que forman el conector C3-2. Los datos se obtienen a partir de los experimentos en Pipes 50 mM pH 7.0. No ha sido posible ajustar los datos a un modelo termodinámico debido a que no se han encontrado las condiciones en las que ambos dominios sean reversibles de forma simultánea. Como ya hemos comentado, debido a la irreversibilidad de las transiciones no ha sido posible realizar un análisis cuantitativo detallado de la cooperatividad en los tándems SH3SH2 de cSrc y cAbl. No obstante, los resultados obtenidos son muy llamativos en cuanto a la diferencia de comportamiento de cada una de las quinasas, lo que podría tener implicaciones importantes en cuanto a sus correspondientes mecanismos de regulación. En el año 2007, Faraldo y Roux publicaron un estudio computacional detallado mediante dinámica molecular de las preferencias conformacionales del tándem SH3SH2 de la quinasa de la familia Src Hck, en el que analizaron distintas construcciones introduciendo dominios adicionales y mutaciones en la secuencia de conexión entre los dominios SH3 y SH2 (Faraldo-Gomez and Roux 2007). Estos autores llegaron a dos conclusiones importantes en su estudio: por un lado que el tándem tiene una alta flexibilidad estructural de modo que una vez disociado del dominio catalítico, puede adoptar una amplia variedad de conformaciones en las que los dominios SH3 y SH2 se encuentran en distintas orientaciones y a distintas distancias. Por otro lado, a pesar de la ausencia de interacciones con el dominio catalítico, la superficie de energía libre obtenida indica claramente que la distribución conformacional está diseñada para inducir una clara preferencia del tándem aislado por conformaciones compatibles con la conformación 144 Capítulo 4 cerrada en la que el dominio SH3 interacciona con la secuencia de conexión SH2-quinasa en la conformación inactiva de la enzima. Los autores concluyen que la secuencia de conexión entre los dominios SH3 y SH2 juega un papel clave en la determinación de estas preferencias conformacionales. Considerando las diferencias observadas en el comportamiento cooperativo del tándem SH3SH2 de Abl respecto al tándem de Src, propusimos como hipótesis de trabajo que el tándem de Abl presenta un comportamiento diferente a las quinasas de la familia Src que podría tener importantes implicaciones para la comprensión de su regulación funcional. Con el propósito de investigar esta idea en detalle se estableció una colaboración entre nuestro grupo de investigación y el Dr. Faraldo en el Instituto Max Planck de Franckfurt, para el análisis computacional del tándem Abl mediante técnicas de dinámica molecular. Para ello, el Dr. Carles Corbi, miembro de nuestro grupo de investigación, en colaboración con el Dr. Faraldo, generó una serie de trayectorias de dinámica molecular de 500 ns donde se puede observar la capacidad del tándem de adoptar tanto la conformación abierta (2ABL) como la cerrada (2FO0) (Figura 4.5). Esto haría pensar que existe un posible equilibrio conformacional entre ambas formas, apoyando así la hipótesis de que la conformación abierta coincide con la disposición del tándem cuando cAbl se encuentra activa o, que al menos, éstas serían las conformaciones más probables dentro del equilibrio conformacional del tándem en ausencia de interacciones intramoleculares con otras regiones, como Ncap o C2Q, que podrían modular este equilibrio conformacional. 145 Figura 4.5. Dinámica conformacional del tándem aislado SH3SH2 en dos simulaciones independientes de 500 ns tomando la conformación cerrada del tándem como punto de partida. Como coordenadas de los descriptores para el cambio conformacional del tándem se han domado los ángulos diedros D1 y D2. D1 está formado por el centro de masas de los residuos P137, L141, W146 y P150, pertenecientes al conector C3-2. D2 está formado por el centro de masas de los residuos Y134, P137, L141 y W146, también pertenecientes al conector C3-2. La frecuencia en las que estas coordenadas son visitadas durante la trayectoria está coloreada en azul cuando son visitadas de 1 a 10 veces, en naranja de 10 a 100 y en rojo las que son visitadas más de 100 veces. En ambas trayectorias el tándem cambia a la conformación abierta a los 100 ns de trayectoria y después vuelve a su estado inhibido (conformación cerrada) a los 400 ns de trayectoria. Aunque las conformaciones observadas sean accesibles durante la trayectoria de dinámica molecular, nada puede asegurar que sean las conformaciones más pobladas. Para evaluar de un modo más completo las dinámicas del tándem SH3SH2 se usó una avanzada técnica de muestreo denominada metadinámica (Marinelli et al. 2009; Crespo et al. 2010; Biarnes et al. 2012). La metadinámica aplicada a nuestro sistema nos permite conocer las diferencias de energía libre que existen entre las conformaciones abierta y cerrada, así como la posible existencia de otras conformaciones que pudieran estar pobladas. Este cálculo confirmó que ambos confórmeros eran los dos principales mínimos de energía (Figura 4.6), siendo la conformación abierta el estado más poblado. A través de las metadinámicas se ha comprobado también que el intercambio entre 146 Capítulo 4 ambas orientaciones está relacionado con un cambio conformacional en el conector que une los dominios SH2 y SH3. Figura 4.6. Proyección de la superficie de energía libre en el espacio RMSD respecto a las configuraciones cerrada (2FO0) y abierta (2ABL). Con un cuadrado azul de 4 Å de lado, se resaltan las regiones correspondientes a las conformaciones cristalográficas abierta y cerrada. La conformación abierta muestreada en las simulaciones es consistente con las medidas realizadas por SAXS de la forma activa de cAbl, donde las unidades reguladoras se encuentran parcialmente desacopladas del dominio catalítico (Nagar et al. 2006). Si comparamos las dinámicas estructurales obtenidas para el tándem cAblSH3SH2 y el tándem cSrcSH3SH2, se encuentran entre ambas diferencias muy significativas. Las simulaciones de energía libre del tándem SH3SH2 para la quinasa Hck (homóloga a cSrc), identifican un único confórmero muy cercano a la conformación cerrada (Ulmer et al. 2002). Estudios previos de la quinasa Fyn, usando cristalografía de Rayos X y RMN conducen a una conclusión análoga (Fushman et al. 1999; Arold et al. 2001). Por lo tanto, los resultados experimentales en los que observamos una única transición para el tándem cSrcSH3SH2, resaltando la elevada cooperatividad que existe entre ambos dominios, concuerdan con los datos teóricos obtenidos donde el tándem SH3SH2 de estas quinasas está predispuesto a adoptar conformaciones que conducen al estado inactivo, en el cual el dominio SH3 puede unirse al conector C2Q. 147 Para cAbl también concuerdan los datos obtenidos experimental y computacionalmente. En este caso los dominios SH2 y SH3 se comportan de forma individual permitiendo que el tándem adopte tanto la conformación abierta como la cerrada. El hecho de que la regulación del tándem de cAbl difiera de cSrc en este aspecto, sugiere que la formación del estado autoinhibido requerirá de otros factores para su regulación. 4.2.3. Influencia del conector C2Q en el equilibrio conformacional del tándem cAblSH3SH2 Estudios experimentales de intercambio hidrógeno/deuterio (HDX) sobre el tándem cAblSH3SH2 han demostrado que el dominio SH3 podría unirse al conector entre el dominio SH2 y el dominio quinasa (C2Q), incluso en ausencia de otros elementos de la proteína (Koepf et al. 1999). Como hemos visto en el apartado anterior, el tándem aislado alterna entre dos conformaciones posibles, la abierta o la cerrada. La conformación cerrada sería compatible con la interacción entre el dominio SH3 y el conector C2Q, sin embargo, no está del todo claro que esta interacción sea compatible con la conformación abierta, la cual, es la más probable cuando el tándem se encuentra aislado. Para comprobar la influencia del conector C2Q sobre el equilibrio conformacional del tándem SH3SH2, hemos realizado la caracterización del proceso de desplegamiento de la construcción cAblSH32-C2Q mediante DSC. Como en el caso del tándem aislado SH3SH2, se probaron las mismas condiciones de pH y no se encontró ninguna en la que ambos dominios fuesen reversibles de forma simultánea. Únicamente a pH 7.0 ambos dominios se encontraban plegados a la vez. Si comparamos ambas trazas, la del tándem SH3SH2 aislado y en presencia del conector C2Q (Figura 4.7), podemos comprobar cómo en presencia de C2Q, se observa un único pico muy agudo, lo que indica que la interacción con la secuencia de conexión hace que el desplegamiento del tándem sea altamente cooperativo. 148 Capítulo 4 Figura 4.7. Dependencia de la capacidad calorífica molar parcial con la temperatura para el tándem cAblSH3SH2 (fucsia) y el tándem cAblSH3SH2-C2Q (azul). Los datos se obtienen a partir de los experimentos en Pipes 50 mM y pH 7.0. No ha sido posible ajustar los datos a un modelo termodinámico debido a que no se han encontrado las condiciones en las que ambos dominios sean reversibles de forma simultánea. Como hemos visto anteriormente, el comportamiento en tándem de cAbl SH3SH2 es muy diferente al comportamiento de cSrc SH3SH2. Mientras que en el primer caso, ambos dominios parecen desplegarse de forma individual, en el caso del tándem de cSrc, los dominios SH3 y SH2 presentan una elevada cooperatividad conformacional. Estudios computacionales realizados previamente (Faraldo-Gomez and Roux 2007) muestran una clara preferencia de cSrc SH3H2 por conformaciones compatibles con la conformación cerrada, de tal modo que el dominio SH3 pueda interaccionar con el conector C2Q en la conformación inactiva de la quinasa. Para analizar el efecto de este conector C2Q en el equilibrio conformacional del tándem cSrc SH3SH2 hemos llevado a cabo la caracterización de la desnaturalización térmica de la construcción cSrc SH3SH2-C2Q por DSC. Al igual que para el resto de construcciones en tándem, tanto de cSrc como de cAbl, el desplegamiento de este tándem resulta irreversible a cualquier pH, únicamente a pH 7.0 ambos dominios se encuentran plegados a la vez. Como podemos observar en la Figura 4.8, la presencia del conector C2Q en el tándem cSrcSH3SH2 hace que la estructura del tándem SH3SH2 siga siendo altamente cooperativa, además 149 de aumentar ligeramente la Tm de la construcción, lo que podría relacionar la presencia de C2Q con un aumento de la estabilidad del tándem. Figura 4.8. Comparación de la dependencia de la capacidad calorífica molar parcial con la temperatura para las construcciones cSrcSH3SH2-C2Q (azul) y cSrcSH3SH2 (fucsia). Los datos se obtienen a partir de los experimentos en Pipes 50 mM y pH 7.0. No ha sido posible ajustar los datos a un modelo termodinámico debido a que no se han encontrado las condiciones en las que ambos dominios sean reversibles de forma simultánea. Para evaluar el efecto de la presencia del conector C2Q en la distribución conformacional del tándem y en el origen de la cooperatividad observada, se realizaron simulaciones adicionales de dinámica molecular con la construcción Abl SH3SH2-C2Q. Para ello se calcularon dos trayectorias de dinámica molecular de 500 ns para la construcción cAbl SH3SH2 que incluía también el conector C2Q unido al dominio SH3 y usando la conformación cerrada como punto de partida (Corbi-Verge 2012). En estas simulaciones se observó que durante toda la simulación el tándem permanecía en la conformación inicial (Panel a, Figura 4.9), en contraste con las simulaciones del tándem aislado, sugiriendo que la interacción con C2Q no sería posible en la conformación abierta del tándem SH3SH2. Los cálculos de superficie de energía libre realizados a través de las metadinámicas proporcionaron resultados similares (Panel b, Figura 4.9). En éstos se observa una única y amplia región donde se concentran los valores mínimos de energía libre 150 Capítulo 4 que corresponde a la conformación cerrada del tándem. Estos resultados indican claramente que la presencia del conector C2Q desplaza la distribución conformacional del tándem hacia la forma cerrada, de tal manera que debe ser indispensable la pérdida de interacciones entre el dominio SH3 y el conector C2Q para el cambio de conformación y la activación de cAbl. Esto refuerza el papel de C2Q como un elemento imprescindible en el mecanismo de autoinhibición de cAbl, en contraste con lo observado para Hck. Figura 4.9. a) Dinámica conformacional de la construcción cAbl SH3SH2-C2Q en dos simulaciones de 500 ns las cuales se inician en la conformación cerrada. Las coordenadas de los descriptores (D1 y D2), están coloreadas según la frecuencia en las que son visitadas durante la trayectoria. En azul se resaltan las coordenadas visitadas de 1 a 10 veces, en naranja de 10 a 100 y en rojo las que son visitadas más de 100 veces. b) Proyección de la superficie de energía libre en el espacio RMSD respecto a la configuración cerrada (2FO0). Con un cuadrado azul de 4 Å de lado se resaltan las regiones que corresponden a las conformaciones cristalográficas abierta y cerrada. En ambos paneles podemos observar cómo la estructura únicamente permanece en su conformación cerrada (Corbi-Verge 2012). 151 Como ya hemos señalado, experimentos previos con quinasas de tirosina de la subfamilia de Src, determinaron que la afinidad del dominio SH3 por la secuencia de conexión C2Q era muy baja, estando favorecida principalmente por el empaquetamiento de esta secuencia entre los dominios quinasa y SH3 (Brown and Cooper 1996; Boggon and Eck 2004). Sin embargo, Engen y colaboradores propusieron que la secuencia C2Q de cAbl podría tener una afinidad muy superior por el dominio SH3 que en la familia de cSrc (Engen et al. 2008). Así, la unión de C2Q al dominio SH3 en la conformación inicial de la trayectoria es suficiente para que el tándem permanezca durante toda la simulación en la conformación cerrada. Hay que tener en cuenta que el tándem SH3SH2 no puede adoptar la conformación abierta sin dejar de interaccionar con la región C2Q, de forma que esta secuencia podría constituir un elemento clave para mantener cAbl en la conformación autoinhibida. Con la intención de obtener una interpretación mecanística de los datos de DSC y poder así compararlos con los resultados obtenidos computacionalmente, hemos creado dos modelos termodinámicos estudiando la interacción del tándem cAbl SH3SH2 y cAbl SH3SH2-C2Q. Los modelos están basados en las relaciones de termodinámica estadística entre la estabilidad de los dominios, la cooperatividad inter-dominio, y la unión del ligando. En ambos modelos se consideran las dos conformaciones alternativas del tándem SH3SH2: conformación 1) el estado abierto, que corresponde con el mínimo de energía libre cuando el dominio SH3 no está unido al conector C2Q, y conformación 2) el estado cerrado, el cual está menos poblado en ausencia de dicha interacción. La primera conformación se considera como el estado de referencia para la formulación de los modelos. Las simulaciones de los termogramas de DSC para cada modelo se aplican tanto al tándem cAbl SH3SH2 como a la construcción cAbl SH3SH2-C2Q. En el Modelo 1 asumimos que no existe cooperatividad entre ambos dominios, es decir, el conector C2Q interacciona con el dominio SH3 independientemente del estado de plegamiento del dominio SH2. En el Modelo 2, consideramos que existe una completa cooperatividad en el desplegamiento del tándem SH3SH2 cuando el conector C2Q está unido, es decir, los estados parcialmente desplegados no están poblados cuando está unido el conector. Para cada modelo, consideramos un estado en el que C2Q se une preferentemente a la conformación cerrada, como predice 152 Capítulo 4 nuestra simulación computacional, y otro estado en el que el conector se une a la conformación abierta. Los estados propuestos para cada modelo se enumeran en la Tabla 4.1. Cada estado está representado en función del estado de plegamiento y unión de cada dominio. La energía de Gibbs respecto al estado de referencia (conformación abierta) son las variables de entrada de los modelos. El peso estadístico de cada estado corresponde al exponente de Boltzmann de esas energías libres. ΔGcd es la diferencia energética entre la conformación abierta y la cerrada. En todos los cálculos se asume que este valor es de 20 kJ·mol-1 a 25ºC, el cual corresponde, aproximadamente, al valor estimado de 17 kJ·mol-1 obtenido en las metadinámicas (Corbi-Verge 2012). ΔGC2Q-ab, ΔGC2Q-cd y ΔGC2Q-pd representan las energías libres de interacción entre el conector C2Q y el dominio SH3, en la conformación abierta, en la conformación cerrada y en los estados parcialmente desplegados del tándem, respectivamente. Finalmente, ΔG2 y ΔG3 son las energías libres del desplegamiento de los dominios SH2 y SH3 cuando no se encuentran unidos a C2Q (En el Apéndice II aparece el desarrollo matemático de cada modelo). Tabla 4.1. Clasificación de los estados considerados en el Modelo 1 y el Modelo 2, acompañados por sus respectivas energías libres y el peso estadístico de cada estado. Los modelos se diferencian en la consideración o no de los estados parcialmente desplegados. Los dominios SH3 y SH2 se representan como círculos azules y rojos (estado plegado), o garabatos (estado desplegado), respectivamente. El conector C2Q se muestra en verde. 153 Las simulaciones obtenidas para estos dos modelos se muestran en la Figura 4.10. Los paneles A y B corresponden al Modelo 1 en el que la interacción del conector C2Q con el dominio SH3 no implica cooperatividad entre los dominios que forman el tándem, por lo que la interacción puede darse tanto en el estado nativo como en el semidesplegado. En la simulación del panel A esa interacción sólo puede darse en la conformación abierta del estado nativo y con la misma intensidad que en el estado semidesplegado (ΔGC2Q-ab =ΔGC2Q-pd), estando impedida la interacción en la conformación cerrada, para lo que se da un valor alto a su correspondiente energía de Gibbs (ΔGcd=100kJ·mol-1). En el panel B se impide la interacción en la conformación abierta (ΔGab=100kJ·mol-1) y la de la conformación cerrada se equipara a la del estado semidesplegado (ΔGC2Q-cd =ΔGC2Q-pd). En ambos casos se observa que al aumentar la intensidad de la interacción del conector C2Q con el dominio SH3 se produce un desplazamiento del segundo pico a mayores temperaturas, lo que implica una estabilización de este dominio, mientras que la transición del dominio SH2 no se ve afectada (Panel A, Figura 4.10) o se desplaza a temperaturas más bajas debido a la estabilización del estado semidesplegado por la interacción con el conector (Panel B, Figura 4.10). De cualquier modo las simulaciones de los paneles A y B distan mucho de acercarse a la transición única y aguda que se obtiene experimentalmente para la construcción cAbl SH3SH2-C2Q. Los paneles C y D corresponden al Modelo 2 en el cual el valor de ΔGC2Q-pd se considera muy elevado ya que no se contemplan los estados semidesplegados. En ambos paneles los termogramas reflejan una cooperatividad completa, la forma de los picos bajo cualquier condición se desplaza a mayores temperaturas a medida que aumenta la energía de interacción. Sin embargo, para las constantes de disociación que se encuentran en el rango de µM, los valores de Tm se sitúan por encima de 70ºC (Panel C, Figura 4.10). Por el contrario, los picos que aparecen en torno a 60ºC pertenecen a constantes de disociación superiores a 5 µM (Panel D, Figura 4.10). Está claro desde este análisis que la medida de DSC para la construcción Abl SH3SH2-C2Q es muy distinta a las que aparecen en los Paneles A y B de la Figura 4.10. El termograma de la Figura 4.7 es mucho más parecido a los termogramas simulados en los Paneles C y D de la Figura 4.10. Sin embargo, el rango teórico de los valores de Tm para estos picos cooperativos depende de si se asumen dos escenarios posibles: 1) C2Q se une a la conformación abierta, con una constante de disociación 154 Capítulo 4 extremadamente baja (10-100 nm) o 2) C2Q se une a la conformación cerrada con una constante de disociación en el rango entre mM y µM. No obstante, sólo la última situación parece más probable, ya que éste es el rango de la constante de unión observada para el reconocimiento de poliprolina por dominios SH3 (Palencia et al. 2004). Figura 4.10. Simulación de los perfiles de capacidad calorífica para la desnaturalización térmica de la construcción cAblSH3SH2-C2Q. Los paneles A y B corresponden al Modelo 1 y los paneles B y C se han obtenido a partir del Modelo 2. En los paneles A y C, se supone que el conector C2Q se une a la conformación abierta del tándem, la cual es también el estado con menor energía libre. En los paneles B y D el conector C2Q se une a la conformación cerrada que presenta una mayor energía libre. En cada panel, las simulaciones de los termogramas de DSC para la forma libre del tándem SH3-SH2 se muestra en negro y se obtiene usando como valores ΔGC2Q-ab,=ΔGC2Q-cd=ΔGC2Q-pd= 100 kJ·mol-1. Después se explora un intervalo de afinidades de unión del conector C2Q y las diferentes simulaciones de termogramas obtenidas se representan en distintos colores. En los paneles A y C el valor de ΔGC2Q-cd es de 100 kJ·mol-1 mientras se varía el valor de ΔGC2Q-ab. En los paneles B y D ΔGC2Q-abtiene un valor de 100 kJ·mol-1, mientras que el valor de ΔGC2Qcd varía. El valor de ΔGC2Q-pd se considera igual al valor de ΔGC2Q-ab y de ΔGC2Q-cd en los paneles A y B, respectivamente. En los paneles C y D este valor se considera muy elevado ya que no se contemplan los estados semidesplegados. Los parámetros de estabilidad usados en las simulaciones para los dominios individuales son: Tm = 50ºC, ΔH (Tm) = 300 kJ·mol-1, y ΔCp = 1 kJ· (K·mol-1) para el dominio SH2 y Tm = 70ºC, ΔH (Tm) = 180 kJ·mol-1, y ΔCp = 1 kJ·(K·mol-1) para el dominio SH3. La diferencia de energía libre entre el estado abierto y el estado cerrado es de 20 kJ·mol-1, valor cercano al obtenido en los cálculos computacionales. 155 Los datos de DSC obtenidos indican que la presencia del conector C2Q tiene un gran efecto en el comportamiento del tándem, acoplando el desplegamiento de los dominios SH3 y SH2 como una única unidad cooperativa. Además, de acuerdo con los datos de DSC, las simulaciones de dinámica molecular y los modelos mecanísticos usados, existe una interacción preferente del conector con el dominio SH3 en la conformación cerrada. 4.2.4. Papel del conector C3-2 en el equilibrio conformacional del tándem SH3SH2 Como ya hemos visto en los apartados anteriores, al superponer las estructuras cristalográficas 2ABL y 2FO0 (usando como referencia solamente el dominio SH2), observamos un cambio en la orientación relativa de los dominios modulares que implica el desplazamiento y rotación del dominio SH3 respecto al dominio SH2. Como se puede apreciar en la Figura 4.3, en la zona de la secuencia de conexión entre los dominios SH3 y SH2 (C3-2), podemos percibir un ligero cambio en algunos de los residuos más cercanos al dominio SH3 que se traduce en un cambio en el valor de RMSD del conector C3-2 cuando el tándem cambia de orientación relativa (Corbi-Verge 2012). Experimentalmente, mutaciones realizadas en esta región han dado lugar a un aumento en los niveles de activación tanto en la quinasa de cSrc como en la quinasa de cAbl (Hantschel and Superti-Furga 2004; Nagar et al. 2006). Una interpretación factible de estos resultados sería considerar que las mutaciones realizadas en el conector C3-2 disminuirían su habilidad de acoplar los dos lóbulos del dominio catalítico en el estado inactivo, incluso si el complejo está ensamblado (Young et al. 2001; Nagar et al. 2006). Otra alternativa posible, complementaria a esta explicación, sería que en los mutantes el equilibrio entre la forma acoplada y desacoplada de la enzima se desplazaría hacia la segunda, es decir, hacia el estado activado (Ulmer et al. 2002). Para investigar la validez de esta segunda interpretación, llevamos a cabo el estudio del impacto de las mutaciones en el conector cAbl SH3SH2 sobre la habilidad del tándem para unirse al conector SH2quinasa (C2Q). Para localizar los residuos específicos que debían ser mutados, se recogieron los valores de los ángulos diedros del esqueleto peptídico de los residuos que componen la secuencia C3-2 a lo largo de las 156 Capítulo 4 diferentes trayectorias. El análisis mostró que el intercambio entre la conformación abierta y la cerrada está relacionada con las transiciones entre los ángulos phi y psi en la posiciones N139, S140 y, aunque en menor medida, L141 (Corbi-Verge 2012). Algo que, a priori, parece coincidir con los datos experimentales obtenidos por Brasher y colaboradores que indican que la mutación a glicina de los restos S140, L141 y E142 provoca la activación de cAbl (Brasher et al. 2001). Estos resultados indican que los residuos N139, S140 y L141 del conector SH3SH2 actúan a modo de articulación, modulando el movimiento de orientación relativa entre los dominios SH3 y SH2, fruto del equilibrio entre flexibilidad y rigidez conformacional de la secuencia conectora. Para comprobar que, efectivamente, estos residuos son claves para modular el equilibrio conformacional del tándem, se sustituyeron los tres residuos por glicinas, ya que la glicina posee una mayor libertad conformacional. Esta triple mutación conduce a una disminución significativa de la Tm respecto a la construcción cAbl SH3SH2-C2Q de unos 3.5ºC, sin un cambio importante en la forma del termograma (Figura 4.11). Este desplazamiento lo podemos interpretar como un reflejo del aumento de la entropía conformacional. Figura 4.11. Comparación de la dependencia de la capacidad calorífica molar parcial con la temperatura para la construcción cAblSH3SH2-C2Q (verde) y su variante con la triple mutación de glicina cAbl SH32-C2Q (3xGly) (Rojo). Los experimentos se llevaron a cabo en tampón Pipes 50 mM pH 7.0. 157 Estos resultados están en concordancia con los obtenidos mediante las simulaciones de dinámica molecular, donde se observa que al introducir estas glicinas se produce un aumento de la flexibilidad de esta región, aumentando la entropía conformacional del tándem y favoreciéndose la conformación abierta (Figura 4.12). Sin embargo, existen conformaciones compatibles con la unión del conector C2Q y el dominio SH3 que se encuentran significativamente pobladas, quizá por esta razón no varíe de un modo significativo la forma del termograma. Estos datos sugieren que, una vez que se activa cAbl, la orientación relativa de los dominios modulares es muy importante y, por lo tanto, es necesario que se encuentre controlada. Figura 4.12. Dinámica conformacional de la mutación (3xGly) en el conector C3-2 en una simulación de 250 ns. Las coordenadas de los descriptores (D1 y D2), están coloreadas según la frecuencia en las que son visitadas durante la trayectoria. En azul se resaltan las coordenadas visitadas de 1 a 10 veces, en naranja de 10 a 100 y en rojo las que son visitadas más de 100 veces. Con los resultados obtenidos decidimos probar el efecto contrario, es decir, en lugar de aumentar la flexibilidad del conector, se sustituyó la S140 por una prolina, observándose un efecto drástico. La presencia de la prolina en la construcción cAbl SH3SH2-C2Q genera un termograma en el que vuelven a aparecer dos picos, que corresponderían al desplegamiento de cada uno de los dominios de forma individual, del mismo modo que cuando analizábamos el tándem cAbl SH3SH2, de forma que, aún en presencia del conector C2Q, los dominios permanecen desacoplados (Figura 4.13). Esto significaría una pérdida de cooperatividad respecto a la construcción silvestre cAbl SH3SH2-C2Q. 158 Capítulo 4 Figura 4.13. Comparación de la dependencia de la capacidad calorífica molar parcial con la temperatura para la construcción cAblSH3SH2-C2Q (verde) y su variante con mutación de prolina, cAblSH3SH2-C2Q (S140P) (granate). Los experimentos se llevaron a cabo en tampón Pipes 50 mM pH 7.0. Una vez más estos resultados están en concordancia con los obtenidos en las simulaciones de dinámica molecular, donde la mutación por prolina en el conector C3-2 induce al tándem a adoptar prácticamente una única conformación, alejada de la forma cerrada, y que aparentemente es incompatible con la interacción entre el conector C2Q y el dominio SH3 (Figura 4.14). De este modo, se hace evidente cómo los residuos que ocupan tanto la posición 140, como las posiciones colindantes, son claves en el equilibrio conformacional del tándem y, por lo tanto, vitales para la regulación de la actividad de la quinasa de tirosina cAbl. Por lo tanto, es lógico pensar, que estas mutaciones explican, al menos en parte, el aumento en los niveles de activación observados (Hantschel and Superti-Furga 2004). 159 Figura 4.14. Dinámica conformacional de la mutación S140P en el conector C3-2 en una simulación de 250 ns. Las coordenadas de los descriptores (D1 y D2), están coloreadas según la frecuencia en las que son visitadas durante la trayectoria. En azul se resaltan las coordenadas visitadas de 1 a 10 veces, en naranja de 10 a 100 y en rojo las que son visitadas más de 100 veces. Estos datos podrían explicar por qué las variantes resistentes de las formas oncogénicas de BCR-ABL con mutaciones en la región del conector C3-2 no responden a los inhibidores como Gleevec (Gorre et al. 2002; Azam et al. 2003; Ernst et al. 2011). En la forma oncogénica BCRABL, aunque el mecanismo de autoinhibición esté dañado, el dominio SH3 debe seguir inhibiendo la actividad gracias a su unión con el conector C2Q, ya que este mecanismo se encuentra intacto. Una mutación en la región C3-2 puede acabar por desplazar este equilibrio hacia la conformación abierta, contrarrestando el efecto inhibidor de la interacción del dominio SH3 con C2Q, lo que aumentaría la actividad de la forma oncogénica y disminuiría la efectividad del inhibidor. 4.2.5. Influencia del conector C2Q y las mutaciones en el conector C3-2 de cAbl en la energética de unión En un primer momento, decidimos llevar a cabo un estudio sobre el comportamiento del tándem cAbl SH3SH2 y la construcción cAbl SH3SH2-C2Q en presencia de un ligando rico en poliprolina el cual presentase una mayor afinidad por el dominio SH3 que el propio conector C2Q. Para ello, realizamos un estudio mediante Calorimetría Isotérmica de Titulación de la interacción del tándem cAbl SH3SH2 y de la construcción cAbl SH3SH2-C2Q con el ligando p41 (APSYSPPPPP) 160 Capítulo 4 (Figura 4.15). Este péptido se obtuvo mediante métodos de diseño racional a partir del ligando natural 3BP1 (APTMPPPLPP) y es uno de los ligandos descritos hasta la fecha, con mayor afinidad por el dominio cAbl-SH3 (Pisabarro et al. 1994; Pisabarro and Serrano 1996). Los experimentos los hemos realizado en tampón Pipes 20 mM, pH 7.0 a 25ºC y los resultados obtenidos se representan en la Tabla 4.2. En el caso de las construcciones cSrc SH3SH2 y cSrc SH3SH2C2Q, el estudio de la influencia de un ligando de alta afinidad en la interacción entre el dominio SH3 y C2Q, se realizó con el péptido VSL12 cuya interacción con el dominio SH3 ha sido estudiada con profundidad en nuestro grupo de investigación (Martin-Garcia 2009). Los experimentos de Calorimetría Isotérmica de Titulación (Figura 4.16) también los hemos llevado a cabo en tampón Pipes 20 mM, pH 7.0 a 25ºC y los resultados obtenidos aparecen en la Tabla 4.2. 161 162 Figura 4.15. Experimentos de titulación mediante ITC del ligando p41 con el dominio cAbl-SH3, el tándem cAbl SH3SH2 y la construcción cAbl SH3SH2-C2Q en Pipes 20 mM, pH 7.0 y 25ºC. a) Termograma de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando p41 sobre las distintas construcciones. b) Isoterma de unión correspondiente al experimento a, obtenida después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (ecuación 2.5.11). Figura 4.16. Experimentos de titulación mediante ITC del ligando VSL12 con el dominio cSrc-SH3, el tándem cSrc SH3SH2 y la construcción cSrc SH3SH2-C2Q en Pipes 20 mM, pH 7.0 y 25ºC. a) Termograma de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando VSL12 sobre las distintas construcciones. b) Isoterma de unión correspondiente al experimento a, obtenida después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (ecuación 2.5.11). Capítulo 4 163 Para comprobar el efecto de las mutaciones realizadas en el conector C3-2 en la energética de unión entre el dominio SH3 y el ligando p41, realizamos un estudio de esta unión mediante ITC en Pipes 20 mM, pH 7.0 y 25ºC (Figura 4.17). Los parámetros termodinámicos obtenidos se detallan en la Tabla 4.2. Figura 4.17. Experimentos de titulación mediante ITC del ligando p41 con los mutantes cAblSH3SH2-C2Q (3xGly) y cAblSH3SH2-C2Q (S140P) en Pipes 20 mM, pH 7.0 y 25ºC. a) Termograma de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando p41 sobre las distintas construcciones. b) Isoterma de unión correspondiente al experimento a, obtenida después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (ecuación 2.5.11). Desafortunadamente, no podemos extraer información relevante de estos experimentos debido a la similitud en las constantes de disociación tanto para cAbl como para cSrc. Tampoco hay una gran diferencia en la entalpía de unión, exceptuando el caso del mutante cAblSH3SH2-C2Q (S140P) y la construcción cSrcSH3SH2-C2Q, donde la diferencia ronda los 20 kJ·mol-1. Este cambio podría estar relacionado con cambios conformacionales debido a la unión de los ligandos p41 y VSL12 o a los eventos de precipitación observados en el transcurso de los experimentos de ITC. En cualquier caso, la información obtenida a través 164 Capítulo 4 de los experimentos de titulación calorimétrica es escasa a la hora de relacionarla con los datos obtenidos tanto por DSC como por dinámica molecular. Tabla 4.2. Parámetros termodinámicos obtenidos a partir de los experimentos de ITC para la unión del ligando p41 al dominio cAbl-SH3, al tándem cAbl SH3SH2 y a la construcción cAbl SH3SH2-C2Q, y parámetros termodinámicos para la unión del ligando VSL12 al dominio cSrc-SH3, al tándem cSrc SH3SH2 y la construcción cSrc SH3SH2C2Q. Todos los experimentos están realizados en Pipes 20 mM pH 7.0 a 25 oC. Kd# (µM) ∆Gap (kJ/mol) ∆Hap# (kJ/mol) -T∆Sap (kJ/mol) cAbl-SH3 1.9 -32.7 -85.3 52.6 cAblSH3SH2 4.0 -30.8 -77.6 46.8 7.6 -29.2 -75.9 46.7 cAblSH3SH2C2Q (3XGly) 3.9 -30.9 -77.6 46.7 cAblSH3SH2C2Q (S140P) 4.6 -30.5 -91.7 61.2 cSrc-SH3 0.2 -38.2 -69.3 31.1 0.3 -37.2 -58.9 21.7 0.7 -35.1 -46.1 11.0 Proteína cAblSH3SH2C2Q cSrcSH32 cSrcSH3SH2C2Q Ligando p41 VSL12 # Los errores en los parámetros termodinámicos se estiman en torno al 5% para la entalpía de unión y al 10% para la constante de disociación 165 4.3. Conclusiones Del análisis del equilibrio conformacional del tándem de los dominios SH2 y SH3 de cAbl realizado se desprenden las siguientes conclusiones: 1. El tándem SH3SH2 de cAbl en ausencia de las interacciones con C2Q se comporta como un interruptor molecular que se encuentra en un equilibrio conformacional entre dos formas, la abierta y la cerrada, aunque la más probable es la abierta. 2. La secuencia C2Q, en ausencia de ningún otro elemento de la quinasa, reconfigura el espacio conformacional del tándem, haciendo que la configuración más estable sea la cerrada. Esto, sumado al desplegamiento cooperativo observado por DSC del tándem SH3SH2 en presencia del conector C2Q, reforzaría la idea de que la interacción entre C2Q y el dominio SH3 tiene una afinidad mayor en cAbl que en cSrc, respondiendo así a la necesidad de aumentar la estabilidad de la conformación cerrada en ausencia de las interacciones que establece el extremo C-terminal con el dominio SH2 para la familia Src. 3. El equilibrio conformacional del tándem se encuentra modulado gracias a las propiedades de la secuencia que conecta ambos dominios modulares, C3-2. El conector C3-2 es responsable de limitar la entropía conformacional del tándem de los dominios modulares, otorgándoles suficiente libertad para que el dominio SH3 se desplace para reconocer ligandos y liberar el dominio catalítico, a la vez que limita las conformaciones posibles para que el dominio SH3 se mantenga unido a C2Q. Se destaca asimismo el papel de los residuos que se encuentran en las posiciones 139, 140 y 141. 166 Capítulo 5 Efectos contextuales en la especificidad y afinidad de unión de los dominios WW de hNedd4 Capítulo 5 CAPÍTULO 5.- EFECTOS CONTEXTUALES EN LA ESPECIFICIDAD Y AFINIDAD DE UNIÓN EN LOS DOMINIOS WW DE hNedd4 5.1. Introducción Como se ha mencionado en el Capítulo 1, la etapa final del ciclo de vida de los virus encapsulados consiste en un proceso de fusión con la membrana de la célula huésped que tiene como resultado la liberación del virus. En el proceso de liberación del virus están implicadas pequeñas secuencias ricas en prolina que se denominan dominios L (“Late assembly domains”) y se hallan en diversas proteínas víricas como las poliproteínas Gag de los retrovirus o en las proteínas de matriz de rhabdovirus y filovirus. La eliminación de estos dominios o la alteración de su secuencia, bloquea la liberación del virus, impidiendo la propagación de las partículas infecciosas (Gottlinger et al. 1991; Yasuda and Hunter 1998; Freed 2002; Yasuda et al. 2003). Existen numerosas evidencias experimentales que indican que los dominios L no actúan directamente en la morfogénesis del virión, sino que su principal función es reclutar la maquinaria celular necesaria para el ensamblaje del virus y su posterior liberación. Este proceso tiene lugar mediante la interacción directa de los dominios L víricos con proteínas celulares implicadas en los mecanismos de creación y gestión de vesículas. Los dominios L con secuencia PTAP, presentes en virus como el VIH-1 o Ébola, interaccionan con el dominio UEV de la proteína Tsg101 (“Tumor Susceptibility Gene 101” (VerPlank et al. 2001; Bouamr et al. 2003); mientras que los dominios de tipo PPxY, presentes en los virus del Ébola, de Mason-Pfizer, del sarcoma Rous y otros onco-retrovirus como el virus de la leucemia humana de linfocitos T de tipo I (HTLV1), interaccionan con la ligasa de ubiquitina humana Nedd4, y más concretamente con el tercer dominio WW (Harty et al. 2000; Harty et al. 2001; Freed 2002; Yasuda et al. 2003; Demirov and Freed 2004). El diseño de moléculas de pequeño tamaño que bloqueen las interacciones víricas se ha consolidado como una estrategia viable para el desarrollo de nuevos fármacos contra patógenos tan letales como el VIH o el Ébola. Dado que el diseño eficaz de estos inhibidores requiere una comprensión profunda de las fuerzas que dirigen las interacciones entre los dominios L y sus dianas, nuestro grupo de investigación fue el primero en abordar una caracterización termodinámica detallada y completa del equilibrio conformacional de algunos dominios WW, entre ellos el tercer y cuarto dominio WW de hNedd4, así como un análisis exhaustivo de la interacción de estos dominios con sus ligandos (Cobos et al. 2009; Bexiga 2011). Como hemos visto en los capítulos anteriores, el análisis del plegamiento y de las propiedades cooperativas es muy relevante para la comprensión de la regulación y la transmisión de información en los 171 módulos de reconocimiento molecular y, por tanto, para el diseño racional de ligandos. De este modo, es importante establecer los posibles efectos que la configuración en tándem de los dominios WW pudiera tener sobre la estabilidad y cooperatividad estructural de la proteína, así como los posibles efectos sinérgicos entre los diferentes dominios que podrían influir en la afinidad y especificidad de unión. Diferentes estudios estructurales de distintas proteínas con dominios WW en tándem, revelan que la secuencia que los conecta tiene propiedades y funciones muy diferentes en cada caso. Esta secuencia puede estar estructurada y orientar los dominios en caras opuestas, como sucede para la pareja de dominios WW1WW2 de la proteína Prp40. Esta orientación es necesaria para unir proteínas específicas en los intrones de los precursores del ARNm en el espliceosoma (Wiesner et al. 2002). Lo mismo ocurre con los dominios WW1WW2 de FBP11, donde las cadenas laterales se quedan orientadas de tal modo que ambos dominios pueden unirse a la vez a sus respectivos ligandos (Ramirez-Espain et al. 2007). La secuencia que conecta los dominios también puede ser una secuencia más larga, flexible y desestructurada como la secuencia ubicada entre los dominios WW3WW4 de la proteína Suppressor de Deltex Su(dx). Esta secuencia estabiliza el dominio Su(dx)-WW4 que está parcialmente desestructurado antes de que se produzca la unión de un ligando al otro dominio Su(dx)WW3 (Fedoroff et al. 2004; Jennings et al. 2007). En ocasiones, la secuencia de conexión puede ser relativamente corta y flexible permitiendo que los dominios tengan cierta libertad conformacional pero obligando a que estén suficientemente próximos el uno del otro para aumentar la superficie de unión y reconocer ligandos con dos motivos de unión, este es el caso de los dominios WW1WW2 de la proteína FBP21 (Huang et al. 2009; Klippel et al. 2011). Recientemente se ha descrito otra forma de unión cooperativa para el primer y segundo dominio en tándem de Smurf1 y el supresor tumoral WWOX, similar a la del tándem FBP21 WW1WW2, aunque en este caso los dominios individuales Smurf1 WW2 y WWOX WW2, por sí solos no tienen capacidad de unir ligandos ricos en prolina. Cuando el domino WW2 de Smurf1 se encuentra formando un tándem con el dominio WW1, interaccionan entre ellos expandiendo la superficie de unión con el péptido. En este complejo, el domino Smurf1WW2 proporciona contactos adicionales con los restos contiguos al motivo PPxY del ligando que se une a Smurf1 WW1, con el consiguiente aumento en la afinidad de unión (Chong et al. 2010). El dominio WW1 de WWOX aislado está estructuralmente desordenado, sin embargo, cuando se une a un ligando se encuentra como una estructura correctamente plegada. La presencia del dominio WW2 en tándem hace que el dominio WW1 se estabilice, favoreciendo la unión de ligandos y aumentando su afinidad (McDonald et al. 2012). En este contexto, nos hemos propuesto, dentro de los objetivos de este trabajo, y debido a la importancia del dominio WW3 como diana 172 Capítulo 5 para el desarrollo de agentes terapéuticos, evaluar los posibles efectos sinérgicos en las construcciones en tándem de los distintos dominios WW que componen hNedd4, tanto en cuanto a su equilibrio conformacional, como en el reconocimiento de ligandos. 5.2. Resultados y discusión 5.2.1. Construcciones en tándem de los dominios WW de hNedd4 Para estudiar la influencia de los efectos contextuales en la cooperatividad y en la especificidad de unión, hemos realizado la caracterización termodinámica del equilibrio conformacional y de la energética de unión de los cuatro dominios WW que componen hNedd4, tanto de forma individual como de sus diferentes construcciones en tándem. Para ello, hemos clonado, expresado y purificado las siguientes construcciones de dominios, que se recogen en la Figura 5.1. hNedd4 WW1WW2 SPLPPGWEERQDILGRTYYVNHESRRTQWKRPTPQDNLTDAENGNIQ LQAQRAFTTRRQISEETESVDNRESSENWEIIREDEATMYSNQAFPSPPP SSNLDVPTHLAEELNARLTIFGNSAVSQPASSSNHSSRRGSLQAYTFEEQ PTLPVLLPTSSGLPPGWEEKQDERGRSYYVDHNSRTTTWTKPTV hNedd4 WW3WW4 GFLPKGWEVRHAPNGRPFFIDHNTKTTTWEDPRLKIPAHLRGKTSLDT SNDLGPLPPGWEERTHTDGRIFYINHNIKRTQWEDPRL hNedd4 WW2WW3WW4 SGLPPGWEEKQDERGRSYYVDHNSRTTTWTKPTVQATVETSQLTSSQS SAGPQSQASTSDSGQQVTQPSEIEQGFLPKGWEVRHAPNGRPFFIDHNT KTTTWEDPRLKIPAHLRGKTSLDTSNDLGPLPPGWEERTHTDGRIFYI NHNIKRTQWEDPRL hNedd4 WW1WW2WW3WW4 SPLPPGWEERQDILGRTYYVNHESRRTQWKRPTPQDNLTDAENGNIQ LQAQRAFTTRRQISEETESVDNRESSENWEIIREDEATMYSNQAFPSPPP SSNLDVPTHLAEELNARLTIFGNSAVSQPASSSNHSSRRGSLQAYTFEEQ PTLPVLLPTSSGLPPGWEEKQDERGRSYYVDHNSRTTTWTKPTVQATV ETSQLTSSQSSAGPQSQASTSDSGQQVTQPSEIEQGFLPKGWEVRHAPN GRPFFIDHNTKTTTWEDPRLKIPAHLRGKTSLDTSNDLGPLPPGWEER THTDGRIFYINHNIKRTQWEDPRL Figura 5.1. Secuencias de las diferentes construcciones en tándem de los dominios WW de hNedd4. El dominio WW1 aparece representado en fucsia, el dominio WW2 en azul, el dominio WW3 en verde y el dominio WW4 en granate. Las secuencias que conectan los distintos dominios aparecen en negro. 173 5.2.2. Estudio del equilibrio conformacional de los dominios WW individuales de hNedd4 Como hemos mencionado anteriormente, nuestro grupo de investigación realizó una caracterización exhaustiva del tercer y cuarto dominio WW de la ligasa de ubiquitina humana Nedd4 (Cobos et al. 2009; Bexiga 2011). Los datos obtenidos para hNedd4 WW4 indican que, aunque el modelo de dos estados describe el comportamiento experimental de manera razonable, los parámetros termodinámicos obtenidos no son propios de proteínas dos estados, sino más similares a los de proteínas tipo “downhill” como BBL (Naganathan et al. 2005) y gpW (Fung et al. 2008). Además, la existencia de una desnaturalización a bajas temperaturas y los experimentos de doble perturbación indican que el nivel de cooperatividad en el equilibrio es muy bajo. En el caso de los experimentos llevados a cabo con el dominio hNedd4 WW3, no siguen los criterios establecidos para una proteína dos estados y más bien apuntan a un plegamiento sin barreras o con barreras de energía muy bajas separando los diferentes macroestados. Para poder evaluar los efectos sinérgicos en las construcciones en tándem, necesitamos caracterizar tanto los dominios individuales como las construcciones en tándem. Por esta razón, hemos realizado una caracterización termodinámica de los dominios WW restantes que componen hNedd4, hNedd4 WW1 y hNedd4 WW2. En la Figura 5.2 se representan las trazas de DSC correspondientes al proceso de desnaturalización térmica de los dominios WW1 y WW2 de hNedd4 en tampón fosfato sódico 50 mM a pH 7.0, condición en la cual el proceso de desnaturalización ha presentado una elevada reversibilidad. Los termogramas se han analizado mediante un ajuste individual al modelo de dos estados (Sección 2.2.4). Los datos termodinámicos obtenidos de este análisis se representan en la Tabla 5.1. Tabla 5.1. Parámetros termodinámicos de plegamiento de los dominios WW1, WW2, WW3 y WW4 de hNedd4. Proteína hNedd4 WW1 hNedd4 WW2 hNedd4 WW3 hNedd4 WW4 174 Tm (oC) ∆Hm(kJ/mol) ∆G25ºC (kJ/mol) 57.1 108.9 8.3 49.3 86.8 4.7 57.2 83.0 7.5 56.8 127.6 9.7 Capítulo 5 En la Tabla 5.1 también se incluyen los valores obtenidos del mismo tipo de ajuste realizado para las trazas de DSC a pH 7.0 de los dominios hNedd4 WW3 y hNedd4 WW4. Estos valores difieren ligeramente de los publicados en (Cobos et al. 2009; Bexiga 2011), ya que estos se obtuvieron por ajuste múltiple de trazas de DSC y CD obtenidas a distintos valores de pH. Como ya hemos mencionado anteriormente, los estudios realizados en nuestro grupo de investigación apuntan a un comportamiento de los dominios WW cercano a un límite entre un modelo de dos estados y un modelo “downhill”, indicando una baja cooperatividad estructural. Esto puede observarse tanto en la anchura de las transiciones térmicas como en los bajos valores de ΔG a 25 ºC (Tabla 5.1). Además, la intersección de las funciones Cp,N (T) y Cp,D (T), obtenidas por ajuste simple (Figura 5.2), ocurre a temperaturas bastante inferiores a la temperatura de convergencia universal de las proteínas globulares, 140 ºC. Figura 5.2. Dependencia de la capacidad calorífica de los dominios hNedd4 WW1 (Panel a) y hNedd4 WW2 (Panel b). Los datos experimentales se han representado como círculos, en azul oscuro para el dominio hNedd4 WW1 y en magenta para el dominio hNedd4 WW2. Los experimentos se han llevado a cabo en tampón fosfato sódico 50 mM a pH 7.0. El ajuste al modelo de equilibrio de dos estados se muestra como una línea continua en el mismo código de colores que los datos experimentales. Las líneas discontinuas en azul corresponden a las funciones Cp,N (T) obtenidas del ajusto para cada curva y las líneas discontinuas en cian corresponden a las funciones Cp,D (T), obtenidas también para el ajuste de cada curva. En resumen, como se ha descrito previamente para el dominio WW4 de Nedd4 (Cobos et al. 2009), a pesar de que los datos experimentales se pueden describir en términos de un equilibrio de dos estados, el análisis del desplegamiento térmico de los dominios WW individuales que componen hNedd4 revela valores anómalos para algunos de los parámetros termodinámicos que son indicios de un proceso más complejo, como puede ser el desplegamiento sin barreras o la presencia de otras conformaciones alternativas del estado nativo. 175 5.2.3. Equilibrio conformacional de los dominios WW de hNedd4 en tándem Para comprobar si la baja cooperatividad estructural que presentan estos dominios de forma individual se ve afectada cuando se encuentran unidos en tándem, hemos llevado a cabo la caracterización termodinámica del equilibrio conformacional mediante DSC de las construcciones hNedd4 WW1WW2, hNedd4 WW3WW4, hNedd4 WW2WW3WW4 y hNedd4 WW1WW2WW3WW4. La forma de las transiciones calorimétricas determinadas mediante DSC de una proteína con diferentes dominios puede proporcionar información sobre las interacciones cooperativas entre los dominios. En la Figura 5.3 se muestran los termogramas correspondientes a la desnaturalización térmica a pH 7.0 de las distintas construcciones en tándem, condición en la cual todas presentan una elevada reversibilidad. Todas las construcciones de dominios WW de hNedd4 en tándem presentan transiciones muy anchas, que no son compatibles con un modelo de dos estados. Esto hace pensar en una baja cooperatividad estructural como en el caso de los dominios WW individuales. Como podemos observar al comparar las distintas trazas de DSC, no existen grandes diferencias en la forma de las transiciones de las distintas construcciones, debilitando la idea de que la presencia de otros dominios y de las secuencias que los conectan puedan mejorar la estabilidad marginal que poseen los dominios WW de forma aislada. 176 Capítulo 5 Figura 5.3. Dependencia de la capacidad calorífica con la temperatura medida experimentalmente mediante DSC para las construcciones hNedd4 WW1WW2 (rojo), hNedd4 WW3WW4 (negro), hNedd4 WW2WW3WW4 (azul) y hNedd4 WW1WW2WW3WW4 (verde). Los experimentos se han realizado en tampón fosfato sódico 50 mM a pH 7.0. Las trazas se encuentran desplazadas para una mejor comparación entre ellas. En ausencia de interacciones cooperativas, la capacidad calorífica molar parcial del tándem es equivalente a la adición de las respectivas capacidades caloríficas de los dominios individuales. Para comprobar si éste es nuestro caso hemos comparado los perfiles de desnaturalización por DSC a pH 7.0 tanto de las diferentes construcciones en tándem como de la suma de los dominios individuales (Figura 5.4). Al comparar las trazas de las distintas construcciones con las correspondientes sumas de los dominios individuales más la contribución a la capacidad calorífica de desplegamiento del conector entre los distintos dominios, apenas existe diferencia entre ellas dentro del error experimental que conlleva este tipo de transiciones tan poco cooperativas que dan lugar a trazas calorimétricas muy ensanchadas. Esto nos confirma la ausencia de efectos sobre la estabilidad y cooperatividad estructural significativa entre los dominios presentes en las construcciones en tándem estudiadas y que, además, las secuencias conectoras se encuentran prácticamente desestructuradas. Hay que indicar, que en el caso del tándem hNedd4 WW1WW2 el conector es muy largo en comparación con los otros (Figura 5.1) y podría dar lugar a que presentara algún tipo de estructura, originando una contribución en la Cp experimental que no se ha tenido en cuenta en las simulaciones realizadas. 177 Figura 5.4. Comparación de los datos experimentales de DSC de las construcciones en tándem hNedd4 WW1WW2 (círculos rojos), hNedd4 WW3WW4 (círculos negros), hNedd4 WW2WW3WW4 (círculos azules) y hNedd4 WW1WW2WW3WW4 (círculos verdes) con la curva de DSC de la suma de los dominios WW individuales correspondientes. La suma de los dominios individuales se representa como una línea discontinua, en rojo para la suma de los dominios WW1 y WW2, en negro la suma de los dominios WW3 y WW4, en azul la de los dominios WW2 y el tándem WW3WW4 y en rosa los dominios WW2, WW3 y WW4. Para el tándem WW1WW2WW3WW4 se han realizado varias combinaciones de sumas: la línea discontinua en granate corresponde a la suma del domino WW1 más el tándem WW2WW3WW4, la línea discontinua en magenta es la suma del tándem WW1WW2 más los dominios individuales WW3 y WW4, en cian se representa la suma de los dominios WW1, WW2 más el tándem WW3WW4, en morado tenemos la suma de los tándem WW1WW2 más WW3WW4 y finalmente en azul marino se representa la suma de los cuatro dominios individuales WW1, WW2, WW3 y WW4.A la adición de las trazas calorimétricas de los dominios WW individuales se le ha sumado también la contribución a la capacidad calorífica de desplegamiento de cada aminoácido de la secuencia de conexión entre los cuatro dominios (Privalov and Makhatadze 1990). Todos los experimentos se han realizado en tampón fosfato sódico 50 mM, pH 7.0. 5.2.4. Estudio de la especificidad de unión en los dominios WW de hNedd4 Como hemos mencionado en la introducción de este capítulo, el estudio de las interacciones entre los dominios L víricos y los dominios WW de ligasas tipo Nedd4 a nivel molecular tiene un gran interés para el diseño racional de inhibidores específicos de estas interacciones ya que podrían constituir antivirales de amplio espectro. Uno de los objetivos de este trabajo ha sido evaluar si, tal como sugiere la independencia funcional de los dominios L víricos (Parent et al. 1995; Freed 2002), la especificidad observada radica en características 178 Capítulo 5 intrínsecas de sus secuencias o, por el contrario, dicha especificidad responde a factores contextuales, como son la localización celular o el efecto sinérgico debido a interacciones establecidas con diferentes elementos de la proteína (Ladbury&Arold 2000). Para ello hemos investigado la influencia de los distintos dominios WW de hNedd4 sobre la unión del ligando Ébola A (ILPTAPPEYME), un fragmento seleccionado a partir de la proteína VP40 del virus del Ébola y del cual se conoce su interacción con el dominio WW3 de hNedd4 (Harty et al. 2000; Timmins et al. 2003). También hemos seleccionado el ligando p53bp2 o M1 (EYPPYPPPPYPSG), derivado de la proteína “p53 binding protein-2” que es una diana natural de hYap WW1 descubierta mediante la técnica de doble híbrido de levadura (“yeast two-hibrid screening”) (Espanel and Sudol 2001). Por último, hemos caracterizado la unión del ligando UGR-1, obtenido en nuestro grupo de investigación a través de la técnica de expresión en fagos y que es capaz de unirse al dominio WW3 de hNedd4 con una constante de disociación nanomolar, la mayor descrita hasta la fecha. La primera caracterización termodinámica y estructural de la interacción del dominio hNedd4 WW3 con un conjunto de ligandos peptídicos correspondientes a las secuencias de unión de dominios L de varios virus, se llevó a cabo en nuestro grupo de investigación con el fin de analizar los determinantes moleculares de la afinidad de unión en este sistema (Bexiga 2011). Las afinidades de unión de los dominios L víricos determinadas para el dominio hNedd4 WW3 confirman que las secuencias de los dominios L extraídas del contexto de la proteína completa mantienen la capacidad de reconocer sus dianas naturales. Además, un estudio de la especificidad de unión de los dominios L realizado con los dominios WW de la proteína humana asociada a Yes (hYap) pone de manifiesto que la afinidad de todos los dominios L analizados, es mayor para su diana natural hNedd4 WW3 que para los demás dominios WW estudiados. Este resultado indica que las secuencias víricas seleccionadas presentan cierto nivel de especificidad intrínseca por el dominio hNedd4 WW3. Para comprobar si este nivel de especificidad se mantiene con el resto de dominios WW que conforman hNedd4, hemos llevado a cabo la caracterización de la energética de unión de los dominios hNedd4 WW1, hNedd4 WW2 y hNedd4 WW4 con los ligandos Ébola A, p53bp2 y UGR-1. Con el fin de confirmar la unión y obtener una estimación inicial de las constantes de disociación que nos permita diseñar correctamente los experimentos calorimétricos de ITC, hemos realizado titulaciones preliminares mediante espectroscopía de fluorescencia de cada uno de los dominios WW con los diferentes ligandos. Los experimentos se realizaron en tampón fosfato sódico 20 mM pH 7.0 a 25ºC. Los resultados obtenidos de esta forma se muestran en la Tabla 5.2. 179 En el caso del ligando Ébola A, los resultados de las titulaciones por fluorescencia confirman la especificidad de este ligando por el dominio WW3 de hNedd4 sobre los dominios hNedd4 WW1 y hNedd4 WW4, pero no sobre el dominio hNedd4 WW2 que presenta una constante de disociación similar. El valor de las constantes de disociación hace que no sea factible realizar los experimentos de ITC ya que necesitaríamos una elevada concentración tanto de ligando como de proteína. Para el ligando p53bp2 ocurre igual que con el ligando Ébola A, los dominios hNedd4 WW2 y hNedd4 WW3 presentan constantes de disociación parecidas, mientras que para los dominios hNedd4 WW1 y hNedd4 WW4 las constantes de disociación son mayores. Con el ligando UGR-1 podemos observar la elevada afinidad que presenta por los dominios hNedd4 WW3 y hNedd4 WW4. Este ligando también interacciona con el dominio hNedd4 WW2, aunque con un orden de magnitud menor. Sin embargo, la afinidad disminuye con el dominio hNedd4 WW1, dominio del cual, hasta la fecha no se conocen ligandos de alta afinidad. En la Figura 5.5 se pueden observar, a modo de ejemplo, los experimentos de titulación mediante ITC de los dominios WW de hNedd4 aislados con el ligando UGR-1 en los paneles superiores y en los paneles inferiores se representan las isotermas de unión junto con el mejor ajuste al modelo de unión de sitios idénticos e independientes. Al comparar los datos de la Tabla 5.2 se observa claramente que el aumento de afinidad del ligando UGR-1 por los dominios hNedd4 WW3 y WW4 con respecto al ligando p53bp2 se debe a un aumento notable en la entalpía de unión (de unos 40 kJ·mol-1), indicando que el ligando UGR1 establece un mayor número de interacciones con estos dominios que p53bp2. Esta característica también se observa para los dominios hNedd4 WW1 y WW2, aunque el aumento entálpico no es tan acusado y además hay una compensación entrópica que da lugar a que la afinidad sea similar para ambos ligandos al unirse a estos dos dominios. Tabla 5.2. Parámetros obtenidos a partir de los experimentos de fluorescencia e ITC para la unión de los ligandos Ébola A, p53bp2 y UGR-1 a los dominios WW individuales de hNedd4. Los experimento se han realizado en fosfato sódico 20 mM pH 7.0 a 25 oC. 180 Capítulo 5 Kd# (µM) ∆Gap (kJ/mol) ∆Hap# (kJ/mol) -T∆Sap(kJ/mol) hNedd4 WW1* 469 -19.0 - - hNedd4 WW2* 166.5 -21.6 - - 146.9 -21.9 -50.7 28.8 hNedd4 WW4* 605.2 -18.4 - - hNedd4 WW1 77.5 -23.5 -47.8 24.3 hNedd4 WW2 6.6 -29.6 -53.6 24.0 5.3 -30.1 -53.4 23.8 hNedd4 WW4 61.7 -24.0 -45.9 21.9 hNedd4 WW1 37.7 -25.2 -59.4 34.3 6.4 -29.7 -79.1 49.4 0.2 -38.2 -99.7 60.8 1.1 -33.9 -86.5 52.6 Proteína hNedd4 WW3 hNedd4 WW3 hNedd4 WW2 hNedd4 WW3 hNedd4 WW4 Ligando Ébola A p53bp2 UGR-1 # Los errores en los parámetros termodinámicos se estiman en torno al 5% para la entalpía de unión y al 10% para la constante de disociación. *Datos obtenidos a partir de titulación por fluorescencia. 181 182 Figura 5.5. Experimentos de titulación mediante ITC del ligando UGR-1 con los dominios hNedd4 WW1 (Panel a), hNedd4 WW2 (Panel b), hNedd4 WW3 (Panel c) y hNedd4 WW4 (Panel d) en fosfato sódico 20 mM pH 7.0 a 25ºC. En los paneles superiores aparecen los termogramas de titulación formado por los calores por unidad de tiempo liberados tras la inyección del ligando UGR-1 sobre los distintos dominios. En los paneles inferiores se representan las isotermas de unión correspondientes a los experimentos de titulación, obtenidas después de normalizar los calores de titulación y corregir los calores por dilución. Los datos experimentales se representan como círculos mientras que la línea continua corresponde al mejor ajuste para el modelo de un sitio de unión (ecuación 2.5.11). Todos los experimentos se han realizado con el calorímetro VP-ITC excepto la titulación correspondiente al dominio hNedd4 WW3, que se ha llevado a cabo en el ITC 200. Capítulo 5 5.2.5. Influencia de los efectos contextuales en la especificidad de unión de los dominios WW de hNedd4 Para comprobar la influencia sobre la especificidad de unión de los efectos contextuales cuando los dominios WW de hNedd4 se encuentran en tándem, hemos estudiado la unión de los péptidos p53bp2 y UGR-1 a las distintas construcciones de los dominios WW de Nedd4 que aparecen en la Sección 5.2.1 en las mismas condiciones que se han realizado los experimentos de los dominios WW individuales (fosfato sódico 20 mM pH 7.0 a 25ºC). Debido al valor de las constantes de disociación de la interacción entre los dominios WW individuales y el ligando Ébola A, no se han podido realizar los experimentos de ITC para las construcciones en tándem. La magnitud de las constantes obtenidas para la unión de los dominios WW individuales con los ligandos p53bp2 y UGR-1 está dentro de un intervalo adecuado para llevar a cabo las titulaciones mediante ITC con las construcciones en tándem. En la Figura 5.6 se representan las isotermas de unión del ligando p53bp2 a las diferentes construcciones en tándem. El análisis de la titulación de la construcción hNedd4 WW3WW4 con el ligando p53bp2 se ha realizado mediante un ajuste simple de la isoterma de unión correspondiente a un modelo de dos sitios de unión diferentes e independientes (Figura 5.6, Panel a). Los datos obtenidos para dicho ajuste concuerdan razonablemente con los obtenidos para los dominios aislados hNedd4 WW3 y hNedd4 WW4, indicando una ausencia, o una muy baja cooperatividad entre estos dos dominios al formar la construcción en tándem. Para el caso del tándem hNedd4 WW1WW2 (Figura 5.6, Panel b), no se ha podido obtener un buen ajuste simple a dos sitios de unión diferentes e independientes. También se ha intentado realizar un ajuste múltiple de las isotermas de unión de cada uno de los dominios individuales (al modelo de un sitio de unión) y de la del tándem correspondiente (al modelo de dos sitios de unión independientes), de tal modo que los valores de ajuste para cada domio del tándem tienen que ser los mismos que cuando se encuentran de forma individual (de esta forma se supondría una ausencia de efectos en la unión del ligando al formar la construcción en tándem). Este tipo de análisis múltiple para el caso de la construcción hNedd4 WW1WW2 con el ligando p53bp2 tampoco da un buen ajuste de las isotermas. En el panel b de la Figura 5.6 se ha representado la simulación de isoterma para el tándem hNedd4 WW1WW2 correspondiente a un modelo de dos sitios de unión diferentes e independientes, cada uno de ellos con los valores de unión (constante de disociación y entalpía de unión) obtenidos en los ajustes simples para los respectivos dominios WW aislados (ver Tablas 5.2 y 5.3); se observa una clara desviación con los datos experimentales, que parecen indicar un menor número de sitios de unión. De hecho al realizar un 183 ajuste simple de la isoterma de este tándem a un modelo un un sitio de unión, se obtiene un buen ajuste (Figura 5.6, Panel b) y los valores resultantes para los distintos parámetros de unión son muy similares a los obtenidos para el dominio hNedd4 WW1 aislado (Tabla 5.3). Figura 5.6. a) Isoterma de unión del tándem hNedd4 WW3WW4 con el ligando p53bp2, los datos experimentales se representan como círculos negros, mientras que la línea continua en rojo corresponde al ajuste simple de dos sitios de unión diferentes e independientes. b) Isoterma de unión del tándem hNedd4 WW1WW2 con el ligando p53bp2, los datos experimentales se representan como círculos negros, mientras que la línea continua en rojo corresponde al ajuste a un único sitio de unión. La línea continua azul corresponde a la simulación de la isoterma de unión sumando las isotermas de los dominios individuales hNedd4 WW1 y hNedd4 WW2. c) Comparación de las isotermas de unión correspondientes al experimento de titulación de la construcción hNedd4 WW2WW3WW4 con el ligando p53bp2 (círculos negros) junto con la simulación de la isoterma de unión para tres sitios distintos e independientes, cada uno de ellos con los parámetros termodinámicos obtenidos en los ajustres simples de cada uno de los tres dominios individuales con el ligando p53bp2 (línea azul). d) Comparación de las isotermas de unión correspondientes al experimento de titulación de la construcción hNedd4 WW1WW2WW3WW4 con el ligando p53bp2 (círculos negros) junto con la simulación de la isoterma de unión para cuatro sitios distintos e independientes, cada uno de ellos con los parámetros termodinámicos obtenidos en los ajustes simples de cada uno de los cuatro dominios individuales con el ligando p53bp2 (línea azul). Los datos experimentales se han obtenido en condiciones de tampón fosfato sódico 20 mM, 25 ºC a pH 7.0. 184 Capítulo 5 De estos análisis podemos concluir que para la unión del ligando p53bp2 con el tándem hNedd4 WW1WW2, existe un efecto muy importante (incluso el ocultamiento de un sitio de unión) cuando los dominios hNedd4 WW1 y hNedd4 WW2 se constituyen en un tándem; mientras que para el caso de los dominios hNedd4 WW3 y hNedd4 WW4 la existencia de estos efectos al formar el tándem es nula o muy pequeña. Este mismo comportamiento se va a observar de forma muy parecida cuando se describa la unión de los tándem al ligando UGR-1. En los paneles inferiores de la Figura 5.6 se representan las isotermas de unión del ligando p53bp2 a las construcciones en tándem hNedd4 WW2WW3WW4 y hNedd4 WW1WW2WW3WW4. En estos casos no se han realizado ajustes a modelos más complejos (de 3 y 4 sitios de unión) ya que tendríamos demasiados parámetros para ajustar isotermas con muy poca información, lo que haría que los ajustes no fueran fiables. Lo que sí hemos realizado ha sido la simulación de las isotermas usando el programa AFFINImeter para cada tándem suponiendo que los sitios de unión tienen los mismos valores que los obtenidos en los ajustes simples a un sitio de unión de las isotermas correspondientes a los dominios aislados. En estos casos se obtienen grandes diferencias de las simulaciones con respecto a los datos experimentales. Por lo tanto la formación de estos tándem, hNedd4 WW2WW3WW4 y hNedd4 WW1WWW2WW3WW4, produce efectos importantes en la unión del ligando p53pb2 a los dominios WW; en la Figura 5.6 se puede observar que el número de sitios de unión y/o la constante de afinidad disminuyen claramente en dichas construcciones en tándem. 185 Tabla 5.3. Parámetros termodinámicos obtenidos a partir de los experimentos de ITC para la unión del ligando p53bp2 a los dominios WW individuales de hNedd4 y sus construcciones en tándem, hNedd4 WW1WW2 y hNedd4 WW3WW4, realizados en fosfato sódico 20 mM pH 7.0 a 25 oC. Proteína N Kd# (µM) ∆Gap (kJ/mol) ∆Hap# (kJ/mol) -T∆Sap (kJ/mol) hNedd4 WW1 1 77.5 -23.5 -47.8 24.3 hNedd4 WW2 1 6.6 -29.6 -53.6 24.0 hNedd4 WW3 1 5.3 -30.1 -53.4 23.8 hNedd4 WW4 1 61.7 -24.0 -45.9 21.9 hNedd4 WW1WW2 1 90.1 -23.1 -47.8 24.7 ΔG1-23.4 ΔH1-28.6 -TΔS1 5.2 Kd180.0 1* hNedd4 Kd26.5 ΔG2-29.6 ΔH2-56.1 -TΔS2 26.5 1* WW3WW4 # Los errores en los parámetros termodinámicos se estiman en torno al 5% para la entalpía de unión y al 10% para la constante de disociación. * Análisis realizado por ajuste múltiple a un modelo de dos sitios diferentes e independientes. El análisis de la isoterma de unión del tándem hNedd4 WW3WW4 con el ligando UGR-1 se ha realizado a partir de un ajuste múltiple de las isotermas de unión de los dominios individuales hNedd4 WW3 y hNedd4 WW4 y del tándem hNedd4 WW3WW4, suponiendo que los valores de unión para cada sitio (constante de disociación y entalpía de unión) fueran los mismos cuando el dominio está aislado o cuando se encuentra formando el tándem. En la gráfica podemos observar que el ajuste es bastante bueno y los valores de las constantes de disociación y entalpía (Tabla 5.4) se comparan razonablemente bien con los obtenidos con el ajuste simple de los dominios individuales. Estos resultados indican que el ligando UGR-1 se une a los dominios hNedd4 WW3 y hNedd4 WW4 de forma similar, tanto si se encuentran aislados como formando el tándem hNedd4 WW3WW4, por lo que la cooperatividad entre estos dominios es prácticamente inexistente y el conector entre ellos no influye en la afinidad por el ligando UGR-1. Esto estaría en concordancia con los datos obtenidos por DSC que indican un comportamiento independiente para los dominios y similares a los descritos para el ligando p53bp2. 186 Capítulo 5 Figura 5.7. a) Isoterma de unión del tándem hNedd4 WW3WW4 y los dominios individuales con el ligando UGR-1. Los datos experimentales se representan como círculos negros, mientras que la línea continua en el mismo color corresponde a un ajuste múltiple de esta curva junto a la isoterma de unión del dominio hNedd4 WW3 (en círculos rojos se representan los datos experimentales de la isoterma de unión y la línea continua en el mismo color corresponde al ajuste múltiple) y junto a la isoterma de unión del dominio hNedd4 WW4 cuyos datos experimentales se representan como triángulos azules y en el mismo color en línea continua se representan los datos para el ajuste múltiple. El experimento de titulación calorimétrica se ha llevado a cabo a pH 7.0 a 25 ºC. Para el estudio de interacción del tándem hNedd4 WW1WW2 con UGR-1 se ha procedido a realizar un análisis análogo al descrito para el tándem hNedd4 WW3WW4. El análisis llevado a cabo con un ajuste múltiple con los respectivos dominios individuales hNedd4 WW1 y hNedd4 WW2 indica que no es posible obtener un juego de parámetros que describan simultáneamente las tres isotermas de unión. De hecho, la simulación de la isoterma del tándem hNedd4 WW1WW2 usando para cada uno de los posibles sitios de unión los valores obtenidos para los dominios individuales (Tabla 5.4), se aleja mucho de la isoterma obtenida experimentalmente (Figura 5.8). 187 Figura 5.8. Isoterma de unión del tándem hNedd4 WW1WW2 con el ligando UGR-1, los datos experimentales se representan como círculos negros, mientras que la línea continua en magenta corresponde al ajuste a un único sitio de unión. La línea continua azul corresponde a la simulación de la isoterma de unión sumando las isotermas de los dominios individuales hNedd4 WW1 y hNedd4 WW2. Los datos experimentales se han obtenido en condiciones de tampón fosfato sódico 20 mM, 25 ºC a pH 7.0. Si se intenta ajustar la isoterma del tándem al modelo de n sitios iguales e independientes, se obtiene un buen ajuste para un único sitio de unión y con una Kd casi idéntica a la del dominio hNedd4 WW1 (Tabla 5.4), aunque la entalpía de unión es muy distinta; estos resultados son análogos a los obtenidos para el ligando p53bp2. Como se apuntaba anteriormente, una interpretación plausible sería que en el tándem hNedd4 WW1WW2 el sitio de unión para el dominio WW2 se encuentre enmascarado por el dominio WW1 o por el propio conector entre ambos dominios, ya que por su longitud y por la cantidad de restos cargados que posee podría estar parcialmente estructurado y con capacidad de interaccionar con los dominios. 188 Capítulo 5 Tabla 5.4. Parámetros termodinámicos obtenidos a partir de los experimentos de ITC para la unión del ligando UGR-1 a los dominios WW individuales de hNedd4 y sus construcciones en tándem, hNedd4 WW1WW2 y hNedd4 WW3WW4, realizados en fosfato sódico 20 mM pH 7.0 a 25 oC. Proteína N Kd# (µM) ∆Gap (kJ/mol) ∆Hap# (kJ/mol) -T∆Sap (kJ/mol) hNedd4 WW1 1 37.7 -25.1 -59.4 34.3 hNedd4 WW2 1 6.4 -29.7 -79.1 49.4 hNedd4 WW3 1 0.2 -38.9 -99.7 60.8 hNedd4 WW4 1 1.1 -33.9 -86.5 52.6 1 37.9 -25.1 -96.7 71.6 hNedd4 WW1WW2 hNedd4 WW3WW4 Kd10.3 ΔG1-37.3 ΔH1-94.4 -TΔS157.1 1* 1* Kd21.2 ΔG2-33.7 ΔH2-81.8 -TΔS248.1 # Los errores en los parámetros termodinámicos se estiman en torno al 5% para la entalpía de unión y al 10% para la constante de disociación. *Análisis realizado por ajuste múltiple para dos sitios distintos e independientes Como en el caso del ligando p53bp2, la complejidad de las construcciones hNedd4 WW2WW3WW4 y hNedd4 WW1WW2WW3WW4, hace que los ajustes de las isotermas experimentales no sean fiables ya que implicarían demasiados parámetros a ajustar para la información que contienen dichas isotermas. Lo que sí hemos podido realizar, al igual que en el caso de los tándem anteriores, es la simulación de las isotermas que se obtienen para cada tándem suponiendo que los sitios de unión tienen los mismos valores que cuando los dominios se encuentran aislados. Si se observan estas simulaciones, para el caso del tándem hNedd4 WW2WW3WW4 (Figura 5.9, Panel a), la simulación se ajusta bastante bien a la isoterma experimental en la parte correspondiente a altas relaciones de concentración ligando/proteína, pero es incapaz de reproducir los datos a bajas relaciones. Por tanto, podríamos suponer que en presencia del dominio WW2 realiza algún tipo de interacción cuando se encuentra formando el tándem WW2WW3WW4. Para el caso de la construcción hNedd4 WW1WWW2WW3WW4, la simulación correspondiente (Figura 5.9 Panel b), se aleja mucho más de la isoterma de unión obtenida experimentalmente, por lo que podríamos suponer que se están llevando a 189 cabo interacciones más complejas cuando el ligando UGR-1 se une a hNedd4 WW1WW2WW3WW4. Hay que recordar que ya se apuntaba un efecto importante en al unión del ligando para la construcción del tándem hNedd4 WW1WW2. Es conveniente recordar que estos efectos sinérgicos en la afinidad de unión no se han observado en la estabilidad estructural (analizada por DSC), lo que indica que los efectos contextuales en la afinidad de unión no están asociados a modulaciones del equilibrio conformacional intrínseco de los dominios pudiendo tener su origen en otro tipo de efectos que podrían estar relacionados, o bien con la disposición de los dominios en el tándem, que podrían estar ocultando algunos sitios de unión, o bien con posibles interacciones con las secuencias de conexión. Esta es una posibilidad que no debe descartarse considerando la longitud y elevado contenido en aminoácidos cargados de la secuencia de conexión entre los dominios WW1 y WW2. Figura 5.9. a) Comparación de las isotermas de unión correspondientes al experimento de titulación de la construcción hNedd4 WW2WW3WW4 con el ligando UGR-1 (círculos cerrados) junto con la simulación de la isoterma de unión para tres sitios distintos e independientes, cada uno de ellos con los parámetros termodinámicos obtenidos en los ajustres simples de cada uno de los tres dominios individuales con el ligando UGR-1 (línea azul). b) Comparación de las isotermas de unión correspondientes al experimento de titulación de la construcción hNedd4 WW1WW2WW3WW4 con el ligando UGR-1 (círculos cerrados) junto con la simulación de la isoterma de unión para cuatro sitios distintos e independientes, cada uno de ellos con los parámetros termodinámicos obtenidos en los ajustes simples de cada uno de los cuatro dominios individuales con el ligando UGR1 (línea magenta). Los datos de ITC se han obtenido en condiciones de tampón fosfato sódico, 20 mM a pH 7.0. En este sentido, es de gran interés obtener la estructura cristalográfica de estas cuatro construcciones unidas a los ligandos p53bp2 y UGR-1 para conocer el tipo de interacciones que se están dando y conocer el papel funcional que tiene el dominio WW1 cuando se encuentra formando un tándem con el resto de dominios WW. Estos 190 Capítulo 5 estudios con el ligando UGR-1 se están llevando a cabo en el laboratorio de la Dr. Ana Cámara, en la Universidad de Almería. 5.3. Conclusiones De la caracterización del equilibrio conformacional de las construcciones en tándem de los dominios WW de hNedd4 y del análisis termodinámico de la unión de diferentes ligandos a estos dominios, podemos extraer las siguientes conclusiones: 1. La baja estabilidad conformacional de los dominios WW cuando se encuentran aislados no se ve prácticamente alterada mediante efectos cooperativos por la presencia de distintos dominios en una misma construcción en tándem. 2. La afinidad del ligando Ébola A es similar para los dominios hNedd4 WW3 y hNedd4 WW4 y bastante inferior para los dominios hNedd4 WW1 y hNedd4 WW2. Esto indica que el ligando Ébola A sigue manteniendo un elevado nivel de especificidad. Un efecto muy similar ocurre para el ligando de alta afinidad UGR-1 3. La elevada afinidad del ligando UGR-1 para los dominios hNedd4 WW3 y hNedd4 WW4 con respecto al ligando p53bp2 se debe a un aumento considerable en el componente entálpico de la unión, indicando que el número de interacciones entre el ligando UGR-1 y ambos dominios es mayor que para el ligando p53bp2. 4. La elevada afinidad (y especificidad) del ligando UGR-1 para los dominios hNedd4 WW3 y hNedd4 WW4 no se ve afectada cuando estos dominios forman tándem. 5. La presencia del dominio hNedd4 WW1 en las construcciones en tándem altera significativamente la afinidad de los restantes dominios tanto en la unión del ligando p53bp2 como en la unión del ligando UGR-1. 191 Capítulo 6 Resumen y conclusiones Capítulo 6 CAPÍTULO 6.- RESUMEN Y CONCLUSIONES 6.1. Resumen El reconocimiento de secuencias ricas en prolina a través de interacciones proteína-proteína es clave para el correcto funcionamiento celular. Debido a la relación de estas interacciones con el desarrollo de importantes enfermedades humanas, los módulos de reconocimiento de secuencias ricas en prolina (MPR), están considerados como atractivas dianas para el diseño de fármacos. Un diseño eficiente y racional requiere de una profunda comprensión tanto de la naturaleza de estas interacciones como de su efecto en el equilibrio conformacional, así como de la cooperatividad estructural del dominio y la influencia de elementos adicionales en la proteína. El primer objetivo dentro del trabajo de esta tesis ha estado centrado en el análisis de las bases moleculares de la comunicación intramolecular en el dominio SH3 de cSrc. Diferentes estudios experimentales y teóricos han demostrado que la unión de un ligando provoca una transmisión de información que es propagada a través de cambios alostéricos hacia regiones distantes del sitio de unión de la proteína. La identificación de los residuos relacionados con esta transmisión de información presenta una gran importancia a la hora del desarrollo de dianas terapéuticas. El Dr. Tom Lenaerts, de la Universidad Libre de Bruselas, ha desarrollado un método computacional de análisis con el cual, haciendo uso de la teoría de la información, se puede identificar y predecir la red de transmisión de información en la proteína. En nuestro grupo de investigación hemos validado experimentalmente este método llevando a cabo un estudio de 15 mutantes, haciendo uso de la Calorimetría Diferencial de Barrido (DSC) y la Calorimetría Isotérmica de Titulación (ITC) para determinar el efecto de estas mutaciones en la estabilidad y la energética de unión. A través de este análisis hemos identificado un grupo de residuos los cuales están implicados en la transmisión de información desde el sitio de unión hacia otras regiones del dominio. Cada uno de estos residuos pueden ser clasificados en dos grupos: un grupo que influye en la estabilidad de la proteína y otro grupo que tiene efectos en la afinidad de unión, que se reflejan en una modulación funcional de la proteína. La regulación de las señales enzimáticas a menudo se encuentra mediada por dominios modulares como los dominios SH2 y SH3. El segundo objetivo abordado en esta tesis ha sido investigar la influencia del tándem SH3SH2 en la regulación de la quinasa de tirosina cAbl. Los dominios SH3 y SH2 mantienen a Abl en su conformación inactiva a través de su ensamblaje con el dominio catalítico. A través de técnicas experimentales como DSC, técnicas de dinámica molecular y 195 metadinámica, hemos estudiado los factores que influyen en la regulación de cAbl a través del tándem de dominios SH3-SH2. Nuestros resultados indican que el tándem Abl SH3SH2 se encuentra en equilibrio entre dos estados que corresponden a la estructura de la enzima autoinhibida y otra configuración que es consistente con los datos que existen para la forma activa. Al comprobar el efecto del conector entre el dominio quinasa y el dominio SH2 (C2Q) en el equilibrio conformacional del tándem SH3SH2, tanto los datos experimentales como los computacionales, indican que la presencia de este conector tiene un efecto muy significativo en el comportamiento del tándem, acoplando el desplegamiento de los dos dominios de un modo completamente cooperativo. También hemos comprobado que el conector entre los dominios SH3 y SH2 tiene un papel determinante en el equilibrio conformacional de Abl, ya que mutaciones en este conector provocan el desacoplamiento entre C2Q y el dominio SH3. Estos resultados proporcionan información importante de la relación del conector C2Q y el conector entre los dominios SH3 y SH2 con la regulación de Abl. El último objetivo de esta tesis ha sido investigar la influencia de elementos adicionales de la proteína en el equilibrio conformacional de los dominios WW de hNedd4, por lo que se ha estudiado el equilibrio conformacional y la interacción con ligandos de los cuatro dominios WW de esta proteína, tanto aislados como en diferentes construcciones en tándem, evaluando el impacto de la presencia simultánea de varios dominios WW, y de las secuencias conectoras entre ellos. Para evaluar el impacto de dominios adicionales en la energética de unión, hemos realizado diferentes experimentos de ITC en los que hemos estudiado la unión entre los péptidos Ébola A, p53bp2 y UGR-1 y las construcciones hNedd4 WW3WW4, hNedd4 WW1WW2, hNedd4 WW2WW3WW4 y hNedd4 WW1WW2WW3WW4. Además, hemos investigado la existencia de cooperatividad estructural entre los diferentes dominios WW de hNedd4 a través de experimentos de DSC de las construcciones en tándem mencionadas anteriormente. Se ha observado que ni la presencia simultánea de distintos dominios WW ni de sus respectivos conectores en las construcciones en tándem producen un efecto significativo en el equilibrio conformacional de los dominios que, en el contexto de las construcciones en tándem, mantienen la baja estabilidad y cooperatividad estructural que presentan los dominios WW de forma aislada. En cuanto a efectos en la energética de unión se ha demostrado que los efectos cooperativos son nulos en el caso del tándem hNedd4 WW3WW4 con el ligando UGR-1 y p53bp2. No obstante, la presencia del dominio WW1 produce cambios significativos en el comportamiento de los tándem, indicando que o bien el propio dominio o bien la secuencia de conexión pudiera estar bloqueando la unión a los demás dominios. Capítulo 6 6.2. Conclusiones Del trabajo desarrollado en esta Tesis Doctoral se pueden realizar las siguientes conclusiones generales: 1. Hemos identificado un grupo de residuos aminoacídicos que se encuentran involucrados en la transmisión intramolecular de efectos cooperativos al producirse la unión de un ligando al dominio SH3 de Src. Esta transmisión se realiza desde el sitio de unión hasta zonas del dominio muy alejadas del sitio de unión. El efecto de estos residuos se produce bien en la estabilidad del dominio o bien en la propia afinidad del dominio por el ligando, afectando a la función. El grupo de residuos identificados en la transmisión intramolecular de información para el dominio SH3 de cSrc puede ser bastante conservativo entre dominios SH3 homólogos. 2. Hemos puesto de manifiesto la existencia de efectos cooperativos entre los dominios SH3 y SH2 de la quinasa de cAbl mediados por sus conectores, y la repercusión de éstas en la función quinasa de esta proteína. a. Así, la presencia del conector C2Q en la construcción en tándem cAblSH3SH2 produce un fuerte acoplamiento entre los dos dominios que presentan un desplegamiento altamente cooperativo. b. Mediante mutaciones en la secuencia conectora entre los dominios SH3 y SH2 se ha determinado que este conector juega un papel muy importante en la configuración del espacio conformacional del tándem; de hecho, las mutaciones estudiadas producen una eliminación de la cooperatividad de desplegamiento causada por el conector C2Q. 3. La presencia simultánea de distintos dominios WW de hNedd4 y de sus respectivos conectores en una misma construcción en tándem no afecta significativamente la baja estabilidad estructural que presentan los mismos dominios WW de forma aislada. Desde el punto de vista estructural prácticamente no existe cooperatividad entre dichos dominios. No obstante, la presencia del dominio hNedd4 WW1 en tándem induce efectos importantes en el reconocimiento de los ligandos estudiados, posiblemente asociados al bloqueo de alguno de 197 los sitios de unión, bien por el propio dominio o bien por la secuencia de conexión WW1-WW2. Chapter 6 Summary and conclusions SUMMARY Chapter 6 CHAPTER 6.- SUMMARY AND CONCLUSSIONS 6.1. Summary The recognition of proline-rich sequences by protein-protein interaction modules is key for the correct functioning of the cell. Because of the implication of these interactions in the development of important human diseases, proline-rich recognition modules (PRM) are considered as attractive targets for drug design, so that inhibitors of their interactions could have high potential as therapeutic agents. Efficient rational design requires a deep understanding of the nature of the interactions themselves, of their effect on the conformational equilibrium and structural cooperativity of the domain and of the influence of additional elements in the protein. The first aim in this Thesis project has been the analysis of molecular basis of the intramolecular communication in the cSrc SH3 domain. Different experimental and theoretical studies have shown that ligand binding information may be propagated by allosteric changes to distal regions within and between protein domains, leading recently to the sequence-based identification of protein sectors as novel evolutionary units. The precise identification of the residues involved in the process has gained importance. Professor Tom Lenaerts from Free University of Brussels, has developed a biocomputational analysis for the identification and prediction of the information network in small protein domains based on information theory. This approach has been applied to the cSrc-SH3 domain. We have validated his predictions, performing a thermodynamic study of a set of 15 mutants using Differential Scanning Calorimetry (DSC) and Isothermal Titration Calorimetry (ITC) to determine the effect of a number of selected mutants on the stability and/or binding affinity of the domain. Through this analysis we have identified a dynamical pattern, consisting of a limited number of residues, which are implicated in the transduction of information from the binding site to other regions in the domain. The predicted residues can be categorized into two subgroups: one subgroup having stability implications and another with effects in binding affinity, which is reflected in the protein functional modulation. The regulation of signaling enzymes is often mediated by accessory modular domains, such as SH2 and SH3 domains. The second aim of this thesis has been to investigate the influence of SH3SH2 tandem in the regulation of Abl tyrosine kinase. SH3 and SH2 domains inhibit Abl by assembling onto the catalytic domain, allosterically clamping it in an inactive state. We have used Differential Scanning Calorimetry (DSC), molecular dynamics and microsecond all-atom simulations to study the determining factors of a necessary step in the assembly of the 203 autoinhibited form of Abl. Our results indicate that the Abl SH3SH2 tandem is a two-state switch, alternating between the conformation observed in the structure of the autoinhibited enzyme, and another configuration that is consistent with existing scattering data for an activated form. Experimental and computational data indicate that the presence of the SH2-Kinase linker has a profound effect on the behaviour of the tandem, coupling the unfolding of the two domains in a fully cooperative manner. We also show that the SH3SH2 connector plays a determinant role in the assembly equilibrium of Abl, since mutations thereof hinder the engagement of the SH2-kinase linker and SH3 domain. These results provide a thermodynamic rationale for the involvement of linker and SH3SH2 connector in Abl regulation. Finally, the last goal of this project has been to investigate the influence of additional elements of the protein on the conformational equilibrium of the WW domains of hNedd4, studying the conformational equilibrium and binding energetics to different peptides of the four WW domains in this protein, both isolated and in the context of different tandem constructs, evaluating the impact of the presence of several WW domains and linker sequences. We have measured by ITC the binding energetics of different peptide ligands such as Ebola A, p53bp2 and the ligand UGR-1, to the individual domains and to the hNedd4 WW3WW4, the hNedd4 WW1WW2, the hNedd4 WW2WW3WW4 and the hNedd4 WW1WW2WW3WW4 tandem constructs. Moreover, we tackled the analysis of the conformational equilibrium of the different constructs by DSC. We have found that the presence of different WW domains and their linkers does not contribute to the stabilization to the isolated domains. Regarding the effects of the tandem configuration on the binding energetics, we have not found any cooperative effects for the hNedd4 WW3WW4, neither with UGR-1 nor with p53bp2. Nonetheless the presence of hNedd4 WW1 domain does produce significant changes in binding energetics of these ligands to the tandem, indicating that the WW1 domain or the WW1-WW2 conection linker could be blocking the binding to others domains. 6.2. Conclusions From the study carried out in this Thesis project we can conclude: 1. 204 We have identified a number of residues, which are implicated in the transduction of cooperative intramolecular effects when a peptide is bound to Src-SH3 domain. This transduction is performed from the binding site to other regions in the domain. The effect of these residues has influence in the stability of the domain or in the binding Chapter 6 energetic, affecting the function. The group of residues identified in cSrc-SH3 domain can be quite preserved in homologous domains. 2. 3. We have confirmed the existence of cooperative effects between cAbl SH3 and SH2 domains through their linkers and the influence in the kinase function. a. The presence of the C2Q linker in cAbl SH3SH2 tandem has a profound effect on its conformational properties, coupling the unfolding of the SH3 and SH2 domains in a highly cooperative manner. b. Mutations in SH3-SH2 connector have shown that this linker have an important role in the configuration of conformational equilibrium of tandem; in fact, these mutations reverse the cooperative unfolding induced by C2Q linker. The low structural stability of isolated WW domains is not compensated by the presence of other domains in tandem. From a structural point of view no cooperativity exists between these domains. Nevertheless, the presence of hNedd4 WW1 domain in tamdem has important effects in the ligand binding, probably associated to the blockage of some of the binding sites, either by the WW1 domain itself or the linker sequence WW1-WW2 205 BIBLIOGRAFÍA Bibliografía BIBLIOGRAFÍA 1. Abriel, H., J. Loffing, et al. (1999). "Defective regulation of the epithelial Na+ channel by Nedd4 in Liddle's syndrome." J Clin Invest 103(5): 667-673. 2. Adzhubei, A. A., M. J. Sternberg, et al. (2013). "Polyproline-II helix in proteins: structure and function." J Mol Biol 425(12): 2100-2132. 3. Aghazadeh, B. and M. K. Rosen (1999). "Ligand recognition by SH3 and WW domains: the role of N-alkylation in PPII helices." Chem Biol 6(9): R241-246. 4. Anderson, S. R. and G. Weber (1969). "Fluorescence polarization of the complexes of 1-anilino-8-naphthalenesulfonate with bovine serum albumin. Evidence for preferential orientation of the ligand." Biochemistry 8(1): 371-377. 5. Arold, S. T., T. S. Ulmer, et al. (2001). "The role of the Src homology 3-Src homology 2 interface in the regulation of Src kinases." J Biol Chem 276(20): 17199-17205. 6. Azam, M., R. R. Latek, et al. (2003). "Mechanisms of autoinhibition and STI-571/imatinib resistance revealed by mutagenesis of BCRABL." Cell 112(6): 831-843. 7. Bacarizo, J. and A. Camara-Artigas (2013). "Atomic resolution structures of the c-Src SH3 domain in complex with two high-affinity peptides from classes I and II." Acta Crystallogr D Biol Crystallogr 69(Pt 5): 756-766. 8. Bache, K. G., T. Slagsvold, et al. (2004). "Defective downregulation of receptor tyrosine kinases in cancer." EMBO J 23(14): 2707-2712. 9. Ball, L. J., R. Kuhne, et al. (2005). "Recognition of proline-rich motifs by protein-protein-interaction domains." Angew Chem Int Ed Engl 44(19): 2852-2869. 10. Barila, D., R. Mangano, et al. (2000). "A nuclear tyrosine phosphorylation circuit: c-Jun as an activator and substrate of c-Abl and JNK." EMBO J 19(2): 273-281. 11. Barila, D. and G. Superti-Furga (1998). "An intramolecular SH3domain interaction regulates c-Abl activity." Nat Genet 18(3): 280282. 12. Bedford, M. T., D. C. Chan, et al. (1997). "FBP WW domains and the Abl SH3 domain bind to a specific class of proline-rich ligands." EMBO J 16(9): 2376-2383. 13. Bedford, M. T., R. Reed, et al. (1998). "WW domain-mediated interactions reveal a spliceosome-associated protein that binds a third 209 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 210 class of proline-rich motif: The proline glycine and methionine-rich motif." Proceedings of the National Academy of Sciences of the United States of America 95(18): 10602-10607. Bellomaria, A., G. Barbato, et al. (2010). "Recognition of p63 by the E3 ligase ITCH: Effect of an ectodermal dysplasia mutant." Cell Cycle 9(18): 3730-3739. Ben-Dor, A., R. Shamir, et al. (1999). "Clustering gene expression patterns." J Comput Biol 6(3-4): 281-297. Bexiga, M. I. (2011). Dominios WW: Estudio del equilibrio conformacional y del reconocimiento de ligandos. Departamento de Química Física. Granada, Universidad de Granada. Birge, R. B., B. S. Knudsen, et al. (1996). "SH2 and SH3-containing adaptor proteins: redundant or independent mediators of intracellular signal transduction." Genes Cells 1(7): 595-613. Boggon, T. J. and M. J. Eck (2004). "Structure and regulation of Src family kinases." Oncogene 23(48): 7918-7927. Bouamr, F., J. A. Melillo, et al. (2004). "PPPYVEPTAP motif is the late domain of human T-cell leukemia virus type 1 gag and mediates its functional interaction with cellular proteins nedd4 and Tsg101 (vol 77, pg 11882, 2003)." Journal of Virology 78(8): 4383-4383. Brabek, J., D. Mojzita, et al. (2002). "The SH3 domain of Src can downregulate its kinase activity in the absence of the SH2 domainpY527 interaction." Biochemical and Biophysical Research Communications 296(3): 664-670. Brannetti, B. and M. Helmer-Citterich (2003). "iSPOT: A web tool to infer the interaction specificity of families of protein modules." Nucleic Acids Res 31(13): 3709-3711. Brasher, B. B., S. Roumiantsev, et al. (2001). "Mutational analysis of the regulatory function of the c-Abl Src homology 3 domain." Oncogene 20(53): 7744-7752. Brown, M. T. and J. A. Cooper (1996). "Regulation, substrates and functions of src." Biochim Biophys Acta 1287(2-3): 121-149. Burchat, A., D. W. Borhani, et al. (2006). "Discovery of A-770041, a src-family selective orally active lck inhibitor that prevents organ allograft rejection." Bioorg Med Chem Lett 16(1): 118-122. Candel, A. M. (2008). Diseño y caracterización de proteínas quiméricas par el estudio del reconocimiento molecular entre ligandos peptídicos y dominios SH3. Departamento de Química Física. Granada, Universidad de Granada. Bibliografía 26. Candel, A. M., F. Conejero-Lara, et al. (2007). "The high-resolution NMR structure of a single-chain chimeric protein mimicking a SH3peptide complex." FEBS Lett 581(4): 687-692. 27. Candel, A. M., N. A. van Nuland, et al. (2008). "Analysis of the thermodynamics of binding of an SH3 domain to proline-rich peptides using a chimeric fusion protein." J Mol Biol 377(1): 117-135. 28. Cary, L. A., R. A. Klinghoffer, et al. (2002). "SRC catalytic but not scaffolding function is needed for integrin-regulated tyrosine phosphorylation, cell migration, and cell spreading." Mol Cell Biol 22(8): 2427-2440. 29. Casares, S. (2003). Análisis de las rutas cooperativas de propagación de estabilidad en el dominio SH3. Aplicación al estudio de interacciones proteína-ligando. Departamento de Química Física. Granada, Universidad de Granada. 30. Casares, S., E. Ab, et al. (2007). "The high-resolution NMR structure of the R21A Spc-SH3:P41 complex: understanding the determinants of binding affinity by comparison with Abl-SH3." BMC Struct Biol 7: 22. 31. Casares, S., O. Lopez-Mayorga, et al. (2007). "Cooperative propagation of local stability changes from low-stability and highstability regions in a SH3 domain." Proteins 67(3): 531-547. 32. Casares, S., M. Sadqi, et al. (2004). "Detection and characterization of partially unfolded oligomers of the SH3 domain of alpha-spectrin." Biophys J 86(4): 2403-2413. 33. Cesareni, G., S. Panni, et al. (2002). "Can we infer peptide recognition specificity mediated by SH3 domains?" Febs Letters 513(1): 38-44. 34. Cheadle, C., Y. Ivashchenko, et al. (1994). "Identification of a Src SH3 domain binding motif by screening a random phage display library." J Biol Chem 269(39): 24034-24039. 35. Chen, C. and L. E. Matesic (2007). "The Nedd4-like family of E3 ubiquitin ligases and cancer." Cancer Metastasis Rev 26(3-4): 587-604. 36. Chong, P. A., H. Lin, et al. (2010). "Coupling of tandem Smad ubiquitination regulatory factor (Smurf) WW domains modulates target specificity." Proc Natl Acad Sci U S A 107(43): 18404-18409. 37. Cilia, E., R. Pancsa, et al. (2013). "From protein sequence to dynamics and disorder with DynaMine." Nature Communications 4. 38. Cobos, E. S. (2002). Estabiliad, plegamiento y estructura de la proteina circular AS-48 y de mutantes del dominio SH3. Departamento de Química Física. Granada, Universidad de Granada. 211 39. Cobos, E. S., V. V. Filimonov, et al. (2001). "AS-48: a circular protein with an extremely stable globular structure." FEBS Lett 505(3): 379382. 40. Cobos, E. S., M. Iglesias-Bexiga, et al. (2009). "Thermodynamic Characterization of the Folding Equilibrium of the Human Nedd4WW4 Domain: At the Frontiers of Cooperative Folding." Biochemistry 48(36): 8712-8720. 41. Cobos, E. S., M. T. Pisabarro, et al. (2004). "A miniprotein scaffold used to assemble the polyproline II binding epitope recognized by SH3 domains." J Mol Biol 342(1): 355-365. 42. Cohen, G. B., R. Ren, et al. (1995). "Modular binding domains in signal transduction proteins." Cell 80(2): 237-248. 43. Colicelli, J. (2010). "ABL tyrosine kinases: evolution of function, regulation, and specificity." Sci Signal 3(139): re6. 44. Combs, A. P., T. M. Kapoor, et al. (1996). "Protein structure-based combinatorial chemistry: Discovery of non-peptide binding elements to Src SH3 domain." Journal of the American Chemical Society 118(1): 287-288. 45. Condie, C. C. and S. C. Quay (1983). "Conformational studies of aqueous melittin. Characteristics of a fluorescent probe binding site." J Biol Chem 258(13): 8231-8234. 46. Cooper, A. and C. M. Johnson (1994). "Differential scanning calorimetry." Methods Mol Biol 22: 125-136. 47. Cooper, A. and C. M. Johnson (1994). "Isothermal titration microcalorimetry." Methods Mol Biol 22: 137-150. 48. Corbi-Verge, C. (2012). Tesis doctoral: Aspectos dinámicos del reconocimiento de ligandos y regulación funcional de dominios SH3: Hidratación, cooperatividad y equilibrio conformacional. Departamento de Química-Física. Granada, Universidad de Granada. 49. Corbi-Verge, C., F. Marinelli, et al. (2013). "Two-state dynamics of the SH3-SH2 tandem of Abl kinase and the allosteric role of the Ncap." Proc Natl Acad Sci U S A 110(36): E3372-3380. 50. Cowan-Jacob, S. W. (2006). "Structural biology of protein tyrosine kinases." Cell Mol Life Sci 63(22): 2608-2625. 51. Crane, J. C., E. K. Koepf, et al. (2000). "Mapping the transition state of the WW domain beta-sheet." J Mol Biol 298(2): 283-292. 52. Creamer, T. P. (1998). "Left-handed polyproline II helix formation is (very) locally driven." Proteins-Structure Function and Genetics 33(2): 218-226. 212 Bibliografía 53. Creamer, T. P. and M. N. Campbell (2002). "Determinants of the polyproline II helix from modeling studies." Adv Protein Chem 62: 263-282. 54. Cubrilovic, D., W. Haap, et al. (2013). "Determination of ProteinLigand Binding Constants of a Cooperatively Regulated Tetrameric Enzyme Using Electrospray Mass Spectrometry." ACS Chem Biol. 55. Dalgarno, D. C., M. C. Botfield, et al. (1997). "SH3 domains and drug design: ligands, structure, and biological function." Biopolymers 43(5): 383-400. 56. Daniel, E. and G. Weber (1966). "Cooperative effects in binding by bovine serum albumin. I. The binding of 1-anilino-8naphthalenesulfonate. Fluorimetric titrations." Biochemistry 5(6): 1893-1900. 57. de Azevedo, W. F. and R. Dias (2008). "Experimental Approaches to Evaluate the Thermodynamics of Protein- Drug Interactions." Current Drug Targets 9(12): 1071-1076. 58. Demirov, D. G. and E. O. Freed (2004). "Retrovirus budding." Virus Res 106(2): 87-102. 59. Di Nardo, A. A., S. M. Larson, et al. (2003). "The relationship between conservation, thermodynamic stability, and function in the SH3 domain hydrophobic core." J Mol Biol 333(3): 641-655. 60. Dietrich, J., C. Hulme, et al. (2010). "The design, synthesis, and evaluation of 8 hybrid DFG-out allosteric kinase inhibitors: a structural analysis of the binding interactions of Gleevec, Nexavar, and BIRB-796." Bioorg Med Chem 18(15): 5738-5748. 61. Dragan, A. I. and P. L. Privalov (2002). "Unfolding of a leucine zipper is not a simple two-state transition." Journal of Molecular Biology 321(5): 891-908. 62. Engen, J. R., T. E. Wales, et al. (2008). "Structure and dynamic regulation of Src-family kinases." Cell Mol Life Sci 65(19): 3058-3073. 63. Ernst, T., P. La Rosee, et al. (2011). "BCR-ABL mutations in chronic myeloid leukemia." Hematol Oncol Clin North Am 25(5): 997-1008, v-vi. 64. Erpel, T., G. Superti-Furga, et al. (1995). "Mutational analysis of the Src SH3 domain: the same residues of the ligand binding surface are important for intra- and intermolecular interactions." EMBO J 14(5): 963-975. 65. Espanel, X., N. Navin, et al. (2003). "Probing WW domains to uncover and refine determinants of specificity in ligand recognition." Cytotechnology 43(1-3): 105-111. 213 66. Espanel, X. and M. Sudol (2001). "Yes-associated protein and p53binding protein-2 interact through their WW and SH3 domains." J Biol Chem 276(17): 14514-14523. 67. Falsone, S. F., S. Leptihn, et al. (2004). "Oncogenic mutations reduce the stability of SRC kinase." J Mol Biol 344(1): 281-291. 68. Faraldo-Gomez, J. D. and B. Roux (2007). "On the importance of a funneled energy landscape for the assembly and regulation of multidomain Src tyrosine kinases." Proc Natl Acad Sci U S A 104(34): 13643-13648. 69. Fedoroff, O. Y., S. A. Townson, et al. (2004). "The structure and dynamics of tandem WW domains in a negative regulator of notch signaling, Suppressor of deltex." J Biol Chem 279(33): 34991-35000. 70. Feng, S., J. K. Chen, et al. (1994). "Two binding orientations for peptides to the Src SH3 domain: development of a general model for SH3-ligand interactions." Science 266(5188): 1241-1247. 71. Feng, S., T. M. Kapoor, et al. (1996). "Molecular basis for the binding of SH3 ligands with non-peptide elements identified by combinatorial synthesis." Chem Biol 3(8): 661-670. 72. Feng, S., C. Kasahara, et al. (1995). "Specific interactions outside the proline-rich core of two classes of Src homology 3 ligands." Proc Natl Acad Sci U S A 92(26): 12408-12415. 73. Ferguson, M. R., X. Fan, et al. (2004). "Directed discovery of bivalent peptide ligands to an SH3 domain." Protein Sci 13(3): 626-632. 74. Ferguson, N., C. M. Johnson, et al. (2001). "Ultrafast folding of WW domains without structured aromatic clusters in the denatured state." Proceedings of the National Academy of Sciences of the United States of America 98(23): 13002-13007. 75. Ferguson, N., J. R. Pires, et al. (2001). "Using flexible loop mimetics to extend Phi-value analysis to secondary structure interactions." Proceedings of the National Academy of Sciences of the United States of America 98(23): 13008-13013. 76. Fernandez-Ballester, G., C. Blanes-Mira, et al. (2004). "The tryptophan switch: changing ligand-binding specificity from type I to type II in SH3 domains." J Mol Biol 335(2): 619-629. 77. Ferreon, J. C. and V. J. Hilser (2003). "The effect of the polyproline II (PPII) conformation on the denatured state entropy." Protein Sci 12(3): 447-457. 78. Filimonov, V. V., A. I. Azuaga, et al. (1999). "A thermodynamic analysis of a family of small globular proteins: SH3 domains." Biophys Chem 77(2-3): 195-208. 214 Bibliografía 79. Franz, W. M., P. Berger, et al. (1989). "Deletion of an N-terminal regulatory domain of the c-abl tyrosine kinase activates its oncogenic potential." EMBO J 8(1): 137-147. 80. Freed, E. O. (2002). "Viral late domains." J Virol 76(10): 4679-4687. 81. Freire, E. (1995). "Differential scanning calorimetry." Methods Mol Biol 40: 191-218. 82. Freire, E. (2008). "Do enthalpy and entropy distinguish first in class from best in class?" Drug Discov Today 13(19-20): 869-874. 83. Fung, A., P. Li, et al. (2008). "Expanding the realm of ultrafast protein folding: gpW, a midsize natural single-domain with alpha+beta topology that folds downhill." Journal of the American Chemical Society 130(23): 7489-7495. 84. Fushman, D., R. Xu, et al. (1999). "Direct determination of changes of interdomain orientation on ligation: use of the orientational dependence of 15N NMR relaxation in Abl SH(32)." Biochemistry 38(32): 10225-10230. 85. Garcia-Mira, M. M., M. Sadqi, et al. (2002). "Experimental identification of downhill protein folding." Science 298(5601): 21912195. 86. Ghose, R., A. Shekhtman, et al. (2001). "A novel, specific interaction involving the Csk SH3 domain and its natural ligand." Nat Struct Biol 8(11): 998-1004. 87. Gill, S. C. and P. H. von Hippel (1989). "Calculation of protein extinction coefficients from amino acid sequence data." Anal Biochem 182(2): 319-326. 88. Goff, S. P., E. Gilboa, et al. (1980). "Structure of the Abelson murine leukemia virus genome and the homologous cellular gene: studies with cloned viral DNA." Cell 22(3): 777-785. 89. Gorre, M. E., K. Ellwood-Yen, et al. (2002). "BCR-ABL point mutants isolated from patients with imatinib mesylate-resistant chronic myeloid leukemia remain sensitive to inhibitors of the BCRABL chaperone heat shock protein 90." Blood 100(8): 3041-3044. 90. Gottlinger, H. G., T. Dorfman, et al. (1991). "Effect of mutations affecting the p6 gag protein on human immunodeficiency virus particle release." Proc Natl Acad Sci U S A 88(8): 3195-3199. 91. Gril, B., M. Vidal, et al. (2007). "Grb2-SH3 ligand inhibits the growth of HER2(+) cancer cells and has antitumor effects in human cancer xenografts alone and in combination with docetaxel." International Journal of Cancer 121(2): 407-415. 215 92. Halabi, N., O. Rivoire, et al. (2009). "Protein Sectors: Evolutionary Units of Three-Dimensional Structure." Cell 138(4): 774-786. 93. Hantschel, O. and G. Superti-Furga (2004). "Regulation of the c-Abl and Bcr-Abl tyrosine kinases." Nat Rev Mol Cell Biol 5(1): 33-44. 94. Harty, R. N., M. E. Brown, et al. (2001). "Rhabdoviruses and the cellular ubiquitin-proteasome system: a budding interaction." J Virol 75(22): 10623-10629. 95. Harty, R. N., M. E. Brown, et al. (2000). "A PPxY motif within the VP40 protein of Ebola virus interacts physically and functionally with a ubiquitin ligase: implications for filovirus budding." Proc Natl Acad Sci U S A 97(25): 13871-13876. 96. Harvey, K. F. and S. Kumar (1999). "Nedd4-like proteins: an emerging family of ubiquitin-protein ligases implicated in diverse cellular functions." Trends Cell Biol 9(5): 166-169. 97. Hassan, A. Q., S. V. Sharma, et al. (2010). "Allosteric inhibition of BCR-ABL." Cell Cycle 9(18): 3710-3714. 98. Hilser, V. J., D. Dowdy, et al. (1998). "The structural distribution of cooperative interactions in proteins: analysis of the native state ensemble." Proc Natl Acad Sci U S A 95(17): 9903-9908. 99. Hu, H., J. Columbus, et al. (2004). "A map of WW domain family interactions." Proteomics 4(3): 643-655. 100. Huang, X., M. Beullens, et al. (2009). "Structure and function of the two tandem WW domains of the pre-mRNA splicing factor FBP21 (formin-binding protein 21)." J Biol Chem 284(37): 25375-25387. 101. Hubbard, S. R. and J. H. Till (2000). "Protein tyrosine kinase structure and function." Annu Rev Biochem 69: 373-398. 102. Hunter, T. and B. M. Sefton (1980). "Transforming gene product of Rous sarcoma virus phosphorylates tyrosine." Proc Natl Acad Sci U S A 77(3): 1311-1315. 103. Huse, M. and J. Kuriyan (2002). "The conformational plasticity of protein kinases." Cell 109(3): 275-282. 104. Ingham, R. J., K. Colwill, et al. (2005). "WW domains provide a platform for the assembly of multiprotein networks." Mol Cell Biol 25(16): 7092-7106. 105. Jager, M., H. Nguyen, et al. (2001). "The folding mechanism of a beta-sheet: The WW domain." Journal of Molecular Biology 311(2): 373-393. 106. Jahnke, W., M. J. Blommers, et al. (2005). "Strategies for the NMRbased identification and optimization of allosteric protein kinase inhibitors." Chembiochem 6(9): 1607-1610. 216 Bibliografía 107. Jelen, F., A. Oleksy, et al. (2003). "PDZ domains - common players in the cell signaling." Acta Biochim Pol 50(4): 985-1017. 108. Jelesarov, I. and H. R. Bosshard (1999). "Isothermal titration calorimetry and differential scanning calorimetry as complementary tools to investigate the energetics of biomolecular recognition." J Mol Recognit 12(1): 3-18. 109. Jennings, M. D., R. T. Blankley, et al. (2007). "Specificity and autoregulation of Notch binding by tandem WW domains in suppressor of Deltex." J Biol Chem 282(39): 29032-29042. 110. Johnson, C. M. (2013). "Differential scanning calorimetry as a tool for protein folding and stability." Archives of Biochemistry and Biophysics 531(1-2): 100-109. 111. Kanelis, V., M. C. Bruce, et al. (2006). "Structural determinants for high-affinity binding in a Nedd4 WW3* domain-Comm PY motif complex." Structure 14(3): 543-553. 112. Kang, H., C. Freund, et al. (2000). "SH3 domain recognition of a proline-independent tyrosine-based RKxxYxxY motif in immune cell adaptor SKAP55." EMBO J 19(12): 2889-2899. 113. Kardinal, C., B. Konkol, et al. (2000). "Cell-penetrating SH3 domain blocker peptides inhibit proliferation of primary blast cells from CML patients." FASEB J 14(11): 1529-1538. 114. Karkkainen, S., M. Hiipakka, et al. (2006). "Identification of preferred protein interactions by phage-display of the human Src homology-3 proteome." EMBO Rep 7(2): 186-191. 115. Kasanov, J., G. Pirozzi, et al. (2001). "Characterizing Class I WW domains defines key specificity determinants and generates mutant domains with novel specificities." Chem Biol 8(3): 231-241. 116. Kay, B. K., M. P. Williamson, et al. (2000). "The importance of being proline: the interaction of proline-rich motifs in signaling proteins with their cognate domains." Faseb Journal 14(2): 231-241. 117. Kitova, E. N., A. El-Hawiet, et al. (2012). "Reliable Determinations of Protein-Ligand Interactions by Direct ESI-MS Measurements. Are We There Yet?" Journal of the American Society for Mass Spectrometry 23(3): 431-441. 118. Klippel, S., M. Wieczorek, et al. (2011). "Multivalent binding of formin-binding protein 21 (FBP21)-tandem-WW domains fosters protein recognition in the pre-spliceosome." J Biol Chem 286(44): 38478-38487. 217 119. Koepf, E. K., H. M. Petrassi, et al. (1999). "Characterization of the structure and function of W --> F WW domain variants: identification of a natively unfolded protein that folds upon ligand binding." Biochemistry 38(43): 14338-14351. 120. Koshland, D. E., Jr., G. Nemethy, et al. (1966). "Comparison of experimental binding data and theoretical models in proteins containing subunits." Biochemistry 5(1): 365-385. 121. Kumar, S., Y. Tomooka, et al. (1992). "Identification of a set of genes with developmentally down-regulated expression in the mouse brain." Biochem Biophys Res Commun 185(3): 1155-1161. 122. Ladbury, J. E. and S. Arold (2000). "Searching for specificity in SH domains." Chem Biol 7(1): R3-8. 123. Lafont, V., A. A. Armstrong, et al. (2007). "Compensating enthalpic and entropic changes hinder binding affinity optimization." Chem Biol Drug Des 69(6): 413-422. 124. Landgraf, C., S. Panni, et al. (2004). "Protein interaction networks by proteome peptide scanning." Plos Biology 2(1): 94-103. 125. Larson, S. M. and A. R. Davidson (2000). "The identification of conserved interactions within the SH3 domain by alignment of sequences and structures." Protein Sci 9(11): 2170-2180. 126. Leavitt, S. A., A. Schon, et al. (2004). "Interactions of HIV-1 proteins gp120 and Nef with cellular partners define a novel allosteric paradigm." Current Protein & Peptide Science 5(1): 1-8. 127. Lee, K. Y., J. H. Yoon, et al. (2002). "A dipalmitoyl peptide that binds SH3 domain, disturbs intracellular signal transduction, and inhibits tumor growth in vivo." Biochemical and Biophysical Research Communications 296(2): 434-442. 128. Lemmon, M. A. and J. Schlessinger (2010). "Cell signaling by receptor tyrosine kinases." Cell 141(7): 1117-1134. 129. Lenaerts, T., J. Ferkinghoff-Borg, et al. (2009). "Information theoretical quantification of cooperativity in signalling complexes." BMC Syst Biol 3: 9. 130. Lenaerts, T., J. Ferkinghoff-Borg, et al. (2008). "Quantifying information transfer by protein domains: Analysis of the Fyn SH2 domain structure." Bmc Structural Biology 8. 131. Li, S. S. C. (2005). "Specificity and versatility of SH3 and other proline-recognition domains: structural basis and implications for cellular signal transduction." Biochemical Journal 390: 641-653. 218 Bibliografía 132. Lim, W. A., F. M. Richards, et al. (1994). "Structural determinants of peptide-binding orientation and of sequence specificity in SH3 domains." Nature 372(6504): 375-379. 133. Liu, Q., D. Berry, et al. (2003). "Structural basis for specific binding of the Gads SH3 domain to an RxxK motif-containing SLP-76 peptide: a novel mode of peptide recognition." Mol Cell 11(2): 471481. 134. Liu, X., F. Li, et al. (2013). "Solution structure of the SH3 domain of DOCK180." Proteins 81(5): 906-910. 135. Luque, I. and E. Freire (1998). "Structure-based prediction of binding affinities and molecular design of peptide ligands." Energetics of Biological Macromolecules, Pt B 295: 100-127. 136. Luque, I. and E. Freire (2002). "Structural parameterization of the binding enthalpy of small ligands." Proteins-Structure Function and Genetics 49(2): 181-190. 137. Luque, I., S. A. Leavitt, et al. (2002). "The linkage between protein folding and functional cooperativity: Two sides of the same coin?" Annual Review of Biophysics and Biomolecular Structure 31: 235256. 138. Luque, I., M. J. Todd, et al. (1998). "Molecular basis of resistance to HIV-1 protease inhibition: A plausible hypothesis." Biochemistry 37(17): 5791-5797. 139. Macias, M. J., V. Gervais, et al. (2000). "Structural analysis of WW domains and design of a WW prototype." Nat Struct Biol 7(5): 375379. 140. Macias, M. J., M. Hyvonen, et al. (1996). "Structure of the WW domain of a kinase-associated protein complexed with a proline-rich peptide." Nature 382(6592): 646-649. 141. Macias, M. J., S. Wiesner, et al. (2002). "WW and SH3 domains, two different scaffolds to recognize proline-rich ligands." FEBS Lett 513(1): 30-37. 142. Makhatadze, G. I. and P. L. Privalov (1990). "Heat capacity of proteins. I. Partial molar heat capacity of individual amino acid residues in aqueous solution: hydration effect." J Mol Biol 213(2): 375-384. 143. Manning, G., D. B. Whyte, et al. (2002). "The protein kinase complement of the human genome." Science 298(5600): 1912-1934. 144. Martinez, J. C., M. T. Pisabarro, et al. (1998). "Obligatory steps in protein folding and the conformational diversity of the transition state." Nature Structural Biology 5(8): 721-729. 219 145. Martinez, J. C. and L. Serrano (1999). "The folding transition state between SH3 domains is conformationally restricted and evolutionarily conserved." Nature Structural Biology 6(11): 10101016. 146. Martinez JC, C. E., Luque I, Ruiz-Sanz J (2011). Differential Scanning Calorimetry: Thermodynamic Analysis of the Unfolding Transitions of Proteins, Domains and Peptidic Fragments by Using Equilibrium Models. Protein Folding. W. EC. New York, Nova Science Publishers Hauppauge. 147. Martin-Garcia, J. M. (2009). Tesis doctoral: Determinantes moleculares de la afinidad y especificidad de unión en dominios SH3. Departamento de Química Física. Granada, Universidad de Granada. 148. Martin-Garcia, J. M., I. Luque, et al. (2007). "Crystallographic structure of the SH3 domain of the human c-Yes tyrosine kinase: loop flexibility and amyloid aggregation." FEBS Lett 581(9): 1701-1706. 149. Martin-Garcia, J. M., I. Luque, et al. (2012). "The promiscuous binding of the Fyn SH3 domain to a peptide from the NS5A protein." Acta Crystallogr D Biol Crystallogr 68(Pt 8): 1030-1040. 150. Martin-Garcia, J. M., J. Ruiz-Sanz, et al. (2012). "Interfacial water molecules in SH3 interactions: a revised paradigm for polyproline recognition." Biochemical Journal 442: 443-451. 151. Martin-Serrano, J., T. Zang, et al. (2001). "HIV-1 and Ebola virus encode small peptide motifs that recruit Tsg101 to sites of particle assembly to facilitate egress." Nat Med 7(12): 1313-1319. 152. Mateo, P. L., C. Baron, et al. (1984). "AMP and IMP binding to glycogen phosphorylase b. A calorimetric and equilibrium dialysis study." J Biol Chem 259(15): 9384-9389. 153. Mayer, B. J. (2001). "SH3 domains: complexity in moderation." J Cell Sci 114(Pt 7): 1253-1263. 154. Mayer, B. J. (2006). "Protein-protein interactions in signaling cascades." Methods Mol Biol 332: 79-99. 155. Mayer, B. J. and D. Baltimore (1993). "Signalling through SH2 and SH3 domains." Trends Cell Biol 3(1): 8-13. 156. Mayer, B. J. and D. Baltimore (1994). "Mutagenic Analysis of the Roles of Sh2 and Sh3 Domains in Regulation of the Abl Tyrosine Kinase." Molecular and Cellular Biology 14(5): 2883-2894. 157. Mayer, B. J. and M. J. Eck (1995). "SH3 domains. Minding your p's and q's." Curr Biol 5(4): 364-367. 220 Bibliografía 158. McDonald, C. B., L. Buffa, et al. (2012). "Biophysical basis of the binding of WWOX tumor suppressor to WBP1 and WBP2 adaptors." J Mol Biol 422(1): 58-74. 159. Meng, Y. and B. Roux (2013). "Locking the Active Conformation of c-Src Kinase through the Phosphorylation of the Activation Loop." J Mol Biol. 160. Meyer, B. and T. Peters (2003). "NMR Spectroscopy techniques for screening and identifying ligand binding to protein receptors." Angewandte Chemie-International Edition 42(8): 864-890. 161. Mi, D., W. Q. Meng, et al. (2011). "Unifying model for two-state and downhill protein folding." Phys Rev E Stat Nonlin Soft Matter Phys 83(4 Pt 1): 041901. 162. Mian, A. A., A. Metodieva, et al. (2012). "Allosteric inhibition enhances the efficacy of ABL kinase inhibitors to target unmutated BCR-ABL and BCR-ABL-T315I." BMC Cancer 12: 411. 163. Miyoshi-Akiyama, T., L. M. Aleman, et al. (2001). "Regulation of Cbl phosphorylation by the Abl tyrosine kinase and the Nck SH2/SH3 adaptor." Oncogene 20(30): 4058-4069. 164. Monod, J., J. Wyman, et al. (1965). "On the Nature of Allosteric Transitions: A Plausible Model." J Mol Biol 12: 88-118. 165. Morton, C. J., D. J. Pugh, et al. (1996). "Solution structure and peptide binding of the SH3 domain from human Fyn." Structure 4(6): 705-714. 166. Musacchio, A., M. Saraste, et al. (1994). "High-resolution crystal structures of tyrosine kinase SH3 domains complexed with prolinerich peptides." Nat Struct Biol 1(8): 546-551. 167. Nagar, B. (2007). "c-Abl tyrosine kinase and inhibition by the cancer drug imatinib (Gleevec/STI-571)." J Nutr 137(6 Suppl 1): 1518S1523S; discussion 1548S. 168. Nagar, B., O. Hantschel, et al. (2006). "Organization of the SH3-SH2 unit in active and inactive forms of the c-Abl tyrosine kinase." Mol Cell 21(6): 787-798. 169. Nagar, B., O. Hantschel, et al. (2003). "Structural basis for the autoinhibition of c-Abl tyrosine kinase." Cell 112(6): 859-871. 170. Neduva, V., R. Linding, et al. (2005). "Systematic discovery of new recognition peptides mediating protein interaction networks." PLoS Biol 3(12): e405. 171. Nguyen, J. T., M. Porter, et al. (2000). "Improving SH3 domain ligand selectivity using a non-natural scaffold." Chemistry & Biology 7(7): 463-473. 221 172. Nguyen, J. T., C. W. Turck, et al. (1998). "Exploiting the basis of proline recognition by SH3 and WW domains: design of N-substituted inhibitors." Science 282(5396): 2088-2092. 173. Ohno, H., J. Stewart, et al. (1995). "Interaction of tyrosine-based sorting signals with clathrin-associated proteins." Science 269(5232): 1872-1875. 174. Okumura, A., P. M. Pitha, et al. (2008). "ISG15 inhibits Ebola VP40 VLP budding in an L-domain-dependent manner by blocking Nedd4 ligase activity." Proc Natl Acad Sci U S A 105(10): 3974-3979. 175. Oneyama, C., H. Nakano, et al. (2002). "UCS15A, a novel small molecule, SH3 domain-mediated protein-protein interaction blocking drug." Oncogene 21(13): 2037-2050. 176. Ortega Roldan, J. L., S. Casares, et al. (2013). "Distinct Ubiquitin Binding Modes Exhibited by SH3 Domains: Molecular Determinants and Functional Implications." PLoS One 8(9): e73018. 177. Otte, L., U. Wiedemann, et al. (2003). "WW domain sequence activity relationships identified using ligand recognition propensities of 42 WW domains." Protein Science 12(3): 491-500. 178. Palencia, A. (2008). Tesis Doctoral: Reconocimiento de secuencias ricas en prolina por dominios modulares de interacción proteínaproteína. Departamento de Química Físca. Granada, Universidad de Granada. 179. Palencia, A., A. Camara-Artigas, et al. (2010). "Role of interfacial water molecules in proline-rich ligand recognition by the Src homology 3 domain of Abl." J Biol Chem 285(4): 2823-2833. 180. Palencia, A., E. S. Cobos, et al. (2004). "Thermodynamic dissection of the binding energetics of proline-rich peptides to the Abl-SH3 domain: implications for rational ligand design." J Mol Biol 336(2): 527-537. 181. Panjarian, S., R. E. Iacob, et al. (2013). "Structure and Dynamic Regulation of Abl Kinases." Journal of Biological Chemistry 288(8): 5443-5450. 182. Panni, S., L. Dente, et al. (2002). "In vitro evolution of recognition specificity mediated by SH3 domains reveals target recognition rules." J Biol Chem 277(24): 21666-21674. 183. Parent, L. J., R. P. Bennett, et al. (1995). "Positionally independent and exchangeable late budding functions of the Rous sarcoma virus and human immunodeficiency virus Gag proteins." J Virol 69(9): 5455-5460. 222 Bibliografía 184. Pawson, T. (1995). "Protein modules and signalling networks." Nature 373(6515): 573-580. 185. Pawson, T. and P. Nash (2000). "Protein-protein interactions define specificity in signal transduction." Genes Dev 14(9): 1027-1047. 186. Pawson, T. and P. Nash (2003). "Assembly of cell regulatory systems through protein interaction domains." Science 300(5618): 445-452. 187. Pawson, T., M. Raina, et al. (2002). "Interaction domains: from simple binding events to complex cellular behavior." FEBS Lett 513(1): 2-10. 188. Pawson, T. and J. D. Scott (1997). "Signaling through scaffold, anchoring, and adaptor proteins." Science 278(5346): 2075-2080. 189. Pellicena, P. and W. T. Miller (2001). "Processive phosphorylation of p130Cas by Src depends on SH3-polyproline interactions." J Biol Chem 276(30): 28190-28196. 190. Pendergast, A. M. (2002). "The Abl family kinases: mechanisms of regulation and signaling." Adv Cancer Res 85: 51-100. 191. Pendergast, A. M. and O. N. Witte (1987). "Role of the ABL oncogene tyrosine kinase activity in human leukaemia." Baillieres Clin Haematol 1(4): 1001-1020. 192. Pereboev, A. V., N. Ahmed, et al. (2001). "Epitopes in the interacting regions of beta-dystroglycan (PPxY motif) and dystrophin (WW domain)." Biochim Biophys Acta 1527(1-2): 54-60. 193. Petrovich, M., A. L. Jonsson, et al. (2006). "Phi-analysis at the experimental limits: mechanism of beta-hairpin formation." J Mol Biol 360(4): 865-881. 194. Pires, J. R., C. Parthier, et al. (2005). "Structural basis for APPTPPPLPP peptide recognition by the FBP11WW1 domain." J Mol Biol 348(2): 399-408. 195. Pires, J. R., F. Taha-Nejad, et al. (2001). "Solution structures of the YAP65 WW domain and the variant L30 K in complex with the peptides GTPPPPYTVG, N-(n-octyl)-GPPPY and PLPPY and the application of peptide libraries reveal a minimal binding epitope." J Mol Biol 314(5): 1147-1156. 196. Pisabarro, M. T., A. R. Ortiz, et al. (1994). "Molecular modeling of the interaction of polyproline-based peptides with the Abl-SH3 domain: rational modification of the interaction." Protein Eng 7(12): 1455-1462. 197. Pisabarro, M. T. and L. Serrano (1996). "Rational design of specific high-affinity peptide ligands for the Abl-SH3 domain." Biochemistry 35(33): 10634-10640. 223 198. Pisabarro, M. T., L. Serrano, et al. (1998). "Crystal structure of the abl-SH3 domain complexed with a designed high-affinity peptide ligand: implications for SH3-ligand interactions." J Mol Biol 281(3): 513-521. 199. Pluk, H., K. Dorey, et al. (2002). "Autoinhibition of c-Abl." Cell 108(2): 247-259. 200. Pornillos, O., J. E. Garrus, et al. (2002). "Mechanisms of enveloped RNA virus budding." Trends Cell Biol 12(12): 569-579. 201. Privalov, P. L. (1979). "Stability of proteins: small globular proteins." Adv Protein Chem 33: 167-241. 202. Privalov, P. L. (1982). "Stability of proteins. Proteins which do not present a single cooperative system." Adv Protein Chem 35: 1-104. 203. Privalov, P. L. and A. I. Dragan (2007). "Microcalorimetry of biological macromolecules." Biophys Chem 126(1-3): 16-24. 204. Privalov, P. L. and G. I. Makhatadze (1990). "Heat capacity of proteins. II. Partial molar heat capacity of the unfolded polypeptide chain of proteins: protein unfolding effects." J Mol Biol 213(2): 385391. 205. Puffer, B. A., S. C. Watkins, et al. (1998). "Equine infectious anemia virus Gag polyprotein late domain specifically recruits cellular AP-2 adapter protein complexes during virion assembly." J Virol 72(12): 10218-10221. 206. Ramirez-Espain, X., L. Ruiz, et al. (2007). "Structural characterization of a new binding motif and a novel binding mode in group 2 WW domains." Journal of Molecular Biology 373(5): 12551268. 207. Reiss, D. J. and B. Schwikowski (2004). "Predicting protein-peptide interactions via a network-based motif sampler." Bioinformatics 20 Suppl 1: i274-282. 208. Ren, R., B. J. Mayer, et al. (1993). "Identification of a ten-amino acid proline-rich SH3 binding site." Science 259(5098): 1157-1161. 209. Renzoni, D. A., D. J. R. Pugh, et al. (1996). "Structural and thermodynamic characterization of the interaction of the SH3 domain from Fyn with the proline-rich binding site on the p85 subunit of PI3kinase." Biochemistry 35(49): 15646-15653. 210. Rickles, R. J., M. C. Botfield, et al. (1995). "Phage display selection of ligand residues important for Src homology 3 domain binding specificity." Proc Natl Acad Sci U S A 92(24): 10909-10913. 211. Roberts, G. C. (1999). "NMR spectroscopy in structure-based drug design." Curr Opin Biotechnol 10(1): 42-47. 224 Bibliografía 212. Roskoski, R., Jr. (2004). "Src protein-tyrosine kinase structure and regulation." Biochem Biophys Res Commun 324(4): 1155-1164. 213. Rotin, D. (1998). "WW (WWP) domains: from structure to function." Curr Top Microbiol Immunol 228: 115-133. 214. Ruiz-Sanz, J., V. V. Filimonov, et al. (2004). "Thermodynamic analysis of the unfolding and stability of the dimeric DNA-binding protein HU from the hyperthermophilic eubacterium Thermotoga maritima and its E34D mutant." Eur J Biochem 271(8): 1497-1507. 215. Sadqi, M., S. Casares, et al. (1999). "The native state conformational ensemble of the SH3 domain from alpha-spectrin." Biochemistry 38(28): 8899-8906. 216. Sanchez-Ruiz, J. M. (1995). "Differential scanning calorimetry of proteins." Subcell Biochem 24: 133-176. 217. Schleinkofer, K., U. Wiedemann, et al. (2004). "Comparative structural and energetic analysis of WW domain-peptide interactions." J Mol Biol 344(3): 865-881. 218. Schumacher, T. N. M., L. M. Mayr, et al. (1996). "Identification of D-peptide ligands through mirror-image phage display." Science 271(5257): 1854-1857. 219. Sen, B. and F. M. Johnson (2011). "Regulation of SRC family kinases in human cancers." J Signal Transduct 2011: 865819. 220. Shannon, C. E. (1997). "The mathematical theory of communication. 1963." MD Comput 14(4): 306-317. 221. Sharpe, T., A. L. Jonsson, et al. (2007). "The role of the turn in betahairpin formation during WW domain folding." Protein Sci 16(10): 2233-2239. 222. Sherbenou, D. W., O. Hantschel, et al. (2010). "BCR-ABL SH3-SH2 domain mutations in chronic myeloid leukemia patients on imatinib." Blood 116(17): 3278-3285. 223. Shimkets, R. A., D. G. Warnock, et al. (1994). "Liddle's syndrome: heritable human hypertension caused by mutations in the beta subunit of the epithelial sodium channel." Cell 79(3): 407-414. 224. Shishido, T., T. Akagi, et al. (2000). "The kinase-deficient Src acts as a suppressor of the Abl kinase for Cbl phosphorylation." Proc Natl Acad Sci U S A 97(12): 6439-6444. 225. Skorski, T., M. Nieborowska-Skorska, et al. (1998). "The SH3 domain contributes to BCR/ABL-dependent leukemogenesis in vivo: role in adhesion, invasion, and homing." Blood 91(2): 406-418. 226. Smith, J. M. and B. J. Mayer (2002). "Abl: mechanisms of regulation and activation." Front Biosci 7: d31-42. 225 227. Sparks, A. B., J. E. Rider, et al. (1996). "Distinct ligand preferences of Src homology 3 domains from Src, Yes, Abl, Cortactin, p53bp2, PLCgamma, Crk, and Grb2." Proc Natl Acad Sci U S A 93(4): 15401544. 228. Stapley, B. J. and T. P. Creamer (1999). "A survey of left-handed polyproline II helices." Protein Sci 8(3): 587-595. 229. Staub, O., S. Dho, et al. (1996). "WW domains of Nedd4 bind to the proline-rich PY motifs in the epithelial Na+ channel deleted in Liddle's syndrome." EMBO J 15(10): 2371-2380. 230. Stauffer, T. P., C. H. Martenson, et al. (1997). "Inhibition of Lyn function in mast cell activation by SH3 domain binding peptides." Biochemistry 36(31): 9388-9394. 231. Stehelin, D., D. J. Fujita, et al. (1977). "Detection and enumeration of transformation-defective strains of avian sarcoma virus with molecular hybridization." Virology 76(2): 675-684. 232. Streicher, W. W. and G. I. Makhatadze (2007). "Unfolding thermodynamics of Trp-cage, a 20 residue miniprotein, studied by differential scanning calorimetry and circular dichroism spectroscopy." Biochemistry 46(10): 2876-2880. 233. Sturtevant, J. M. (1977). "Heat capacity and entropy changes in processes involving proteins." Proc Natl Acad Sci U S A 74(6): 22362240. 234. Sudol, M. (1996). "Structure and function of the WW domain." Prog Biophys Mol Biol 65(1-2): 113-132. 235. Sudol, M. (1996). "The WW module competes with the SH3 domain?" Trends Biochem Sci 21(5): 161-163. 236. Sudol, M. (1998). "From Src Homology domains to other signaling modules: proposal of the 'protein recognition code'." Oncogene 17(11 Reviews): 1469-1474. 237. Sudol, M., H. I. Chen, et al. (1995). "Characterization of a novel protein-binding module--the WW domain." FEBS Lett 369(1): 67-71. 238. Sudol, M. and T. Hunter (2000). "NeW wrinkles for an old domain." Cell 103(7): 1001-1004. 239. Sudol, M., C. C. Recinos, et al. (2005). "WW or WoW: the WW domains in a union of bliss." IUBMB Life 57(12): 773-778. 240. Sudol, M., K. Sliwa, et al. (2001). "Functions of WW domains in the nucleus." FEBS Lett 490(3): 190-195. 241. Summy, J. M. and G. E. Gallick (2003). "Src family kinases in tumor progression and metastasis." Cancer Metastasis Rev 22(4): 337-358. 226 Bibliografía 242. Sze, C. I., M. Su, et al. (2004). "Down-regulation of WW domaincontaining oxidoreductase induces Tau phosphorylation in vitro. A potential role in Alzheimer's disease." J Biol Chem 279(29): 3049830506. 243. Timmins, J., G. Schoehn, et al. (2003). "Ebola virus matrix protein VP40 interaction with human cellular factors Tsg101 and Nedd4." Journal of Molecular Biology 326(2): 493-502. 244. Toepert, F., J. R. Pires, et al. (2001). "Synthesis of an Array Comprising 837 Variants of the hYAP WW Protein Domain This work was supported by the DFG (INK 16/B1-1), by the Fonds der Chemischen Industrie, and by the Universitatsklinikum Charite Berlin." Angew Chem Int Ed Engl 40(5): 897-900. 245. Tong, A. H., B. Drees, et al. (2002). "A combined experimental and computational strategy to define protein interaction networks for peptide recognition modules." Science 295(5553): 321-324. 246. Tsai, C. J., A. del Sol, et al. (2008). "Allostery: absence of a change in shape does not imply that allostery is not at play." J Mol Biol 378(1): 1-11. 247. Ulmer, T. S., J. M. Werner, et al. (2002). "SH3-SH2 domain orientation in Src kinases: NMR studies of Fyn." Structure 10(7): 901911. 248. Varela, L., B. Morel, et al. (2009). "A single mutation in an SH3 domain increases amyloid aggregation by accelerating nucleation, but not by destabilizing thermodynamically the native state." Febs Letters 583(4): 801-806. 249. Velazquez Campoy, A. and E. Freire (2005). "ITC in the postgenomic era...? Priceless." Biophys Chem 115(2-3): 115-124. 250. Velazquez-Campoy, A. and E. Freire (2001). "Incorporating target heterogeneity in drug design." J Cell Biochem Suppl Suppl 37: 82-88. 251. Velazquez-Campoy, A. and E. Freire (2006). "Isothermal titration calorimetry to determine association constants for high-affinity ligands." Nat Protoc 1(1): 186-191. 252. Velazquez-Campoy, A., S. A. Leavitt, et al. (2004). "Characterization of protein-protein interactions by isothermal titration calorimetry." Methods Mol Biol 261: 35-54. 253. Velazquez-Campoy, A., H. Ohtaka, et al. (2004). "Isothermal titration calorimetry." Curr Protoc Cell Biol Chapter 17: Unit 17 18. 254. VerPlank, L., F. Bouamr, et al. (2001). "Tsg101, a homologue of ubiquitin-conjugating (E2) enzymes, binds the L domain in HIV type 1 Pr55(Gag)." Proc Natl Acad Sci U S A 98(14): 7724-7729. 227 255. Vidal, M., V. Gigoux, et al. (2001). "SH2 and SH3 domains as targets for anti-proliferative agents." Critical Reviews in Oncology Hematology 40(2): 175-186. 256. Vlieghe, P., V. Lisowski, et al. (2010). "Synthetic therapeutic peptides: science and market." Drug Discov Today 15(1-2): 40-56. 257. Wand, A. J. (2001). "Dynamic activation of protein function: a view emerging from NMR spectroscopy." Nat Struct Biol 8(11): 926-931. 258. Wang, C., N. H. Pawley, et al. (2001). "The role of backbone motions in ligand binding to the c-Src SH3 domain." J Mol Biol 313(4): 873-887. 259. Wang, J. Y., F. Ledley, et al. (1984). "The mouse c-abl locus: molecular cloning and characterization." Cell 36(2): 349-356. 260. Weng, Z., R. J. Rickles, et al. (1995). "Structure-function analysis of SH3 domains: SH3 binding specificity altered by single amino acid substitutions." Mol Cell Biol 15(10): 5627-5634. 261. Wiesner, S., G. Stier, et al. (2002). "Solution structure and ligand recognition of the WW domain pair of the yeast splicing factor Prp40." J Mol Biol 324(4): 807-822. 262. Wiseman, T., S. Williston, et al. (1989). "Rapid Measurement of Binding Constants and Heats of Binding Using a New Titration Calorimeter." Analytical Biochemistry 179(1): 131-137. 263. Yadav, S. S. and W. T. Miller (2007). "Cooperative activation of Src family kinases by SH3 and SH2 ligands." Cancer Letters 257(1): 116123. 264. Yadav, S. S. and W. T. Miller (2008). "The evolutionarily conserved arrangement of domains in SRC family kinases is important for substrate recognition." Biochemistry 47(41): 10871-10880. 265. Yasuda, J. and E. Hunter (1998). "A proline-rich motif (PPPY) in the Gag polyprotein of Mason-Pfizer monkey virus plays a maturationindependent role in virion release." J Virol 72(5): 4095-4103. 266. Yasuda, J., M. Nakao, et al. (2003). "Nedd4 regulates egress of Ebola virus-like particles from host cells." J Virol 77(18): 9987-9992. 267. Yu, H., J. K. Chen, et al. (1994). "Structural basis for the binding of proline-rich peptides to SH3 domains." Cell 76(5): 933-945. 268. Yuzawa, S., M. Yokochi, et al. (2004). "Sequence-specific resonance assignments of the tandem SH3 domains in an autoinhibitory form of p47(phox)." J Biomol NMR 29(3): 451-452. 269. Zafra-Ruano, A. and I. Luque (2012). "Interfacial water molecules in SH3 interactions: Getting the full picture on polyproline recognition 228 Bibliografía by protein-protein interaction domains." Febs Letters 586(17): 26192630. 270. Zarrinpar, A., R. P. Bhattacharyya, et al. (2003). "The structure and function of proline recognition domains." Sci STKE 2003(179): RE8. 271. Zarrinpar, A. and W. A. Lim (2000). "Converging on proline: the mechanism of WW domain peptide recognition." Nat Struct Biol 7(8): 611-613. 272. Zarrinpar, A., S. H. Park, et al. (2003). "Optimization of specificity in a cellular protein interaction network by negative selection." Nature 426(6967): 676-680. 273. Zhang, J., F. J. Adrian, et al. (2010). "Targeting Bcr-Abl by combining allosteric with ATP-binding-site inhibitors." Nature 463(7280): 501-506. 229 APÉNDICE Apéndice APÉNDICE APÉNDICE I. Cálculo de errores para los experimentos de ITC y DSC • DSC (I.I) (I.II) (I.III) (I.IV) (I.V) • ITC (I.VI) (I.VII) (I.VIII) (I.IX) (I.X) 233 Apéndice APÉNDICE II. Modelos termodinámicos para el estudio de la interacción del tándem cAblSH3SH2 y cAblSH3SH2-C2Q • MODELO 1.- No existe cooperatividad entre ambos dominios, es decir, el conector C2Q interacciona con el dominio SH3 independientemente del estado de plegamiento del dominio SH2. Variable independiente: x (temperatura experimental, en ºC) Variable dependiente: y (capacidad calorífica experimental, en kJ·K-1·mol-1) Parámetros ajustables: Tm0U2, Tm0U3 (temperaturas de transición para los estados U2 y U3, en ºC) HmU2, HmU3 (diferencia de entalpía a la temperatura de transición para los estados U2 y U3, en kJ·mol-1) DCpU2,DCpU3 (diferencia de capacidad calorífica para los estados U2 y U3, en kJ·K-1·mol-1). Se suponen constantes con la temperatura. DGcd (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado cd, en kJ·mol-1). DHcd y DCpcd se suponen nulas. DGc2q_ab (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado c2q_ab, en kJ·mol-1). DHc2q_ab y DCpc2q_ab se suponen nulas. DGc2q_cd (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado c2q_cd, en kJ·mol-1). DHc2q_cd y DCpc2q_cd se suponen nulas. DGc2q_pd (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado c2q_pd, en kJ·mol-1). DHc2q_cd y DCpc2q_cd se suponen nulas. Desarrollo ecuaciones: 235 R=0.0083143 (constante de los gases en kJ·K-1·mol-1) T=x+273.15 (conversión de la temperatura experimental de ºC a Kelvin) Tr=298.15 (temperatura de referencia en Kelvin) TmU2=Tm0U2+273.15 (conversión de las Tm0U2 y Tm0U3 de ºC a Kelvin) TmU3=Tm0U3+273.15 DHU2=HmU2+DCpU2*(T-TmU2) (diferencia de entalpía para los estados U2 y U3) DHU3=HmU3+DCpU3*(T-TmU3) DSU2=(HmU2/Tm2)+DCpU2*ln(T/TmU2) (diferencia de entropía para U2 y U3) DSU3=(HmU3/TmU3)+DCpU3*ln(T/TmU3) DGU2=DHU2-T*DSU2 (diferencia de energía de Gibbs para U2 y U3) DGU3=DHU3-T*DSU3 KU2=exp(-DGU2/(R*T)) (constante de equilibrio para U2 y U3) KU3=exp(-DGU3/(R*T)) Kcd=exp(-DGcd/(R*Tr)) (constante de equilibrio para el estado cd) Kc2q_ab =exp(-DGc2q_ab /(R*Tr)) (constante de equilibrio para el estado c2q_ab) Kc2q_cd =exp(-DGc2q_cd /(R*Tr)) (constante de equilibrio para el estado c2q_cd) Kc2q_pd =exp(-DGc2q_pd /(R*Tr)) (constante de equilibrio para el estado c2q_pd) (Función de partición) Q=1+Kcd+Kc2q_ab+Kcd*Kc2q_cd+KU2*Kc2q_pd+KU2+KU3+KU2*KU3 (Derivada de la función de partición con respecto T) DQ={Kcd*DHcd*(1+Kc2q_cd)+Kc2q_cd*Kcd*DHc2q_cd+DHc2q_ab*Kc2q_a b+KU2*DHU2*(1+KU3)+KU3*DHU3*(1+KU2)+KU2*Kc2q_pd*(DHU2+D Hc2q_pd)}/(R*T*T) DQc=DQ*(R*T*T) (Fracción molar, población, de cada estado y su derivada con respecto a la temperatura) Pcd=Kcd/Q DPcd=(Kcd*(DHcd*Q-DQc))/(R*T^2*Q^2) Pc2q_ab=(Kc2q_ab)/Q DPc2q_ab=(Kc2q_ab*(DHc2q_ab*QDQc))/(R*T^2*Q^2) Pc2q_cd=(Kcd*Kc2q_cd)/Q DPc2q_cd=(Kcd*Kc2q_cd*((DHcd+DHc2q_cd)*QDQc))/(R*T^2*Q^2) Pc2q_pd=(KU2*Kc2q_pd)/Q DPc2q_cd=(KU2*Kc2q_pd*((DHU2+DHc2q_pd)*QDQc))/(R*T^2*Q^2) PU2=KU2/Q DPU2=(KU2*(DHU2*Q-DQc))/(R*T^2*Q^2) PU3=KU3/Q DPU3=(KU3*(DHU3*Q-DQc))/(R*T^2*Q^2) PU2U3=(KU2*KU3)/Q DPU2U3=(KU2*KU3*((DHU2+DHU3)*QDQc))/(R*T^2*Q^2) (capacidad calorífica intrínseca) Cpint=DCpU2*(PU2+Pc2q_pd)+DCpU3*PU3+(DCpU2+DCpU3)*PU2U3 236 Apéndice (capacidad calorífica extrínseca) Cpex=DHcd*DPcd+DHc2q_ab*DPc2q_ab+(DHcd+DHc2q_cd)*DPc2q_cd+D HU2*DPU2+(DHc2q_pd+DHU2)*DPc2q_pd+DHU3*DPU3+(DHU2+DHU3) *DPU2U3 y=Cpint+Cpex *** • (ajuste a Cp experimental) MODELO 2.- Existe una completa cooperatividad en el desplegamiento del tándem SH3SH2 cuando el conector C2Q está unido, es decir, los estados parcialmente desplegados no están poblados cuando está unido el conector. Variable independiente: x (temperatura experimental, en ºC) Variable dependiente: y (capacidad calorífica experimental, en kJ·K-1·mol-1) Parámetros ajustables: Tm0U2, Tm0U3 (temperaturas de transición para los estados U2 y U3, en ºC) HmU2, HmU3 (diferencia de entalpía a la temperatura de transición para los estados U2 y U3, en kJ·mol-1) DCpU2,DCpU3 (diferencia de capacidad calorífica para los estados U2 y U3, en kJ·K-1·mol-1). Se suponen constantes con la temperatura. DGcd (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado cd, en kJ·mol-1). DHcd y DCpcd se suponen nulas. DGc2q_ab (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado c2q_ab, en kJ·mol-1). DHc2q_ab y DCpc2q_ab se suponen nulas. DGc2q_cd (diferencia de energía de Gibbs a la temperatura de referencia,Tr, de 298.15 Kelvin para el estado c2q_cd, en kJ·mol-1). DHc2q_cd y DCpc2q_cd se suponen nulas. Desarrollo ecuaciones: R=0.0083143 (constante de los gases en kJ·K-1·mol-1) T=x+273.15 (conversión de la temperatura experimental de ºC a Kelvin) Tr=298.15 (temperaturA de referencia en Kelvin) TmU2=Tm0U2+273.15 (conversión de las Tm0U2 y Tm0U3 de ºC a Kelvin) TmU3=Tm0U3+273.15 DHU2=HmU2+DCpU2*(T-TmU2) (diferencia de entalpía para los estados U2 y U3) DHU3=HmU3+DCpU3*(T-TmU3) DSU2=(HmU2/Tm2)+DCpU2*ln(T/TmU2) (diferencia de entropía para U2 y U3) DSU3=(HmU3/TmU3)+DCpU3*ln(T/TmU3) 237 DGU2=DHU2-T*DSU2 DGU3=DHU3-T*DSU3 KU2=exp(-DGU2/(R*T)) KU3=exp(-DGU3/(R*T)) (diferencia de energía de Gibbs para U2 y U3) Kcd=exp(-DGcd/(R*Tr)) Kc2q_ab =exp(-DGc2q_ab /(R*Tr)) estado c2q_ab) Kc2q_cd =exp(-DGc2q_cd /(R*Tr)) estado c2q_cd) (constante de equilibrio para U2 y U3) (constante de equilibrio para el estado cd) (constante de equilibrio para el (constante de equilibrio para el (Función de partición) Q=1+Kcd+Kc2q_ab+Kcd*Kc2q_cd + KU2*KU3 (Derivada de la función de partición con respecto T) DQ={Kcd*DHcd*(1+Kc2q_cd)+Kc2q_ab*DHc2q_ab+DHc2q_cd*Kc2q_cd*Kc d+ +KU2* KU3*(DHU2+DHU3)}/(R*T*T) DQc=DQ*(R*T*T) (Fracción molar, población, de cada estado y su derivada con respecto a la temperatura) Pcd=Kcd/Q DPcd=(Kcd*(DHcd*Q-DQc))/(R*T^2*Q^2) Pc2q_ab=(Kc2q_ab)/Q DPc2q_ab=(Kc2q_ab*(DHc2q_ab*QDQc))/(R*T^2*Q^2) Pc2q_cd=(Kcd*Kc2q_cd)/Q DPc2q_cd=(Kcd*Kc2q_cd*((DHcd+DHc2q_cd)*QDQc))/(R*T^2*Q^2) PU2U3=(KU2*KU3)/Q DPU2U3=(KU2*KU3*((DHU2+DHU3)*QDQc))/(R*T^2*Q^2) (capacidad calorífica intrínseca) Cpint=(DCpU2+DCpU3)*PU2U3 (capacidad calorífica extrínseca) Cpex=DHcd*DPcd+DHc2q_ab*DPc2q_ab+(DHcd+DHc2q_cd)*DPc2q_cd+(D HU2+DHU3)*DPU2U3 y=Cpint+Cpex *** 238 (ajuste a Cp experimental) FEBS Letters 586 (2012) 2619–2630 journal homepage: www.FEBSLetters.org Review Interfacial water molecules in SH3 interactions: Getting the full picture on polyproline recognition by protein–protein interaction domains Ana Zafra-Ruano, Irene Luque ⇑ Department of Physical Chemistry and Institute of Biotechnology, Faculty of Sciences, University of Granada, 18071 Granada, Spain a r t i c l e i n f o Article history: Received 23 March 2012 Revised 27 April 2012 Accepted 30 April 2012 Available online 11 May 2012 Edited by Marius Sudol, Gianni Cesareni, Giulio Superti-Furga and Wilhelm Just Keywords: SH3 domain Proline-rich ligand recognition Water-mediated interaction Protein–protein interaction module a b s t r a c t The recognition of proline-rich sequences by protein–protein interaction modules is essential for many cellular processes. Nonetheless, in spite of the wealth of structural and functional information collected over the last two decades, polyproline recognition is still not well understood. The patent inconsistency between the generally accepted description of SH3 interactions, based primarily on the stacking of hydrophobic surfaces, and their markedly exothermic character is a clear illustration of the higher complexity of these systems. Here we review the structural and thermodynamic evidence revealing the need for a revision of the current binding paradigm, incomplete and clearly insufficient for a full understanding of binding affinity and specificity, to include interfacial water molecules as universal and relevant elements in polyproline recognition. Ó 2012 Federation of European Biochemical Societies. Published by Elsevier B.V. All rights reserved. 1. Introduction The establishment of transient protein–protein interactions is essential for intracellular signaling. A subset of these interactions are mediated by modular domains [1,2] that recognize short linear motifs in their targets [3,4]. Contrary to most protein–protein interactions, implicating large and featureless surfaces with discontinuous binding epitopes, protein interaction modules recognize well defined and continuous sequences that bind to concave sites in the domain with small interaction surfaces, similar in size to those of protein enzymes. These properties facilitate the identification of relevant physiological targets and the design of small size inhibitors [5–7]. An important class of protein-interaction domains is constituted by protein modules recognizing solvent exposed proline-rich motifs. Amongst all types of short linear motifs, proline-rich sequences are the most widely distributed in the different genomes, from prokaryotes to eukaryotes [8,9], due, to a great extent, to the specific properties conferred by the proline amino acid [10–16]. Correspondingly, polyproline-recognition domains (PRD), which seem to have coevolved with the sequences they recognize [8], are also the most abundant protein modules in many proteomes Abbreviations: ITC, isothermal titration calorimetry; Kd, dissociation constant; SH3, Src homology 3 domain ⇑ Corresponding author. Fax: +34 958 272 879. E-mail address: iluque@ugr.es (I. Luque). [17,18]. Several families of PRD have been described to date, including SH3 (Src-homology 3) domains, WW domains (named after two highly conserved tryptophan residues in the domain), EVH1 (enabled vasodilator-stimulated-protein homology) domains, GYF domains (so called due to their characteristic Gly-Tyr-Phe triad) and UEV (ubiquitin E2 variant) domains, together with the protein profilin and the recently identified CAP (cytoskeleton-associated protein)-Gly domain. A comparative analysis of the structure, function and ligand recognition properties of the different PRD families can be found in several reviews [14,17,19–22]. The different PRD families vary in size (ranging between the 35 residues of the WW domains and the 150 residues of the UEV domains), present different folds and recognize specific proline-rich ‘‘core motifs’’. In spite of this, they all share a very similar mechanism for proline recognition based on the establishment of hydrophobic interactions between key proline residues in the ligand and highly conserved hydrophobic pockets in the domain, leading to a significant level of cross-reactivity within and between the different PRD families. Nonetheless, because of the central role that PRD interactions play in the regulation of many cellular processes, including cell growth, differentiation, apoptosis, splicing, endosomal trafficking or transcription [17,21–23], their interactions with their physiological targets must be specific and well regulated. This apparent paradox between specificity and promiscuity in polyproline-recognition has been the subject of intense debate [17–19,21,23–27], highlighting the need for a profound understanding of the molecular basis for binding affinity and specificity 0014-5793/$36.00 Ó 2012 Federation of European Biochemical Societies. Published by Elsevier B.V. All rights reserved. http://dx.doi.org/10.1016/j.febslet.2012.04.057 2620 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 in polyproline-recognition. Such detailed knowledge is fundamental for the development of efficient and specific inhibitors of PRD interactions as potential therapeutic agents and useful tools for the investigation of cell physiology [22,28]. 2. Function and structure of SH3 domains Among the different PRD, SH3 domains are, by far, the most abundant in vertebrates (over 300 SH3 domains have been identified in the human proteome [18,29]) and the most extensively studied [19,30]. SH3 domains are small (about 60 amino acids) non-catalytic protein modules, found in multi-domain signaling proteins of different functions and architectures that generally act as anchor sites for the recruitment of substrates or the formation of supra-molecular complexes. In some cases, these domains play also an essential role in the regulation of the enzymatic activity of the proteins that contain them through the establishment of intramolecular interactions with other elements in the molecule [31,32]. This is the case of the tyrosine kinases of the Src family, involved in carcinogenesis [33]. In addition to cancer, SH3 domains are associated to other pathologies such as leukemia, Alzheimer disease, osteoporosis, inflammatory, allergic and asthmatic processes as well as viral infections, including AIDS and hepatitis C [17,19,21,34,35]. Because of their biological relevance, SH3 domains have been widely studied, both from structural and functional perspectives. Today, more than 400 structures of SH3 domains are available including NMR and X-ray structures of free domains, complexes and full-length proteins. SH3 domains fold into a common fivestranded b-barrel structure composed of two orthogonal anti-parallel b-sheets (see Fig. 1). The five b-strands are connected by three loops: a longer one, the –RT loop, which connects strands b1 and b2 adopting an irregular anti-parallel structure and two shorter loops, the n-Src and distal loops, connecting strands b2–b3 and b3–b4 respectively. Additionally, SH3 domains also contain a short 310 helix segment placed between strands b4 and b5 [20,35]. Many efforts have also been devoted to characterizing the stability, conformational equilibrium and folding mechanism of these domains, which have been shown to fold according to a two-state model in the absence of intermediates, both in equilibrium and kinetic studies [36,37]. b-Hairpins in the domains play a very relevant role in the determination of the folding mechanism, with Fig. 1. Structure of SH3 domains. Cartoon representation of the SH3 structure of the c-Yes SH3 domain (Pdb code: 2hda). The five b strands are shown in yellow, the 310 helix in red and the n-Src, RT and distal loops in green. Conserved aromatic residues shaping the hydrophobic pockets for proline recognition are shown as sticks. the folding nucleus being constituted by the distal loop and 310 helix regions [38–41]. In spite of the macroscopic simplicity of the folding process, NMR H/D exchange experiments have made patent the statistical nature of the native state conformational ensemble [42,43], which translates into the existence of regions of high structural stability (the central portions of the beta strands, the short 310 helix and the conserved part of the –RT loop) and highly flexible regions, (n-Src loop and the tip of the –RT loop). According to this, the SH3 binding site has a dual character, containing regions of high and low structural stability, which facilitates the transmission of long-range cooperative effects throughout the structure [44–46], of obvious functional relevance for a protein domain implicated in signal transduction. Most SH3 domains characterized to date recognize proline-rich sequences containing a uPpuP motif (where u and p are frequently hydrophobic and proline residues, respectively) [10,20, 25,35]. SH3 ligands bind in a PPII conformation to a flat and hydrophobic surface in the domain consisting of three shallow pockets. Each of the two uP moieties in the core motif packs tightly into one hydrophobic pocket, very specific for the recognition of proline and N-substituted amino acids [47], and formed by highly conserved aromatic residues on the surface of the domain (the two tyrosine residues in the conserved ALYDY motif at the base of the –RT loop, the first tryptophan residue of the WW motif at the boundary between the b3 strand and the n-Src loop, the proline residue at strand b4 and the tyrosine residue of the SNY motif at the 310 helix region). Proline staking into these hydrophobic pockets provides the basis for the general recognition of proline-rich sequences. Nonetheless, taking into account the wealth of prolinerich motifs in the proteomes (it has been estimated that about 25% of human proteins contain proline-rich regions [21]), selectivity for proline does not assure specificity between SH3 domains or other PRD families. In general, binding specificity seems to be mostly associated to the establishment of additional interactions between residues flanking the core motif in the ligand and a third pocket delimited by variable regions of the RT and n-Src loops [17,20,48,49]. Sequence and conformational variability within these loops seem to have been exploited by SH3 domains to modulate binding affinity and specificity [25,50–52]. This mechanism of binding is shared by most PRD families that contain one or two proline-recognition pockets combined with additional regions conferring binding specificity. Whether this ‘‘intrinsic’’ specificity determined by the peptide and domain sequences is enough for the required in vivo selectivity is under discussion. An additional level of specificity seems to be conferred by contextual factors, such as the establishment of tertiary contacts with other elements in the full-length protein (see [21,23,27] for a review), multidomain binding [31], dimerization [53,54] or cellular co-localization of proteins [55,56]. The pseudo-symmetry of the PPII conformation allows SH3 ligands to bind in a forward (N-to-C terminal in class I ligands) or reverse (C-to-N terminal in class II ligands) orientation with respect to the binding site [57]. Even though peptide array screening experiments seem to indicate a general preference for class II ligands [50], the preferred orientation depends on the characteristics of the SH3 binding site, being frequently determined by (a) the presence of a basic amino acid, located two residues Nterminal from the uPpuP motif in class I ligands and two residues C-terminal from the motif in class II ligands, that interacts with an acidic residue at the RT loop [57,58] and (b) the conformation of a conserved Trp side chain at the b3 strand in the domain [59]. In fact, most SH3 ligands identified to date correspond to the consensus sequences fn-R 3p 2u 1P0x1f2P2-fc and fc-R5f4P3u2p1P0w 1-fn for class I and class II ligands [20,60], respectively. There are other domains, such as Abl–SH3, that interact with ligands containing the canonical uPpuP motif but lacking positive residues in their se- A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 quences, which can be considered a second specificity group. Also, most interestingly, several SH3 domains have been identified that recognize atypical sequences in their targets (see [21,23] for reviews), including discontinuous epitopes [61–63], slight variations of the canonical motifs (PxxxPR [64], RKxxYxxY, RxxPxxxP [65]), or even non-PPII peptides containing the RxxK motif [66,67]. These are clear examples of how sequence variability within the RT and n-Src loops, not only allows for a certain level of binding specificity within canonical ligands, but can also be exploited to evolve new binding specificities [17,21,23,26,51]. 3. Complexity in polyproline recognition by SH3 domains During the last two decades a wealth of structural and functional information has been collected for the different PRD families, especially for SH3 and WW domains, according to their potential as targets for the development of novel therapeutic agents against a variety of diseases [22,68,69]. Many efforts have been directed towards the design and identification of high-affinity ligands for SH3 domains [35,70,71] using different strategies, including screening of libraries of synthetic compounds [28,72,73], phage display techniques [26,74], the use of protein scaffolds to stabilize the PPII conformation [75] and structure-based rational design strategies directed to optimize peptide sequences [76,77], introduce nonpeptidic elements in the peptide ligands [78–80] or design smallmolecule inhibitors [81,82]. In most cases the results have been modest, although the use of combinatorial libraries of peptoids, with synthetic substitutes of key proline residues [47,83,84] and the combinatorial modification of peptide scaffolds [72,78] have provided some high-affinity ligands, with dissociation constants in the nM range. Today, after more than two decades of study, and in spite of the wealth of structural and functional information available, the design of high affinity and specificity inhibitors or modulators of polyproline recognition by SH3 domains or other PRD families remains quite a challenging task. This is partly due, as mentioned before, to the delicate balance between promiscuity and specificity characteristic of these interactions and to the low binding affinity of most SH3 natural ligands, usually ranging between 1 and 200 lM. These difficulties have been exacerbated by the lack of a profound and detailed understanding of the forces driving polyproline recognition. Traditionally, most identification and optimization strategies have been directed towards obtaining improvements in the binding affinity of the ligands. This has, indeed, been the case in most of the above-mentioned works on SH3 domains. However, considering binding affinity, determined by the Gibbs energy of binding (DG), as the only discriminating parameter in screening procedures or rational design strategies constitutes a very limited perspective of the binding process since the Gibbs energy alone does not provide information about the nature and magnitude of the forces driving the association. This information is, nonetheless, encoded in the enthalpic and entropic contributions to the binding Gibbs energy (DG = DH TDS), which arise from different types of interactions and, thus, report on the relative weight of the different intermolecular forces in a particular binding event [85,86]. Considering that the same binding affinity can arise from many different combinations of enthalpic (DH) and entropic (DS) contributions, knowledge of the thermodynamic signature of an interaction (the proportion in which the binding enthalpy and entropy contribute to the Gibbs energy) provides a very valuable insight into the forces governing the binding process [87–89]. Moreover, it is now well established that incorporating thermodynamic considerations into screening and rational design procedures can contribute to select the best initial leads and devise the best optimization strategies for the development of the most appropri- 2621 ate ligands in terms of binding affinity, selectivity [90–96] or even resistance profiles [97,98]. In this sense, the case of SH3 domains has been paradigmatic of how thermodynamic information can contribute to attain a better understanding of the binding process. According to the high quality structural information available, the recognition or proline-rich sequences by SH3 domains has been described as a process based primarily on the stacking of hydrophobic surfaces in the protein and ligand, with very few polar interactions. In most complexes, these are limited to a couple of highly conserved hydrogen bonds established between the carbonyl oxygens of proline residues in the ligand and the side chains of two conserved Trp and Tyr residues located at the b3 strand and the 310 helix, respectively, and, in some cases, to the conserved salt bridge at the specificity pocket. According to this description, the recognition of proline-rich sequences by SH3 domains would be expected to present a thermodynamic signature dominated by the hydrophobic effect, with the main driving force being a favorable entropic contribution associated to the increment of the conformational degrees of freedom of the solvating water molecules that are released into the bulk solvent upon formation of the complex. Correspondingly, the binding enthalpy would be expected to be unfavorable (positive) or, in an optimal situation, slightly favorable [89,90]. Nonetheless, all thermodynamic studies of SH3 interactions collected during the last two decades revealed that the recognition of proline-rich ligands by these domains is invariably driven by markedly negative (favorable) enthalpic contributions opposed by unfavorable binding entropies [27,52,67,75,99–108]. This thermodynamic behavior cannot be rationalized exclusively in terms of direct interactions between hydrophobic surfaces and, thus, reveals an underlying complexity in the recognition of proline-rich ligands by SH3 domains, not evident from the interpretation of static three dimensional structures. Significant efforts have been devoted to deciphering this apparent discrepancy between structure and thermodynamics. These studies have revealed a highly complex scenario to which several factors of different nature contribute significantly. In this sense, several studies have shown that the redistribution of the conformational ensemble of both, peptide and protein, upon formation of the complex has a significant impact on the binding energetics. In this way, the calorimetric and structural-thermodynamic analysis of the binding of the Sem-5 SH3 domain to its Sos ligand revealed that the adoption of the PPII conformation by the ligand upon binding results in unfavorable entropic contributions associated to the reduction in the conformational degrees of freedom of the ligand and favorable enthalpic effects, estimated to be on the range of 10 kJ mol 1[99]. Also, the rigidification of the RT and n-Src loops upon ligand binding and the corresponding reorganization of the intra- and inter-molecular network of hydrogen bond interactions have been postulated to contribute in a similar manner [43,52,109]. Along these lines, the NMR characterization of ligand binding to the SH3 domain of the Src tyrosine kinase revealed that the intercalation of the uP moieties from the ligand in the hydrophobic pockets of the domains results in the disruption of the intramolecular hydrogen bond network. These alterations propagate throughout the domain resulting in changes in backbone dynamics that have been postulated to contribute significantly to the exothermic character of the interaction [102,110]. In addition to these conformational effects, the thermodynamic and structural analysis of several complexes implicating the SH3 domain from the Abl tyrosine kinase brought to light additional effects associated to the presence of interfacial water molecules occluded at the binding site that seem to play a very relevant role in proline-rich ligand recognition by SH3 domains, highlighting the need for a revision of the current binding paradigm for these systems. 2622 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 4. Interfacial water molecules in Abl–SH3 complexes The cellular form of the Abelson leukemia virus, c-Abl, is a tightly regulated tyrosine kinase implicated in the development of chronic myelogenous leukemia. C-Abl becomes constitutively activated upon mutation or deletion of the SH3 domains [111]. Moreover, it has been shown that displacement of the SH3 intramolecular interaction with the linker sequence connecting the SH2 and the kinase domains enhances the inhibitory effect of the anti-tumor drug Gleevec [112]. Consequently the Abl–SH3 domain has been targeted for the design of novel ligands of high affinity and specificity of potential therapeutic applications [76,77]. Starting from the 3BP1 natural ligand (RAPTMPPPLPP), characterized by a dissociation constant of 34 lM for Abl–SH3 [113], the group of Luis Serrano was able to derive new ligands with increased affinity and specificity for the Abl–SH3 domain by rational design strategies. By introducing new favorable interactions with the RT loop, specific to Abl–SH3, and increasing the tendency of the free peptide to adopt the PPII conformation they arrived to the p40 (APTYSPPPPP) and p41 (APSYSPPPPP) sequences characterized by 2 lM binding affinities and a high selectivity for Abl–SH3 against Fyn–SH3 [76]. The thermodynamic study of the binding energetics of the p41 ligand and a set of related peptides to the SH3 domain of Abl revealed these interactions as a particularly striking example of the inconsistency existing between the canonical description of SH3 binding and its thermodynamic signature. In fact, the interactions of p41 related peptides with Abl–SH3 are characterized by extremely negative binding enthalpies ( 92 kJ mol 1 for p41) [100], which are notably bigger than the values reported for other SH3 complexes, typically ranging between 20 and 50 kJ mol 1. This is particularly striking considering the fact that the p41 peptide lacks polar or ionizable groups, present in most SH3 ligands in these thermodynamic studies. The large and negative binding enthalpy is partially compensated by highly unfavorable entropic contributions, resulting in a binding affinity within the range reported for other SH3 interactions. This thermodynamic signature cannot be easily reconciled with the canonical binding mode, especially considering the highly apolar character of the Abl–SH3/p41 binding interface (2.8 non-polar/polar ratio for the accessible surface area). In order to understand the molecular basis of the increment in binding affinity in the p41 optimization process and validate the design rationale, a detailed thermodynamic study was carried out with a set of p41 related peptides differing in unique and specific positions in the PPII region [100]. Some of these mutations implicated solvent exposed residues in the complex [114] not involved in any interactions with the domain, such as Ser5 and Pro8 in the p41 sequence (see Fig. 2). According to the canonical binding mode, the replacement of aliphatic residues by proline at these positions should result in more favorable entropic contributions due to the restrictions imposed on the conformational ensemble of the free ligand, favoring the adoption of a PPII conformation in the free state. No significant enthalpic effects are to be expected. This is what has been found in similar situations for other SH3 complexes [13]. Surprisingly, the analysis of the calorimetric results revealed a very different scenario, unveiling remarkable and surprising effects associated to these substitutions. Indeed, as expected, the introduction of proline residues at these positions led to an increase in the binding affinity. Nonetheless, as illustrated in Fig. 2, this increment was not associated to more favorable entropic contributions, but to a considerable increment (up to 15 kJ mol 1) in the negative binding enthalpy, particularly striking for residues not directly implicated in any interactions within the complex. Moreover, these effects were also found to be context-dependent, revealing some level of cooperativity between these two solvent exposed positions. Indeed, the thermodynamic behavior observed for the Abl–SH3 complexes is a clear indication of the complexity of these interactions to which additional factors, other than the direct interaction between the ligand and protein surfaces, must be contributing. With respect to the conformational effects described above, binding studies of a p41-containing miniprotein designed to stabilize the PPII conformation indicate that, in this particular case, the conformational reorganization of the ligand does not seem to contribute significantly to magnitude of the different thermodynamic parameters [75]. Interestingly, as illustrated in Fig. 3, inspection of the crystal structure of the Abl–SH3/p41 complex [114] revealed the presence of a set of fully buried interfacial water molecules distributed in two distinct hydration regions defined by different water-coordinating amino acids in the SH3 domains: a) waters 1–3 in Fig. 3 that mediate the interactions between residues in the n-Src loop and the specificity region of the ligand and b) waters 4 and 5 in Fig. 3 that bridge the interactions between residues Asn114 and Ser113 in the 310 helix region of the domain and the PPII region of p41. These residues, which are not in direct contact with the ligand, define an extended interaction surface characterized by a higher polar character than the canonical binding site, so that the ratio of apolar to polar surface area drops from 2.8 to 1.7. Interfacial water molecules will serve as adapters that fill empty spaces and optimize van der Waals interactions, satisfy the hydrogen bonding potential of the ligand and the binding site and assist in the dissipation of charges. All these terms might be expected to contribute favorably to the binding enthalpy [115,116]. Conversely, fixing a water molecule at the binding interface entails a considerable entropic penalty that counterbalances these favorable enthalpic effects, so that the impact of buried water molecules on the Gibbs energy of binding is, often, no more than modest. These effects are in agreement with the observed thermodynamic behavior and suggest that interfacial water molecules might be playing a very relevant role in the interaction, contributing significantly to the extremely negative binding enthalpy of the Abl–SH3/p41 complex. This hypothesis was confirmed by a structural, thermodynamic and molecular dynamics study of a set of conservative mutants of the Abl SH3 domain designed to perturb the water-mediated hydrogen bond network with a minimum impact on the structural and conformational properties of the domain. This analysis revealed significant enthalpic effects associated to the mutation of residues at position 114, at the base of the 310 helix, that coordinate water molecules at hydration sites 4 and 5 without being implicated in any direct contacts with the peptide ligand. A very good correlation was found between these enthalpic effects and the changes induced in the dynamic properties of water molecules at site 5. From these results, it was possible to tentatively estimate the contribution to the binding enthalpy of water molecules at this hydration site to be around 20 kJ mol 1, confirming a very substantial contribution of interfacial water molecules to the strongly exothermic character of Abl–SH3 interactions [117] and, probably, to the unexpected cooperative effects associated to the mutation of solvent exposed residues in the ligand. In summary, these results demonstrate that the currently accepted binding paradigm is incomplete and does not provide an adequate description of the binding of Abl–SH3 to the family of p41 peptides, which interact via two different mechanisms: the stacking of proline side-chains with the hydrophobic grooves in the binding site and the establishment of a robust and plastic network of water-mediated hydrogen bonds implicating residues in the periphery of the canonical binding site. This double binding mechanism is in better agreement with the thermodynamic behavior of the system and has important implications for molecular modeling and ligand design. A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 2623 Fig. 2. Thermodynamic effects of mutations at solvent exposed positions in p41-related peptides. Thermodynamic cycle summarizing the effects on the thermodynamic parameters of binding to the Abl–SH3 domain associated to substitutions at positions 5 (blue) and 8 (red) in the ligands. The values associated with the vertical arrows correspond to the substitutions at position 5 and those associated with the horizontal arrows to the substitutions at position 8. The inset corresponds to the cartoon and surface representation of the Abl–SH3/p41 complex. P41 ligand is shown as sticks. Mutations sites 5 and 8 are highlighted by blue and red cycles respectively. (Reproduced with permission from [100]). Fig. 3. Water-mediated interactions at the Abl–SH3/p41 binding interface. The structure of the Abl–SH3 domain is shown in a gray cartoon representation. Residues defining the canonical binding site for polyproline recognition are shown as gray sticks. The structure of the p41 peptide is shown as cyan sticks. Fully buried water molecules at the binding interface are shown as green spheres. Peripheral water-coordinating residues in the 310 and n-Src regions are shown as purple and dark pink sticks respectively. Water-mediated hydrogen bonds are depicted as green lines. (Reproduced with permission from [86].) 5. Revision of the general binding paradigm for SH3 domains Taking into account that all SH3 complexes studied to date share the same thermodynamic profile, the question arises about the relevance of the Abl–SH3 dual binding mechanism for other SH3 domains. In Abl–SH3, the presence of most water molecules at the binding site is contingent upon ligand binding, being absent in the structures of free domains, with the exception of water molecules at hydration site 4, at the base of the 310 helix, which is occupied in all Abl–SH3 structures independently of their ligation state. Also, the properties of these water molecules, fully buried and characterized by very high residence times and low B factors, are not affected by the binding of the ligand. This indicates that water molecules at this site are structural waters that should be considered as an integral part of the Abl–SH3 domain. Interestingly, these water molecules are coordinated by the backbone atoms of highly stable and well conserved residues (see Fig. 3), suggesting that equivalent water molecules would probably be found in many other SH3 domains. Analysis of the SH3 structural database, including close to 100 high resolution crystal structures of SH3 domains from different proteins including free domains, inter- and intra-molecular complexes with natural ligands, rationally designed and phage-display peptides as well as full-length target proteins, reveals that this is indeed the case [118]. As expected from the sequence conservation of the 310 helix region, water molecules at positions equivalent to hydration site 4 in Abl–SH3 were found in 77% of all SH3 structures, including complexes and free domains, with properties (solvent accessibility, B factors, and coordination patterns) very similar, in all cases, to that described for Abl–SH3 (see Fig. 4A, B). From these observations, it is clear that the water molecule at the base of the 310 helix is an invariant element in most SH3 domains and seems to be an integral part of the domain structure, independently of its ligation state. In fact, in the analyzed database, the absence of this hydration site was generally associated to anomalous sequences and conformations of SH3 domains and ligands. Consequently, this structural water molecule should be included in binding site descriptions for docking or rational design. A second structural water molecule, located at the n-Src loop, was found in about 60% (59% in free domains and 55% in complexes) of all SH3 structures (see Fig. 4C, D). These waters molecules, which are also fully buried and tightly bound, are implicated in the establishment of an average of 4 hydrogen bonds with residues within the loop, stabilizing its conformation. In fact, the presence of these waters has been found to be highly dependent on the length of the loop, being observed in 85% of the structures of n-Src loops between 5 and 8 residues and absent in structures with shorter or longer loops [118]. Even though, in most cases, these water molecules are not directly implicated in ligand recognition, they may play an important indirect role by regulating the dynamic and conformational properties of the n-Src loop, of relevance for binding specificity [25,27,52]. Globally, at least one structural water molecule was found in 93% of all free SH3 structures studied. In addition to these 2624 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 Fig. 4. Structural water molecules in SH3 domain structures. Cartoon representation of the SH3 domain structures colored in a rainbow scheme. Side chains of residues constituting the 310 helix hydration site are represented as sticks. Water molecules are depicted as purple non-bonded spheres (A) 310 helix structural waters in free SH3 domains, (B) 310 helix structural waters in SH3 complexes, (C) n-Src loop structural waters in free SH3 domains and (D) n-Src loop structural waters in SH3 complexes. (Reproduced with permission from [118].) structural waters, other interfacial water molecules were consistently found in most SH3 complex structures, originating highly variable hydration patterns. As illustrated in Fig. 5, interfacial water molecules were found in all analyzed complex structures distributed throughout the binding interface, mediating the interactions between the ligand and the SH3 domain. As described for Abl–SH3, water-mediated interactions frequently implicate residues in the periphery of the canonical binding site, different from those defining the hydrophobic pockets for proline recognition. This observation underlines the importance of considering interfacial water molecules for a correct definition of the complete SH3 binding interface. Fig. 5. Cartoon representation of the superposed structures of the SH3 complexes. SH3 domains are colored in a rainbow scheme (blue: N-terminus; red: C-terminus) while ligands are represented in light pink. Buried interfacial water molecules are shown as purple non-bonded spheres. (Reproduced with permission from [118].) A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 A third conserved hydration site, equivalent to site 5 in Abl– SH3, was occupied in approximately one third of the complex structures. This water molecule, which in the Abl–SH3/p41 complex was found to interact mostly with the ligand through interactions established with the carbonyl oxygens of P6 and p7 in the peptide, is implicated in an average of 3 hydrogen bonds with atoms in the protein and ligand and with the structural water molecules at the base of the 310 helix. In this case, a higher variability exists in the location and interaction pattern of this water molecule that seems to be dependent mostly on the length of the side chains at position 114 in the domain and the nature of the central amino acids in the uPpuP core motif of the ligand. These factors determine whether the hydrogen bonding potential of carboxyl atoms in the peptide is satisfied by the establishment of direct hydrogen bonds with the side chains at position 114 in the domain or through water-mediated interactions [118]. These patterns provide a rationalization for the puzzling thermodynamic results associated to mutations at solvent-exposed positions in the p41 ligand [100]. In addition to the conserved hydration sites at the polyprolinerecognition region, interfacial water molecules were very frequently observed mediating the interactions between the RT and n-Src loops and the specificity region of the ligand, giving rise to highly variable hydration patterns, very dependent on the sequence of ligands and loops. In general, waters at the RT loop region were frequently found mediating the interactions between charged residues in the peptide and the protein. This explains why no water molecules in the vicinity of the RT loop were observed in the Abl–SH3 complexes. In spite of the high variability in this region, no significant differences in hydration patterns were found associated to ligand orientation. Conserved water molecules in the polyproline recognition region were equally found for class I and class II ligands and a similar variability in water configurations was observed for both classes at the specificity region. In summary, the analysis of the SH3 structural database clearly shows that the presence of interfacial water molecules is a universal factor in SH3 interactions and, consequently, the dual binding mechanism described for Abl–SH3, far from being an exception, is a general feature of these domains. This new description of SH3 binding is in better agreement with the thermodynamic properties of these systems. In this context, it becomes apparent that ignoring the role of interfacial water molecules in polyproline recognition by SH3 domains would preclude a full and deep understanding of the molecular basis of binding affinity and specificity. Consequently, the current description of SH3 complexes needs to be replaced by a new binding paradigm that incorporates interfacial waters as relevant elements in the mechanism of polyproline recognition by these domains. 6. Implications for target identification and rational design This dual binding paradigm opens new perspectives for rational design and target identification for SH3 domains, since, as it has been demonstrated in numerous studies, the efficiency of docking [119–126] or rational design [127–130] procedures can be significantly enhanced if detailed information about of the role and weight of each water molecule at the binding interface is incorporated into binding site descriptions (see [130,131] for detailed reviews). In this context, important questions arise that would need to be answered in order to take full advantage of the second level of interactions provided by the water-mediated hydrogen bonds in SH3 domains. Is the impact of all interfacial water molecules on the thermodynamic signature of the binding process equally relevant for all SH3 complexes? What is the actual weight of these interfacial waters on binding affinity? Do they have a real 2625 impact on SH3 binding specificity? Could new rational design strategies be devised to improve binding affinity or specificity by engineering new interactions with interfacial waters of by their displacement from the binding interface? Should the hydration profile of a particular domain be considered for docking and ligand identification protocols? To answer these questions a profound understanding of the properties and role of each specific water molecule would be required. With respect to the binding energetics, it is well established that the presence of interfacial water molecules will alter the thermodynamic signature of the binding process, resulting in entropic penalties arising from the reduction in the configurational degrees of freedom of the occluded water molecules, enthalpic benefits associated to the establishment of water-mediated hydrogen bonds and more negative binding heat capacities [132–136]. Nonetheless, to date, estimating the actual contribution of a particular water molecule to the different thermodynamic parameters remains a considerable challenge. In general, the contribution of each water molecule would be expected to vary according to its degree of immobilization and the number and quality of its interactions. In this sense, theoretical studies applying the theory of inhomogenous fluids predict the entropic cost for water immobilization to range between 0 and 41 kJ mol 1[137,138]. Also, according to these studies, the presence of interfacial water molecules always results in an enthalpic benefit that, in some cases is modest ( 8 kJ mol 1 for a water molecule in the cyclophilin-cyclosporin A complex [139]), while in others can be very relevant ( 63 kJ mol 1 for a conserved interfacial water in HIV-1 protease complexes [140]). These theoretical predictions are in good agreement with experimental observations that show a wide spectrum of entropic and enthalpic effects depending on the specific characteristics of the system. Experimentally, it is observed that the displacement of water molecules from the binding interface, either by modification of the ligand or mutation of the protein, is associated to variable entropic benefits combined with enthalpic penalties that range between 9.5 kJ mol 1 [141] and 30 kJ mol 1 [142]. It is interesting to point out that the 20 kJ mol 1 estimated to be contributed by the waters at site 5 to the binding enthalpy of p41/Abl– SH3 [117] falls well within this range. In spite of the considerable magnitude of the entropic and enthalpic effects, the net impact of interfacial water molecules on the binding affinity is not as significant and can be, also, very variable. In this sense, studies carried out with different systems (i.e. HIV-1 protease [143], scytalone dehydratase [144], OppA peptide binding protein [145], FK506 binding protein [146], ConA [147], major urinary protein MUP-1 [142]) reveal that water displacement is sometimes energetically favorable, resulting in improved binding affinities, and sometimes unfavorable. Moreover, in some cases, strong enthalpy/entropy compensation dampens all effects, resulting in very modest or even negligible changes on the binding affinity. This variability indicates that, in order to efficiently incorporate water-mediated interactions rational design, a good understanding of the properties of the different interfacial waters and the quality of the interactions they mediate is required. This would allow us to adequately select which water molecules should be targeted for displacement and which could be considered as good anchor sites for the engineering of new, energetically favorable, interactions. Within the last years, several methods have been developed to easily classify interfacial waters, such as Consolv [148], Waterscore [149], HINT/RANK [150,151] or GRID [152], which are generally based on geometrical studies of molecular surfaces, number of hydrogen bonds, crystallographic B factors and proximity to polar residues. These type of analysis indicate that the contribution to the binding Gibbs energy of each water molecule would strongly depend on its environment, so that tightly bound water molecules 2626 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 are typically found in polar cavities, fully buried and establishing at least three hydrogen bonds with the protein and the ligand [153]. Nonetheless, the predictive capacity of these methodologies is still quite limited. Alternative, more exhaustive and time-consuming approaches, including free energy calculations such as the double decoupling method [154,155], or molecular dynamics simulations can provide a more reliable description of the role of interfacial waters in a particular system. In this sense, the detailed structural, thermodynamic and molecular dynamic analysis carried out with Abl–SH3 complexes provided a very detailed description of the different hydration sites, showing that not all sites at the SH3 interface are equivalent. This is further sustained by the analysis of the SH3 structural database that confirms the existence of three types of water molecules in these systems with distinct properties (accessibility, B factors and number of interactions): (a) tightly bound structural water molecules, conserved in most SH3 structures and present in free domains as integral part of their structure. These water molecules do not interact significantly with the ligand; (b) conserved water molecules in the polyproline region mediating the interactions with the ligand and characterized by high residence times, such as waters at site 5 in Abl–SH3, which were shown to interact mostly with the peptide ligands [117] and (c) waters at the specificity region, more mobile and exposed. Which of these water molecules should be targeted for rational design? In general, two different scenarios can be considered to include interfacial waters in rational design (a) modification of the ligand to optimize its interactions with interfacial water molecules, aimed at increasing binding affinity by improving the binding enthalpy or (b) introduction of new moieties in the ligand that displace binding site waters present in the free protein or in related complexes, taking advantage of the entropic benefit of releasing a trapped water molecule. In any case, in order to overcome enthalpy/entropy compensation effects and obtain a net improvement on the binding affinity, it is important to select carefully the targeted waters. In the first case, a significant improvement on binding affinity would only be achieved if the newly engineered interactions can overcome any entropic penalty associated to the additional restrictions on the configurational degrees of freedom imposed on the water molecule as well as in the ligand and the protein. These enthalpy/entropy compensation effects can be minimized if the new interactions are directed against highly structured and stable elements in the binding site [88]. In this sense, the structural water molecules at the base of the 310 helix, tightly coordinated by backbone atoms of the most structurally stable residues in the domain [42,45] constitute a good anchor site against which to design new interactions, i.e. hydrogen bonds, with reduced associated enthalpy–entropy compensation effects, and, thus, with good chances of leading to significant improvements in binding affinity. On the contrary, in the second scenario, it is important to select which water molecules can be easily displaced from the binding interface. In this sense, water molecules at the polyproline regions (waters at sites equivalent to position 5 in Abl–SH3) seem to be interacting predominantly with the ligand with higher conformational flexibility. In this sense, the introduction of new moieties in the ligand to displace these waters from the binding site and establish interactions with the structural water at the 310 helix could be energetically favorable and lead to improvements on binding affinity. In any case, the new moieties in the ligand should be carefully design to establish highly optimized hydrogen bonds in order to compensate for the loss of water-mediated interactions. In addition to modulate binding affinity, water molecules in biomolecular interfaces can also play a very relevant role in binding specificity. Because of their small size and their ability to establish multiple hydrogen bonds as donors or acceptors, interfacial waters are very versatile elements in protein recognition. In some systems they contribute to narrow binding specificity, as happens with the recognition of phosphotyrosine peptides by SH2 domains, where water-mediated hydrogen bonds are essential to maintain the specificity for a glutamic side chain two positions C-terminal from the phosphotyrosine residue in the ligands [156]. Nonetheless, in other systems, interfacial waters confer great adaptability to molecular surfaces allowing a considerable degree of promiscuity in the interactions. The OppA peptide binding protein is a paradigmatic example of this situation. This protein can recognize oligopeptidic chains between 2 and 5 amino acids independently of their sequence by combining two levels of interactions: direct, conserved, interactions between the protein and the backbone of the peptide ligand and the insertion of the peptide side chains into hydrophobic pockets that modify their water content depending on the specific sequence of the ligand. In this way, water molecules modulate protein binding specificity by occupying in each case only a few positions from a set of well-defined, highly conserved and favorable hydration sites at the surface of the protein [135,157]. This situation is very similar to that observed for SH3 domains. The high variability of hydration patterns found in the specificity region of SH3 complexes appears to indicate that interfacial water molecules might be acting as adaptors to facilitate the recognition of diverse sequences, contributing to the versatility and promiscuity of these domains. Consequently, interfacial waters seem to be also of great relevance to fully understand binding specificity and optimize target identification in SH3 domains. 7. Polyproline recognition by other domain families Even though the structural information available is much more limited for the other families of polyproline recognition domains, water mediated interactions were also systematically found in all high resolution crystal structures available for these systems (13 structures of WW domains from different specificity classes, 6 structures of UEV domains and 10 structures of EVH-1 domains, including free domains and complexes) [118]. As illustrated in Fig. 6 for WW and UEV domains, the situation is very similar to that described for SH3 domains, with some hydration sites corresponding to structural water molecules present and conserved in free domains and complexes and others being only occupied upon binding of the ligand. In all cases, as in SH3 domains, these watermediated interactions result in extended binding interfaces with higher polar character. This is in agreement with the fact that, to our knowledge, all thermodynamic studies reported for polyproline recognition by PRD reveal a common thermodynamic signature, dominated by favorable enthalpic interactions. It is interesting to point out that this exothermic character is inherent of proline-rich motifs, as illustrated by the fact that the binding of short peptides corresponding to the PPPY core motif for type 1 WW domains is characterized by a binding enthalpy similar to that found for longer peptides containing charged or polar residues in their sequences [158]. In any case, to this moment, the structural information for these systems is insufficient to derive any specific patterns. Obviously, the actual relevance of this mechanism for all PRD families will need to be confirmed as the structural and thermodynamic databases increase. In conclusion, the current evidence indicate that the dual binding mechanism, combining hydrophobic interactions with the establishment of strong networks of water-mediated hydrogen bonds, is probably general, not only to SH3 domains, but also to most families of polyproline recognition modules. This seems to indicate that the tendency of proline-rich sequences to be highly hydrated, illustrated by the solid and extensive hydration structure of the collage triple helices [159,160], has been exploited by nature to favor the adaptability and plasticity of the different families of protein modules for the recognition of proline-rich targets. In this A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 2627 Fig. 6. Water-mediated interaction patterns in WW and UEV domains. WW and UEV domains are shown in white, ligands are depicted as marine blue sticks and relevant protein residues are represented as cyan sticks. Interfacial waters are shown as non-bonded spheres (waters in complex structures are colored in blue tones, while waters in free structures are colored in red, orange, yellow and purple). Hydrogen bonds are depicted as discontinuous lines following the same color scheme. (a) Class IV Pin1–WW domain, free (1PIN, 2Q5A, 2F21, 2ITK, 1ZCN) and in complex with a phosphoserine peptide. (b) Class I dystrophin–WW domain free (1EG3) and in complex with a bdystroglican peptide (1EG4). (c) Class II FE65–WW domain free (2IDH) and in complex with proline-rich peptide from Mena (2OEI). (d) Tsg101–UEV domain free (3OBS, 2FOR) and in complex with proline-rich viral late domain sequences (3OBQ, 3OBU, 3OBX). Hydrogen bond patterns common to most structures (including the free domains) are shown as discontinuous marine blue lines while interactions specific to particular structures are shown in their respective colors. (Reproduced with permission from [118].) context, understanding the role of interfacial water molecules may provide important clues for deciphering the specificity versus promiscuity paradox in polyproline recognition. Acknowledgements This work was supported by Grants BIO2009-13261-CO2 from the Spanish Ministry of Science and Innovation, FEDER Funds and Grant CVI-5915 from the Andalusian Government. Ana Zafra-Ruano is supported by a FPI predoctoral research contract from the Spanish Ministry of Science and Technology. References [1] Pawson, T., Raina, M. and Nash, P. (2002) Interaction domains: from simple binding events to complex cellular behavior. FEBS Lett. 513, 2–10. [2] Pawson, T. and Scott, J.D. (1997) Signaling through scaffold, anchoring, and adaptor proteins. Science 278, 2075–2080. [3] Weatheritt, R., Luck, K., Petsalaki, E., Davey, N. and Gibson, T. (2012) The identification of short linear motif-mediated interfaces within the human interactome. Bioinformatics 28, 976–982. [4] Gould, C.M. et al. (2010) ELM: the status of the 2010 eukaryotic linear motif resource. Nucleic Acids Res. 38, D167–D180. [5] Xu, Z., Hou, T., Li, N., Xu, Y. and Wang, W. (2012) Proteome-wide detection of Abl1 SH3-binding peptides by integrating computational prediction and peptide microarray. Mol Cell Proteomics 11, O111 010389. [6] Obenauer, J.C. and Yaffe, M.B. (2004) Computational prediction of protein– protein interactions. Methods Mol. Biol. 261, 445–468. [7] Lam, H.Y., Kim, P.M., Mok, J., Tonikian, R., Sidhu, S.S., Turk, B.E., Snyder, M. and Gerstein, M.B. (2010) MOTIPS: automated motif analysis for predicting targets of modular protein domains. BMC Bioinform. 11, 243. [8] Rubin, G.M. et al. (2000) Comparative genomics of the eukaryotes. Science 287, 2204–2215. [9] Chandra, B.R., Gowthaman, R., Akhouri, R.R., Gupta, D. and Sharma, A. (2004) Distribution of proline-rich (PxxP) motifs in distinct proteomes: functional and therapeutic implications for malaria and tuberculosis. Protein Eng. Des. Sel. 17, 175–182. [10] Zarrinpar, A. and Lim, W.A. (2000) Converging on proline: the mechanism of WW domain peptide recognition. Nat. Struct. Biol. 7, 611–613. [11] Creamer, T.P. (1998) Left-handed polyproline II helix formation is (very) locally driven. Proteins 33, 218–226. [12] Creamer, T.P. (2000) Side-chain conformational entropy in protein unfolded states. Proteins 40, 443–450. [13] Ferreon, J.C. and Hilser, V.J. (2003) The effect of the polyproline II (PPII) conformation on the denatured state entropy. Protein Sci. 12, 447–457. [14] Kay, B.K., Williamson, M.P. and Sudol, M. (2000) The importance of being proline: the interaction of proline-rich motifs in signaling proteins with their cognate domains. FASEB J. 14, 231–241. [15] Stapley, B.J. and Creamer, T.P. (1999) A survey of left-handed polyproline II helices. Protein Sci. 8, 587–595. [16] Vijayakumar, M., Qian, H. and Zhou, H.X. (1999) Hydrogen bonds between short polar side chains and peptide backbone: prevalence in proteins and effects on helix-forming propensities. Proteins 34, 497–507. [17] Zarrinpar, A., Bhattacharyya, R.P. and Lim, W.A. (2003) The structure and function of proline recognition domains. Sci. STKE 2003, RE8. [18] Castagnoli, L. et al. (2004) Selectivity and promiscuity in the interaction network mediated by protein recognition modules. FEBS Lett. 567, 74–79. 2628 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 [19] Mayer, B.J. (2001) SH3 domains: complexity in moderation. J. Cell Sci. 114, 1253–1263. [20] Ball, L.J., Kuhne, R., Schneider-Mergener, J. and Oschkinat, H. (2005) Recognition of proline-rich motifs by protein–protein-interaction domains. Angew. Chem., Int. Ed. Engl. 44, 2852–2869. [21] Li, S.S. (2005) Specificity and versatility of SH3 and other proline-recognition domains: structural basis and implications for cellular signal transduction. Biochem. J. 390, 641–653. [22] Freund, C., Schmalz, H.G., Sticht, J. and Kuhne, R. (2008) Proline-rich sequence recognition domains (PRD): ligands, function and inhibition. Handb. Exp. Pharmacol., 407–429. [23] Kaneko, T., Li, L. and Li, S.S. (2008) The SH3 domain–a family of versatile peptide- and protein-recognition module. Front. Biosci. 13, 4938–4952. [24] Ladbury, J.E. and Arold, S. (2000) Searching for specificity in SH domains. Chem. Biol. 7, R3–R8. [25] Kaneko, T., Sidhu, S.S. and Li, S.S. (2011) Evolving specificity from variability for protein interaction domains. Trends Biochem. Sci. 36, 183–190. [26] Panni, S., Dente, L. and Cesareni, G. (2002) In vitro evolution of recognition specificity mediated by SH3 domains reveals target recognition rules. J. Biol. Chem. 277, 21666–21674. [27] Ladbury, J.E. and Arold, S.T. (2011) Energetics of Src homology domain interactions in receptor tyrosine kinase-mediated signaling. Methods Enzymol. 488, 147–183. [28] Oneyama, C., Nakano, H. and Sharma, S.V. (2002) UCS15A, a novel small molecule, SH3 domain-mediated protein–protein interaction blocking drug. Oncogene 21, 2037–2050. [29] Karkkainen, S. et al. (2006) Identification of preferred protein interactions by phage-display of the human Src homology-3 proteome. EMBO Rep. 7, 186– 191. [30] Macias, M.J., Wiesner, S. and Sudol, M. (2002) WW and SH3 domains, two different scaffolds to recognize proline-rich ligands. FEBS Lett. 513, 30–37. [31] Arold, S.T., Ulmer, T.S., Mulhern, T.D., Werner, J.M., Ladbury, J.E., Campbell, I.D. and Noble, M.E. (2001) The role of the Src homology 3-Src homology 2 interface in the regulation of Src kinases. J. Biol. Chem. 276, 17199–17205. [32] Barila, D. and Superti-Furga, G. (1998) An intramolecular SH3-domain interaction regulates c-Abl activity. Nat. Genet. 18, 280–282. [33] Miyazaki, K., Senga, T., Matsuda, S., Tanaka, M., Machida, K., Takenouchi, Y., Nimura, Y. and Hamaguchi, M. (1999) Critical amino acid substitutions in the Src SH3 domain that convert c-Src to be oncogenic. Biochem. Biophys. Res. Commun. 263, 759–764. [34] Chin, J. et al. (2005) Fyn kinase induces synaptic and cognitive impairments in a transgenic mouse model of Alzheimer’s disease. J. Neurosci. 25, 9694– 9703. [35] Dalgarno, D.C., Botfield, M.C. and Rickles, R.J. (1997) SH3 domains and drug design: ligands, structure, and biological function. Biopolymers 43, 383–400. [36] Viguera, A.R., Martinez, J.C., Filimonov, V.V., Mateo, P.L. and Serrano, L. (1994) Thermodynamic and kinetic analysis of the SH3 domain of spectrin shows a two-state folding transition. Biochemistry 33, 2142–2150. [37] Cobos, E.S., Filimonov, V.V., Vega, M.C., Mateo, P.L., Serrano, L. and Martinez, J.C. (2003) A thermodynamic and kinetic analysis of the folding pathway of an SH3 domain entropically stabilised by a redesigned hydrophobic core. J. Mol. Biol. 328, 221–233. [38] Martinez, J.C. and Serrano, L. (1999) The folding transition state between SH3 domains is conformationally restricted and evolutionarily conserved. Nat. Struct. Biol. 6, 1010–1016. [39] Martinez, J.C., Pisabarro, M.T. and Serrano, L. (1998) Obligatory steps in protein folding and the conformational diversity of the transition state. Nat. Struct. Biol. 5, 721–729. [40] Riddle, D.S., Grantcharova, V.P., Santiago, J.V., Alm, E., Ruczinski, I. and Baker, D. (1999) Experiment and theory highlight role of native state topology in SH3 folding. Nat. Struct. Biol. 6, 1016–1024. [41] Viguera, A.R., Jimenez, M.A., Rico, M. and Serrano, L. (1996) Conformational analysis of peptides corresponding to beta-hairpins and a beta-sheet that represent the entire sequence of the alpha-spectrin SH3 domain. J. Mol. Biol. 255, 507–521. [42] Sadqi, M., Casares, S., Abril, M.A., Lopez-Mayorga, O., Conejero-Lara, F. and Freire, E. (1999) The native state conformational ensemble of the SH3 domain from alpha-spectrin. Biochemistry 38, 8899–8906. [43] Ferreon, J.C., Volk, D.E., Luxon, B.A., Gorenstein, D.G. and Hilser, V.J. (2003) Solution structure, dynamics, and thermodynamics of the native state ensemble of the Sem-5 C-terminal SH3 domain. Biochemistry 42, 5582–5591. [44] Luque, I. and Freire, E. (2000) Structural stability of binding sites: consequences for binding affinity and allosteric effects. Proteins Suppl. 4, 63–71. [45] Casares, S., Lopez-Mayorga, O., Vega, M.C., Camara-Artigas, A. and ConejeroLara, F. (2007) Cooperative propagation of local stability changes from lowstability and high-stability regions in a SH3 domain. Proteins 67, 531–547. [46] Manson, A., Whitten, S.T., Ferreon, J.C., Fox, R.O. and Hilser, V.J. (2009) Characterizing the role of ensemble modulation in mutation-induced changes in binding affinity. J. Am. Chem. Soc. 131, 6785–6793. [47] Nguyen, J.T., Turck, C.W., Cohen, F.E., Zuckermann, R.N. and Lim, W.A. (1998) Exploiting the basis of proline recognition by SH3 and WW domains: design of N-substituted inhibitors. Science 282, 2088–2092. [48] Feng, S., Kasahara, C., Rickles, R.J. and Schreiber, S.L. (1995) Specific interactions outside the proline-rich core of two classes of Src homology 3 ligands. Proc. Natl. Acad. Sci. U S A 92, 12408–12415. [49] Mayer, B.J. and Saksela, K. (2005) SH3 Domains in: Modular Protein Domains (Cesareni, G., Sudol, M. and Pawson, T., Eds.), pp. 37–58, Wiley-VCH. [50] Wu, C. et al. (2007) Systematic identification of SH3 domain-mediated human protein–protein interactions by peptide array target screening. Proteomics 7, 1775–1785. [51] Hiipakka, M. and Saksela, K. (2007) Versatile retargeting of SH3 domain binding by modification of non-conserved loop residues. FEBS Lett. 581, 1735–1741. [52] Arold, S., O’Brien, R., Franken, P., Strub, M.P., Hoh, F., Dumas, C. and Ladbury, J.E. (1998) RT loop flexibility enhances the specificity of Src family SH3 domains for HIV-1 Nef. Biochemistry 37, 14683–14691. [53] Kishan, K.V., Scita, G., Wong, W.T., Di Fiore, P.P. and Newcomer, M.E. (1997) The SH3 domain of Eps8 exists as a novel intertwined dimer. Nat. Struct. Biol. 4, 739–743. [54] Mongiovi, A.M., Romano, P.R., Panni, S., Mendoza, M., Wong, W.T., Musacchio, A., Cesareni, G. and Di Fiore, P.P. (1999) A novel peptide–SH3 interaction. EMBO J. 18, 5300–5309. [55] Sancier, F. et al. (2011) Specific oncogenic activity of the Src-family tyrosine kinase c-Yes in colon carcinoma cells. PLoS ONE 6, e17237. [56] Summy, J.M., Sudol, M., Eck, M.J., Monteiro, A.N., Gatesman, A. and Flynn, D.C. (2003) Specificity in signaling by c-Yes. Front. Biosci. 8, s185–s205. [57] Feng, S., Chen, J.K., Yu, H., Simon, J.A. and Schreiber, S.L. (1994) Two binding orientations for peptides to the Src SH3 domain: development of a general model for SH3–ligand interactions. Science 266, 1241–1247. [58] Lim, W.A., Richards, F.M. and Fox, R.O. (1994) Structural determinants of peptide-binding orientation and of sequence specificity in SH3 domains. Nature 372, 375–379. [59] Fernandez-Ballester, G., Blanes-Mira, C. and Serrano, L. (2004) The tryptophan switch: changing ligand-binding specificity from type I to type II in SH3 domains. J. Mol. Biol. 335, 619–629. [60] Aasland, R. et al. (2002) Normalization of nomenclature for peptide motifs as ligands of modular protein domains. FEBS Lett. 513, 141–144. [61] Ghose, R., Shekhtman, A., Goger, M.J., Ji, H. and Cowburn, D. (2001) A novel, specific interaction involving the Csk SH3 domain and its natural ligand. Nat. Struct. Biol. 8, 998–1004. [62] Kami, K., Takeya, R., Sumimoto, H. and Kohda, D. (2002) Diverse recognition of non-PxxP peptide ligands by the SH3 domains from p67(phox), Grb2 and Pex13p. EMBO J. 21, 4268–4276. [63] Lewitzky, M., Harkiolaki, M., Domart, M.C., Jones, E.Y. and Feller, S.M. (2004) Mona/Gads SH3C binding to hematopoietic progenitor kinase 1 (HPK1) combines an atypical SH3 binding motif, R/KXXK, with a classical PXXP motif embedded in a polyproline type II (PPII) helix. J. Biol. Chem. 279, 28724– 28732. [64] Moncalian, G., Cardenes, N., Deribe, Y.L., Spinola-Amilibia, M., Dikic, I. and Bravo, J. (2006) Atypical polyproline recognition by the CMS N-terminal Src homology 3 domain. J. Biol. Chem. 281, 38845–38853. [65] Tian, L., Chen, L., McClafferty, H., Sailer, C.A., Ruth, P., Knaus, H.G. and Shipston, M.J. (2006) A noncanonical SH3 domain binding motif links BK channels to the actin cytoskeleton via the SH3 adapter cortactin. FASEB J. 20, 2588–2590. [66] Liu, Q., Berry, D., Nash, P., Pawson, T., McGlade, C.J. and Li, S.S. (2003) Structural basis for specific binding of the Gads SH3 domain to an RxxK motif-containing SLP-76 peptide: a novel mode of peptide recognition. Mol. Cell. 11, 471–481. [67] Seet, B.T., Berry, D.M., Maltzman, J.S., Shabason, J., Raina, M., Koretzky, G.A., McGlade, C.J. and Pawson, T. (2007) Efficient T-cell receptor signaling requires a high-affinity interaction between the Gads C-SH3 domain and the SLP-76 RxxK motif. EMBO J. 26, 678–689. [68] Vidal, M., Gigoux, V. and Garbay, C. (2001) SH2 and SH3 domains as targets for anti-proliferative agents. Crit. Rev. Oncol. Hematol. 40, 175–186. [69] Smithgall, T.E. (1995) SH2 and SH3 domains: potential targets for anti-cancer drug design. J. Pharmacol. Toxicol. Methods 34, 125–132. [70] Garbay, C., Liu, W.Q., Vidal, M. and Roques, B.P. (2000) Inhibitors of Ras signal transduction as antitumor agents. Biochem. Pharmacol. 60, 1165–1169. [71] Lulf, S., Horenkamp, F.A., Breuer, S. and Geyer, M. (2011) Nef surfaces: where to interfere with function. Curr. HIV Res. 9, 543–551. [72] Li, H. and Lawrence, D.S. (2005) Acquisition of Fyn-selective SH3 domain ligands via a combinatorial library strategy. Chem. Biol. 12, 905–912. [73] Oneyama, C., Agatsuma, T., Kanda, Y., Nakano, H., Sharma, S.V., Nakano, S., Narazaki, F. and Tatsuta, K. (2003) Synthetic inhibitors of proline-rich ligandmediated protein–protein interaction: potent analogs of UCS15A. Chem. Biol. 10, 443–451. [74] Tong, A.H. et al. (2002) A combined experimental and computational strategy to define protein interaction networks for peptide recognition modules. Science 295, 321–324. [75] Cobos, E.S., Pisabarro, M.T., Vega, M.C., Lacroix, E., Serrano, L., Ruiz-Sanz, J. and Martinez, J.C. (2004) A miniprotein scaffold used to assemble the polyproline II binding epitope recognized by SH3 domains. J. Mol. Biol. 342, 355–365. [76] Pisabarro, M.T. and Serrano, L. (1996) Rational design of specific high-affinity peptide ligands for the Abl-SH3 domain. Biochemistry 35, 10634–10640. [77] Pisabarro, M.T., Ortiz, A.R., Viguera, A.R., Gago, F. and Serrano, L. (1994) Molecular modeling of the interaction of polyproline-based peptides with the Abl-SH3 domain: rational modification of the interaction. Protein Eng. 7, 1455–1462. [78] Lawrence, D.S. (2005) Signaling protein inhibitors via the combinatorial modification of peptide scaffolds. Biochim. Biophys. Acta 1754, 50–57. A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 [79] Mayer, J.P. and Dimarchi, R.D. (2005) Drugging the undruggable. Chem. Biol. 12, 860–861. [80] Vidal, M., Liu, W.Q., Lenoir, C., Salzmann, J., Gresh, N. and Garbay, C. (2004) Design of peptoid analogue dimers and measure of their affinity for Grb2 SH3 domains. Biochemistry 43, 7336–7344. [81] Inglis, S., Jones, R., Fritz, D., Stojkoski, C., Booker, G. and Pyke, S. (2005) Synthesis of 5-, 6- and 7-substituted-2-aminoquinolines as SH3 domain ligands. Org. Biomol. Chem. 3, 2543–2557. [82] Inglis, S.R., Stojkoski, C., Branson, K.M., Cawthray, J.F., Fritz, D., Wiadrowski, E., Pyke, S.M. and Booker, G.W. (2004) Identification and specificity studies of small-molecule ligands for SH3 protein domains. J. Med. Chem. 47, 5405–5417. [83] Nguyen, J.T., Porter, M., Amoui, M., Miller, W.T., Zuckermann, R.N. and Lim, W.A. (2000) Improving SH3 domain ligand selectivity using a non-natural scaffold. Chem. Biol. 7, 463–473. [84] Aghazadeh, B. and Rosen, M.K. (1999) Ligand recognition by SH3 and WW domains: the role of N-alkylation in PPII helices. Chem. Biol. 6, R241–R246. [85] Freire, E. (2009) A thermodynamic approach to the affinity optimization of drug candidates. Chem Biol Drug Des 74, 468–472. [86] Luque, J. (2011) Biophysics of Protein–Protein Interactions in: Protein Surface Recognition. Approaches for Drug Discovery (Giralt, E., Peczuh, M.W. and Salvatella, X., Eds.), pp. 23–45, John Wiley & Sons. [87] Freire, E. (2008) Do enthalpy and entropy distinguish first in class from best in class? Drug Discov. Today 13, 869–874. [88] Lafont, V., Armstrong, A.A., Ohtaka, H., Kiso, Y., Mario Amzel, L. and Freire, E. (2007) Compensating enthalpic and entropic changes hinder binding affinity optimization. Chem. Biol. Drug Des. 69, 413–422. [89] Velazquez Campoy, A. and Freire, E. (2005) ITC in the post-genomic era...?Priceless. Biophys. Chem. 115, 115–124. [90] Velazquez-Campoy, A., Luque, I. and Freire, E. (2001) The application of thermodynamic methods in drug design. Thermochim. Acta 380, 217–227. [91] Schon, A., Lam, S.Y. and Freire, E. (2011) Thermodynamics-based drug design: strategies for inhibiting protein–protein interactions. Future Med. Chem. 3, 1129–1137. [92] Schon, A., Madani, N., Smith, A.B., Lalonde, J.M. and Freire, E. (2011) Some binding-related drug properties are dependent on thermodynamic signature. Chem. Biol. Drug Des. 77, 161–165. [93] Ladbury, J.E., Klebe, G. and Freire, E. (2010) Adding calorimetric data to decision making in lead discovery: a hot tip. Nat. Rev. Drug Discov. 9, 23–27. [94] Kawasaki, Y. and Freire, E. (2011) Finding a better path to drug selectivity. Drug Discov. Today 16, 985–990. [95] Chaires, J.B. (2008) Calorimetry and thermodynamics in drug design. Annu. Rev. Biophys. 37, 135–151. [96] Holdgate, G.A. and Ward, W.H. (2005) Measurements of binding thermodynamics in drug discovery. Drug Discov. Today 10, 1543–1550. [97] Ohtaka, H., Velazquez-Campoy, A., Xie, D. and Freire, E. (2002) Overcoming drug resistance in HIV-1 chemotherapy: the binding thermodynamics of Amprenavir and TMC-126 to wild-type and drug-resistant mutants of the HIV-1 protease. Protein Sci. 11, 1908–1916. [98] Freire, E. (2002) Designing drugs against heterogeneous targets. Nat. Biotechnol. 20, 15–16. [99] Ferreon, J.C. and Hilser, V.J. (2004) Thermodynamics of binding to SH3 domains: the energetic impact of polyproline II (PII) helix formation. Biochemistry 43, 7787–7797. [100] Palencia, A., Cobos, E.S., Mateo, P.L., Martinez, J.C. and Luque, I. (2004) Thermodynamic dissection of the binding energetics of proline-rich peptides to the Abl-SH3 domain: implications for rational ligand design. J. Mol. Biol. 336, 527–537. [101] Renzoni, D.A. et al. (1996) Structural and thermodynamic characterization of the interaction of the SH3 domain from Fyn with the proline-rich binding site on the p85 subunit of PI3-Kinase. Biochemistry 35, 15646–15653. [102] Wang, C., Pawley, N.H. and Nicholson, L.K. (2001) The role of backbone motions in ligand binding to c-Src SH3 domain. J. Mol. Biol. 313, 873–887. [103] Wittekind, M. et al. (1994) Orientation of peptide fragments from Sos proteins boud to the N-terminal SH3 domain of Grb2 determined by NMR spectroscopy. Biochemistry 33, 13531–13539. [104] Rubini, C. et al. (2010) Recognition of lysine-rich peptide ligands by murine cortactin SH3 domain: CD, ITC, and NMR studies. Biopolymers 94, 298–306. [105] Arold, S.T. and Baur, A.S. (2001) Dynamic Nef and Nef dynamics: how structure could explain the complex activities of this small HIV protein. Trends Biochem. Sci. 26, 356–363. [106] Chan, B. et al. (2003) SAP couples Fyn to SLAM immune receptors. Nat. Cell. Biol. 5, 155–160. [107] Aitio, O. et al. (2008) Structural basis of PxxDY motif recognition in SH3 binding. J. Mol. Biol. 382, 167–178. [108] McDonald, C.B., Seldeen, K.L., Deegan, B.J. and Farooq, A. (2009) SH3 domains of Grb2 adaptor bind to PXpsiPXR motifs within the Sos1 nucleotide exchange factor in a discriminate manner. Biochemistry 48, 4074–4085. [109] Ferreon, J.C. and Hilser, V.J. (2003) Ligand-induced changes in dynamics in the RT loop of the C-terminal SH3 domain of Sem-5 indicate cooperative conformational coupling. Protein Sci. 12, 982–996. [110] Cordier, F., Wang, C., Grzesiek, S. and Nicholson, L.K. (2000) Ligand-induced strain in hydrogen bonds of the c-Src SH3 domain detected by NMR. J. Mol. Biol. 304, 497–505. [111] Brasher, B.B., Roumiantsev, S. and Van Etten, R.A. (2001) Mutational analysis of the regulatory function of the c-Abl Src homology 3 domain. Oncogene 20, 7744–7752. 2629 [112] Azam, M., Latek, R.R. and Daley, G.Q. (2003) Mechanisms of autoinhibition and STI-571/imatinib resistance revealed by mutagenesis of BCR-ABL. Cell 112, 831–843. [113] Viguera, A.R., Arrondo, J.L., Musacchio, A., Saraste, M. and Serrano, L. (1994) Characterization of the interaction of natural proline-rich peptides with five different SH3 domains. Biochemistry 33, 10925–10933. [114] Pisabarro, M.T., Serrano, L. and Wilmanns, M. (1998) Crystal structure of the abl-SH3 domain complexed with a designed high-affinity peptide ligand: implications for SH3-ligand interactions. J. Mol. Biol. 281, 513–521. [115] Luque, I. and Freire, E. (2002) Structural parameterization of the binding enthalpy of small ligands. Proteins 49, 181–190. [116] Velazquez-Campoy, A., Luque, I., Todd, M.J., Milutinovich, M., Kiso, Y. and Freire, E. (2000) Thermodynamic dissection of the binding energetics of KNI272, a potent HIV-1 protease inhibitor. Protein Sci. 9, 1801–1809. [117] Palencia, A., Camara-Artigas, A., Pisabarro, M.T., Martinez, J.C. and Luque, I. (2010) Role of interfacial water molecules in proline-rich ligand recognition by the Src homology 3 domain of Abl. J. Biol. Chem. 285, 2823–2833. [118] Martin-Garcia, J.M., Ruiz-Sanz, J. and Luque, I. (2012) Interfacial water molecules in SH3 interactions: a revised paradigm for polyproline recognition. Biochem. J. 442, 443–451. [119] Minke, W.E., Diller, D.J., Hol, W.G. and Verlinde, C.L. (1999) The role of waters in docking strategies with incremental flexibility for carbohydrate derivatives: heat-labile enterotoxin, a multivalent test case. J. Med. Chem. 42, 1778–1788. [120] Rarey, M., Kramer, B. and Lengauer, T. (1999) Docking of hydrophobic ligands with interaction-based matching algorithms. Bioinformatics 15, 243–250. [121] Lie, M.A., Thomsen, R., Pedersen, C.N., Schiott, B. and Christensen, M.H. (2011) Molecular docking with ligand attached water molecules. J. Chem. Inf. Model. 51, 909–917. [122] Thilagavathi, R. and Mancera, R.L. (2010) Ligand–protein cross-docking with water molecules. J. Chem. Inf. Model. 50, 415–421. [123] Roberts, B.C. and Mancera, R.L. (2008) Ligand-protein docking with water molecules. J. Chem. Inf. Model. 48, 397–408. [124] van Dijk, A.D. and Bonvin, A.M. (2006) Solvated docking: introducing water into the modelling of biomolecular complexes. Bioinformatics 22, 2340– 2347. [125] Verdonk, M.L., Chessari, G., Cole, J.C., Hartshorn, M.J., Murray, C.W., Nissink, J.W., Taylor, R.D. and Taylor, R. (2005) Modeling water molecules in protein– ligand docking using GOLD. J. Med. Chem. 48, 6504–6515. [126] Schnecke, V. and Kuhn, L.A. (2000) Virtual Screeing with solvation and ligand-induced complementarity. Perspect. Drug Discov. 20, 171–190. [127] Mancera, R.L. (2002) De novo ligand design with explicit water molecules: an application to bacterial neuraminidase. J. Comput. Aided Mol. Des. 16, 479– 499. [128] Garcia-Sosa, A.T. and Mancera, R.L. (2006) The effect of a tightly bound water molecule on scaffold diversity in the computer-aided de novo ligand design of CDK2 inhibitors. J. Mol. Model. 12, 422–431. [129] Garcia-Sosa, A.T., Firth-Clark, S. and Mancera, R.L. (2005) Including tightlybound water molecules in de novo drug design. Exemplification through the in silico generation of poly(ADP-ribose)polymerase ligands. J. Chem. Inf. Model. 45, 624–633. [130] Mancera, R.L. (2007) Molecular modeling of hydration in drug design. Curr. Opin. Drug Discov. Devel. 10, 275–280. [131] de Beer, S.B., Vermeulen, N.P. and Oostenbrink, C. (2010) The role of water molecules in computational drug design. Curr. Top Med. Chem. 10, 55–66. [132] Dunitz, J.D. (1995) Win some, lose some: enthalpy–entropy compensation in weak intermolecular interactions. Chem. Biol. 2, 709–712. [133] Dunitz, J.D. (1994) The entropic cost of bound water in crystals and biomolecules. Science 264, 670. [134] Cooper, A. (2005) Heat capacity effects in protein folding and ligand binding: a re-evaluation of the role of water in biomolecular thermodynamics. Biophys. Chem. 115, 89–97. [135] Tame, J.R., Sleigh, S.H., Wilkinson, A.J. and Ladbury, J.E. (1996) The role of water in sequence-independent ligand binding by an oligopeptide transporter protein. Nat. Struct. Biol. 3, 998–1001. [136] Ladbury, J.E. (1996) Just add water! The effect of water on the specificity of protein–ligand binding sites and its potential application to drug design. Chem. Biol. 3, 973–980. [137] Lazaridis, T. (1998) Inhomogeneous fluid approach to solvation thermodynamics. 1 Theory. J. Phys. Chem. B 102, 3531–3541. [138] Lazaridis, T. (1998) Inhomogeneous fluid approach to solvation thermodynamics. 2. Applications to simple fluids. J. Phys. Chem. B 102, 3542–3550. [139] Li, Z. and Lazaridis, T. (2006) Thermodynamics of buried water clusters at a protein–ligand binding interface. J. Phys. Chem. B 110, 1464–1475. [140] Li, Z. and Lazaridis, T. (2003) Thermodynamic contributions of the ordered water molecule in HIV-1 protease. J. Am. Chem. Soc. 125, 6636–6637. [141] Li, Z. and Lazaridis, T. (2005) The effect of water displacement on binding thermodynamics: concanavalin A. J. Phys. Chem. B 109, 662–670. [142] Sharrow, S.D., Edmonds, K.A., Goodman, M.A., Novotny, M.V. and Stone, M.J. (2005) Thermodynamic consequences of disrupting a water-mediated hydrogen bond network in a protein:pheromone complex. Protein Sci. 14, 249–256. [143] Lam, P.Y. et al. (1994) Rational design of potent, bioavailable, nonpeptide cyclic ureas as HIV protease inhibitors. Science 263, 380–384. 2630 A. Zafra-Ruano, I. Luque / FEBS Letters 586 (2012) 2619–2630 [144] Chen, J.M., Xu, S.L., Wawrzak, Z., Basarab, G.S. and Jordan, D.B. (1998) Structure-based design of potent inhibitors of scytalone dehydratase: displacement of a water molecule from the active site. Biochemistry 37, 17735–17744. [145] Sleigh, S.H., Seavers, P.R., Wilkinson, A.J., Ladbury, J.E. and Tame, J.R. (1999) Crystallographic and calorimetric analysis of peptide binding to OppA protein. J. Mol. Biol. 291, 393–415. [146] Connelly, P.R. et al. (1994) Enthalpy of hydrogen bond formation in a protein–ligand binding reaction. Proc. Natl. Acad. Sci. U S A 91, 1964–1968. [147] Clarke, C., Woods, R.J., Gluska, J., Cooper, A., Nutley, M.A. and Boons, G.J. (2001) Involvement of water in carbohydrate–protein binding. J. Am. Chem. Soc. 123, 12238–12247. [148] Raymer, M.L., Sanschagrin, P.C., Punch, W.F., Venkataraman, S., Goodman, E.D. and Kuhn, L.A. (1997) Predicting conserved water-mediated and polar ligand interactions in proteins using a K-nearest-neighbors genetic algorithm. J. Mol. Biol. 265, 445–464. [149] Garcia-Sosa, A.T., Mancera, R.L. and Dean, P.M. (2003) WaterScore: a novel method for distinguishing between bound and displaceable water molecules in the crystal structure of the binding site of protein–ligand complexes. J. Mol. Model. 9, 172–182. [150] Kellogg, G.E., Semus, S.F. and Abraham, D.J. (1991) HINT: a new method of empirical hydrophobic field calculation for CoMFA. J. Comput. Aided Mol. Des. 5, 545–552. [151] Chen, D.L. and Kellogg, G.E. (2005) A computational tool to optimize ligand selectivity between two similar biomacromolecular targets. J. Comput. Aided Mol. Des. 19, 69–82. [152] Goodford, P.J. (1985) A computational procedure for determining energetically favorable binding sites on biologically important macromolecules. J. Med. Chem. 28, 849–857. [153] Lu, Y., Wang, R., Yang, C.Y. and Wang, S. (2007) Analysis of ligand-bound water molecules in high-resolution crystal structures of protein–ligand complexes. J. Chem. Inf. Model. 47, 668–675. [154] Gilson, M.K., Given, J.A., Bush, B.L. and McCammon, J.A. (1997) The statisticalthermodynamic basis for computation of binding affinities: a critical review. Biophys. J. 72, 1047–1069. [155] Hamelberg, D. and McCammon, J.A. (2004) Standard free energy of releasing a localized water molecule from the binding pockets of proteins: doubledecoupling method. J. Am. Chem. Soc. 126, 7683–7689. [156] Henriques, D.A. and Ladbury, J.E. (2001) Inhibitors to the Src SH2 domain: a lesson in structure–thermodynamic correlation in drug design. Arch. Biochem. Biophys. 390, 158–168. [157] Tame, J.R., Murshudov, G.N., Dodson, E.J., Neil, T.K., Dodson, G.G., Higgins, C.F. and Wilkinson, A.J. (1994) The structural basis of sequence-independent peptide binding by OppA protein. Science 264, 1578–1581. [158] Iglesias-Bexiga, M., Palencia, A., Blanco, F.J., Macias, M.J., Cobos, E.S. and Luque, I. (2012). Plasticity in viral PPxY Late domain recognition by the third WW domain of human Nedd4. In preparation. [159] Bella, J., Brodsky, B. and Berman, H.M. (1995) Hydration structure of a collagen peptide. Structure 3, 893–906. [160] Melacini, G., Bonvin, A.M., Goodman, M., Boelens, R. and Kaptein, R. (2000) Hydration dynamics of the collagen triple helix by NMR. J. Mol. Biol. 300, 1041–1049. Two-state dynamics of the SH3–SH2 tandem of Abl kinase and the allosteric role of the N-cap Carles Corbi-Verge a,1, Fabrizio Marinelli b,1,2, Ana Zafra-Ruano a, Javier Ruiz-Sanz a, Irene Luque a,3, and José D. Faraldo-Gómez b,2,3 a Department of Physical Chemistry and Institute of Biotechnology, University of Granada, 18071 Granada, Spain; and bTheoretical Molecular Biophysics Group, Max Planck Institute of Biophysics, 60438 Frankfurt am Main, Germany Edited by John Kuriyan, University of California, Berkeley, CA, and approved July 18, 2013 (received for review March 1, 2013) The regulation and localization of signaling enzymes is often mediated by accessory modular domains, which frequently function in tandems. The ability of these tandems to adopt multiple conformations is as important for proper regulation as the individual domain specificity. A paradigmatic example is Abl, a ubiquitous tyrosine kinase of significant pharmacological interest. SH3 and SH2 domains inhibit Abl by assembling onto the catalytic domain, allosterically clamping it in an inactive state. We investigate the dynamics of this SH3–SH2 tandem, using microsecond all-atom simulations and differential scanning calorimetry. Our results indicate that the Abl tandem is a two-state switch, alternating between the conformation observed in the structure of the autoinhibited enzyme and another configuration that is consistent with existing scattering data for an activated form. Intriguingly, we find that the latter is the most probable when the tandem is disengaged from the catalytic domain. Nevertheless, an amino acid stretch preceding the SH3 domain, the so-called N-cap, reshapes the free-energy landscape of the tandem and favors the interaction of this domain with the SH2kinase linker, an intermediate step necessary for assembly of the autoinhibited complex. This allosteric effect arises from interactions between N-cap and the SH2 domain and SH3–SH2 connector, which involve a phosphorylation site. We also show that the SH3–SH2 connector plays a determinant role in the assembly equilibrium of Abl, because mutations thereof hinder the engagement of the SH2-kinase linker. These results provide a thermodynamic rationale for the involvement of N-cap and SH3–SH2 connector in Abl regulation and expand our understanding of the principles of modular domain organization. | the catalytic domain, which binds and cleaves ATP, and mediates tyrosine phosphorylation in protein targets. Additional elements in Abl are not conserved in Src or Tec and vary among isoforms. The Abl-1b splice variant, which is our focus, features a long, seemingly unstructured N-terminal extension preceding the SH3 domain, known as the N-cap, which becomes myristoylated posttranslationally. Following the catalytic domain is another long stretch, containing various sequence motifs for DNA or cytoskeleton recognition, among others. The SH3 and SH2 domains not only function as interaction modules, but also as allosteric inhibitors of the catalytic domain. In autoinhibited Abl, the three domains are assembled into a compact arrangement, in which the SH3–SH2 tandem appears to mechanically clamp the N- and C-lobes of the catalytic domain in an inactive configuration (Fig. 1A) (6, 7), without directly occluding the active site. The domain-domain linkers appear to be key elements in this assembly. The SH2 domain docks directly onto the C-lobe of the catalytic domain, whereas its linker to the N-lobe engages the SH3 domain. Simultaneously, the portion of N-cap most proximal to the SH3 domain binds to the short SH3– SH2 connector, while the myristoyl group, at the very N terminus, inserts itself into a hydrophobic cavity within the C-lobe of the catalytic domain. Interestingly, Src-family kinases adopt the same compact domain organization in their down-regulated form (8), although their equivalent to N-cap serves as a membrane anchor and is not involved in autoinhibition. Instead, a C-terminal extension from the catalytic domain containing a phosphorylated | Significance allosteric inhibitors protein–protein interactions macromolecular assembly population shift leukemia | | There is increasing interest in developing pharmacological strategies to inhibit the allosteric regulatory mechanisms of signaling enzymes. The Abl tyrosine kinase is a prominent target, due to its ubiquitous cellular role and its involvement in cancer. Here, computational and experimental methods are used in synergy to probe the mechanism of the regulatory unit of Abl, whose dual function is to inhibit the enzyme and to mediate its interaction with other signaling proteins. Our results provide insights into the thermodynamic basis for the mechanism of Abl autoinhibition and activation and expand our understanding of the principles that govern modular domain organization. T yrosine kinases are involved in a wide variety of key signaling processes and are therefore tightly regulated by the cell. Indeed, numerous pathologies, ranging from cancer to neurodegeneration, result from or are associated with deficiencies in kinase regulation. Consequently, these enzymes are a prominent target for novel pharmacological strategies against human disease. This study focuses on Abelson murine-leukemia viral-oncogene homolog-1 (Abl), which is one of the most ubiquitously conserved tyrosine kinases. Abl is present in all metazoa, where it plays an essential role in processes as diverse as cytoskeleton reorganization, DNA repair, and regulation of apoptosis (1, 2). Accordingly, when constitutively active forms of Abl are present in normal cells, these are transformed into cancer cells (3). For example, in human white blood cells, a chromosomal abnormality leads to the fusion of the bcr and abl genes, which together encode for a cytoplasmtargeted deregulated form of Abl; Bcr-Abl interferes with the cell cycle, resulting in uncontrolled cell proliferation, and is the principal cause of chronic myeloid leukemia (CML) (4). The architecture of Abl kinases resembles that of other tyrosine kinase families such as Src and Tec (5). It consists of a Srchomology-3 (SH3) module, which is an interaction domain specialized for recognition of xPxxP sequence motifs; a Src-homology-2 (SH2) module, which recognizes phosphorylated tyrosines; and E3372–E3380 | PNAS | Published online August 19, 2013 Author contributions: I.L. and J.D.F.-G. designed research; C.C.-V., F.M., A.Z.-R., and J.R.-S. performed research; C.C.-V., F.M., A.Z.-R., J.R.-S., I.L., and J.D.F.-G. analyzed data; and C.C.-V., F.M., I.L., and J.D.F.-G. wrote the paper. The authors declare no conflict of interest. This article is a PNAS Direct Submission. 1 C.C.-V. and F.M. contributed equally to this work. 2 Present address: Theoretical Molecular Biophysics Section, National Heart, Lung and Blood Institute, National Institutes of Health, Bethesda, MD 20892. 3 To whom correspondence may be addressed. E-mail: iluque@ugr.es or jose.faraldo@ biophys.mpg.de. This article contains supporting information online at www.pnas.org/lookup/suppl/doi:10. 1073/pnas.1303966110/-/DCSupplemental. www.pnas.org/cgi/doi/10.1073/pnas.1303966110 PNAS PLUS enables us to reconcile seemingly contradictory structural and biophysical data on the mechanism of Abl regulation. Our analysis also enables us to formulate a mechanistic hypothesis for the role of the N-cap. Finally, we also examine the impact of activating mutations within the SH3–SH2 unit, particularly in the short connector between the domains. Results and Discussion Fig. 1. (A) Crystal structure of Abl in the autoinhibited state (PDB ID code 2FO0). The SH2 domain docks onto the C-lobe of the catalytic domain, whereas the SH3 domain engages the SH2-kinase linker. This inhibitory configuration of the SH3–SH2 tandem is referred to as the on conformer throughout the text. (B) Pseudodihedral angles used to describe the relative orientation of the regulatory domains during the simulations, encompassing residues in the C-terminal β-strand of the SH3 domain, the SH3–SH2 connector, and the N-terminal β-strand of the SH2 domain (Methods). tyrosine associates with the SH2 module and seemingly locks the complex in the autoinhibited state. Reversible phosphorylation of this C-terminal tail is a major regulatory mechanism of Src family kinases (9, 10). Activation of both Src and Abl is enabled by the disengagement or reconfiguration of the intramolecular interactions just described (7, 11, 12). Regulation can therefore be thought as a reversible equilibrium whereby the SH3, SH2, and catalytic domains are either dissociated or self-assembled in one or more configurations. External factors, such as competing interactions involving one or both regulatory domains, will bias this equilibrium in one or the other direction (13). For Abl in particular, the significance of this mechanism is underscored by the fact that mutations that impair the correct assembly of the autoinhibited complex, either in the SH3–SH2 tandem or in the domain-domain linkers, confer CML cells with resistance against inhibitory drugs designed to target the catalytic domain of the Bcr-Abl oncogene (14). This outcome has prompted considerable interest in the mechanisms of allosteric regulation of Abl and other tyrosine kinases and in the development of compounds designed to interfere with these mechanisms (15–19). In this paper, we use molecular simulations, free energy calculations, and differential scanning calorimetry (DSC) to study the determining factors of a necessary step in the assembly of the autoinhibited form of Abl, namely the organization of the SH3 and SH2 domains into a conformation conducive to its association with the SH2–kinase linker (KL). Our results show that the conformational dynamics of the Abl SH3–SH2 tandem are clearly distinct from those of Src and related kinases. This finding Corbi-Verge et al. Experimental and computational studies of SH3–SH2 tandems from several Src family tyrosine kinases, such as Fyn or Hck, have concluded that these constructs can retain the conformation observed in the down-regulated, assembled enzyme, even in the absence of other elements from the kinase (13, 20, 21). To assess whether the SH3–SH2 tandem from Abl is similar in this regard, we calculated two 500-ns molecular dynamics trajectories, both starting in the inhibitory conformation of the tandem observed in the crystal structure of the inactivated complex—hereafter referred to as the “on” state of the SH3–SH2 clamp (Table S1). In the course of these simulations, the internal structure of each domain was very well preserved; on average, the conformation of the backbone deviated from the X-ray structure [root-mean-square-difference (RMSD)] by only ∼0.6 Å. Nonetheless, significant changes in the relative orientation of the two domains were observed throughout the simulations. We monitored these with the two pseudodihedral angles defined in Fig. 1B. The variations in these dihedral angles in the simulation time scale were both very significant (up to ∼180°) and reversible (Fig. 2). Thus, the initial “on” conformation was not sustained beyond the first 20–50 ns of the simulations, although it could be transiently observed thereafter. Instead, we observed that the tandem frequently adopted an alternative, well-defined arrangement, markedly different from the on conformation. Further analysis of this alternative arrangement, which we refer to as the “off” or noninhibitory state of the SH3–SH2 clamp, reveals that it closely resembles (RMSD < 3 Å) an existing crystal structure of the isolated tandem (22), reported several years before that of the inactive, complete enzyme (6). In this isolated tandem structure (Fig. 3A), the orientation of the two domains differs drastically (RMSD ∼10 Å) from that seen in the assembled kinase complex. The tandem is also slightly more compact, with Fig. 2. Conformational dynamics of the isolated SH3–SH2 tandem in two independent simulation trajectories of 500 ns, initiated in the on conformation. Time series of the pseudodihedral angles defined in Fig. 1 are represented as probability histograms in blocks of 20, 100, and 500 ns (red color equals greater probability). In both trajectories, the tandem switches to the noninhibitory off conformation within 100 ns; in one of them, the tandem switches back to the inhibitory on state, after 400 ns. PNAS | Published online August 19, 2013 | E3373 BIOPHYSICS AND COMPUTATIONAL BIOLOGY Isolated SH3–SH2 Tandem Switches Between Two Main Conformers. since the determination of the structures of the complete enzyme in the inactive (6) and active (7) states. It is worth noting, however, that diffusion anisotropy measurements by solution NMR had previously indicated that the SH3 and SH2 domains in the Abl tandem have a greater propensity to be in contact than those in tandems from Src kinases (20, 23), in agreement with our results. Moreover, the off conformation sampled in our simulations is highly consistent with small-angle X-ray scattering (SAXS) measurements obtained for a constitutively active form of Abl, where the regulatory unit is partially disassembled from the catalytic domain (7) (Fig. 5). Thus, even though this alternative off conformation of the Abl SH3–SH2 regulatory unit might have been perceived as an artifact Fig. 3. (A) Comparison of the on and off conformers of the SH3–SH2 tandem (blue and red, respectively), overlaid only using the SH2 domain; the on conformer is shown as seen in the autoinhibited configuration of the Abl complex and viewed from two perspectives. The catalytic domain is shown as orange spheres, and the SH2-kinase linker is shown in cyan. The RMSD between the two conformations of the tandem (considering regions with secondary structure only) is ∼8 Å. The off conformer sampled in our simulations closely resembles a crystal structure of the isolated SH3–SH2 tandem (RMSD, ∼2–3 Å; PDB ID code 2ABL). This alternate conformation does not interfere with the interaction between the SH2 and catalytic domains but appears to be incompatible with the engagement of the SH2-kinase linker by the SH3 domain. (B) Conformational dynamics of the SH3–SH2 tandem in two independent simulation trajectories of 500 ns, initiated in the off conformation. In one of the simulations, the tandem switches to the on conformation after 50 ns, returning to the off state after 100 ns, and switching again to the on conformer after 450 ns. In the second trajectory, the tandem remains in the off state throughout the simulation. several direct contacts between the SH3 and SH2 domains, specifically involving the distal loop of the SH3 domain and the βB-βc, βD′-βc loops of the SH2 domain (Fig. S1). By contrast, in the on conformation, there are no direct interactions between these domains; instead, this conformation seems to be stabilized by interactions between the SH3 domain and the SH3–SH2 connector (Fig. S1). Two additional trajectories of 500 ns, now initiated in the crystal structure of the off conformer, confirm that the Abl SH3–SH2 tandem exchanges between off and on states within the simulation time scale (Fig. 3B), with a preference for the former. To further evaluate the switch-like dynamics of the Abl SH3– SH2 tandem, we set out to verify that the on and off states are minima in its conformational free energy landscape. To calculate this landscape, we used an advanced sampling technique known as bias-exchange metadynamics (Methods). This calculation, based on ∼6 μs of simulation time, confirms that the on and off conformers correspond to the two main energetic minima (Fig. 4A; Fig. S2A), separated by a relatively small barrier, of about 4 kcal/mol (Fig. S3). Moreover, it reveals that the exchange between these two states correlates with a conformational change within the SH3–SH2 connector (Fig. 4A). Importantly, the off state is more probable than the on state, by approximately fivefold (see Methods for formal definitions); the population of the on state is only ∼8% (±2%). To our knowledge, the mechanistic significance of the off configuration of the Abl SH3–SH2 tandem has not been readdressed E3374 | www.pnas.org/cgi/doi/10.1073/pnas.1303966110 Fig. 4. Conformational free-energy landscapes of (A) the SH3–SH2 tandem, (B) the tandem engaged to the SH2-kinase linker (red), and (C) the tandem engaged to N-cap (green). Each of the free-energy landscapes derives from ∼6 μs of all-atom bias-exchange metadynamics simulations, using five collective variables (Methods). The free-energy landscapes shown derive from projections of the unbiased probability density on two of these variables; i.e., the probability density function is integrated along the other variables. S1 represents the relative orientation of the SH3 and SH2 domains; S2 describes the conformation of the SH3–SH2 connector. The integration excludes values in S3 larger than 1 nm2, because those are more poorly sampled (Fig. S2). Corbi-Verge et al. induced by the crystallization process, this and previous studies actually indicate that it is mechanistically relevant. The structural dynamics of the Abl SH3–SH2 tandem and those in Src-type kinases, therefore, differ significantly. Free energy simulations of the SH3–SH2 tandem from Hck (a close homolog of cSrc) identified a single major conformer, which closely resembles the on state (13); previous studies of Fyn using X-ray crystallography and NMR led to an analogous conclusion (20, 21). In these kinases, the SH3–SH2 tandem is thus predisposed to adopt conformations conducive to the inactive, assembled form of the enzyme, in which the SH3 domain can readily engage the SH2–KL. The fact that the regulatory tandem of Abl differs in this regard suggests that the assembly of the autoinhibited state involves other elements, as we discuss below. Engagement of the SH2–KL Requires the On Conformation. Experi- mental studies of the Abl SH3–SH2 tandem using hydrogen/ deuterium exchange (HDX) measurements have shown that the SH3 domain may bind the SH2–KL even in the absence of other elements of the kinase (24). Here, we showed that the isolated tandem alternates between two conformational states, referred to as on and off conformations. The former is known to be compatible with the interaction between the SH3 domain and SH2–KL (Fig. 1A); however, it is unclear whether this interaction is also feasible in the off conformation, which, as mentioned, is inherently preferred by the tandem. To address this question, we calculated two additional 500-ns molecular dynamics trajectories of an SH3–SH2 construct that also includes the SH2–KL, bound to the SH3 domain, with the on conformation as the starting point (Table S1). As Fig. 6A shows, the tandem remained in the initial conformation throughout these simulations (note that spontaneous dissociation of the linker from the SH3 is unlikely to be observed in this time scale). This result is in clear contrast to what we observe for the isolated tandem (Fig. 3) and suggests that the interaction with the SH2-linker would not be viable in the alternate off conformation of the SH3–SH2 unit. Bias-exchange metadyCorbi-Verge et al. Fig. 6. (A) Conformational dynamics of the SH3–SH2 tandem when bound to the SH2-kinase linker, in terms of a histogram of the D1/D2 time series for two independent simulation trajectories of 500 ns each, both of which were initiated in the on conformation. (B) Analysis of the interaction between the Abl SH2-kinase linker and the SH3 domain, via differential scanning calorimetry, for constructs of the SH3–SH2 tandem with and without the linker and the individual domains. PNAS | Published online August 19, 2013 | E3375 PNAS PLUS BIOPHYSICS AND COMPUTATIONAL BIOLOGY Fig. 5. Putative model of fully activated Abl, with the SH3–SH2 tandem in the proposed off conformation. The model is based on a partial X-ray structure (cyan) of a deregulated, mutagenized form of Abl (PDB ID code 1OPL, chain B), in which the SH2 domain docks onto the N-lobe of the catalytic domain (7). The SH3–SH2 tandem is overlaid using the SH2 domain as reference, either in the on or off conformers explored in the simulations (blue and red, respectively). Both models are fitted into a low-resolution envelope (gray mesh) constructed on the basis of SAXS measurements for the same deregulated Abl mutant (7). It is apparent that the experimental scattering data very likely reflects the SH3–SH2 tandem in the off conformation predicted to be the most probable by our free-energy calculations (when the tandem is disengaged from the SH2-kinase linker and the N-cap). namics calculations of the conformational free energy landscape of this construct support this observation. The calculated landscape, based again on ∼6 μs of simulation time, clearly demonstrates that the off conformer is energetically prohibited (Fig. 4B; Fig. S2B). Instead, we observe a single free energy minimum (population 98%), which corresponds precisely to the on conformation observed in the autoinhibited state of the enzyme (Fig. 1A). These results clearly indicate that engagement of the SH2– KL has a profound effect on the energetic landscape of the Abl SH3–SH2 tandem. DSC experiments carried out with SH3–SH2 and SH3–SH2– KL constructs further support this observation. DSC provides direct experimental access to the folding/unfolding partition function, and consequently, the shape of the calorimetric trace provides insights not only on the energetics of the unfolding equilibrium, but also on the mechanism underlying the process. Specifically, the shape of the calorimetric profile of a multidomain protein can provide information on the degree of interaction and conformational cooperativity between domains and on the influence of ligand binding (25, 26). Thus, to experimentally probe the effect of the kinase linker on the conformational equilibrium of the SH3–SH2 tandem, we measured the temperature dependence of the partial heat capacity of the individual SH3 and SH2 domains, the SH3–SH2 tandem, and the SH3– SH2–KL construct. Unfortunately, with the exception of the Abl SH3 domain, all other constructs resulted in irreversible thermodynamic transitions under all conditions studied, precluding a quantitative evaluation of the linker binding affinity. Nonetheless, from a qualitative perspective, we observed very revealing differences between the heat capacity profiles of the SH3–SH2 and SH3– SH2–KL constructs (Fig. 6B). The thermogram obtained with the SH3–SH2 tandem features two peaks, each of which likely corresponding to the unfolding of one domain, based on a comparison with the single-domain thermograms. The SH2 domain appears to be more stable if isolated; nonetheless, we clearly discern two transitions for the tandem, indicating that even though there might be some cooperativity, it is fairly weak. We can conclude, therefore, that in this construct the two domains unfold largely independently of each other. As mentioned, binding of the SH2–KL to the SH3 domain can take place in the absence of the kinase domain, as previously demonstrated via HDX measurements (24). Simulated DSC thermograms (SI Text, Table S2) show that if this process was noncooperative, binding would be expected to result in a displacement of the peak corresponding to the SH3 unfolding transition to higher temperatures, whereas the SH2 unfolding transition would be either unaffected, if the linker were to bind to the off conformer of the tandem (Fig. S4A), or shifted toward lower temperatures, if the linker binds to the on conformer (Fig. S4B). As Fig. 6B shows, however, this is clearly not what is observed experimentally for SH3–SH2–KL construct. The measured unfolding thermogram shows instead a single sharp peak, characteristic of highly cooperative transitions, centered around 55 °C, between the peaks corresponding to the isolated domains. Highly cooperative transitions can be expected only if we assume that the SH3 domain cannot engage the KL when the SH2 domain is unfolded. However, as illustrated in Fig. S4 C and D, these peaks are characterized by Tm values much higher than that of the SH3–SH2–KL construct (Fig. 6B). Highly cooperative peaks with Tm values comparable to those observed experimentally can be rationalized only in a highly cooperative scenario, as shown in Fig. S4 E and F, in which partially unfolded states of the SH3–SH2 tandem are not significantly populated. Nevertheless, the theoretical range of Tm values for these cooperative peaks depends on whether the SH2–KL is assumed to bind to on or off conformation, i.e., the high or low free energy states of the tandem, according to our bias-exchange simulations. In particular, Tm values comparable to the experimental observation (Fig. 6B) are only compatible with two possible scenarios: (i) the SH2–KL binds to the off conformer, albeit with extremely low dissociation constants, in the 10- to 100-mM range (Fig. S4E) or (ii) the linker binds to the on conformation with dissociation constants in the millimolar to micromolar range (Fig. S4F). Only the latter scenario seems probable, in view of the binding affinities typically observed for poly-proline recognition by SH3 domains (27). In summary, the DSC data indicate that the presence of the linker has a profound effect on the structural dynamics of the tandem, coupling the unfolding of the two domains in a fully cooperative manner. Also, from a qualitative perspective, the low Tm value of the SH3–SH2–KL transitions suggests a preferential interaction of the linker with the high free energy on conformation, in agreement with the molecular dynamics simulations. N-Cap Extension Promotes Inactive-Like Conformations. The fact that the SH3–SH2 unit may engage the SH2–KL, as demonstrated by HDX and DSC experiments, indicates that the affinity of this interaction must be sufficiently large to overcome the energy difference between on and off conformers, i.e., to displace the conformational equilibrium of the tandem toward the on conformation. Nevertheless, the formation of this interaction would entail a conformational strain in the tandem, because the off conformer is energetically preferred when the SH3–SH2 unit is disengaged from other elements in the kinase (Fig. 4A). Such strain is probably minimal in other tightly regulated kinases such as Src or Fyn, in which the SH3–SH2 tandem is biased toward binding-competent conformations. The lack of this conformational drive in Abl suggests a different strategy for the stabilization of the autoinhibited complex relative to other kinases, e.g., a higher affinity between SH3 domain and SH2-kinase linker, the involvement of additional elements in the kinase, or both. As mentioned above, a key element in the autoinhibition of Src-type tyrosine kinases is a C-terminal extension of the catalytic domain, featuring a tyrosine phosphorylation site. This site is recognized by the SH2 domain in the assembled form of the enzyme, and thus the short C-tail seems to mechanically lock the down-regulated state (8). Functional studies indicate that the myristoylated N terminus of the Abl N-cap region (in the 1b splice variant) might have a comparable role, because mutant forms that cannot be myristoylated are constitutively active (28). Indeed, a comparison of crystal structures of autoinhibited and active Abl suggests that binding of the myristoyl moiety to the catalytic domain is required for its C-lobe to adopt a conformation complementary with the SH2 domain interface (6, 29). E3376 | www.pnas.org/cgi/doi/10.1073/pnas.1303966110 The role of the N-cap, however, is not to provide a tight physical link between the SH3 domain and the myristoyl-binding pocket. Most of the N-cap can be deleted without impairing the autoinhibition of the enzyme (28), consistent with the fact that this region is highly disordered in crystal structures (6, 7). However, a ∼20 amino acid fragment of N-cap immediately preceding the SH3 domain in Abl-1b is crucial for proper regulation. In one of the crystal structures of the autoinhibited complex (7), this fragment establishes several direct interactions with the SH2 domain and the SH3–SH2 connector, one of which is mediated by a phosphorylated serine (Ser69). Consistent with this finding, mutation of Ser69 and neighboring residues increases the activation level of the enzyme (28). We therefore hypothesized that the mechanistic role of this N-cap fragment might be to modulate the structural dynamics of the SH3–SH2 unit, in a manner that promotes the engagement of the SH2–KL and further stabilizes the autoinhibited state. To assess this hypothesis, we carried out two 500-ns molecular dynamics simulations of an SH3–SH2 construct including the N-cap fragment visible in the experimental structure of the autoinhibited enzyme (Fig. 1A) (7), and a bias-exchange metadynamics calculation of the free energy landscape of the construct. As illustrated in Figs. 4C and 7A, the results indeed show that the Ncap reshapes the conformational landscape of the tandem so as to favor the on configuration, relative to the off conformer, approximately by a factor of ∼2 (Fig. 4C; Fig. S2C) compared with the tandem alone (Fig. 4A; Fig. S2A). Specifically, the population of the on state in this construct is now ∼20% (±5%), i.e., approximately two times more likely than in the SH3–SH2 construct with no N-cap. The most likely pathway followed by the domains in the transitions between the states is also not identical, although the calculated free energy barrier is largely unchanged (Fig. S3). Fig. 7. Conformational dynamics of the SH3–SH2 tandem, either when bound to WT N-cap (A), with a mutated form of N-cap that readily dissociates from the tandem (B), or to both N-cap and the SH2-kinase linker (C). The trajectory data are presented as in Fig. 6. In A and B, the histograms combine D1/D2 time series for two independent simulation trajectories of 500 ns each, both of which were initiated in the on conformation. A single trajectory was calculated in C. Corbi-Verge et al. Mutations in the SH3–SH2 Connector Influence Assembly Equilibrium. From the data presented thus far and from previous studies (13, 21, 31), it can be inferred that the connector between the SH3 and SH2 domains in tyrosine kinases is key to determining the relative arrangements of these domains in space, rather than being a simple flexible linker. Indeed, our calculated free energy landscapes for the cAbl SH3–SH2 tandem reveal a clear correlation between the two-state dynamics of the tandem (S1 variable Corbi-Verge et al. Fig. 8. Effect of SH3–SH2 connector mutations on the conformational dynamics of the Abl tandem. (A) Analysis of the interaction between the SH2kinase linker and the SH3 domain, via differential scanning calorimetry, for WT and mutated SH3–SH2-kinase linker constructs. (B) Molecular dynamics trajectories of the SH3–SH2 tandem, on mutation of the SH3–SH2 connector. PNAS | Published online August 19, 2013 | E3377 PNAS PLUS in Fig. 4) and alternate, well-defined conformations of the connector (S2 variable in Fig. 4). Experimentally, mutations in this region have been shown to result in increased activation levels in both Src and Abl kinases (6, 28). A plausible interpretation of these observations that has been put forward is that in these mutants the SH3–SH2 unit has a diminished ability to clamp the two lobes of the catalytic domain in the inactive state, even if the complex is assembled (6, 31). An alternative, possibly complementary interpretation is that in the mutants the equilibrium between assembled and disassembled forms of the enzyme is shifted toward the latter, i.e., the uninhibited form (13). To assess this second interpretation, we set out to study the impact of mutations in the Abl SH3–SH2 connector on the ability of the tandem to engage the SH2–KL. The specific residues to be mutated were selected on the basis of Ramachandran plots extracted from the simulations of the SH3–SH2 tandem presented previously (Fig. S6). This analysis shows that the exchange between on and off conformations of the tandem correlates with ϕ/ψ transitions at positions Asn139, Ser140, and Leu141. Thus, two different constructs were studied experimentally and computationally: a triple mutant with Gly residues at these three positions and a single proline mutant at position S140. The triple glycine substitution leads to a significant decrease in the melting temperature of the SH3–SH2–KL construct, by about 3.5 °C, without much change in the overall shape of the thermogram (Fig. 8A). We interpret this shift to reflect an increased entropic penalty on association of the SH3 domain with the KL, shifting the binding equilibrium toward unbound conformations. Consistent with this interpretation, molecular simulations of an SH3–SH2 construct carrying these mutations demonstrate a marked increase in the conformational entropy of the tandem, relative to the WT, although conformations compatible with the engagement of the SH2–KL by the SH3 domain are still significantly populated (Fig. 8B; Fig. S6). The substitution of Ser140 by proline has an even more drastic effect. The thermogram for this construct features two peaks and closely resembles the sum of the thermograms measured for the BIOPHYSICS AND COMPUTATIONAL BIOLOGY In the course of these simulations, the interactions mediated by pSer69 with residues Ser145 and His144 (which is positively charged in this case) in the SH3–SH2 connector are preserved. In a second set of two 500-ns simulations, in which we induced the dissociation of the N-cap region by replacing Ser69 with alanine, the SH3–SH2 tandem departed from the on configuration, adopting predominantly the off conformer (Fig. 7B), consistent with the simulations of the SH3–SH2 construct lacking this N-cap segment (Fig. 2). By contrast, the structural dynamics of the tandem in a construct including both N-cap (WT) and the SH2–KL is very similar to that observed when only the SH2-kinase linker is bound (Fig. 7C). The mechanistic implication of these results is that binding of the N-cap to the SH3–SH2 connector ought to facilitate the engagement of the SH2–KL by the SH3 domain and thus the formation of the autoinhibited complex. This allosteric role, not previously recognized, is in our view not only consistent with the abovementioned functional assays of mutant forms of Abl (28), but also with existing HDX measurements designed to probe the influence of N-cap on the conformational dynamics of the SH3 domain, when in tandem with the SH2 domain (30). Specifically, Chen et al. (30) reported a twofold increase in the unfolding half-life of the SH3 domain (i.e., an approximate twofold decrease in the rate of deuterium incorporation) when the tandem was coexpressed with the SH2–KL. An almost identical shift (1.9-fold) was measured for a construct containing the N-cap region instead. Inclusion of both N-cap and the SH2–KL, however, extended the half-life 4.6 times. This result was interpreted as evidence of noncooperativity between the interactions with Ncap and the SH2–KL; however, our interpretation of this measurement differs. If the HDX measurements are analyzed using a suitable thermodynamic model (SI Text), it can be shown that an increase in the SH3 domain half-life by a factor of 4.6 could actually imply that N-cap enhances the affinity for the SH2–KL by about twofold (Fig. S5). This interpretation would be consistent with the calculated increase in the population of the on state when N-cap is included in our simulations. In summary, our analysis supports a model in which the region of N-cap most proximal to the SH3 domain may bind the SH3– SH2 connector in either of the two main conformers of the tandem, although its affinity for the on conformer is slightly higher. Either way, binding of N-cap introduces a conformational bias in the SH3–SH2 tandem toward the on state, thus relieving the strain associated with the engagement of the SH2–KL, which as mentioned opposes the intrinsic conformational propensity of the tandem. The conformational bias induced by N-cap on the SH3–SH2 tandem is admittedly subtle; however, it should be noted that mutations that disrupt the interaction of N-cap with the SH3–SH2 connector result in kinase activity levels that are only two to six times greater than those of the fully regulated enzyme (7). Thus, we envisage that these mutations diminish the thermodynamic stability of the assembled complex, i.e., they result in an increased population of partially disassembled, and thus uninhibited, Abl. This subtle perturbation of the regulatory mechanism is not negligible; by comparison, impairment of the interaction between the SH3 domain and the SH2–KL, or deletion of the myristoylated N terminus, lead to an approximate eightfold increase in kinase activity (28). Thus, the magnitude of the allosteric effect that we propose for N-cap is, in our view, significant. individual domains, suggesting that the association between the SH3 domain and the SH2–KL is more severely impaired (Fig. 8A). Accordingly, molecular simulations of the tandem reveal that the Ser140Pro mutation induces the tandem to adopt essentially a unique conformation (Fig. 8B) that is apparently incompatible with the engagement of the SH2–KL (the RMSD relative to the on conformer is >6 Å). In summary, DSC and simulation data provide support to the notion that mutations in the SH3–SH2 connector significantly impair one of the necessary intermediate steps in the assembly of the autoinhibited form of Abl, namely the association of the SH2–KL with the regulatory tandem. It is therefore logical to conclude that this impairment accounts, at least in part, for the increased activation levels observed for such mutants (28). Conclusions Modular domains play a central role in the organization and propagation of signals in protein interaction networks. These modules may function as scaffolds to facilitate the colocalization of signaling enzymes and thus contribute to amplify the relay of signals with the necessary specificity (32). In many cases, such as tyrosine kinases and phosphatases, tandems of modular domains also function as intramolecular regulatory units, assembling onto the catalytic components and allosterically inhibiting their mechanisms (33). The emerging paradigm from studies of the structural dynamics of these complexes is that the modular regulatory units have evolved to adopt multiple, well-defined conformations, consistent with their dual functional roles (34). As for other multidomain proteins, the nature of these conformational states seems to be encoded, at least in part, by seemingly nonstructured linkers between individual modules (35); thus, mutations or posttranslational modifications of these linkers often have a significant effect on activity. Here, we showed that the SH3–SH2 tandem of the Abl tyrosine kinase is a dynamic two-state switch, alternating between the well-known inhibitory conformation and another configuration in which both the SH3 domain and the PxxP motifs in the SH2– KL are exposed and that seems to correspond to the uninhibited state, according to available SAXS data. We envisage that this alternate conformer, which is also consistent with an existing crystal structure, is likely to mediate interactions of Abl with other proteins. For example, the so-called Abl interactor protein Abi-2, widely expressed in human tissues, is believed to interact with Abl concurrently via its proline-rich amino terminus and its C-terminal SH3 domain, which would engage the Abl SH3 domain and SH2–KL, respectively (36). Likewise, the SH3 domain of the adaptor protein Crk targets PxxP motifs in Abl (37), while simultaneously, the Abl SH3 domain recognizes a PxxP motif within the Crk SH2 domain (38). Our data also indicate that the specific amino acid sequence of the connector between the SH3 and SH2 domains has evolved to restrict the conformational flexibility of the regulatory unit, so that a well-defined set of conformations is favored; mutations in this connector, therefore, are likely to influence the thermodynamic equilibrium between autoinhibited and uninhibited forms of Abl, as was previously proposed for Src family kinases (13), whose domain architecture is similar to that of Abl. Nevertheless, our simulations reveal subtle differences between Abl and Src kinases. In particular, we find that in Abl, the so-called N-cap complements the SH3–SH2 connector in stabilizing the SH3–SH2 unit in a conformation conducive to the autoinhibited state. This allosteric role is consistent with comparative activity measurements of WT and mutant forms of Abl, as well as with unfolding experiments specifically probing the stabilizing role of the N-cap, according to our own independent analysis of the published data. In summary, we gained detailed structural and thermodynamic information on the molecular mechanism of regulation of a signaling enzyme of significant biomedical importance, E3378 | www.pnas.org/cgi/doi/10.1073/pnas.1303966110 which is also paradigmatic among modular domain proteins. From a methodological standpoint, our study also underscores the potential of computationally distributed, enhanced-sampling simulation methods for the quantitative analysis of conformational exchange processes. We envisage that such methods will surely complement conventional simulation approaches focused on sampling ever-increasing time scales. Methods Unbiased Simulations. Molecular dynamics trajectories were calculated with NAMD 2.7b1 (39) and the CHARMM22/CMAP protein force field (40, 41). The simulation systems (Table S1) were prepared with CHARMM (42). Each of the constructs was immersed in a truncated-octahedral water box, 75 Å in size, which also included 0.15 M KCl and counter ions to neutralize the net charge of the protein. To optimize the protein–solvent interface, each system was energy minimized with harmonic restraints on protein atoms and crystallographic water molecules and subsequently equilibrated via conventional molecular dynamics simulations, with gradually weaker restraints, over 4 ns. All restraints were then released, and the simulations were continued for up to 500 ns per repeat. All trajectories were calculated at 298 K and 1 atm, using a stochastic thermostat/barostat, and periodic boundary conditions. The integration time step was 2 fs. Electrostatic interactions were computed using the Particle-Mesh-Ewald (PME) algorithm with a real-space cutoff distance at 12 Å; the same cutoff distance was used for van der Waals interactions, modeled with a Lennard-Jones function. Processing of SAXS Data. The X-ray scattering data reported in ref. 7 for a deregulated, mutant form of Abl was scanned from the published figure (Fig. 3C, red curve) and used to construct a 3D, low-resolution shape reflecting the most probable conformation of the enzyme. Specifically, we used the simulated annealing procedure in GASBOR (43) to construct 34 alternative shapes consistent with the probability distribution of interatomic distances derived from the scattering data. These shapes were aligned and averaged using DAMAVER (44). The normalized space discrepancy among these shapes is 1.46 ± 0.045, which is only slightly higher than the value originally reported in ref. 7 (1.362 ± 0.032). The final SAXS envelope shown in Fig. 5 was then obtained from the average shape, using DAMFILT. Alternative conformations of the atomic structure of the SH3–SH2-kinase complex were fitted into the envelope using DAMSUP. Free Energy Landscapes. All bias-exchange metadynamics calculations were carried out with GROMACS/PLUMED (45, 46) and the CHARMM22/CMAP protein force field, using analogous simulation systems and conditions as above, except for the introduction of a virtual hydrogen scheme, which enable us to use a time step of 4 fs. In bias-exchange metadynamics, a series of concurrent simulations or replicas are carried out in which the protein is adiabatically driven from one conformer to another, through historydependent biasing forces that oppose sampling of conformations previously explored (47, 48). At a given frequency, attempts are made to exchange the biases accumulated in each replica, using a Metropolis Monte Carlo acceptance criterion, as in other Hamiltonian exchange schemes (49). Effectively, this procedure results in the flattening of the conformational free energy landscape of the molecular system, and therefore, the protein is eventually able to interexchange between the reference states easily, in all replicas. At convergence, the accumulated biases may be combined and transformed into an unbiased probability distribution, i.e., a free energy landscape. Each of the calculations (Table S1) involved 32 simulation replicas and biasing potentials on five collective variables, referred to as D1, D2, and S1–S3. Twelve replicas included a metadynamics bias on S1 and S2; 15 replicas on S1 and S3; and 4 replicas on D1 and D2. The last replica was unbiased. D1 and D2 are pseudodihedral angles defined by the centers-of-mass of the backbone atoms of residues 137, 141, 146, and 150 and residues 134, 137, 141, and 146, respectively (Fig. 1B). S1 and S2 are so-called path collective variables (50), defined in terms of the RMSD values of a given conformation relative to the two alternate structures of the SH3–SH2 tandem, namely those in PDB ID codes 2ABL and 2FO0. Finally, S3 measures the orthogonal distance to the straight path between these two conformations (50). By construction, S1 and S3 monitor the relative orientation of the two domains, each defined by the Cα trace of the regions with secondary structure within these domains; S2 specifically monitors the conformation of the SH3–SH2 connector, defined by the Cα trace of residues 136–145. The normalization factor λ was set to 4 nm−2 for S1 and S2, and to 30 nm−2 for S3. Boundary quadratic potentials were used to restrict S1 and S3 to values between 1 and 2 and S3 to values between 0 and 3 nm2. To avoid systematic errors in the calculated free en- Corbi-Verge et al. DSC. The heat capacities of all samples were measured as a function of temperature with a high-precision differential scanning VP-DSC microcalorimeter (MicroCal). Samples were prepared by extensive dialysis against a large volume of the appropriate buffer (50 mM Pipes, pH 7.0). All DSC experiments were performed at a scan rate of 1.5 K·min−1 using a protein concentration around 0.6 mg·mL−1. Protein samples and reference solutions were properly degassed and carefully loaded into the cell to avoid bubble formation. Thermal denaturation scans were recorded from 5–100 °C. Samples were cooled down inside the calorimeter and reheated to check the reversibility of the unfolding process at each experimental condition. The DSC thermograms were systematically corrected for the time response of the calorimeter and for the instrumental baseline obtained with both calorimeter cells filled with the corresponding dialysis buffer. After normalization for protein concentration, the partial molar heat capacity curves (Cp) were calculated from the resulting thermograms, assuming a value of 0.73 mL·g−1 for the partial specific volume of all proteins. Protein Samples. The Abl SH3 domain was expressed and purified as previously described (27). The full-length Abl-1b gene encoded for Escherichia coli was synthesized and cloned into the pETM-28a plasmid by GeneArt. DNA fragments corresponding to the Abl SH2 domains and to constructs SH3–SH2 (Ser78 to Pro237) and SH3–SH2–KL (Ser78 to Trp253) were subsequently subcloned by Topgenetech into the pETM-11 plasmid (Protein Expression and Purification Core Facility, EMBL), containing an N-terminal 6xHis tag and a tobacco etch virus (TEV) protease cleavage site. SH3–SH2–KL mutants were constructed using the QuikChange site-directed mutagenesis kit from Stratagene. Plasmid-encoded SH2, SH3–SH2, SH3–SH2–KL, and its mutant constructs were expressed in E. coli BL21 (DE3) strain (Novagen). Cells were ACKNOWLEDGMENTS. We thank Dr. José C. Martínez for many helpful discussions. This project was funded in part by Project EXC115 of the German Research Foundation (J.F.G.) and Grants BIO2009-13261-CO2 and BIO201239922-CO2 of the Spanish Ministry of Science and Innovation (to I.L.), as well as by the Fondo Europeo de Desarrollo Regional and Grant CVI-05915 from the Andalusian Government (to I.L.). C.C.-V. and A.Z.-R. were recipients of a Formación de Personal Investigador fellowship from the Spanish Ministry of Science and Innovation. Computing resources were provided in part by the node of the Andalusian Network for Scientific Supercomputing at the University of Granada. Mass spectrometry measurements were performed at the Center of Scientific Instrumentation of the University of Granada. 1. Colicelli J (2010) ABL tyrosine kinases: Evolution of function, regulation, and specificity. Sci Signal 3(139):re6. 2. Wang JY (2000) Regulation of cell death by the Abl tyrosine kinase. Oncogene 19(49): 5643–5650. 3. Raitano AB, Whang YE, Sawyers CL (1997) Signal transduction by wild-type and leukemogenic Abl proteins. Biochim Biophys Acta 1333(3):F201–F216. 4. Ben-Neriah Y, Daley GQ, Mes-Masson AM, Witte ON, Baltimore D (1986) The chronic myelogenous leukemia-specific P210 protein is the product of the bcr/abl hybrid gene. Science 233(4760):212–214. 5. Hantschel O, Superti-Furga G (2004) Regulation of the c-Abl and Bcr-Abl tyrosine kinases. Nat Rev Mol Cell Biol 5(1):33–44. 6. Nagar B, et al. (2003) Structural basis for the autoinhibition of c-Abl tyrosine kinase. Cell 112(6):859–871. 7. Nagar B, et al. (2006) Organization of the SH3-SH2 unit in active and inactive forms of the c-Abl tyrosine kinase. Mol Cell 21(6):787–798. 8. Sicheri F, Kuriyan J (1997) Structures of Src-family tyrosine kinases. Curr Opin Struct Biol 7(6):777–785. 9. Boggon TJ, Eck MJ (2004) Structure and regulation of Src family kinases. Oncogene 23(48):7918–7927. 10. Levinson NM, Seeliger MA, Cole PA, Kuriyan J (2008) Structural basis for the recognition of c-Src by its inactivator Csk. Cell 134(1):124–134. 11. Cowan-Jacob SW, et al. (2005) The crystal structure of a c-Src complex in an active conformation suggests possible steps in c-Src activation. Structure 13(6):861–871. 12. Bernadó P, Pérez Y, Svergun DI, Pons M (2008) Structural characterization of the active and inactive states of Src kinase in solution by small-angle X-ray scattering. J Mol Biol 376(2):492–505. 13. Faraldo-Gómez JD, Roux B (2007) On the importance of a funneled energy landscape for the assembly and regulation of multidomain Src tyrosine kinases. Proc Natl Acad Sci USA 104(34):13643–13648. 14. Barouch-Bentov R, Sauer K (2011) Mechanisms of drug resistance in kinases. Expert Opin Investig Drugs 20(2):153–208. 15. Iacob RE, Zhang J, Gray NS, Engen JR (2011) Allosteric interactions between the myristate- and ATP-site of the Abl kinase. PLoS ONE 6(1):e15929. 16. Lu X-L, Cao X, Liu X-Y, Jiao B-H (2010) Recent progress of Src SH2 and SH3 inhibitors as anticancer agents. Curr Med Chem 17(12):1117–1124. 17. Zhang J, et al. (2010) Targeting Bcr-Abl by combining allosteric with ATP-binding-site inhibitors. Nature 463(7280):501–506. 18. Hantschel O, Grebien F, Superti-Furga G (2011) Targeting allosteric regulatory modules in oncoproteins: “Drugging the undruggable”. Oncotarget 2(11):828–829. 19. Grebien F, et al. (2011) Targeting the SH2-kinase interface in Bcr-Abl inhibits leukemogenesis. Cell 147(2):306–319. 20. Ulmer TS, Werner JM, Campbell ID (2002) SH3-SH2 domain orientation in Src kinases: NMR studies of Fyn. Structure 10(7):901–911. 21. Arold ST, et al. (2001) The role of the Src homology 3-Src homology 2 interface in the regulation of Src kinases. J Biol Chem 276(20):17199–17205. Corbi-Verge et al. PNAS | Published online August 19, 2013 | E3379 PNAS PLUS grown on Luria-Bertani medium at 37 °C. Protein expression was induced at OD 600 nm ∼ 0.6–0.8 with 1 mM isopropyl-D-1-thiogalactopyranoside for 12– 20 h at 37 °C. Cells were resuspended after 10-min centrifugation at 8,346 × g and 4 °C in 50 mM phosphate and 0.3 M NaCl, pH 8.0, buffer [column buffer (CB)] and broken with two passes in a French pressure cell. After 30-min centrifugation at 70,409 × g and 4 °C, the supernatant was loaded onto a 5-mL NiSepharose column (Pharmacia) equilibrated with CB. The protein was eluted with a solution of CB + 500 mM imidazole. Protein-containing fractions were extensively dialyzed against TEV buffer (50 mM Tris·HCl, pH 8.0, 0.5 mM EDTA, and 1 mM DTT) to eliminate imidazole. The His-tag was hydrolyzed by overnight incubation with TEV protease in the presence of 1 mM ditiothreitol at room temperature. The cleaved proteins were recovered by a second chromatography step on a Ni-Sepharose resin (Pharmacia). Protein purity was checked by SDS/PAGE to be >95%. Finally, the identity and purity of the purified proteins were confirmed by matrix-assisted laser desorption/ionization time of flight experiments carried out at the Center of Scientific Instrumentation of the University of Granada. Samples were concentrated to 0.6–0.8 mg·mL−1 in 50 mM Pipes buffer, frozen in liquid nitrogen, and stored at −80 °C. Under these conditions, protein samples were stable for several months. Protein concentration was determined from absorbance measurements at 280 nm using an extinction coefficient of 39,880 M−1·cm−1 for SH3– SH2–KL (19.9 kDa), 31,400 M-1·cm−1 for SH3–SH2 (17.8 kDa), and 16,894 and 17,420 M−1·cm−1 for the SH3 Abl (7.4 kDa) and SH2 Abl (11.4 kDa) domains, respectively. BIOPHYSICS AND COMPUTATIONAL BIOLOGY ergies, a boundary correction scheme was also used at these values, as described previously (51). In the metadynamics simulations that included the Ncap region or the SH2–KL, distance restraints were applied to a subset of residue pairs (or centers-of-mass) to ensure that these remained bound to the SH3–SH2 tandem. The reference value and for each restrain was derived from the unbiased simulations previously carried out for these constructs. For SH3–SH2–KL, we used the following pairs: Pro149 and Trp118/Trp129; Pro242 and Tyr89/Tyr134; and Val244 and Phe91/Pro131. For NCap–SH3–SH2, we used Ser69 and His144; Trp67 and Trp146/Phe168/Val218; and Leu73 and Val218/Trp146. The time-dependent metadynamics bias was progressively developed over the first 100 ns of simulation time per replica (the filling time), in which the height of the biasing-Gaussians, added every 2 ps, was gradually reduced from 0.5 to 0.1 kJ·mol−1. The widths of the biasing Gaussians was, however, constant, namely 0.03 (or 0.05 for NCap–SH3–SH2), 0.07 (0.015), and 0.07 nm2 for S1, S2, and S3, respectively, and 0.3 rad for both D1 and D2. Exchanges between pairs of replica were attempted every 2 ps. On average, the exchange acceptance ratio was ∼30–40% among biased replicas and ∼2–10% between these and the unbiased replica, depending on the construct. The free energy landscapes in Fig. 4 and Fig. S2 were derived from the sampling subsequent to the filling time, namely 106 ns for SH3–SH2, 102 ns for SH3–SH2–KL, and 58 ns for NCap–SH3–SH2, per replica. The derivation followed a methodology previously described (52), using METAGUI (53). Briefly, the weighted histogram analysis method was used to combine the sampling gathered in all replicas and to derive the global, unbiased free energy landscapes. This calculation requires, for each replica, the biased probability distribution of all microstates in collective-variable space, the time-averaged bias potential accumulated during the simulation (after the filling time) on each microstate, and the variance of this average. The latter was defined as the mean-squared difference between two time averages, each spanning one half of the simulation. For a given microstate and a given replica, the larger the variance, the smaller the contribution of that replica to the unbiased probability of that microstate; for computational convenience, a cutoff in the variance of (8 kBT)2 was used in the calculation of the weights. To compute the populations of the on and off states cited in the text, the unbiased probability distribution in S1–S3/D1–D2 was first recalculated in terms of the RMSD with respect to each reference structure, i.e., PDB ID codes 2ABL (RMSD1) and 2FO0 (RMSD2). The probability of the on state is the integral of this 2D function for 0 < RMSD2 < 4 Å and 6 < RMSD1 < 10 Å, whereas for the off state is 0 < RMSD1 < 4 Å and 6 < RMSD2 < 10 Å. Error estimates were computed as described previously (52). 22. Nam HJ, Haser WG, Roberts TM, Frederick CA (1996) Intramolecular interactions of the regulatory domains of the Bcr-Abl kinase reveal a novel control mechanism. Structure 4(9):1105–1114. 23. Fushman D, Xu R, Cowburn D (1999) Direct determination of changes of interdomain orientation on ligation: Use of the orientational dependence of 15N NMR relaxation in Abl SH(32). Biochemistry 38(32):10225–10230. 24. Chen S, Brier S, Smithgall TE, Engen JR (2007) The Abl SH2-kinase linker naturally adopts a conformation competent for SH3 domain binding. Protein Sci 16(4):572–581. 25. Straume M, Freire E (1992) Two-dimensional differential scanning calorimetry: simultaneous resolution of intrinsic protein structural energetics and ligand binding interactions by global linkage analysis. Anal Biochem 203(2):259–268. 26. Luque I, Leavitt SA, Freire E (2002) The linkage between protein folding and functional cooperativity: Two sides of the same coin? Annu Rev Biophys Biomol Struct 31:235–256. 27. Palencia A, Cobos ES, Mateo PL, Martínez JC, Luque I (2004) Thermodynamic dissection of the binding energetics of proline-rich peptides to the Abl-SH3 domain: Implications for rational ligand design. J Mol Biol 336(2):527–537. 28. Hantschel O, et al. (2003) A myristoyl/phosphotyrosine switch regulates c-Abl. Cell 112(6):845–857. 29. Nagar B, et al. (2002) Crystal structures of the kinase domain of c-Abl in complex with the small molecule inhibitors PD173955 and imatinib (STI-571). Cancer Res 62(15): 4236–4243. 30. Chen S, Dumitrescu TP, Smithgall TE, Engen JR (2008) Abl N-terminal cap stabilization of SH3 domain dynamics. Biochemistry 47(21):5795–5803. 31. Young MA, Gonfloni S, Superti-Furga G, Roux B, Kuriyan J (2001) Dynamic coupling between the SH2 and SH3 domains of c-Src and Hck underlies their inactivation by C-terminal tyrosine phosphorylation. Cell 105(1):115–126. 32. Cesareni G (2005) Modular Protein Domains (Wiley-VCH, Weinheim, Germany), p xxii. 33. Superti-Furga G, Barila D, Dorey K, Gonfloni S (1998) Regulation of the SRC and ABL protein tyrosine kinases. FASEB J 12(8):A1324. 34. Bond PJ, Faraldo-Gómez JD (2011) Molecular mechanism of selective recruitment of Syk kinases by the membrane antigen-receptor complex. J Biol Chem 286(29): 25872–25881. lu T, Nussinov R (2011) Dynamic allostery: Linkers are not merely 35. Ma B, Tsai CJ, Halilog flexible. Structure 19(7):907–917. 36. Dai Z, Pendergast AM (1995) Abi-2, a novel SH3-containing protein interacts with the c-Abl tyrosine kinase and modulates c-Abl transforming activity. Genes Dev 9(21): 2569–2582. 37. Antoku S, Saksela K, Rivera GM, Mayer BJ (2008) A crucial role in cell spreading for the interaction of Abl PxxP motifs with Crk and Nck adaptors. J Cell Sci 121(Pt 18): 3071–3082. E3380 | www.pnas.org/cgi/doi/10.1073/pnas.1303966110 38. Donaldson LW, Gish G, Pawson T, Kay LE, Forman-Kay JD (2002) Structure of a regulatory complex involving the Abl SH3 domain, the Crk SH2 domain, and a Crkderived phosphopeptide. Proc Natl Acad Sci USA 99(22):14053–14058. 39. Phillips JC, et al. (2005) Scalable molecular dynamics with NAMD. J Comput Chem 26(16):1781–1802. 40. MacKerell AD, et al. (1998) All-atom empirical potential for molecular modeling and dynamics studies of proteins. J Phys Chem B 102(18):3586–3616. 41. Mackerell AD, Jr., Feig M, Brooks CL, 3rd (2004) Extending the treatment of backbone energetics in protein force fields: Limitations of gas-phase quantum mechanics in reproducing protein conformational distributions in molecular dynamics simulations. J Comput Chem 25(11):1400–1415. 42. Brooks BR, et al. (2009) CHARMM: The biomolecular simulation program. J Comput Chem 30(10):1545–1614. 43. Svergun DI, Petoukhov MV, Koch MH (2001) Determination of domain structure of proteins from X-ray solution scattering. Biophys J 80(6):2946–2953. 44. Volkov VV, Svergun DI (2003) Uniqueness of ab initio shape determination in smallangle scattering. J Appl Cryst 36(3):860–864. 45. Hess B, Kutzner C, van der Spoel D, Lindahl E (2008) GROMACS 4: Algorithms for highly efficient, load-balanced, and scalable molecular simulation. J Chem Theory Comput 4(3):435–447. 46. Bonomi M, Branduardi D, Bussi G, Pietrucci F, Parrinello M (2009) PLUMED: A portable plugin for free-energy calculations with molecular dynamics. Comput Phys Commun 180(10):1961–1972. 47. Piana S, Laio A (2007) A bias-exchange approach to protein folding. J Phys Chem B 111(17):4553–4559. 48. Marinelli F, et al. (2011) Evidence for an allosteric mechanism of substrate release from membrane-transporter accessory binding proteins. Proc Natl Acad Sci USA 108(49):E1285–E1292. 49. Faraldo-Gómez JD, Roux B (2007) Characterization of conformational equilibria through Hamiltonian and temperature replica-exchange simulations: Assessing entropic and environmental effects. J Comput Chem 28(10):1634–1647. 50. Branduardi D, Gervasio FL, Parrinello M (2007) From A to B in free energy space. J Chem Phys 126(5):054103. 51. Crespo Y, Marinelli F, Pietrucci F, Laio A (2010) Metadynamics convergence law in a multidimensional system. Phys Rev E Stat Nonlin Soft Matter Phys 81(5 Pt 2):055701. 52. Marinelli F, Pietrucci F, Laio A, Piana S (2009) A kinetic model of trp-cage folding from multiple biased molecular dynamics simulations. PLOS Comput Biol 5(8):e1000452. 53. Biarnes X, Pietrucci F, Marinelli F, Laio A (2012) METAGUI. A VMD interface for analyzing metadynamics and molecular dynamics simulations. Comput Phys Commun 183(1):203–211. Corbi-Verge et al.