Maestría en Bioinformática. 2009 Tutorial: Estructura de proteínas I) Resumen Con la ayuda de un programa para visualización de estructuras de proteínas (RasWin), se estudia en detalle la estructura de una proteína en particular (proteína de unión a la “caja TATA” o TBP), en complejo con su ligando, una molécula de ADN. La actividad tiene formato de tutorial: el repartido guía a través de la práctica y propone preguntas que deben ser respondidas sobre la base de lo que se observa en la pantalla. El ejercicio se realiza en una clase de 1.5 horas de duración. II) Conocimientos previos importantes Los aminoácidos proteicos tienen un átomo de carbono central unido a un grupo amino, a un grupo carboxilo (ácido) y a una cadena lateral, ésta última diferente para cada uno de los 20 aminoácidos diferentes. Los enlaces peptídicos son químicamente grupos amida, que se forman por la condensación de un grupo amino y uno carboxilo (sombreado en la fórmula debajo). Residuo aminoacídico es “lo que queda” de un aminoácido una vez que está formando enlace(s) peptídico(s). Los enlaces de hidrógeno se forman entre un átomo de hidrógeno con carga parcial positiva (el llamado dador de enlace de H; en general un átomo de H unido a O o N) y un átomo con carga parcial negativa (el llamado aceptor de enlace de H; en general un átomo de O o N). Los grupos amida propios de los enlaces peptídicos tienen tanto dadores como aceptores de enlaces de H, por lo que suelen forman enlaces de H entre sí, como se muestra debajo. La estructura proteica se clasifica en diferentes niveles: primaria (la secuencia aminoacídica), secundaria (las estructuras regulares dadas por enlaces de hidrógeno entre los átomos de los enlaces peptídicos; hélices y hojas plegadas ), terciaria (la conjunción de diferentes elementos de estructura terciaria) y cuaternaria (la asociación entre más de una cadena polipeptídica). Cada hoja (o lámina) plegada está formada por varios segmentos de cadena polipeptídica, a los que se llama hebras de la hoja En la hoja, dos hebras vecinas pueden estar orientadas en la misma dirección yendo de N- a C- terminal (hebras paralelas) o en direcciones opuestas (hebras antiparalelas). Cuando se considera la totalidad de una hoja (ii) todas antiparalelas, o (iii) paralelas y antiparalelas; en el último caso, se habla de una hoja mixta. Las proteínas pueden tener uno o más dominios, cada uno de los cuales es una unidad de plegamiento: un conjunto de elementos de estructura secundaria que dan lugar a una unidad compacta, que se pliega (o sea, alcanza su estructura terciaria) independientemente de otras partes de proteína. Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 1 de 11 Las proteínas se unen a través de conjuntos de interacciones no covalentes (enlaces de hidrógeno, interacciones iónicas, efecto hidrofóbico, fuerzas de Van der Waals) a otras moléculas, llamadas ligandos. La región de una proteína a la que se une un ligando se llama sitio de unión Un nucleótido es una molécula formada por un monosacárido, una base nitrogenada, y uno o más grupos fosfato. Los nucleótidos pueden, por reacciones de condensación, dar cadenas de polinucleótidos, unidas por fosfodiésteres - donde cada fosfato forma dos enlaces fosfo(mono)éster, con dos grupo alcohol (-OH), de dos residuos diferentes de monosacárido. En el caso del ADN los nucleótidos constituyentes se forman a partir del monosacárido desoxirribosa, y las 4 bases presentes son adenina, guanina, timina y citosina (A, G, T y C). El ADN está formado por dos cadenas de polinucleótidos, apareadas entre sí por enlaces de hidrógeno, y enrolladas formando una doble escalera helicoidal, con el esqueleto azúcar fosfato de ambas cadenas hacia el exterior, y las bases nitrogenadas hacia el interior (ocupando lo que serían los “escalones” de la escalera). A pesar de estar hacia el interior de la doble hebra, una parte de cada base en el ADN está expuesta al agua, y por lo tanto disponible para interaccionar con proteínas. Los residuos de azúcar de los nucleótidos poseen polaridad estructural (“una punta es diferente que la otra”), polaridad que le confieren a los polinucleótidos, y a la doble hebra de ADN. La polaridad los polinucleótidos se indica identificando un extremo de la cadena como 5' y el otro como 3' (números que refieren a los átomos de C de la desoxirribosa), y que en el ADN las dos hebras discurren en sentidos opuestos (una en sentido 5'-3' y la otra en sentido 3'-5'). El apareamiento de las bases de ADN a través de enlaces de hidrógeno no es al azar: A siempre se une a T, y C se une a G. En los organismos eucariotas, la expresión de los genes comienza con la unión al ADN de un complejo proteico llamado TFIID. Este complejo no se une a cualquier secuencia de ADN, sino a ciertas secuencias específicas denominadas “cajas TATA”, porque justamente incluyen la subsecuencia “TATA”. Estas cajas TATA se encuentran por lo general al comienzo de los genes. Dentro del complejo TFIID, la subunidad proteica que hace contacto en forma directa con la secuencia de la caja TATA se llama TBP (del inglés “TATA-binding protein”). La unión de la TBP, y luego de todo el complejo TFIID, da lugar a cambios locales en el ADN, que hacen posible la expresión del gen que viene a continuación de esa caja TATA en particular. La estructura que vamos a estudiar Estudiaremos la estructura de la TBP humana unida a un fragmento de ADN correspondiente a la secuencia de la caja TATA. La estructura está detallada, como coordenadas en el espacio para cada átomo, en un archivo del formato “pdb”; el archivo (llamado 1TGH.pdb) está depositado en un banco público que tiene otros miles de archivos de estructuras. Este archivo en particular fue depositado por investigadores de la Rockefeller University en el año 1996. Lo que hicieron estos investigadores fue mezclar una solución acuosa de TBP humana (estrictamente, una parte de la TBP humana recombinante, producida por ingeniería genética) con solución acuosa de un fragmento de ADN de 12 pares de bases de largo, que contiene la secuencia de la caja TATA, de manera que se formara el complejo TBP-ADN en solución. La secuencia considerada como “consenso” de la caja TATA es TATA(A/T)(A/T)(A/T). La secuencia que ellos usaron es CGTATATATACG (en una hebra; en la otra hebra está la secuencia complementaria, lógicamente). La solución usada contenía diversas sales, glicerol, y un agente reductor, en concentraciones tales que facilitaran la formación de cristales a medida que el agua se fuera evaporando muy lentamente – pensemos cuando se evapora el agua de una solución, los solutos (en este caso, el complejo TBP-ADN) pueden pasar a la fase sólida en forma amorfa (con las moléculas y/o iones dispuestos desordenadamente) o en forma cristalina (con las moléculas y/o iones dispuestos regularmente). Los cristales de complejo TBP-ADN fueron puestos bajo un haz de rayos X poderoso. Finalmente, el patrón de difracción de estos rayos X fue interpretado dando la estructura tridimensional cuyas coordenadas están en el archivo. Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 2 de 11 Cuando los investigadores vieron por primera vez (en 1993) la forma de los complejos TBP-ADN, quedaron asombrados por la manera en que la TBP modificaba la estructura del ADN. Programa RasWin (RasMol) Este es un programa para visualizar macromoléculas, relativamente antiguo ya. Emplea archivos con la extensión .pdb ("protein data bank"). Cada uno de estos archivos contiene un conjunto de coordenadas que ubican en el espacio los átomos de una macromolécula (a veces en complejo con otra macromolécula o ligando más pequeño). Estos archivos están disponibles en Internet, en una base de datos donde fueron depositados por los investigadores que determinaron la estructura, generalmente por difracción de rayos X, y a veces por espectroscopía de resonancia magnética nuclear. Actividad a realizar en clase La actividad consiste en explorar la estructura del complejo TBP-ADN. Ud. irá siguiendo las instrucciones y contestando las preguntas con la ayuda de lo que va viendo en la pantalla. Las respuestas las puede ir llenando en la hoja de respuestas que está al final de este documento. Abra el programa RasWin. El programa tiene dos ventanas: una ventana de visualización y una ventana para comandos, que al abrir el programa está minimizada. En la ventana de visualización hay un menú, con diferentes opciones, que se maneja con el ratón (no apriete el botón derecho del ratón, porque hace que el programa se cuelgue). En la ventana de comandos debe teclear instrucciones, seguidas por la tecla "enter". Es bueno verificar que las instrucciones hayan sido aceptadas por el programa: si se comete un error al teclear, el programa responde “unrecognized command” o “no atoms selected”. 1. Panorama general y molécula de ADN Con el menú de la ventana de visualización abra el archivo “1TGH”. Verá las moléculas en la representación "de alambres" (wireframe, en inglés, y en el programa): se representan los enlaces como líneas, y los átomos están en los vértices donde se juntan las líneas. Marcando un punto de la molécula con el ratón, y moviendo éste mientras mantiene apretado, puede hacer girar las moléculas. Ahora la figura está mostrada con el código de colores llamado "CPK": Elemento Color C gris O rojo N azul (*) En muchas estructuras, los átomos de H blanco* hidrógeno no se muestran – pero en la que Ud. P naranja está trabajando, sí. S amarillo Mire ahora las moléculas en otra representación. En el menú de la ventana de visualización, elija “display: ball and stick”. Esto le da el modelo de “bolas y varillas”: las pelotitas son los átomos, y las varillas los enlaces covalentes. Pruebe también "display: sticks”. Este modelo es similar al de “alambres”. Si mira con atención la estructura, lo que más salta a la vista son grupos de átomos en naranja y rojo, dispuestos a intervalos regulares siguiendo dos arcos. Puede ver esto de más cerca: teclee en la ventana de comandos “zoom 200”, seguido de “enter”. 1.1 ¿Qué razona Ud. que son los dos “arcos”? a. hojas plegadas de la TBP b. hélices de la TBP c. esqueletos azúcar-fosfato del ADN d. bases nitrogenadas del ADN e. ninguna de las anteriores El programa funciona aplicando las órdenes que da el usuario solamente al conjunto de átomos que están seleccionados en ese momento. Cuando abrimos el archivo, por defecto están seleccionados todos los átomos. Seleccionemos ahora un conjunto de átomos en particular. Teclee en la ventana de comandos la orden “select HOH”; esto equivale a seleccionar todos los átomos que cumplen con la descripción “HOH”. El programa Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 3 de 11 debería contestar que hay 54 átomos seleccionados. Ahora a los átomos seleccionados les vamos a aplicar una representación que hasta ahora no vimos. Elija en el menú: “display: spacefill”. Esto da el modelo "de llenado de espacio", donde los átomos se representan por sus radios de Van der Waals, es decir por los radios aproximados de sus nubes electrónicas; este es el modelo más realista – el que mejor representa el lugar en el espacio que ocupan los átomos. 1.2 ¿Qué son los grupos de átomos ahora representados con llenado de espacio? a. residuos aminoacídicos b. residuos nucleotídicos c. moléculas de glicerol d. moléculas de agua e. ninguna de las anteriores Teclee ahora "spacefill off": se elimina la representación de bolas, pero solamente para los átomos seleccionados. Otro tipo de orden que se le puede dar al programa es “restrict” (restringir): nos permite seleccionar determinados átomos y al mismo tiempo eliminar a todos los otros de la representación. Vamos a enfocarnos sobre el oligonucleótido de ADN: tecle “restrict DNA” (y “enter”, como siempre). Identifique ahora los grupos fosfato, los anillos de deoxirribosa (con 4 átomos de C y uno de O), y las bases nitrogenadas. Trate de seguir el paso de cada esqueleto de deoxirribosa-fosfato en el espacio. Vamos a comparar la molécula de ADN unida a la TBP con una molécula de ADN “normal”. Para ello, abra la estructura 3DFX (“file: open: 3DFX”). Ahora elimine de la representación la proteína unida al ADN en esta segunda estructura (proteína que no es la TBP, y no nos interesa ahora), tecleando “restrict DNA”. También elija “display: sticks”. Ahora tendrá la molécula de ADN “normal” seleccionada (y por lo tanto “movible” con el ratón), y en el fondo (estática) la molécula de ADN unida a la TBP. 1.3¿Qué tiene de raro la forma de la molécula de ADN unida a la TBP? ¿A qué razona Ud. que se debe esta particularidad? Cierre ahora la segunda estructura (“file: close”), quedándose otra vez sólo con el ADN unido a la TBP. Observe ahora en detalle las bases nitrogenadas: siempre una purina (con dos anillos de C y N) está enfrentada a una pirimidina (con un solo anillo de C y N). Puede identificar sencillamente las bases apretando el botón izquierdo del ratón con el cursor apoyado sobre un átomo, y leyendo luego la identificación que le da el programa en la pantalla de comandos. Por ejemplo: “Atom: N9 432 Group: A8 Chain: C” quiere decir que tocó el átomo número 432, que es el nitrógeno nº 9, perteneciente a la adenina nº 8 en la secuencia, de hebra de ADN identificada en el archivo como “cadena C” (esta herramienta para identificar ya está seleccionada al abrir el programa, pero si no, se la selecciona con “settings: pick ident” en el menú). En este archivo en particular, las cadenas “B” y “C” son las dos hebras de ADN, y la “cadena A” es la proteína (TBP), que ahora no estamos viendo. Pruebe también teclear “show sequence”: el programa le da la secuencia de las tres “cadenas” (de ADN o de proteína) que están presentes; para poder ver toda la respuesta, probablemente tenga que ensanchar la ventana de comandos. Observe que las secuencias de ambas hebras de ADN están escritas de 5’ a 3’. Escriba en un papel la secuencia de la doble hebra (para lo que debe invertir la secuencia de una de las hebras, de forma que quede de 3’ a 5’. Observe que esta secuencia de ADN doble hebra es un palíndromo, es decir que se lee igual en una dirección que la opuesta. Por último, observe que la secuencia de la “cadena A” es de aminoácidos (en código de tres letras), ya que corresponde a la TBP. Vamos a visualizar los enlaces de hidrógeno: teclee “hbonds 20”. Verifique, usando las herramientas indicadas arriba (identificar bases, mostrar secuencias), que lo que Ud. sabía en general se cumple en esta estructura: los pares A-T están unidos por dos enlaces de hidrógeno, y los pares C-G por tres. Recuerde que cada par de bases unido por enlaces de hidrógeno debería formar un plano en el espacio. ¿Es verdad esto para esta estructura? Identifique los pares de bases que forman un plano casi perfecto y los que no. 1.4. Sobre la secuencia del oligonucleótido, marque los pares de bases en los cuales el plano esté claramente distorsionado. Relacione este hecho con su respuesta a la pregunta 1.3. CGTATATATACG GCATATATATGC Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 4 de 11 Veamos ahora la doble hebra de ADN en representación de llenado de espacio. Elija “display: spacefill”. Ahora vamos a agregar a la representación a la TBP. Teclee “select *a” (el asterisco quiere decir “cadena”) y de nuevo elija “display: spacefill”. Para diferenciar fácilmente qué es proteína y qué es ADN, elija “color: monochrome”: ahora tiene la proteína en color todo blanco. Observe la complementariedad de formas de la proteína y su ligando. 2. Molécula de proteína Vamos ahora a estudiar la TBP. Primero saque los enlaces de hidrógeno del ADN (teclee “hbonds off”), y restrinja a la proteína TBP: “restrict *a”. Luego elija “display: backbone”; esta representación muestra el camino que hace en el espacio el esqueleto peptídico principal. Observe con detención cómo se pliega el esqueleto peptídico. ¿Vé segmentos que se pliegan “en tirabuzón”? ¿Vé zonas dónde varios segmentos corren aproximadamente paralelos entre sí? 2.1. ¿A qué nivel estructural corresponden estos plegamientos regulares del esqueleto polipeptídico? a. primario b. secundario c. terciario d. cuaternario El programa puede representar explícitamente la estructura secundaria de las proteínas. Elija “display: cartoons” y también “color: structure”. Observe que además de las hélices (en rosado) y las hojas plegadas (en amarillo) hay zonas en blanco (sin estructura secundaria). 2.2 ¿Cuántas hélices hay en la TBP? Recuerde que las hojas están formadas por varios segmentos de cadena polipeptídica (hebras). 2.3 ¿Cuántas hebras de hoja hay en la TBP? Recuerde también que una hoja es un conjunto de hebras formando un plano (que puede estar torcido en la tercera dimensión) y conectadas lateralmente por enlaces de hidrógeno. Mostremos los enlaces de hidrógeno en la TBP: teclee “hbonds 50”. 2.4 ¿Cuántas hojas hay en la TBP? Recuerde que las hojas pueden ser paralelas o antiparalelas, según las hebras que las componen, tomadas de a pares de hebras vecinas, corran hacia la misma dirección o en direcciones opuestas – o mixtas, si hay pares de hebras vecinas que están paralelos y pares que están antiparalelos. 2.5 ¿Qué tipo(s) de hoja tiene la TBP? Saque los enlaces de hidrógeno: “hbonds off”. Elija “color: group”. Esto le da un “degradé” de color, de azul (amino terminal) a rojo (carboxilo terminal). Siga el paso de la cadena polipeptídica por diferentes elementos de estructura secundaria. 2.6 En los diagramas siguientes, las hebras se representan como flechas blancas, y las hélices como rectángulos grises. ¿Cuál muestra correctamente la estructura de la TBP? a b c N C N d C C N N C Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 5 de 11 3. Interacción proteína-ADN Vuelva a elegir “colour: structure” para la TBP. Vuelva ahora a mostrar la molécula de ADN. Teclee “select DNA” y “spacefill”. 3.1 ¿Con qué elementos estructurales (hélices , hojas , “bucles” sin estructura secundaria) contacta la proteína al ADN? La superficie de contacto entre la TBP y el ADN es muy grande, y las interacciones entre las dos incluyen enlaces iónicos, interacciones hidrofóbicas, fuerzas de Van der Waals, y enlaces de hidrógeno (que desgraciadamente no podemos hacer aparecer en la pantalla como sí podemos mostrar los enlaces de hidrógeno dentro de la molécula de ADN y dentro de la molécula de proteína). Vamos a visualizar algunas de las interacciones entre proteína y ADN. Si Ud. se fija en la tabla de los aminoácidos verá que uno de dos los aminoácidos positivamente cargados es la arginina (Arg). Vamos a seleccionar los residuos arginina de la TBP: teclee “select arg”. Véalas en representación de varillas: “display: sticks” y luego en llenado de espacio “display: spacefill”. La arginina tiene una cadena lateral con un grupo guanidinio (positivamente cargado), que se caracteriza por tres átomos de N unidos al mismo átomo de C; para identificar al grupo guanidinio elija “color CPK”. Para distinguir más claramente a las argininas, píntelas de verde: teclee “color green”. Verá que de todos los residuos de arginina de la proteína, hay sólo 4 que están cercanos a la molécula de ADN: identifíquelos, tocando sobre ellos con botón izquierdo del ratón. 3.2 Los residuos de arginina que hacen contacto con el ADN son los número ....................... 3.3 ¿Con qué parte de la molécula de ADN hacen contacto estos residuos de arginina? a. bases nitrogenadas b. residuos de deoxirribosa c. grupos fosfato 3.4 ¿Qué tipo de interacción razona Ud. que estamos observando? 3.5 Según su razonamiento, la interacción que estamos observando, ¿permite a la TBP distinguir el ADN con la secuencia de la caja TATA de un ADN con otra secuencia? (sí, no, porqué). Saque los residuos de arginina de la representación: “display:cartoons” y “color:structure”. Vamos a seleccionar ahora los residuos del aminoácido fenilalanina (Phe): teclee “select phe”, y elija “display: sticks” y “color: cpk”; vea en la tabla de aminoácidos qué características tiene la fenilalanina. Una vez que ubicó en la estructura a los residuos de fenilalanina, muestre el lugar que realmente ocupan en el espacio “display: spacefill”. Si ahora se le dificulta distinguirlos del ADN, píntelos de verde, tecleando “color green”. 3.6 Hay cuatro residuos de fenilalanina que contactan el ADN. ¿Qué números tienen en la secuencia primaria (siga el mismo procedimiento que para los residuos de arginina antes)? Estos cuatro residuos de fenilalanina interaccionan con las bases del ADN, ayudando a abrir lo que normalmente sería el “surco menor” de la doble hélice, y a torcer al eje de la doble hélice en el espacio. Resalte la adenina 4 de la cadena “C”: teclee “select *c and 4” y luego “color cyan”. 3.7 ¿Cuál de los cuatro residuos de fenilalanina que identificó antes está justo enfrente de la adenina 4?. Ahora resáltelo también este residuo: teclee “select *a and ....” (ponga el número correspondiente en lugar de los puntos suspensivos) y luego “color blue”. 3.8 ¿Cómo se dispone el anillo bencénico de esta fenilalanina en relación al plano del doble anillo de la adenina? a. en un plano perpendicular b. en un plano oblicuo c. en un plano paralelo Esta es una forma común de interacción entre proteína y ADN, que tiene un componente hidrofóbico, y otro de interacción entre “electrones ” (nubes electrónicas presentes por arriba y por debajo de los anillos aromáticos)). Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 6 de 11 Teclee “select dna” y elija “display: sticks”. Luego teclee “select *a” y elija “display: cartoons” y “color : structure”. Ahora vamos a seleccionar la adenina nº6 de la cadena “B”: teclee “select *b and 6”. Y a resaltarla: teclee “spacefill”. Y vamos a seleccionar al residuo de treonina nº 159 de la TBP: teclee “select *a and 159”, y también “spacefill”; y elija “color: cpk”. Observe cómo interaccionan el residuo nucleotídico del ADN y residuo aminoacídico de la proteína. 3.9 El átomo de la adenina que está en contacto con residuo de treonina en la proteína, ¿de qué elemento es (C, O, N, H)? 3.10 El grupo químico del residuo de treonina que está en contacto con la adenina del ADN, ¿qué es? a. amino b. fosfato c. hidroxilo d. carbonilo 3.11 ¿Qué tipo de interacción razona Ud. que estamos viendo, entre la proteína y el ADN? a. iónica b. hidrofóbica c. enlace de hidrógeno d. covalente Nosotros sabemos que las bases del ADN forman enlaces de hidrógeno entre sí. Esta base de adenina no es la excepción. La base apareada con esta adenina es la timina 7 de la “cadena C”. Vamos a seleccionar entonces al par de bases del ADN apareadas, junto con el residuo aminoacídico que hace contacto con una de ellas, la adenina 6. Y vamos a restringir lo que se muestra a estos tres grupos de átomos, para ver claramente. Teclee “restrict *a and 159 or *b and 6 or *c and 7. Y ahora elija “display: sticks”. Si tiene dudas ahora de qué es qué, identifique lo que ve tocando con el ratón, apretando el botón izquierdo. Ahora teclee “hbonds 20” para ver los enlaces de hidrógeno (recuerde que el programa y el archivo tienen la limitación de sólo mostrar los enlaces de hidrógeno dentro de la molécula de proteína y dentro de la molécula de ADN). 3.12 El átomo de la adenina que hace contacto con la treonina de la proteína: ¿participa también en la formación de enlaces de hidrógeno con la timina apareada (sí, no)? 3.13 ¿La TBP precisa abrir totalmente la doble hebra de ADN (es decir, desaparear las bases apareadas) para hacer contacto con las bases del ADN? 3.14 El tipo contacto con el ADN que estamos viendo ahora, junto con otra serie de contactos similares, ¿podría permitir a la TBP distinguir a un segmento de ADN con la secuencia de la caja TATA de segmentos de ADN con otras secuencias (sí, no, porqué)? Antes de terminar, vamos a volver a una perspectiva más general. Primero pinte de verde lo que está seleccionado ahora: teclee “color green”. Luego elija “edit: select all” y también “display: sticks”. Ahora tiene todo el complejo TBP-ADN, más las moléculas de agua. La proteína está en color “estructura” (hélices en rojo, hojas en amarillo) y el ADN en color “cpk”. Y en color verde tiene al par de bases adenina-timina que estamos estudiando y los dos enlaces de hidrógeno que lo unen, así como el residuo proteico de treonina que hace contacto con la adenina. Recuerde que este es uno de muchos contactos con las bases del ADN que hace la TBP. Estos contactos se hacen a lo largo de lo que se denomina el “surco menor” del ADN, que normalmente expone poco de las bases, pero que en este caso, con la distorsión inducida a la doble hebra por el “abrazo” de la proteína, está mucho más abierto. Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 7 de 11 Apéndice: Estructura de los aminoácidos Cadenas laterales básicas Nombre Estructura H2N lisina (Lys o K) H2N O NH2 arginina (Arg o R) O asparagina (Asn o N) OH OH NH NH2 HO NH2 H N H2N Cadenas laterales polares no cargadas Nombre Estructura glutamina (Gln o Q) H2N OH O O O histidina (His o H) OH NH2 OH serina (Ser o S) H2N Cadena lateral ácida Nombre Estructura O OH OH HO NH2 ácido glutámico (Glu o E) O O N HN ácido aspártico (Asp o D) O NH2 treonina (Thr o T) NH2 O HO NH2 HO HO OH O OH O tirosina (Tyr o Y) NH2 O O (continúa en la página siguiente) Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 8 de 11 OH Cadenas laterales no polares Estructura Nombre Nombre Estructura OH O O OH alanina (Ala o A) isoleucina (Ile o I) NH2 NH2 H N valina (Val o V) NH2 O prolina (Pro o P) HO OH O O O leucina (Leu o L) OH triptofano (Trp o W) HO NH2 NH2 Nombre N H Cadenas laterales no polares (cont) Estructura O metionina (Met o M) S HO NH2 O glicina (Gly o G) H2N O cisteína (Cys o C) OH OH H2N SH O fenilalanina (Phe o F) H2N OH Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 9 de 11 Hoja de respuestas del tutorial 1.1 a b c d e 1.2 a b c d e 1.3 .................................................. 1.4. 2.1 CGTATATATACG GCATATATATGC a b c d b c d 2.2 .................. 2.3 .................. 2.4 ................ 2.5 ................. 2.6 a 3.1 ......................................... 3.2 ................... 3.3 a b 3.4 ..................... 3.5 ........................ c 3.6 ...................... 3.7 ........... 3.8 c 3.9 C O N 3.10. a b c d 3.11 a b c d 3.12 sí no 3.13 sí no 3.14 sí no H Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 10 de 11 ESTRUCTURA Y FUNCIÓN PROTEICA La proteína muscular titina, de más de 9000 residuos aminoacídicos y 3 millones de Daltons, es el polipéptido más grande conocido. Se cree que actúa como un elástico que ayuda a que músculo se deforme sin perder su integridad. La titina se compone de unos cien dominios de tipo inmunoglobulina (Ig), provenientes de eventos de duplicación génica a partir de un ancestro común. Cada dominio Ig (uno de ellos mostrado debajo) está formado por 89 residuos aminoacídicos y tiene una longitud de unos 4 nm. La titina posse además otras regiones proteicas también elásticas, que no se consideran para esta pregunta. a. ¿Cuántas hojas plegadas y de cuantas hebras cada una forman el dominio Ig? b. El dominio Ig es más apto para ser insertado en un asa superficial de otro dominio proteico (tipo “plugin”) o para formar estructuras extendidas multidominio? Se sospecha que el comportamiento elástico de la titina se debe al desplegado y replegado de los dominios Ig individuales. Se ensaya esta hipótesis por microscopía de fuerza atómica, que permite tomar una punta de la molécula de titina (que está anclada a algo fijo en su otro extremo) y ejercer sobre ella una fuerza de tracción precisamente determinada, midiendo al mismo tiempo la extensión lograda. Se obtiene por resultado la gráfica en forma de diente de sierra mostrada debajo. Cuando se repite el experimento pero con la proteína puesta en una solución de urea 6 molar (condición desnaturalizante), desaparece el perfil en diente de sierra, y se obtienen extensiones mucho mayores a una fuerza dada. c. ¿Son los datos coherentes con la hipótesis de que el comportamiento elástico de la proteína se debe al desplegado secuencial de dominios Ig individuales? Explique su razonamiento. d. ¿Porqué razona Ud que la fuerza disminuye abruptamente luego de cada pico? e. La extensión para cada supuesto evento de desplegado, ¿es aproximadamente la que Ud esperaría? (En un polipéptido extendido, la distancia entre residuos aminoacídicos contiguos es de aproximadamente 0.34 nm). f. Si se repite el experimento pero con titina tratada con glutaraldehído, que es un agente que entrecruza covalentemente pares de grupos amino (de cadenas laterales) que estén cercanos en la estructura nativa de la proteína, ¿qué tipo de comportamiento espera Ud ver? g. ¿Porqué razona Ud que los picos sucesivos de la gráfica tienden a tener máximos correspondientes a mayor fuerza? Maestría en Bioinformática. Tutorial: Estructura de proteínas. Año 2010. Preparado por A. Díaz. Página 11 de 11