UNIDAD 1: POLÍMEROS BIOLÓGICOS Profesor Mario R. Ermácora Bioquímica de Macromoléculas. Departamento de Ciencia y Tecnología, Universidad Nacional de Quilmes, Roque Sáenz Peña 180, (1876) Bernal, Argentina. Los polímeros sintéticos han revolucionado la vida del hombre con un impacto comparable al dominio del fuego y el desarrollo de la metalurgia. Los polímeros biológicos, por otra parte, son la base estructural de la vida. 1.1 Polímeros lineales y macromoléculas biológicas 1.1.1 Algunas definiciones Los polímeros son macromoléculas formadas por el encadenamiento covalente de un número grande de subunidades monoméricas. Los polímeros son lineales (cada macromolécula tiene sólo dos extremos) o ramificados (mas de dos extremos). Vamos a dejar de lado en esta primera aproximación a los polímeros ramificados. La subunidades monoméricas no pueden existir independientemente como estructuras reales. Se requiere una reacción química para incorporar los precursores a la cadena, por lo tanto la subunidad monomérica en la cadena es químicamente diferente de la molécula que la originó. La reacción de polimerización puede parecer trivial, a veces no es más que una simple deshidratación, pero tiene profundas consecuencias sobre las propiedades fisicoquímicas del polímero. Lamentablemente existe cierta confusión con la nomenclatura. En química de proteínas, se usa el término monómero para describir a la subunidad proteica que interacciona con otra en forma no covalente para formar una estructura cuaternaria. Cuando nos referimos a polímeros en forma general usaremos el término monómero para definir a la subunidad que pierde su identidad química y se une covalentemente a una cadena de subunidades para producir el polímero. Para un polímero lineal la reacción de polimerización puede describirse como: li Mi R1,1–R1,2 ... [–Ri,j ] ... –Ri,m donde: i = 1, 2, ..., n li = m = N0 j = 1, 2, ..., m Mi indica el monómero de tipo i y R indica la subunidad de tipo i que resulta de la polimerización. Ri1 y Rim, lo extremos, son químicamente diferentes entre sí y difieren de sus homólogos en el interior de la cadena. N 0 es el número total de monómeros que reaccionarán para formar el polímero de longitud m. Este número es la sumatoria del número l de unidades del tipo i, sobre todos los tipos de monómeros. Los homopolímeros se forman a partir de sólo un tipo de monómero. Por lo tanto, todas las subunidades en el interior de la cadena son idénticas pero difieren de los dos extremos. En los heteropolímeros hay varios tipos de subunidades y n puede ser un número relativamente grande, como veremos para el caso de las proteínas n=20 y para el caso de los ácidos nucleicos n=4. Homopolímero CRH2CH2-[CRH-CH2](m-2)-CRH-CH3 Heteropolímero NH2CR1HCO–[NH2CRiHCO]–NHCRmHCOOH Fig. 1.1: Dos ejemplos de polímeros lineales ilustran importantes propiedades de la cadena. El homopolímero está compuesto de subunidades idénticas en el interior de la cadena. Si R=H, como en el caso del polietileno, los extremos son indistinguibles y la molécula no tiene polaridad. Como ejemplo de heteropolímero se muestra un polipéptido compuesto de subunidades diferentes. Cada residuo i representa a uno de los 20 residuos de aminoácidos comúnmente encontrados en las proteínas. Cada monómero tiene polaridad y por lo tanto la cadena también la tiene. Nótese la muy diferente naturaleza química de los extremos N y C-terminales, una base y un ácido respectivamente. Los residuos interiores a su vez difieren de los extremos: el ácido y la base forman una amida por eliminación de agua. En la Figura 1.1 se muestran dos ejemplos de polímeros lineales y se indica el origen de la polaridad de ciertos polímeros. El concepto de secuencia aparece aquí por primera vez y está destinado a tener una importancia capital en todas nuestras consideraciones posteriores. Mientras que en el caso del homopolímero lineal del ejemplo es suficiente con especificar el número de monómeros para definir todas las propiedades químicas y físicas de la molécula, el heteropolímero requiere la definición del tipo y el orden de cada residuo. Esta es la base estructural que permite el almacenamiento y la transmisión de la información genética y la variedad de formas de la arquitectura de las macromoléculas. P O2O CH 2 B O O P O2O N CH 2 C R3 B C O O O N C C O N P O2- C R1 C f R2 O O N CH 2 B B O A O 1.2 Diferencias fundamentales entre polímeros sintéticos y macromoléculas biológicas 1.2.1 Algunas propiedades de los polímeros sintéticos No es nuestro interés profundizar en el tema de los polímeros sintéticos. Nos limitaremos a señalar algunas propiedades relevantes en comparación con los polímeros biológicos. El primer aspecto a tener en cuenta es el del origen. Como producto de una reacción química in vitro los polímeros sintéticos no tienen una estructura precisamente definida. Por ejemplo el número de monómeros que componen la cadena no es el mismo para todas las moléculas. Habrá entonces una longitud promedio con una dispersión característica del proceso de obtención. Es conveniente pensar en término del número de moléculas independientes que componen una mezcla de monómeros sometidos a la reacción de polimerización. A tiempo cero, la mezcla estará compuesta exclusivamente de monómeros. Una manera de determinar el número de estos monómeros es determinar químicamente los grupos funcionales que se pierden al polimerizar. Supongamos que estamos polimerizando la siguiente molécula en una reacción de esterificación para dar el poliester correspondiente por simple deshidratación: HO–CR–COOHHO–CR–CO[O–CR–CO]m-2–CR–COOH Supongamos también, como ocurre en muchos casos, que la reactividad de los grupos no cambia significativamente al estar incorporados a una cadena creciente. Obviamente no obtendremos una única cadena conteniendo el número total, N0, de monómeros originalmente presentes. Por el contrario, se obtendrán múltiples cadenas de diferente longitud. ¿Cuál es la manera de conocer algunas de las propiedades de esa distribución de longitudes a medida que la reacción progresa? Por ejemplo ¿Cuál es el grado de polimerización medio, o el m promedio? Debemos definir primero el grado de progreso de la reacción, p, como la fracción de grupos terminales que reaccionaron a un tiempo dado. De la misma manera (1-p) es la fracción de grupos terminales que aun faltan reaccionar. Como cada molécula independiente tendrá un grupo terminal independientemente de su longitud, 1-p es también la fracción de moléculas independientes a cada tiempo. N0(1-p) es el número de moléculas independientes a cada tiempo. Por lo tanto si distribuimos (dividimos) el número de monómeros presentes a tiempo cero sobre el número de moléculas independientes a cada tiempo tendremos el número promedio de subunidades, monómeros o residuos incorporados en las cadenas. Matemáticamente, N0/[N0(1-p)]= 1/(1-p). Esto quiere decir que si la reacción se completa en un 90% la longitud media de las cadenas será de 10 residuos. Si transcurre en un 99%, 100. Y así sucesivamente. No intentaremos demostrarlo aquí, los interesados pueden consultarlo en la bibliografía original, pero es posible calcular en forma muy sencilla cuál es la probabilidad de que un monómero forme parte de una molécula de longitud determinada, con lo que se conocerá la distribución de tamaños en la mezcla para cada grado de polimerización. Los heteropolímeros pueden tratarse de la misma manera si se hace abstracción de las diferencias entre monómeros. Pero debe tenerse presente que se generará un producto heterogéneo en el cual cada molécula difiere de otra en el número de monómeros y además en la secuencia, composición y en las dimensiones. La estructura tridimensional de los homo y hetero polímeros será variable. Cada tipo de polímero sintético se ubicará claramente en una de las siguientes categorías: estructuras sin orden evidente y siempre cambiantes o estructuras altamente periódicas. Por el momento baste con definir periodicidad como la posibilidad de conocer la ubicación en el espacio de los monómeros a partir de simples operaciones matemáticas. Por ejemplo una simple fórmula matemática define la posición de todos los elementos que constituyen una hélice o las hebras de una fibra. Esta dualidad entre orden y desorden o entre periodicidad y aperiodicidad puede explicarse a partir de consideraciones termodinámicas y estereoquímicas. La sencillez de muchos homopolímeros (y heteropolímeros compuestos de dos o unas pocas subunidades diferentes) hace que sea fácil optimizar interacciones entre elementos de la cadena, y entre estos y el solvente si lo hubiera, de manera de superar el alto costo entrópico de ordenar estas macroestructuras. Por otra parte restricciones estéricas importantes producen estructuras aperiódicas en la escala de la cadena y el resultado es un polímero de estructura al azar y siempre cambiante. Estas consideraciones nos introducen a un concepto cuya importancia se empezó a notar sólo recientemente: el grado de ‘frustración’ conformacional de polímeros. Una forma de definir este concepto es representar la distribución de energías para las conformaciones accesibles al polímero. Un polímero tiene alta frustración conformacional cuando puede plegarse en numerosas conformaciones de energía semejante. Por el contrario, cuando sólo existen unas pocas conformaciones que tienen energías mucho menores que el conjunto de las conformaciones posibles, se habla de bajo grado de frustración. Alternativamente, se puede pensar la frustración como la imposibilidad para un polímero de satisfacer simultáneamente todas las interacciones intramoleculares y al mismo tiempo evitar las desfavorables. Los polímeros que adquieren estructuras altamente periódicas tienen bajo grado de frustración. Las proteínas ‘naturales’ (que tienen baja periodicidad como veremos más adelante) son un conjunto de polipétidos que adquirieron por evolución la habilidad de plegarse en una conformación definida tienen también baja frustración. 1.2.2 Distintos tipos de polímeros biológicos Vamos a clasificar los polímeros biológicos en tres grandes categorías. Las proteínas, los ácidos nucleicos y los polisacáridos. Comenzaremos con los polisacáridos que se asemejan en mayor grado a los polímeros sintéticos. Son moléculas lineales (celulosa, amilosa) o ramificadas (glucógeno). No tienen longitud constante y en algunos casos tampoco composición constante. Suelen formar estructuras periódicas normalmente hélices de distinto paso y cintas que se agrupan formando fibras o glóbulos. No nos detendremos aquí en los detalles químicos y estructurales de la enorme variedad de polímeros en cuya composición intervienen azúcares junto a otras moléculas. No existe una estructura única o específica para cada uno de ellos y a pesar de su periodicidad deben ser estudiados como estructuras promedio. Todos estos polímeros parecen tener sólo una función mecánica o de almacenamiento. Para estas funciones la periodicidad es la gran virtud y no molestan mucho las heterogeneidades locales. Los ácidos nucleicos nos introducen en un mundo nuevo. Aquí la fidelidad a una secuencia es la regla. Están absolutamente desaconsejados los cambios. La función de macromolécula que almacena información requiere gran precisión. El mecanismo de síntesis enzimática de estas macromoléculas incorpora mecanismos de corrección para asegurar la fidelidad. Esencialmente hay sólo cuatro tipos de monómeros que difieren solo en la base purina o pirimidina que se une a nucleósidos idénticos. Las propiedades químicas de estas bases son muy semejantes en cuanto a su solubilidad en agua y falta de carga a pH fisiológico. Difieren en tamaño las purinas y pirimidinas y en la capacidad dadora y aceptora de enlaces hidrógeno. Esta similitud global hace que la cadena de DNA se parezca mucho a un homopolímero. De allí su fuerte tendencia a formar una estructura altamente periódica. La propiedad de formar puentes de hidrógeno específicos entre A-T (o A-U) y entre G-C también introduce un alto grado de orden. Esta es la razón por la cual la estructura global del DNA, la doble hélice de Watson y Crick, se dedujo muy tempranamente a partir de los patrones de difracción de las primeras fibras de DNA analizadas. Como veremos mas adelante, miles de mapas de difracción de proteínas estudiadas hasta la fecha no produjeron aún una teoría general del plegamiento de las proteínas. El DNA no se encuentra aislado en casi ninguna circunstancia. Normalmente está revestido de proteínas formando complejos nucleoproteícos. Muchas de esas proteínas cambian la estructura tridimensional de segmentos del DNA. No tiene mucho sentido hablar de la estructura tridimensional del DNA aislado de sus interacciones con otras macromoléculas. Las proteínas son polímeros misteriosos. Ahora que conocemos la estructura tridimensional de más de mil proteínas, toda su fascinación y misterios surgen ante nosotros. Estas moléculas tienen un grado muy bajo de periodicidad y orden interno. No obstante su estructura es absolutamente específica. Además, el grado de complejidad de su arquitectura es tal que es muy difícil generalizar motivos tridimensionales simples que actúen como bloques comunes en su construcción. Es verdad que las proteínas suelen mostrar hélices y láminas en su estructura. Pero estas cortas estructuras periódicas no se relacionan entre sí mediante operaciones geométricas sencillas. Aparecen a lo largo de la cadena y surcan el espacio como surgidas de la imaginación de algún artista. Está firmemente establecido que la secuencia de aminoácidos es un código en el que están escritas en forma unidimensional las especificaciones del objeto tridimensional final. Ese código nos es desconocido y si bien podemos comprender algunas de sus palabras, como veremos más adelante, todavía no podemos leer el mensaje completo y predecir la apariencia más probable de la estructura a partir de su secuencia. Es decir que las proteínas se destacan claramente de otros polímeros. Sus estructuras tridimensionales no son al azar ni tampoco son altamente regulares. La razón mas probable de esta enorme plasticidad en la forma de cada proteína es la existencia de 20 residuos de aminoácido diferentes. El número de combinaciones posibles para un polímero lineal de 20 monómeros diferentes es astronómico. ¡Para una longitud de 100 residuos son posibles 20100 o 10130 combinaciones! Y esta estimación solo hace referencia a la secuencia. La variedad potencial en la geometría de la cadena es aun mayor. Por otra parte, si bien es posible clasificar a los aminoácidos en dos grandes grupos, como polares y no polares, cada uno de los 20 aminoácidos tiene características que lo distinguen claramente de la mayor parte de los demás. Hay residuos ácidos básicos, polares no cargados, voluminosos, no voluminosos, aromáticos, no aromáticos, etc. En verdad, la clasificación de los residuos de aminoácidos mediante criterios fisicoquímicos mantuvo (y mantiene) ocupados a los científicos por mucho tiempo. Hay otro aspecto que separa las proteínas biológicas de los demás polímeros. Las proteínas han evolucionado y el conjunto de estructuras existentes combina la especificidad geométrica con la función de autoensamblado eficiente. En otras palabras, la rica variedad de detalles estructurales en las proteínas se forman rápida y eficientemente, en el término de segundos en la célula, siguiendo instrucciones embebidas en la secuencia. De acuerdo a estimaciones optimistas, una tabla descriptiva de todas las formas globales de plegamiento encontradas o supuestas para las proteínas tendría aproximadamente 1000 entradas. Con esa tabla sería posible clasificar cada nueva estructura de Rayos X descripta en un grupo preexistente. Aún así la estructura real diferiría en detalle de la del grupo asignado. Nos ocuparemos de la estructura proteica de una forma mucho mas rigurosa más adelante. ¿Cuál es la necesidad biológica de tanta variedad en la estructura? Una vez más la respuesta debe buscarse en la función. Toda proteína tiene una función específica. Eso significa acción. Las proteínas pueden ser vistas como herramientas. La variedad es una virtud para las herramientas. Así, a mucha variedad de tareas le corresponde mucha variedad de herramientas. 1.3 Conformación de macromoléculas biológicas Vamos a usar el término conformacíon para definir la estructura tridimensional de una macromolécula o de parte de ella. La conformación se especifica como una lista de las coordenadas espaciales x, y, z de cada átomo que compone la estructura considerada. Conformación debe distinguirse cuidadosamente del término configuración que hace referencia a los isómeros surgidos de la existencia de átomos quirales. Un ejemplo de diferente configuración para un átomo de carbono se muestra en la Figura 1.4. La única manera de interconvertir dos isómeros configuracionales es mediante la ruptura de enlaces covalentes. Por lo tanto no hay interconversión configuracional en los polímeros biológicos. Por ejemplo, sólo L-aminoácidos y D-azucares forman el esqueleto de proteínas y ácidos nucleicos respectivamente. H OH H H COOH COOH HO H CH3 CH3 NH2 NH2 Isómero de L-threonina no presente en las proteínas (configuración L en el carbono beta) L-threonina (configuración D en el carbono beta) H CH3 H H COOH COOH HO H5C2 H CH3 NH2 L-isoleucina (configuración L en el carbono beta) NH2 Isómero de L-isoleucina no presente en las proteínas (configuración D en el carbono beta) Fig. 1.4: Configuración del carbono de los residuos treonina e isoleucina. Nótese que las moléculas no pueden ser superpuestas a menos que se rompan enlaces covalentes. Todo cambio en la conformación de macromoléculas normalmente surge por rotación de átomos a través de enlaces simples . A temperatura ambiente la longitud de los enlaces y los ángulos de valencia fluctúan con pequeñas variaciones alrededor de un mínimo energético. Así, una definición absoluta de la posición de cada átomo no es posible. Por lo tanto cuando se define una conformación o un estado conformacional se toma la posición promedio o más probable de los átomos considerados y se aceptan como conformaciones diferentes a las que se distinguen claramente en términos geométricos. Operativamente esto se hace estableciendo un límite arbitrario a las diferencias en las posiciones de los átomos o en los ángulos de enlace entre ellos. albúm ina 67 kDa Hem oglobina 68 kDa fibrinógeno 400 kDa gam a globulina 160 kDa Fig. 1.5: Imagen global de la estructura proteica hacia 1950. 1.4 Aspectos estructurales de la función biológica Los ácidos nucleicos y proteínas cumplen una función biológica específica para la cual adquieren una estructura específica. Muchas veces el investigador se encuentra con el problema de establecer cuál es la función biológica de una de estas macromoléculas o en caso de conocerla de entender como esta se lleva a cabo. En estos casos el análisis de la estructura tridimensional es el método más fértil para encontrar las respuestas. Por supuesto se trabaja también con modelos previos a los datos estructurales y estos a veces orientan el estudio específico de la estructura tridimensional. Es muy común ver esquemas con esferas que interactúan o figuras geométricas que se acoplan entre sí para esquematizar la interacción de dos macromóléculas. A decir verdad, hacia los años 50, todo lo que se podía decir acerca de la estructura de algunas proteína cabía en un esquema como el que se muestra en la Figura 1.5. A medida que se obtuvieron cristales adecuados para estudios de rayos X y se estableció el método cristalográfico para determinar las coordenadas atómicas de las macromoléculas se pudo avanzar hacia modelos más realistas. Se pudo relacionar entonces la estructura con la función sobre una base fisicoquímica. Conceptos como el de binding, alosterismo y catálisis cobraron vida y salieron de los simples esquemas sobre el papel para convertirse en objetos extremadamente complejos que funcionan siguiendo reglas precisas y leyes generales. Esta relación, un tanto obvia entre la estructura y la función no es la que nos interesa en este momento. Vamos a ver otras propiedades globales de las macromoléculas que se relaciónan indirectamente con la función. Nuevamente, nos limitaremos a las proteínas y los ácidos nucleicos. La primera propiedad es la inestabilidad intrínseca de estas estructuras. Luego de los cursos de biología molecular y bioquímica que ustedes han tomado no necesito convencerlos de que cada molécula de proteína y los ácidos nucleico pasa durante su existencia por innumerables cambios en su conformación. Una doble cadena de DNA debe desenrollarse localmente para permitir la transcripción. Las proteínas se despliegan para pasar membranas y llegar a sus organelas de residencia. Las enzimas cambian su conformación durante la catálisis, etc. El concepto que surge aquí es que una estructura debe ser por un lado específica y precisamente definida. Por otro lado esa misma estructura debe ser plástica y maleable para adaptarse a los cambios estructurales frecuentes a lo largo de su vida. A diferencia de los polisacáridos y otros polímeros con funciones mecánicas o de relleno, los ácidos nucleicos y las proteínas deben ser estructuralmente inestables. Las enzimas necesitan flexibilidad para funcionar y al mismo tiempo precisión en su estructura. También deben resistir condiciones químicas adversas y adaptarse a cambios en la composición de las soluciones en que se encuentran. Las proteínas deben ser degradables y recambiarse rápidamente para adaptarse a las necesidades de las células. Las proteínas deben además ser objetos capaces de evolucionar para conferir ventajas adaptativas. Los ácidos nucléicos deben ser quimicamente estables pero deben permitir la evolución y además ser conformacionalmente flexibles para actuar como moldes. Deben además soportar su propio gigantismo como archivos químicos. Es decir deben ser ágiles para no fragmentarse durante su función. Por último, y a diferencia de las proteínas, deben ser modulares para poder repararse en caso de daño químico. Imaginemos ahora que solicitamos ahora a arquitectos a ingenieros que diseñen y construyan objetos tridimensionales que cumplan las especificaciones dadas mas arriba. La tarea excede no solo nuestra capacidad sino nuestra imaginación. 1.5 Introducción al estudio conformacional de macromoléculas No nos vamos a ocupar del estudio de polímeros sólidos porque por el momento no son relevantes para los objetivos de este curso. Aunque hay que mencionar que por ejemplo a veces se recurre al estudio de películas deshidratadas de proteínas y acidos nucléicos para comprender mejor la estructura de estos polímeros. Cuando se estudian polímeros sintéticos el objetivo fundamental es determinar sus propiedades globales como objetos en el seno de un líquido. Hay dos casos: a) moléculas altamente regulares que estan formadas de motivos discretos que se repiten en el espacio. b) conglomerado conformacional esencialmente al azar. En ambos casos cada molécula difiere de la otra en su conformación, en sus dimensiones o en ambos aspectos. Se busca conocer las dimensiones promedio y se trabaja con conceptos tales como volumen macromolecular, radio de giro y distancia end to end. Las técnicas disponibles permiten deducir estos parámetros a partir de mediciones ópticas o de propiedades físicas como viscosidad de las soluciones o velocidad de sedimentación. Adicionalmente se busca conocer las pautas geométricas que pueden ser importantes para fines específicos. Por ejemplo una matriz cromatográfica puede estar formada por partículas esféricas de unos cientos de micrones de diámetro. Esas partículas pueden estar formadas por un gran número de moléculas entrecruzadas que forman cavidades de dimensiones regulares que pueden actuar como tamices moleculares. Conocer las propiedades de esas cavidades puede ser un importante objetivo tecnológico. Cuando se estudian polímeros biológicos hay que hacer diferencias. Si se trata de materiales importantes por sus propiedades mecánicas, como los polímeros de relleno de tejidos o paredes celulares, muchas de las consideraciones vistas más arriba tienen validez. Si se trata de DNA, el cual pertenece a los polímeros informacionales, de composición y secuencia absolutamente definida, es absolutamente imprescindible conocer la secuencia. Por eso existen mega emprendimientos dirigidos a secuenciar el mayor número posible de genomas. La forma y la geometría de toda la molécula son menos importantes, sin embargo como se trata de objetos muy alargados con un alto grado de orden interno todavía se puede aprender mucho de ellos estudiando sus motivos repetitivos. Por último, en el caso del DNA es necesario conocer la geometría detallada de los sitio de interacción con proteínas. Se aplican entonces los mismos criterios que se usan para proteínas y que se discutirán ahora. Cada proteína es un objeto único, no regular. Su conformación no puede ser estudiada por partes. De allí la frustración cuando no se dispone mas que de información promedio sobre ellas. No sirve de mucho, para entender como funciona una proteína, conocer su contenido de -hélice o su volumen. Se requiere una descripción detallada de todos sus átomos en el espacio. Por eso si bién se usan todas las técnicas mencionadas más arriba, se tiene finalmente que llegar a la determinación de la estructura por técnicas de difracción de rayos X o the RMN. Estas técnicas se verán más adelante. Ahora baste decir que para determinar la cristalográfica de una proteína pueden requerirse años de trabajo un resultado frecuente es todavía el fracaso. Hasta la fecha se conocen aproximadamente unas mil estructuras no redundantes que son el resultado de un esfuerzo de cuarenta anõs. La mayor parte de ellas se resolvieron en los últimos diez años. La técnica de RMN si bién avanza a pasos agigantados es demasiado compleja para proteínas de más de cien residuos. La computación o cálculo de la estructura de una proteína a partir de la secuencia y de principios fundamentales es la solución lógica de la imperiosa necesidad de conocer la estructura de todas las proteínas biológicamente relevantes. Este problema ha ido reclutando el esfuerzo de las mentes mas brillantes de la biología, la física y la química. Se ha erigido en el último gran problema a resolver de la biofísica. y se le conoce como el problema del plegamiento. Este problema es el eje conductor de el curso que acabamos de iniciar.