Francisco Javier Acosta-Reyes Departament d’Enginyeria Química, Universitat Politècnica de Catalunya, Barcelona, España. Doctorado en Polímeros y Biopolímeros Contacto: francisco.javier.acosta@upc.edu, http://macrom.upc.edu/ INTERACCIÓN DE ADN RICO EN ADENINAS Y TIMINAS CON DROGAS Abstract El estudio de estructural a nivel atómico del ADN resulta de gran interés, en particular para secuencias ricas en adeninas y timinas (ATs), ya que estas constituyen principalmente regiones no codificantes etiquetadas inicialmente como ADN basura, pero que recientemente se ha descrito que desempeñan un papel importante mediante funciones de regulación y estructurales. En nuestra investigación nos hemos enfocado en las interacciones entre ADN rico en ATs y drogas (fármacos experimentales). Recientemente hemos determinado la estructura del octámero A4T4 con la droga 4.4’-Bis(imidazolinilamino)difenilamina, un agente antiparasitario en fase de pruebas contra la tripanosomiasis y la malaria. Esta droga interactúa con el surco estrecho de ADN con especificidad por secuencias AATT y AAAA. Uno de los principales objetivos del estudio de las interacciones entre drogas y ADN es la identificación de potenciales drogas contra enfermedades especificas o anticancerígenas. En nuestro caso es contra enfermedades relegadas en la búsqueda de curas, por ser predominantes en países en vías de desarrollo. Como es el caso de la tripanosomiasis africana o la malaria que es provocada por el Plasmodium falsiparum cuyo genoma presenta un contenido de 80% de ATs, lo que lo convierte en una diana perfecta para nuestros estudios. Siendo México uno de los países Americanos con presencia de malaria o paludismo, según se ha reportado en el “World Malaria Report 2012” por el “World Health Organization”. Así mismo identificar las particularidades estructurales que permiten la interacción entre una droga y una secuencia especifica de ADN podría permitir en el futuro un diseño mas racionalizado de las drogas para poder combatir enfermedades especificas y disminuir efectos colaterales de las actuales. En general, con el auge que tiene el ADN en aplicaciones biotecnológicas, ciencias genómicas y medicina genómica, resulta necesaria un mayor profundización sobre el conocimiento estructural del ADN. Por medio de esta línea de investigación se estaría aportando tanto conocimiento de ciencia básica, como atacando problemas de carácter e interés mundial como es el cáncer, aplicaciones biotecnológicas y genómicas, pero también los de carácter local en enfermedades particulares de México. Introducción El descubrimiento del ADN, su estructura y su función es probablemente el descubrimiento biológico más significativo del siglo XX debido a su alto impacto en la ciencia y la medicina. Con la propuesta de un modelo estructural de la doble hélice, con bases apareadas hacia el centro (Watson and Crick) se logra explicar tanto propiedades físicas como biológicas que antes era imposible. Con esto se marcan las pautas que después abrirían paso al desarrollo de ciencias como la biología molecular, la genética y la relación que estas guardan entre sí y con la bioquímica. Conocer las particularidades en la estructura tridimensional de diferentes secuencias de ADN nos permitirá explicar e interpretar de mejor manera el proceso de interacción que genera el ADN para llevar a cabo sus diversas funciones. El ADN, o ácido desoxirribonucleico, por definición es un Biopolímero cuyas unidades repetitivas son nucleótidos y que constituye el material genético de las células y en su secuencia contiene la información para la síntesis de proteínas. Aunque cada unidad de repetición individual es muy pequeña, pueden ser moléculas muy grandes que contienen millones de nucleótidos (como cromosomas). En los organismos vivos, el ADN no suele existir como una molécula individual, sino que se entrelazan dos cadenas largas en la forma de una doble hélice (Fig. 1). Una base ligada a un azúcar se denomina nucleósido y una base ligada a un azúcar y uno o más grupos fosfato se llama un nucleótido. Si varios nucleótidos están unidos entre sí, como en el ADN, este polímero se denomina oligonucleótido. Oligonucleótido Nucleótidos Figura 1. Doble hélice de ADN tipo B formada por las cadenas entrelazadas [PDB-ID: 1ENN]. Niveles estructurales del ADN La estructura primaria (Fig. 2-a) del ADN está definida por la secuencia de nucleótidos que componen una cadena de ADN. El orden de los nucleótidos en esta secuencia guarda toda la información genética y a su vez determina la posibilidad de apareamiento con otra cadena de secuencia complementaria que generará su estructura secundaria. La estructura secundaria (Fig. 2-b) corresponde a las características de una cadena de doble hélice, dextrógira o levógira, según el tipo de ADN. Con dos cadenas antiparalelas, pues el extremo 3´ de una se enfrenta al extremo 5´ de su homóloga. Existen varios tipos de conformaciones del ADN; las formas A, B, C, D y Z. La estructura terciaria (Fig. 2-c) esta referida a la forma en la que se almacena el ADN en un espacio, para la formación de los cromosomas o en su interacción con proteínas. La realización de este proyecto esta mas centrada en el análisis de la estructura secundaria, cuales son sus modificaciones y características al interactuar con drogas o fármacos y también de secuencias con interés particular. a) b) c) Figura 2. a) Estructura primaria definida por la secuencia, b) estructura secundaria definida por la doble hélice y c) estructura terciaria definida por la conformación que adopta el ADN en un espacio dado, como en la formación de un nucleosoma [PDB-ID: 1AOI ] Interacción del ADN con drogas La trascripción y la replicación son procesos vitales para la supervivencia y proliferación de células, así como para el funcionamiento de sus procesos. El ADN comienza su transcripción o replicación solo cuando recibe la señalización necesaria, la cual a menudo es la unión de una proteína reguladora a una región especifica de ADN. Esta actividad de reconocimiento específico puede ser mimetizada por pequeñas moléculas, con lo que las funciones del ADN pueden ser artificialmente moduladas, ya sea inhibiéndoles o activándoles. Estas pequeñas moléculas ya sean sintéticas o naturales pueden actuar como un fármaco mediante la inhibición o activación de una función del ADN, para curar o controlar una enfermedad. Dependiendo del sitio objetivo de la droga (secuencia objetivo), se podría dar activación de una región especifica que podría producir mayores cantidades de una proteína requerida, o bien restringir la síntesis de una proteína, la replicación o inducir la muerte celular. En este modo de inhibición se prevén aplicaciones para la destrucción de células, como antitumorales o antibióticos. Las drogas pueden unirse al ADN de manera covalente y no-covalente (Sheng, Gan and Huang). La unión covalente con el ADN es irreversible e invariablemente conduce a una inhibición completa de los procesos del ADN y subsecuentemente a la muerte celular. Un ejemplo de una droga de unión covalente es el Cis-platin usado como fármaco anticancerígeno, el cual genera una retícula entre las cadenas con la unión de los cloros a los nitrógenos de las bases del ADN. La unión no-covalente de drogas con el ADN puede darse en las dos siguientes formas: • ¨Minor groove binders¨ (Bailly and Chaires; Moreno et al.). Este tipo de drogas aprovechan la forma del surco estrecho para acoplarse a él y generan interacciones tipo van der Waals para su unión. Adicionalmente, estas drogas pueden formar enlaces de hidrogeno con las bases, preferentemente con el N3 de la adenina y el O2 de la timina. La mayor parte de las drogas de unión al surco menor tienen una preferencia por secuencias ricas en A-T, la cual se puede deber a una mejor interacción por fuerzas de van der Waals, debido a que el surco menor en las zonas A-T es más estrecho que en las zonas C-G, y también debido al impedimento estérico generado por el grupo amino del C2 de la guanina. Sin embargo algunas poliaminas sintéticas como lexitropsinas e imidazol-pyrrol han sido diseñadas para unirse específicamente al surco menor de regiones C-G (Goodsell et al.). • Intercaladores (Baguley; Valls et al.). Este tipo de drogas contienen grupos heterocíclicos planares que se intercalan a los pares de bases. El complejo se estabiliza por medio de las interacciones π-π del apilamiento de las bases y la droga. Los intercaladores inducen fuertes perturbaciones estructurales en el ADN. La unión no-covalente es reversible y preferida a la covalente, debido a que esta última al interactuar, si no hay una especificidad perfecta la droga, se puede unir a sitios no deseados y quedarse ahí inamovible generando efectos colaterales o tóxicos. Aun así la alta fuerza de enlace en la unión covalente es una de sus mayores ventajas. Por esto permanece como un gran reto el diseño de nuevas drogas que interactúen con el ADN. a) b) c) Figura 3 Ejemplos de unión droga – ADN [PDB ID]. a) complejo ADN con minor groove binder, Pentamidina [3EY0]. b) complejo ADN con un intercalador, derivado de antraquinona [1XCS]. c) ADN unido covalentemente al cisplatin [1AU5]. Nuestra investigación esta dirigida principalmente al estudio de minor groove binders selectivos a secuencias ricas en adeninas y timinas, las cuales son mas abundantes en regiones de ADN no codificante. El ADN no codificante El ADN del genoma de un organismo puede dividirse conceptualmente en dos: el que codifica las proteínas (los genes), y el que no codifica. En muchas especies, sólo una pequeña fracción del genoma codifica proteínas. Por ejemplo, sólo alrededor del 1,5% del genoma humano consiste en exones que codifican proteínas (20.000 a 25.000 genes), mientras que más del 90% consiste en ADN no codificante (Wolfsberg, McEntyre and Schuler). El ADN no codificante (también denominado ADN basura) corresponde a secuencias del genoma que no generan una proteína (procedentes de transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.), incluyendo los intrones. Hasta hace poco tiempo se pensaba que el ADN no codificante no tenía utilidad alguna, pero estudios recientes indican que eso es inexacto. Entre otras funciones, se postula que el llamado "ADN basura" regula la expresión diferencial de los genes (Consortium et al.). La presencia de tanto ADN no codificante en genomas eucarióticos y las diferencias en tamaño del genoma entre especies representan un misterio que es conocido como el "enigma del valor de C" (Gregory). Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los cromosomas: los telómeros y centrómeros contienen pocos o ningún gen codificante de proteínas, pero son importantes para estabilizar la estructura de los cromosomas. Algunos genes no codifican proteínas, pero sí se transcriben en ARN: ARN ribosómico, ARN de transferencia y ARN de interferencia (ARNi, que son ARN que bloquean la expresión de genes específicos) (Bossu et al.; Goto et al.). Algunas secuencias de ADN no codificante representan pseudogenes que tienen valor evolutivo, ya que permiten la creación de nuevos genes con nuevas funciones (Hirotsune et al.). Las zonas de ADN no codificante, normalmente son ricas en pares de bases AT (Field and Wills; Katti, Ranjekar and Gupta). Por ejemplo el protozoo Dictyostelium discoideum contiene un 78% de AT en el total de su material genético (Eichinger et al.), Plasmodium falciparum contiene un 80% de A-T (Jiang et al.), Arabidopsis thaliana contiene un 64% de A-T, Saccharomyces cerevisiae contiene un 62% de A-T, entre otros. Por todo lo anterior se prevé que aún existen funciones del ADN sin descubrir y una necesidad de explicar mejor las funciones que ya se conocen. Por esto se han seleccionado para este proyecto secuencias representativas de zonas de ADN no codificante y ricas es A-T. Cristalografía de rayos X. Para resolver la estructura de las secuencias seleccionadas de ADN, se llevan a cabo los siguientes pasos; Empleando la técnica de cristalización por difusión de vapor se cristalizan en ADN o ADNDroga de estudio. Al ser un proceso multiparamétrico, no se puede hacer un diseño racionalizado de las condiciones de cristalización y esta fase puede ser muy tardada, a la vez que es una fase crucial de la que dependerán algunas de las siguientes fases. Con los cristales obtenidos se hace difracción de rayos X, si los patrones obtenidos presentan el orden y resolución suficiente se pasa a la fase de resolución de la estructura en caso contrario se ha de regresar a la fase de cristalización. En la fase de resolución se lleva acabo la interpretación de los diagramas de difracción, se determina la celdilla unitaria, se hace asignación de grupo espacial, se asignan los índices de Miller y se indexan las intensidades. Tras una corrección y escalado de intensidades en nuestro caso se asignan fases principalmente por remplazo molecular empleando como modelo de búsqueda un modelo teórico de nuestra molécula de ADN de estudio. Después se lleva acabo el refinado de la estructura y la validación de la misma, para corroborar que no hay errores en distancias de enlaces, ángulos, conformaciones, y demás parámetros helicoidales. Oligonucleotido • Secuencia de interes (rica en AT) • Oligonucleotido sintético de la secuencia seleccionada de alta pureza. Cristalización • Se lleva acabo un barrido con todas las posibles condiciones de cristalización. Variando precipitante, pH, temperatura, conc. se sales e iones, conc. del oligonucléotido Si los resultados obtenidos de la difracción no son útiles se ha de volver a la fase de cristalización buscando condiciones o modificando factores que puedan mejorar la cristalización Difracción de rayos X • Durante esta fase se seleccionan los mejores cristales y se someten a una fuente de rayos x para obtener un patron de difracción. Análisis de resultados y resolución de la estructura • Se genera un modelo teórico del DNA • Se procesan los datos de la difracción • Se acopla el modelo a la interpretación de la difracion por remplazo molecular Afinamiento de la estructura y validación • Se optimizan las posiciones atómicas en bases a las zonas de densidad electrónica • Se comprueban distancias de enlace, ángulos de torsión, etc. Figura 4. Diagrama general del proceso de cristalografía de ADN A 4 T 4 con 4.4’-Bis(imidazolinilamino)difenilamina Recientemente se han obtenido resultados al resolver una estructura de un complejo ADN-droga de la secuencia A 4 T 4 con la droga experimental 4.4’-Bis(imidazolinilamino)difenilamina (Fig. 5-a), grupo espacial hexagonal P6 1 22 formando columnas de oligonucleótidos apilados en forma HASO (Helical arrangement of stacked oligonucleotides) (Campos et al.), favorecido por las interacciones de stacking π-π entre drogas adyacentes que interactúan en el surco menor reconociendo las bases nitrogenadas. Las columnas de oligonucleótidos presentas tres orientaciones de cruce, estabilizadas por las interacciones intermoleculares de la droga con cadenas vecinas (Fig. 5b) . a) b) Figura 5. a) Interacción de la droga en el surco estrecho, b) Cruce de columnas de oligos estabilizados por la droga. Esta droga presenta una potente actividad antiprotozoaria, en particular contra la tripanosomiasis y contra la malaria, siendo la ultima causada por el Plasmodium falciparum, que como se menciono anteriormente, contiene un aproximado de 80% de A-T en su genoma. La malaria causa unos 219 millones de casos de infectados y aproximadamente 660 mil muertes anuales (World Health). A pesar de los esfuerzos por reducir la transmisión e incrementar el tratamiento, ha habido muy poco cambio en las zonas que se encuentran en riesgo de la enfermedad desde 1992 (Hay et al.). La tasa de mortalidad puede duplicarse en los próximos años debido a la resistencia a medicamentos e insecticidas (Breman). Siendo México uno de los países Americanos aun con presencia de malaria según se ha reportado en el “World Malaria Report 2012” por el “WHO”. Bucle de ADN: (AT) 3 T 3 A(AT) 3 Otra estructura en estudio un bucle de ADN (llamado en inglés hairpin o stem loop) se forma cuando se da el apareamiento entre dos zonas complementarias de una misma cadena de ADN, dejando una zona central, entre las regiones complementarias, que queda desapareada formando el bucle. La formación de bucles de ADN representa uno de los mecanismos mediante el cual se regulan vías metabólicas del ADN como la transcripción, la replicación y la recombinación. La formación de bucles de ADN podría tener diferentes funciones dependiendo del contexto celular en el que se encuentren; en algunos casos el bucle por sí mismo es un requisito para la regulación, mientras que en otros casos el incremento de la concentración efectiva local de la proteína puede influir. Para el bucle se ha estudiado la secuencia (AT) 3 T 3 A(AT) 3, la cual presentaría un tetrabucle –TTTAy un tallo con 6 pares de bases. La secuencia es un factor determinante en la formación de bucle (Forsdyke, 1998). La Formación del bucle se corroboró con análisis de dispersión dinámica de luz donde se obtuvo un diámetro hidrodinámico de la especie monomérica de 28.4 Å, mientras que la altura teórica del bucle con una altura de 3.38 Å por par de bases es de 27.04 Å. Tras la cristalización, los diagramas de difracción presentaron una baja resolución. De estos se obtuvo la celdilla unitaria y el grupo espacial P1 pseudo P3 2 . Pero fue imposible resolver la estructura por lo que se llevo acabo una aproximación diferente al analizar manualmente las difracciones y ver la orientación de los oligos en la celdilla, el numero de moléculas por columna y las rotaciones en el apilamiento para generar las repeticiones que dan lugar a las difracciones. Por lo cual fue necesario construir un modelo teórico de bucle usando el tetraloop del PDB-ID: 1BAE y un par de bases de apareamiento Hoogsteen antes del bucle para favorecer el acoplamiento al confrontar los bucles de las moléculas en una columna recta, con las rotaciones por o ligo debidas. Este modelo se comprobó con la simulación teórica de los patrones de difracción los cuales correspondían al diagrama de difracción experimental. Figura X Diagrama de difracción experimental del cristal, b) Diagrama teórico del modelo generado, c)Modelo teórico de acoplamiento de 2 oligos en bucles, d) Columna de bucles de ADN en la celdilla unitaria. Referencias Baguley, B. C. "DNA Intercalating Anti-Tumour Agents." Anticancer Drug Des 6.1 (1991): 1-35. Bailly, C., and J. B. Chaires. "Sequence-Specific DNA Minor Groove Binders. Design and Synthesis of Netropsin and Distamycin Analogues." Bioconjug Chem 9.5 (1998): 513-38. Bossu, J. P., et al. "Two Regulatory Elements of Similar Structure and Placed in Tandem Account for the Repressive Activity of the First Intron of the Human Apolipoprotein a-Ii Gene." Biochem J 318 ( Pt 2) (1996): 547-53. Breman J. G. "Ears of the Hippopotamus: Manifestations, Determinants, and Estimates of the Malaria Burden."(2001) Supplement Vol. 64(1) of the American Journal of Tropical Medicine and Hygiene. Campos, L., et al. "Overview of the Structure of All-at Oligonucleotides: Organization in Helices and Packing Interactions." Biophys J 91.3 (2006): 892-903. Consortium, Encode Project, et al. "Identification and Analysis of Functional Elements in 1% of the Human Genome by the Encode Pilot Project." Nature 447.7146 (2007): 799-816. Eichinger, L., et al. "The Genome of the Social Amoeba Dictyostelium Discoideum." Nature 435.7038 (2005): 43-57. Field, D., and C. Wills. "Long, Polymorphic Microsatellites in Simple Organisms." Proc Biol Sci 263.1367 (1996): 209-15. Goodsell, D. S., et al. "Structure of a Dicationic Monoimidazole Lexitropsin Bound to DNA." Biochemistry 34.51 (1995): 16654-61. Goto, K., et al. "Identification of an Osteoblastic Silencer Element in the First Intron of the Rat Osteocalcin Gene." Biochemistry 35.33 (1996): 11005-11. Gregory, T. R. "The C-Value Enigma in Plants and Animals: A Review of Parallels and an Appeal for Partnership." Ann Bot 95.1 (2005): 133-46. Hay, Simon I., et al. "The Global Distribution and Population at Risk of Malaria: Past, Present, and Future." The Lancet Infectious Diseases 4.6 (2004): 327-36. Hirotsune, S., et al. "An Expressed Pseudogene Regulates the Messenger-Rna Stability of Its Homologous Coding Gene." Nature 423.6935 (2003): 91-6. Jiang, H., et al. "Detection of Genome-Wide Polymorphisms in the at-Rich Plasmodium Falciparum Genome Using a High-Density Microarray." BMC Genomics 9 (2008): 398. Katti, M. V., P. K. Ranjekar, and V. S. Gupta. "Differential Distribution of Simple Sequence Repeats in Eukaryotic Genome Sequences." Mol Biol Evol 18.7 (2001): 1161-7. Moreno, T., et al. "Coiled-Coil Conformation of a Pentamidine-DNA Complex." Acta Crystallogr D Biol Crystallogr 66.Pt 3 (2010): 251-7. Sheng, J., J. Gan, and Z. Huang. "Structure-Based DNA-Targeting Strategies with Small Molecule Ligands for Drug Discovery." Med Res Rev 33.5 (2013): 1119-73. Valls, N., et al. "Variable Role of Ions in Two Drug Intercalation Complexes of DNA." J Biol Inorg Chem 10.5 (2005): 476-82. Watson, J. D., and F. H. Crick. "Molecular Structure of Nucleic Acids; a Structure for Deoxyribose Nucleic Acid." Nature 171.4356 (1953): 737-8. Wolfsberg, T. G., J. McEntyre, and G. D. Schuler. "Guide to the Draft Human Genome." Nature 409.6822 (2001): 824-6. World Health, Organization. "World Malaria Report 2012." World Health Organization. Availabe http://www.who.int/malaria/publications/world_malaria_report_2012/en/index.html (2013).