La magia de la doble hélice: un gran hallazgo El 28 de febrero de 1953, según cuenta el propio James Watson, fue el Día D en la historia del estudio del ADN. Tras múltiples intentos de encontrar una explicación convincente a los misterios básicos de la genética, que respondiese a todas las cuestiones planteadas por biólogos, físicos y químicos, la solución parecía ser la correcta: se había conseguido construir un modelo teórico, tridimensional (con piezas, como un mecano), que daba respuesta a las preguntas básicas. Fue un proceso largo, tras semanas repletas de gran tensión no exenta de rivalidad entre los distintos grupos de investigación que trabajaban en el mismo tema. Desde ese día de 1953 en que James Watson y Francis Crick describieran la estructura en doble hélice de la molécula de ADN, los conocimientos científicos en torno a la misma se han ido acumulando de manera exponencial. La presentación universal del hallazgo tuvo lugar en forma de un breve artículo publicado en las páginas 737 y 738 del número 4.356 de la revista Nature, aparecido el 25 de abril de 1953. En ese mismo número de Nature se publicaban otros trabajos sobre el tema, como los muy originales estudios de Maurice Wilkins y sus colaboradores, así como el de Rosalind Franklin y Gosling. Sin embargo, desde mucho tiempo antes de esa mágica fecha de 1953 los científicos habían intuido claramente que tenía que haber una sustancia capaz de definir y organizar todas las funciones que los seres vivos necesitan para vivir y procrear, es decir, para que al tiempo que una especie pervive pueda también evolucionar, adaptarse a las cambiantes circunstancias de un planeta que, en su conjunto, se encuentra en una lenta pero constante evolución. Ya en el año 1869 el químico Friedrich Miescher, de origen suizo pero que trabajaba en Alemania, aisló de las vendas usadas para proteger las heridas una sustancia a la que llamó «nucleína». En aquella época previa al uso de los antibióticos las vendas solían quedar impregnadas con gran cantidad de pus y otros tejidos. Como el pus contiene muchos leucocitos o glóbulos blancos, que son células nucleadas (y es en el núcleo de la célula donde está el ADN), convendremos en que un material tan peculiar como las vendas usadas resultaba en aquel tiempo una fuente ideal de ADN. Miescher fue capaz de observar posteriormente que la nucleína sólo se encontraba en los cromosomas, por lo que llegó a intuir la existencia de una teoría química de la herencia. En 1909 un biólogo británico llamado William Bateson bautizó con el nombre de «genética» a esta ciencia que acumulaba cada vez más conocimientos en torno a la herencia biológica. Era el primer paso para abandonar otras teorías previas, como las lamarckianas (de Jean Baptiste Lamarck), entre otras que no explicaban de forma adecuada el proceso de la herencia en los seres vivientes. Posteriormente, en 1952, Alfred Hershey y Martha Chase confirmaron que el ADN era efectivamente el material hereditario. No obstante, hay muchos más nombres de científicos que trabajaron en este campo y son desconocidos para gran parte de las personas. Sería por ello totalmente injusto no mencionar, además de a los autores anteriores, otros nombres como Sutton, Boveri, Morgan, Linus Pauling y, antes que todos ellos, a Mendel. Los trascendentes descubrimientos de este último pasaron, por cierto, inadvertidos en su época, quizás porque era una persona ajena al mundo de lo que podríamos llamar con cierta licencia la «aristocracia científica». En reconocimiento póstumo a sus hallazgos, Mendel, cuyas conclusiones fueron posteriormente confirmadas por Sutton, da nombre a las famosas leyes en las que se establecen los principios básicos de la herencia de los caracteres y de la recombinación. Hay otros muchos autores que, pese a la importancia de sus hallazgos y reflexiones, son desconocidos para la gran mayoría de las personas, incluidos algunos estudiosos del tema, pese a que sus nombres están grabados con letras de oro en la historia de la ciencia. Paradójico es el caso del físico austriaco y padre de la mecánica ondulatoria Edwin Schrödinger, y lo califico de paradójico porque se trata de un físico que hizo grandes hallazgos en el campo de la biología. Esto pone de manifiesto que la ciencia no está conformada por compartimentos estancos, aislados, sino que hay una continua, permanente e imprescindible interrelación. Así fue como Schrödinger, en su libro ¿Qué es la vida? (What is Life?), publicado en 1944, intuyó que la vida podía considerarse básicamente como un proceso de acumulación y transmisión de información. Por lo tanto era necesario descifrar el modo en que esa información se almacena, conserva, multiplica y transmite. La lectura de ese libro cautivó a muchos de los que luego fueron actores principales en el campo de la genética, incluidos los mencionados James Watson y Francis Crick. Al contrario de lo que muchas personas puedan pensar, el gran hallazgo, el verdadero descubrimiento de Watson y Crick no fue el ADN en sí, que ya había sido descrito tiempo atrás como molécula. Su aportación consistió en describir la estructura molecular exacta del ADN, en forma de doble hélice. Esta conformación peculiar era la única capaz de responder a las principales preguntas que hasta el momento quedaban por responder. Y es que resultaba difícil saber qué tipo de estructura habría de tener una molécula capaz de 1. Almacenar toda la información necesaria para que se desarrolle una persona (o cualquier otro ser vivo). 2. Utilizar un espacio tan pequeño que cada célula pueda permitirse el lujo de poseer su propia información completa. 3. Replicarse, multiplicarse y copiarse con absoluta perfección cada vez que se crea una nueva célula (lo cual acontece millones de veces al día en un ser humano adulto). 4. Combinarse en los casos necesarios para que los hijos no sean idénticos al padre o a la madre, sino una mezcla o combinación de los mismos, y además de modo que los diferentes hermanos, hijos de una misma pareja, tengan la capacidad de ser diferentes (excepto los gemelos univitelinos). 5. Adaptarse poco a poco, por medio de cambios puntuales (mutaciones), para que los nuevos seres vivos dispongan de una mayor facilidad para sobrevivir en un medio ambiente que también evoluciona. No era evidentemente tarea banal la de descubrir las características de la molécula que contenía todas estas claves, y mucho menos resultaba algo sencillo con las técnicas y medios existentes en 1953. Watson y Crick lo consiguieron, y de ahí que con justicia su nombre se asocie al del ADN, y viceversa. Sin embargo, y como indicamos anteriormente, este gran mérito no debe hacernos olvidar a tantos otros honestos, esforzados y a menudo brillantes estudiosos que dedicaron su vida, con menos suerte, pero con la misma pasión, a este campo de la ciencia. Una vez que la estructura de la molécula quedaba revelada, comenzó una frenética búsqueda de las claves exactas para responder a todas las preguntas planteadas. En particular interesaba saber cómo transmite el ADN la información para que se creen los diversos órganos y tejidos, o cuál es el modo por el que una célula se convierte en músculo y otra que está a su lado se comporta como nervio. Había muchas otras cuestiones: ¿Por qué se producen las mutaciones de un modo y no de otro? ¿Cómo se transmiten ciertas características de padres a hijos? ¿Cómo influyen unos genes sobre otros? Y así un largo etcétera, cientos de preguntas que han mantenido y mantienen ocupados a miles de científicos de todo el mundo desde hace años. Todavía hoy, más de medio siglo después, no se han encontrado todas las respuestas, ya que queda camino por recorrer. Pese a que en el año 2001, y con mayor amplitud y exactitud en 2003, se hiciese pública la secuencia completa del genoma humano, esto no significa que se conozca lo más importante, que es el funcionamiento exacto de esta información genética. Es como si a una persona que nunca se ha relacionado con la tecnología se le pone delante de un potente ordenador: poco provecho le podría sacar. Lo que hoy en día tenemos es mucho, pero lo más interesante está aún por descubrir. El turista y su mapa de carreteras Para hacernos una idea de la situación actual, el esquema del genoma humano del que disponemos es como si tuviésemos en nuestra mano un mapa de carreteras de un país al que acabamos de llegar por primera vez. Imaginemos, para hacerlo más fácil, que alguien de un país lejano llega a España, alquila un automóvil y le dan ese mapa de carreteras. En seguida observa que hay numerosas ciudades (que serían el equivalente a los genes). Las hay grandes (Madrid, Barcelona, Valencia, Sevilla, Bilbao, etc.), otras menores pero de cierto tamaño (Zaragoza, Alicante, Málaga, Cádiz, Valladolid, La Coruña, Vigo, Granada, Almería, etc.), y también muchos pueblos muy pequeños (Serón, Olula del Río, Purchena, Tíjola, Monachil o Bubión), de los cuales algunos resultan especialmente atractivos por su ubicación. Ésta es la visión genérica que uno tiene con la secuencia del genoma humano: tenemos prácticamente toda la información a mano, pero falta algo. Y falta algo porque simplemente mirando un mapa de carreteras, como el de España, no se tienen automáticamente todas las respuestas. Por ejemplo: ¿cuánto tiempo se tarda en ir en automóvil de Madrid a Barcelona? ¿Hay límites de velocidad? Y si los hay, ¿cuáles son? ¿Se tarda el mismo tiempo en recorrer doscientos kilómetros de Valencia a Barcelona que de Valencia a Albacete? Del mismo modo, cientos de preguntas equivalentes se plantean ante el bien llamado «mapa» del genoma humano a los científicos que estudian el ADN. ¿Cómo se interrelacionan los genes entre sí? ¿Actúan los genes independientemente o dependen unos de otros? ¿Hay algún gen o grupo de genes que, en caso de situaciones contradictorias, tenga preponderancia sobre los demás? Algunas preguntas ya han sido respondidas, otras están en estudio y otras muchas decenas de ellas están por descubrir. Sin embargo, ya disponemos de una idea general de cómo es el genoma humano, de dónde están situadas las partes más importantes (los genes), la distancia entre los mismos... Es sólo cuestión de tiempo poder terminar, poco a poco pero cada vez con mayor velocidad y efectividad, la exploración de ese maravilloso universo, de ese patrimonio de la humanidad que cada uno de nosotros llevamos dentro. Estructura bioquímica del ADN Antes de seguir adelante explicaremos algunos conceptos básicos que ya hemos podido vislumbrar en explicaciones anteriores. El conjunto del ADN de cada célula está compuesto por una sucesión de unidades llamadas nucleótidos, que equivalen a los eslabones de una larga cadena. Existen cuatro tipos de nucleótidos, algunos de los cuales ya hemos visto, nombrados con una letra. Se trata de -Adenina (A). -Citosina (C). -Guanina (G). -Timina (T). La adenina y la guanina son llamadas purinas, y la citosina y la timina, pirimidinas. La A y la T se unen por un doble enlace o puente de hidrógeno, mientras que la G y la C lo hacen por un enlace triple. Figura 1. Estructura básica de un nucleótido del ADN. Todos son muy similares y se unen por parejas complementarias (pares de nucleótidos) y en una cadena alargada (la doble hélice). Existe un quinto tipo de nucleótido llamado uracilo (U) que no forma parte del ADN, sino del ácido ribonucleico (ARN). En el ARN hay uracilo en vez de timina. Así pues, el ADN no es sino una sucesión concatenada de los cuatro nucleótidos anteriormente mencionados: A, C, G y T. El orden en que se unen unos a otros, denominado «secuencia», tiene una gran importancia, pues de la misma depende el tipo de aminoácidos y proteínas que se van a sintetizar o, lo que es lo mismo, el tipo y características de los tejidos y de las diversas estructuras que conforman a una persona. Las cadenas de ADN no son simples, sino dobles. Por ello se dice que el ADN se presenta como una doble hélice o doble cadena, ya que las cadenas simples se unen unas a otras, como si conformaran una escalera de mano que se enrollase en torno a un eje central. La característica más importante de esta unión es que no es aleatoria, sino que se relaciona con el fenómeno denominado de «complementariedad de las bases», mediante el cual la adenina de una cadena sólo se une a la timina de la otra (uniones A=T, T=A por medio de un enlace doble de puentes de hidrógeno), y la citosina de una cadena sólo se une a la guanina de la otra (uniones C=G, G=C por medio de un triple enlace de puentes de hidrógeno). Esta unión específica de unas bases nucleotídicas con otras se denomina «par de bases» (una base de una cadena y su complementaria de la otra cadena), y es el modo en que se encuentra el ADN en las células de los seres vivos. Por lo tanto, constituye la unidad fundamental en biología molecular. El conjunto del ADN que posee cada célula se denomina «genoma», y en el ser humano está conformado por unos 6.000 millones de pares de bases, que en el organismo se disponen de modo irregular en 23 pares de cromosomas que se hallan en el interior del núcleo, según se observa en la figura 2, en lo que se denomina un cariotipo. En el interior del núcleo celular el ADN se encuentra unido a una serie de proteínas, formando parte de la cromatina. La cromatina está formada por un material filamentoso que se agrupa de manera diferente según el ciclo vital de la célula y/o su estado funcional, de tal modo que es durante la división celular cuando aparece en la forma clásicamente conocida de cromosomas. El ADN mitocondrial presenta también algunas diferencias estructurales respecto al nuclear. Está formado por dos cadenas de nucleótidos complementarias y paralelas con 16.569 pares de bases que se disponen, al contrario que el ADN nuclear, de forma circular. Por su composición bioquímica las dos cadenas son diferentes, ya que en la secuencia de nucleótidos de una prevalecen las bases púricas (adenina y guanina), por lo que resulta más pesada que su complementaria, en la que predominan las pirimidínicas (timina y citosina). En consecuencia, a la primera de las cadenas se la denomina «H» (del inglés heavy, pesada), y a la otra «L» (light o ligera). Se trate del ADN que se trate (nuclear o mitocondrial), la trascendencia del sistema de complementariedad de las bases es enorme. Por un lado permite a la naturaleza copiar o multiplicar sin errores, en un mecanismo llamado de replicación, las cadenas de ADN. En la vida de las células, cuando es necesario que el ADN se duplique, las dos cadenas que estaban unidas en una doble cadena de ADN se separan, apareciendo dos cadenas simples. A partir de un punto determinado, y por acción de unas enzimas específicas denominadas polimerasas, sobre el molde que suponen las cadenas simples se van uniendo uno a uno los nucleótidos, formando una nueva cadena que es, por lo tanto, complementaria a la que le sirvió de molde y, además, exactamente igual a la cadena que estaba anteriormente unida a la misma. De este modo se garantiza la continuidad de las especies, ya que cada una de las nuevas células va a llevar una copia exacta del ADN de las células de las que procede. Los errores en la copia de las secuencias de ADN pueden originar mutaciones, la gran mayoría de las cuales no tienen trascendencia alguna, aunque existen otras que pueden dar lugar a cierto tipo de enfermedades y a procesos degenerativos y malignos (como cánceres). Pese a los miles de millones de nucleótidos que manejan las polimerasas del organismo cada día en todas las células en las que hay replicación, la fidelidad en la copia de cadenas es enorme, ya que éste es el único medio de garantizar la viabilidad y supervivencia de las especies a corto plazo. Los errores graves en las copias de ADN se suelen pagar con la muerte de la célula o, si el error es especialmente trascendente, con la muerte de todo el organismo. Todo ello no significa que el ADN no tenga oportunidad de variar con el tiempo. De todos es conocido que la supervivencia a largo plazo de las especies (animales y vegetales) ha exigido y exige cambios íntimos de las diversas células para adaptarlas a las exigencias medioambientales. Las teorías de selección natural indican de modo muy general que sólo sobreviven aquellos individuos mejor adaptados o dotados de cada especie. Esta tesis encuentra su más íntima explicación bioquímica en los cambios bien orientados que se producen en las secuencias de ADN y que se perpetúan de generación en generación. Sin embargo, la trascendencia del sistema de complementariedad existente en el ADN no sólo radica en el hecho de permitir una copia exacta del ADN de una célula madre a una célula hija, sino que esta característica es la base de gran parte de las técnicas de biología molecular y la herramienta que se maneja en las tecnologías de uso forense para identificación. Si se conoce la secuencia de una cadena simple de ADN se podrá deducir cuál es la secuencia de la cadena complementaria. De este modo podremos realizar una serie de técnicas analíticas que permitan poner de manifiesto las características de las regiones de ADN que, para identificar a las personas, nos interesan. La joya de la corona en su cámara blindada Se ha analizado cómo el ADN es el elemento que lleva y transmite la información necesaria para el mantenimiento y desarrollo de la vida. Habida cuenta de su enorme importancia, se encuentra especialmente protegido por la naturaleza, no sólo ubicándolo en el interior del núcleo celular, sino evitando que tenga que salir del mismo para ejercer sus funciones de control. Las moléculas de ADN, y en esencia sólo ellas, son capaces de realizar una duplicación idéntica (replicación) y sirven como matrices para transmitir su contenido informativo a la molécula de ARN. El paso de la información genética a un ARN mensajero (ARN-m) específico se designa como «transcripción». Posteriormente, y mediante la información facilitada por el ARN, se forma en los ribosomas la estructura primaria de las proteínas, denominándose a este paso «traducción». El gran principio de la biología molecular, el «dogma central», puede expresarse así: ADN ARN AMINOÁCIDOS PROTEÍNAS Es por esto que existe otro ácido nucleico, el ribonucleico o ARN, que es el encargado de leer el mensaje biológico que posee el ADN y de sacarlo fuera del núcleo para su posterior utilización por parte de la célula mediante un proceso conocido como «síntesis proteica» o síntesis de proteínas. La estructura del ARN es muy similar a la del ADN, con la excepción de presentar al uracilo (U) como nucleótido en lugar de la timina (T). Dicho uracilo se une a la adenina (U=A, A=U) al igual que lo hacía la timina, manteniendo así la complementariedad de las bases. El proceso de síntesis proteica comienza con el ensamblaje de las diferentes secuencias de aminoácidos, hecho éste que depende exclusivamente de la secuencia en que se disponen los nucleótidos en la cadena de ADN. Cada tres nucleótidos hacen que se genere un aminoácido, y una cadena de aminoácidos forma una proteína. El hecho de que fuesen tres los nucleótidos que conjuntamente marcan un mensaje, en un orden predeterminado y exacto, fue propuesto por primera vez por Francis Crick y esto es lo que realmente se llama código genético. La síntesis de las proteínas necesita de la presencia de diversos tipos de ARN: el mencionado ARN-m, el ARN transportador y el ARN ribosómico, además de la intervención de diferentes sustancias y organelas intracelulares, circunstancias y detalles todos estos que no se corresponden con la finalidad del presente texto y que carecen de significación en identificación criminal y ciencia forense, por lo que no van a ser analizados en profundidad. Estructura del genoma humano El conjunto del ADN de un organismo es lo que se denomina «genoma», y en su interior están todos los genes que poseemos. La complejidad del genoma obliga a que su estudio se haga clasificándolo o dividiéndolo de acuerdo a diferentes criterios, siendo todos ellos correctos. Si nos pidiesen una clasificación de los países del mundo podríamos igualmente emplear diferentes puntos de vista, sin que ninguno fuera erróneo. Por ejemplo, podríamos dividirlos por continentes, hacer una lista por orden alfabético, por el número de habitantes, por su renta per capita, por el PIB, etc. En este libro, que trata de ADN e identificación humana, vamos a seguir un criterio de estudio del ADN y el genoma humano basado en su funcionalidad para identificar a las personas. Así, vamos a ofrecer esta visión general e intuitiva antes de que procedamos a estudiar, siquiera someramente, la estructura del ADN como molécula. Hemos de mencionar, en primer lugar, que existen dos ubicaciones para el ADN en el organismo: dentro del núcleo de la célula (ADN nuclear, el principal y más importante, que forma los cromosomas), y dentro de las mitocondrias (ADN mitocondrial). Los dos son de interés en el campo de la identificación humana y serán en su momento motivo de consideración. ADN: genes y no genes El ADN, desde el punto de vista que nos interesa, puede dividirse así en dos grandes tipos: 1. Codificante o expresivo: el que conforma los genes, el código genético capaz de transformarse o expresarse en aminoácidos y proteínas, como veremos con posterioridad. Supone aproximadamente un 10 por ciento del total del ADN, donde existen unos 30.000 genes. 2. No codificante: el que no transmite información en forma de aminoácidos y proteínas, lo cual no significa que no tenga utilidad. Supone un 90 por ciento del total del genoma humano. En algunas ocasiones fue llamado «ADN basura» por no tener una función especial en lo referente a los genes. El ADN codificante o expresivo está compuesto por los diferentes genes que definirán las características de las personas a través de la síntesis de las proteínas, un proceso que determina una secuencia de aminoácidos que sirve para codificar los genes no sólo en cada tejido orgánico, sino en cada momento preciso. La mayoría de los genes presentan una sola copia, localizada de forma específica en el genoma. No obstante, existe una serie de genes de especial importancia repetidos «en tándem», como por ejemplo los que codifican las histonas1 y otras sustancias vitales, entre ellas diferentes tipos de ARN estructurales. Cada gen, o la mayor parte de ellos, se divide a su vez en dos regiones: las codificantes, denominadas exones, y otras no codificantes llamadas intrones, que interrumpen a los exones. Los intrones no son traducidos en proteínas, pero cumplen otras funciones muy importantes. Por ejemplo (y a modo de ilustración) son transcritos al ARN-m (el ARN mensajero), el cual sufre una serie de transformaciones en el interior del núcleo antes de pasar al citoplasma. En este proceso los intrones son eliminados y los exones religados de forma precisa para formar el ARNm maduro. Es lo que se conoce como splicing o «maduración del ARN-m». Aunque parezca algo confuso, es gracias a esto que la información contenida en el ADN codificante (en los genes) se expresará en las proteínas. El ADN codificante es, en general, poco polimórfico, con alguna excepción, por lo que carece de interés en ciencias forenses con fines de identificación humana. Esto hace que, para lo que nos ocupa, resulte de mayor importancia el ADN no codificante. El ADN no codificante o «no esencial» (nunca deberíamos decir «ADN basura», al menos desde el punto de vista de la ciencia forense) es un hecho propio de la biología molecular y forma parte del equilibrio de la naturaleza, aunque considerarlo «inútil» puede ser también consecuencia del desconocimiento que la ciencia moderna tiene de la totalidad de las funciones del genoma humano. Paradójicamente, este ADN es el esencial para la investigación genética forense. Sus características y peculiaridades lo convierten en un gran instrumento para la individualización de los seres humanos. El ADN repetitivo, una de las variedades del ADN no codificante, ha sido clasificado a su vez en diversos tipos basándose en su organización estructural y en la frecuencia de reiteración de cada clase. Hay dos grandes variedades: -Secuencias repetidas en tándem. -Secuencias repetidas intercaladas o dispersas. Las primeras suponen del 5 al 10 por ciento del genoma de los mamíferos, y generalmente se caracterizan por la presencia de una secuencia común repetida en tándem de manera continua en un fragmento de ADN, como la repetición de estos cuatro pares de bases (CGAT) varias veces, o sea, en tándem: ... ATACGTATGGCTCGATCGATCGATCGATCGATCGATTGTACTAACAG...