SECUENCIACIÓN DEL ADN Secuenciar una molécula de ADN consiste en determinar en qué orden se disponen los cuatro nucleótidos (A, T, C y G) que componen la molécula. El primer método diseñado para secuenciar el ADN fue desarrollado por Allan Maxam y Walter Gilbert en 1977. Es un método químico que somete la molécula de DNA a distintos métodos de ruptura. Cada método escinde la molécula allí donde haya un nucleótido específico. Este método es bastante laborioso y, hoy en día, ha sido sustituido por métodos enzimáticos que, además, se pueden llevar a cabo de forma automatizada. El método de Sanger fue diseñado por Fred Sanger en 1977. También se conoce como método didesoxi o secuenciación por terminación de la cadena. Es un método enzimático que permite determinar la secuencia del molde a medida que se sintetiza su hebra complementaria. Se necesitan los siguientes componentes: • • • • • un ADN de cadena sencilla que actúa como molde un cebador para iniciar la síntesis de ADN los cuatro desoxirribonucleótidos trifosfato (dATP, dGTP, dCTP y dTTP) la enzima ADN-polimerasa los cuatro didesoxirribonucleótidos trifosfato (ddATP, ddGTP, ddCTP y ddTTP) que son utilizados por la ADN polimerasa para construir la nueva hebra pero, una vez incorporados, impiden la adición de nuevos nucleótidos. La secuenciación se lleva a cabo en cuatro tubos. Cada tubo contiene el molde, el cebador, los cuatro desoxirribonucleótidos trifosfato (dNTP), la polimerasa y un didesoxirribonucleótido trifosfato (ddNTP) distinto en cada caso. En cada tubo, cuando la ADN polimerasa incorpora aleatoriamente un ddNTP la reacción se detiene, de manera que se generan fragmentos de distinta longitud, todos ellos con el mismo ddNTP terminal. Los diversos fragmentos se separan en función de su tamaño mediante electroforesis en gel de poliacrilamida, una técnica que permite separar fragmentos de ADN cuya longitud difiere en un sólo nucleótido. A partir del gel se puede reconstruir la secuencia que se ha sintetizado, que es complementaria a la secuencia del molde. Mediante esta tecnología, se puede determinar la secuencia de moléculas de ADN de hasta 800 nucleótidos de longitud. MEJORAS EN EL MÉTODO DE SANGER Introduciendo ligeras variaciones en el método original de Sanger se ha conseguido automatizar el proceso. Esta es la principal razón de que se siga utilizando este método hoy en día, a diferencia del método de Maxam y Gilbert, que ya apenas se utiliza. Las mejoras introducidas son las siguientes: 1.- Los ddNTP terminadores de cadena están marcados fluorescentemente. Cada ddNTP se marca con un fluoróforo distinto, que no interfiere en la reacción de la polimerasa y que emite luz con una longitud de onda característica. De este modo, la reacción se lleva a cabo en un sólo tubo, no en cuatro. 2.- Se sustituye la ADN polimerasa por la Taq-polimerasa. De este modo es posible automatizar el proceso como si se tratara de una PCR. En cada ciclo aumenta de forma exponencial el número de fragmentos generados, cada uno marcado con una molécula fluorescente que emite luz de distinto color, en función del ddNTP terminal. Por eso, a este método también se le conoce como secuenciación cíclica. 3.- La separación de los fragmentos se realiza mediante electroforesis capilar, que es más rápida que la electroforesis en gel. Los fragmentos de distintos tamaños llegan al final del capilar, donde son excitados con un láser y se detecta la fluorescencia emitida por el ddNTP terminal. El color de esta fluorescencia determina de qué nucleótido se trata. El gráfico resultante se denomina electroferograma, en el que se observan picos de diversos colores. Cada color indica qué nucleótido ocupa cada posición en la molécula de ADN o, lo que es lo mismo, su secuencia. PIROSECUENCIACIÓN La pirosecuenciación es otro método enzimático que permite determinar la secuencia de una molécula de ADN. Se necesitan los siguientes componentes: • • • • • • un ADN de cadena sencilla que actúa como molde un cebador para iniciar la síntesis de ADN tres desoxirribonucleótidos trifosfato (dGTP, dCTP y dTTP) más desoxiadenosina alfa-tiotrifosfato (dATP•S, un derivado del dATP que puede ser utilizado normalmente por la ADN-polimerasa pero que no es reconocido por la luciferasa). cuatro enzimas: ADN polimerasa (que cada vez que añade un nuevo desoxirribonucleótido trifosfato a la cadena naciente genera una molécula de PPi), ATP sulfurilasa (que convierte el PPi en ATP en presencia de APS), luciferasa (que, en presencia de ATP, convierte la luciferina en oxiluciferina y genera un fotón de luz visible) y apirasa (que degrada los nucleótidos que no se han incorporado a la cadena naciente y el ATP generado por la sulfurilasa). adenosina 5'-fosfosulfato (APS) luciferina La pirosecuenciación es un método de síntesis, porque la secuencia del molde se determina a medida que se sintetiza su hebra complementaria. Para determinar cuál es la base que se añade durante la síntesis se lleva a cabo, en riguroso orden, una serie de reacciones enzimáticas: • 1.- El cebador hibrida con el molde y se incuba en presencia de las cuatro enzimas (ADN polimerasa, ATP sulfurilasa, luciferasa y apirasa) y de los sustratos APS y luciferina. • 2.- Se añade uno de los cuatro desoxirribonucleótidos trifosfato (por ejemplo, dCTP) a la mezcla de reacción anterior. Si resulta ser el complementario a la hebra molde, se incorporará a la nueva cadena de ADN y se producirá una molécula de PPi por cada desoxirribonucleótido incorporado (ya que puede haber varias bases iguales seguidas en la secuencia del molde). Si no es el complementario al molde, se añade otro desoxirribonucleótido trifosfato (por ejemplo, dGTP). Si es el correcto, se formará PPi y si no, se añade un tercero (por ejemplo, dTTP). Si es el correcto, se formará PPi y si no, se añade dATP•S que, ahora sí, será incorporado a la nueva cadena de ADN. • 3.- En presencia de APS, la ATP sulfurilasa convierte el PPi en ATP. Este ATP provoca la conversión de luciferina en oxiluciferina mediante la enzima luciferasa. Esta reacción genera una cantidad de luz visible proporcional a la cantidad de ATP consumido. Esta luz es captada por un fotodetector, dando lugar a un pico en el pirograma. La altura del pico es proporcional al número de nucleótidos que se han incorporado. • 4. La apirasa degrada todos los desoxirribonucleótidos trifosfato (y el dATP•S) que no se han incorporado, así como el exceso de ATP producido por la reacción de la ATP sulfurilasa. Durante la pirosecuenciación, no se añade un nuevo desoxirribonucleótido trifosfato (etapa 2) hasta que la apirasa haya degradado por completo todos los nucleótidos no incorporados y el ATP. Secuenciación masiva en paralelo Los métodos de la primera generación son capaces de secuenciar hasta 100 kbases al día, con lo que se necesitan varios años para secuenciar el genoma humano. Durante esta última década se han desarrollado los denominados "métodos de segunda generación" que son capaces de llevar a cabo el proceso de secuenciación de forma muchísimo más rápida. Estos métodos se caracterizan porque secuencian de forma masiva y simultánea (en parealelo) la genoteca completa y permiten secuenciar la totalidad del genoma humano en cuestión de días. 454-pirosecuenciación La primera fase de este método consiste en la preparación de una genoteca. Se fragmenta el ADN genómico por métodos suaves como, por ejemplo, la nebulización, que genera fragmentos de entre 300 y 800 pares de bases. Se marcan los extremos de los fragmentos con dos tipos de adaptadores, que denominaremos A y B (uno permitirá que el fragmento se una a las esferas de agarosa y el otro es complementario al oligonucleótido que actuará como cebador en las fases de amplificación y secuenciación). Se seleccionan los fragmentos marcados en uno de sus extremos con el adaptador A y en el otro con el adaptador B. En la segunda fase se hace una PCR en emulsión, es decir, en una mezcla de aceite y agua. Para ello, primero se mezclan los fragmentos de la genoteca con esferas de agarosa recubiertas con un oligo complementario a uno de los adaptadores. Se hace la mezcla de forma que cada esfera sólo se una a un fragmento de la genoteca. Después se añade una emulsión que contiene, en su fase acuosa, todos los reactivos necesarios para la PCR. Cada esfera queda aislada en una gota acuosa rodeada de aceite y separada de las demás esferas. Cada gota se convierte en un microrreactor en el que se lleva a cabo la PCR. En cada gota aumenta exponencialmente el número de fragmentos de ADN (todos ellos idénticos) que, a su vez, se unen a los oligonucleótidos que recubren la esfera. Al final del proceso, cada esfera está recubierta de aproximadamente dos millones de fragmentos de ADN. A continuación, se deshace la emulsión y se depositan las esferas recubiertas de ADN en una placa que contiene cientos de miles de pocillos con un diámetro medio de 44 μm, de manera que en cada pocillo sólo cabe una esfera. Algunos pocillos pueden quedar vacíos. A continuación se añaden otras esferas más pequeñas sobre las que se han inmobilizado dos de las enzimas que intervienen en el proceso de pirosecuenciación (la sulfurilasa, que convierte el PPi en ATP, y luciferasa, que convierte la luciferina en oxiluciferina y genera un fotón de luz). En la tercera fase se lleva a cabo la pirosecuenciación. El sistema de flujo hace pasar de manera secuencial cada uno de los cuatro nucleótidos a través de la placa que contiene los pocillos. Se añaden siempre en el mismo orden (TACG) con lo que se consigue una secuenciación masiva en paralelo (cientos de miles de pocillos, cada uno con dos millones de fragmentos de ADN). Cada vez que en uno de los pocillos se incorpora un nucleótido se genera una señal quimioluminiscente que es recogida por una cámara digital. Esta señal es proporcional al número de nucleótidos que se incorporan en cada pocillo. La adición secuencial de los cuatro nucleótidos se repite 42 veces. En la cuarta fase se hace un análisis de las imágenes obtenidas en cada pocillo y se determina la secuencia de cada fragmento. A partir de esta colección de secuencias se reconstruye la secuencia genómica original por métodos computacionales.