SECUENCIACIÓN DEL ADN Secuenciar una molécula de ADN

Anuncio
SECUENCIACIÓN DEL ADN
Secuenciar una molécula de ADN consiste en determinar en qué orden se disponen los
cuatro nucleótidos (A, T, C y G) que componen la molécula.
El primer método diseñado para secuenciar el ADN fue desarrollado por Allan Maxam
y Walter Gilbert en 1977. Es un método químico que somete la molécula de DNA a
distintos métodos de ruptura. Cada método escinde la molécula allí donde haya un
nucleótido específico. Este método es bastante laborioso y, hoy en día, ha sido
sustituido por métodos enzimáticos que, además, se pueden llevar a cabo de forma
automatizada.
El método de Sanger fue diseñado por Fred Sanger en 1977. También se conoce como
método didesoxi o secuenciación por terminación de la cadena. Es un método
enzimático que permite determinar la secuencia del molde a medida que se sintetiza su
hebra complementaria. Se necesitan los siguientes componentes:
•
•
•
•
•
un ADN de cadena sencilla que actúa como molde
un cebador para iniciar la síntesis de ADN
los cuatro desoxirribonucleótidos trifosfato (dATP, dGTP, dCTP y dTTP)
la enzima ADN-polimerasa
los cuatro didesoxirribonucleótidos trifosfato (ddATP, ddGTP, ddCTP y
ddTTP) que son utilizados por la ADN polimerasa para construir la nueva hebra
pero, una vez incorporados, impiden la adición de nuevos nucleótidos.
La secuenciación se lleva a cabo en cuatro tubos. Cada tubo contiene el molde, el
cebador, los cuatro desoxirribonucleótidos trifosfato (dNTP), la polimerasa y un
didesoxirribonucleótido trifosfato (ddNTP) distinto en cada caso.
En cada tubo, cuando la ADN polimerasa incorpora aleatoriamente un ddNTP la
reacción se detiene, de manera que se generan fragmentos de distinta longitud, todos
ellos con el mismo ddNTP terminal. Los diversos fragmentos se separan en función de
su tamaño mediante electroforesis en gel de poliacrilamida, una técnica que permite
separar fragmentos de ADN cuya longitud difiere en un sólo nucleótido. A partir del gel
se puede reconstruir la secuencia que se ha sintetizado, que es complementaria a la
secuencia del molde. Mediante esta tecnología, se puede determinar la secuencia de
moléculas de ADN de hasta 800 nucleótidos de longitud.
MEJORAS EN EL MÉTODO DE SANGER
Introduciendo ligeras variaciones en el método original de Sanger se ha conseguido
automatizar el proceso. Esta es la principal razón de que se siga utilizando este método
hoy en día, a diferencia del método de Maxam y Gilbert, que ya apenas se utiliza.
Las mejoras introducidas son las siguientes:
1.- Los ddNTP terminadores de cadena están marcados fluorescentemente. Cada
ddNTP se marca con un fluoróforo distinto, que no interfiere en la reacción de la
polimerasa y que emite luz con una longitud de onda característica. De este modo, la
reacción se lleva a cabo en un sólo tubo, no en cuatro.
2.- Se sustituye la ADN polimerasa por la Taq-polimerasa. De este modo es posible
automatizar el proceso como si se tratara de una PCR. En cada ciclo aumenta de forma
exponencial el número de fragmentos generados, cada uno marcado con una molécula
fluorescente que emite luz de distinto color, en función del ddNTP terminal. Por eso, a
este método también se le conoce como secuenciación cíclica.
3.- La separación de los fragmentos se realiza mediante electroforesis capilar, que es
más rápida que la electroforesis en gel. Los fragmentos de distintos tamaños llegan al
final del capilar, donde son excitados con un láser y se detecta la fluorescencia
emitida por el ddNTP terminal. El color de esta fluorescencia determina de qué
nucleótido se trata. El gráfico resultante se denomina electroferograma, en el que se
observan picos de diversos colores. Cada color indica qué nucleótido ocupa cada
posición en la molécula de ADN o, lo que es lo mismo, su secuencia.
PIROSECUENCIACIÓN
La pirosecuenciación es otro método enzimático que permite determinar la secuencia
de una molécula de ADN. Se necesitan los siguientes componentes:
•
•
•
•
•
•
un ADN de cadena sencilla que actúa como molde
un cebador para iniciar la síntesis de ADN
tres desoxirribonucleótidos trifosfato (dGTP, dCTP y dTTP) más
desoxiadenosina alfa-tiotrifosfato (dATP•S, un derivado del dATP que puede
ser utilizado normalmente por la ADN-polimerasa pero que no es reconocido
por la luciferasa).
cuatro enzimas: ADN polimerasa (que cada vez que añade un nuevo
desoxirribonucleótido trifosfato a la cadena naciente genera una molécula de
PPi), ATP sulfurilasa (que convierte el PPi en ATP en presencia de APS),
luciferasa (que, en presencia de ATP, convierte la luciferina en oxiluciferina y
genera un fotón de luz visible) y apirasa (que degrada los nucleótidos que no se
han incorporado a la cadena naciente y el ATP generado por la sulfurilasa).
adenosina 5'-fosfosulfato (APS)
luciferina
La pirosecuenciación es un método de síntesis, porque la secuencia del molde se
determina a medida que se sintetiza su hebra complementaria. Para determinar cuál es la
base que se añade durante la síntesis se lleva a cabo, en riguroso orden, una serie de
reacciones enzimáticas:
•
1.- El cebador hibrida con el molde y se incuba en presencia de las cuatro
enzimas (ADN polimerasa, ATP sulfurilasa, luciferasa y apirasa) y de los
sustratos APS y luciferina.
•
2.- Se añade uno de los cuatro desoxirribonucleótidos trifosfato (por ejemplo,
dCTP) a la mezcla de reacción anterior. Si resulta ser el complementario a la
hebra molde, se incorporará a la nueva cadena de ADN y se producirá una
molécula de PPi por cada desoxirribonucleótido incorporado (ya que puede
haber varias bases iguales seguidas en la secuencia del molde). Si no es el
complementario al molde, se añade otro desoxirribonucleótido trifosfato (por
ejemplo, dGTP). Si es el correcto, se formará PPi y si no, se añade un tercero
(por ejemplo, dTTP). Si es el correcto, se formará PPi y si no, se añade dATP•S
que, ahora sí, será incorporado a la nueva cadena de ADN.
•
3.- En presencia de APS, la ATP sulfurilasa convierte el PPi en ATP. Este ATP
provoca la conversión de luciferina en oxiluciferina mediante la enzima
luciferasa. Esta reacción genera una cantidad de luz visible proporcional a la
cantidad de ATP consumido. Esta luz es captada por un fotodetector, dando
lugar a un pico en el pirograma. La altura del pico es proporcional al número de
nucleótidos que se han incorporado.
•
4. La apirasa degrada todos los desoxirribonucleótidos trifosfato (y el dATP•S)
que no se han incorporado, así como el exceso de ATP producido por la reacción
de la ATP sulfurilasa. Durante la pirosecuenciación, no se añade un nuevo
desoxirribonucleótido trifosfato (etapa 2) hasta que la apirasa haya degradado
por completo todos los nucleótidos no incorporados y el ATP.
Secuenciación masiva en paralelo
Los métodos de la primera generación son capaces de secuenciar hasta 100 kbases al
día, con lo que se necesitan varios años para secuenciar el genoma humano. Durante
esta última década se han desarrollado los denominados "métodos de segunda
generación" que son capaces de llevar a cabo el proceso de secuenciación de forma
muchísimo más rápida. Estos métodos se caracterizan porque secuencian de forma
masiva y simultánea (en parealelo) la genoteca completa y permiten secuenciar la
totalidad del genoma humano en cuestión de días.
454-pirosecuenciación
La primera fase de este método consiste en la preparación de una genoteca. Se
fragmenta el ADN genómico por métodos suaves como, por ejemplo, la nebulización,
que genera fragmentos de entre 300 y 800 pares de bases. Se marcan los extremos de
los fragmentos con dos tipos de adaptadores, que denominaremos A y B (uno
permitirá que el fragmento se una a las esferas de agarosa y el otro es complementario al
oligonucleótido que actuará como cebador en las fases de amplificación y
secuenciación). Se seleccionan los fragmentos marcados en uno de sus extremos con el
adaptador A y en el otro con el adaptador B.
En la segunda fase se hace una PCR en emulsión, es decir, en una mezcla de aceite y
agua. Para ello, primero se mezclan los fragmentos de la genoteca con esferas de
agarosa recubiertas con un oligo complementario a uno de los adaptadores. Se hace la
mezcla de forma que cada esfera sólo se una a un fragmento de la genoteca. Después
se añade una emulsión que contiene, en su fase acuosa, todos los reactivos necesarios
para la PCR. Cada esfera queda aislada en una gota acuosa rodeada de aceite y
separada de las demás esferas. Cada gota se convierte en un microrreactor en el que se
lleva a cabo la PCR. En cada gota aumenta exponencialmente el número de
fragmentos de ADN (todos ellos idénticos) que, a su vez, se unen a los
oligonucleótidos que recubren la esfera. Al final del proceso, cada esfera está recubierta
de aproximadamente dos millones de fragmentos de ADN.
A continuación, se deshace la emulsión y se depositan las esferas recubiertas de ADN
en una placa que contiene cientos de miles de pocillos con un diámetro medio de 44
μm, de manera que en cada pocillo sólo cabe una esfera. Algunos pocillos pueden
quedar vacíos. A continuación se añaden otras esferas más pequeñas sobre las que se
han inmobilizado dos de las enzimas que intervienen en el proceso de pirosecuenciación
(la sulfurilasa, que convierte el PPi en ATP, y luciferasa, que convierte la luciferina en
oxiluciferina y genera un fotón de luz).
En la tercera fase se lleva a cabo la pirosecuenciación. El sistema de flujo hace pasar
de manera secuencial cada uno de los cuatro nucleótidos a través de la placa que
contiene los pocillos. Se añaden siempre en el mismo orden (TACG) con lo que se
consigue una secuenciación masiva en paralelo (cientos de miles de pocillos, cada uno
con dos millones de fragmentos de ADN). Cada vez que en uno de los pocillos se
incorpora un nucleótido se genera una señal quimioluminiscente que es recogida por
una cámara digital. Esta señal es proporcional al número de nucleótidos que se
incorporan en cada pocillo. La adición secuencial de los cuatro nucleótidos se repite 42
veces.
En la cuarta fase se hace un análisis de las imágenes obtenidas en cada pocillo y se
determina la secuencia de cada fragmento. A partir de esta colección de secuencias se
reconstruye la secuencia genómica original por métodos computacionales.
Descargar