tecnologías novedosas de tamizaje rápido - Elfos Scientiae

Anuncio
CAPÍTULO 19
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
347
TECNOLOGÍAS NOVEDOSAS
DE TAMIZAJE RÁPIDO: ANÁLISIS
COMPARATIVO DE LA EXPRESIÓN
GÉNICA Y EL GENOMA
ISABEL A GUILLÉN PÉREZ1, JULIO R FERNÁNDEZ MASSÓ2
1
Departamento de Cicatrización y Regeneración.
2
Neurobiología Molecular. División de Farmacéuticos. Centro de Ingeniería Genética y
Biotecnología (CIGB), Ave 31 e/ 158 y 190, Cubanacán, Playa. AP 6162, CP 10600,
Ciudad de La Habana, Cuba.
INTRODUCCIÓN
G racias al desarrollo vertiginoso de las técnicas de secuenciación de ADN, y a
la posibilidad de almacenar información en bases de datos de fácil acceso a
todos los usuarios, se han podido secuenciar un gran número de genes e, incluso, genomas completos de diferentes organismos que van desde los microbios
hasta el hombre. Este poderoso avance se ha podido constatar además en diversas esferas de la ciencia, como la medicina, la biología molecular y la
biotecnología (industrial, farmacéutica y agropecuaria), lo que a su vez, según
el criterio de muchos investigadores ha permitido adentrarnos en la “era del
genoma funcional” o “era post-genómica”.
Los adelantos que se realicen en el estudio de la incidencia de las mutaciones
génicas en la población y, su repercusión en la aparición y desarrollo de las
enfermedades (genómica), así como en los patrones de expresión molecular a
nivel de ARN mensajero (ARNm) (transcriptoma) y proteínas (proteómica),
serán el complemento imprescindible para descifrar y comprender la función
de múltiples genes que conforman el recientemente secuenciado genoma
humano, y de otros muchos organismos vivos cuya composición genética ya
ha sido develada [1,2].
Por lo que en los próximos años el descubrimiento de nuevos genes, la evaluación del polimorfismo, grupos alélicos de genes conocidos o desconocidos en
las poblaciones, y el diagnóstico de enfermedades, serán entre otros muchos,
348
CAPÍTULO 19
los retos futuros para la comunidad científica mundial. Esto, unido al acelerado
desarrollo de la industria farmacéutica, permitirá la obtención de novedosos
fármacos y terapias.
Entre las técnicas clásicas que han permitido incrementar durante décadas el
conocimiento de las funciones génicas, se encuentra el Northern blot [3], cuya
aplicación como herramienta experimental es clave en la comprobación de los
resultados obtenidos mediante las técnicas de tamizaje rápido (HTS, del inglés
high throughput screening); los ensayos de protección con la ARNasa [4], y
la hibridación diferencial de colonias [5], entre otras tecnologías. Estas
metodologías, que hoy en día no dejan de tener gran importancia y aplicación en
las investigaciones científicas, llevan implícitas desventajas en su uso, como
son: el tiempo que consumen en su desarrollo, el número limitado de muestras
que se pueden analizar en cada experimento, la cantidad necesaria de ARN y
ADN complementario (ADNc) en su realización, su reproducibilidad, la fiabilidad de la cuantificación de la expresión génica, y la necesidad de conocer, en
algunos casos la secuencia de los genes en estudio. Por estas razones, los científicos han abordado, avanzado y perfeccionado los métodos para la introducción de las técnicas de HTS en las investigaciones clínicas e industriales.
Las técnicas de HTS, introducidas para el estudio comparativo de la expresión
génica en cuanto al análisis de la representatividad del ARNm en células y
tejidos, constituyen herramientas moleculares actuales, excelentes para el estudio
de la función de los genes (Tabla 19.1).
Tabla 19.1. Técnicas que permiten hacer tamizaje rápido de la expresión génica y el
genoma
Estos métodos novedosos han sido desarrollados para el análisis en gran escala
de la secuencia génica y la expresión génica a nivel de ARNm y proteínas, por
lo que permiten hacer un estudio comparativo del polimorfismo genético en las
poblaciones y, conocer la diferencia de expresión génica entre muestras diferentes, pero relacionadas en su origen.
La decisión de los investigadores de aplicar una u otra de las técnicas mencionadas anteriormente, depende en gran medida, de las posibilidades materiales de
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
349
que dispongan, como por ejemplo la posibilidad de contar con laboratorios espaciosos, con el equipamiento necesario para el trabajo, y el financiamiento adecuado. De todas estas tecnologías las menos costosas son: la expresión diferencial y
el RDA, las cuales son de fácil acceso para laboratorios pequeños y con pocos
recursos. Por el contrario, los EST, el SAGE y los bio-arreglos, necesitan un
desarrollo tecnológico integral para su eficiente y confiable aplicación.
A continuación se describen de forma general las bases funcionales y los procedimientos de trabajo de cada una de las técnicas de HTS. Es necesario tener
en cuenta que estas metodologías están en constante perfeccionamiento,
racionalización y desarrollo.
EXPRESIÓN DIFERENCIAL
Desde que se comenzó a establecer esta técnica en 1992 [6], su utilización se
presentó como un método rápido y de alta reproducibilidad para la comparación
diferencial de la expresión génica de dos o más poblaciones celulares o tejidos.
Inicialmente se utilizaron nucleótidos radiactivos y luego se hizo menos riesgoso
su uso con el empleo de nucleótidos marcados con fluoresceína.
La aplicación de esta técnica y de otras que se comentarán más adelante,
involucra etapas “claves”, en las que el control y buen manejo de las muestras
garantizan la confiabilidad en el resultado final. Entre las etapas “claves” se
encuentran la óptima selección de la fuente de la muestra y la pureza del ARN
a estudiar, por lo que condiciones inadecuadas de aislamiento y almacenamiento de células y tejidos los cuales constituyen el material de partida para e l
aislamiento del ARN total, pueden conducir a resultados no satisfactorios y no
confiables durante su desarrollo.
El ARN total, libre de ADN genómico, se utiliza en la realización de la transcripción inversa con un oligo dT (5’-T12 MG-3’) que da lugar a una primera
cadena del ADNc, la cual es utilizada como “ADN cebador” para desarrollar
la reacción en cadena de la polimerasa (PCR) [11] con el empleo de
oligonucleótidos de 10 bases (5’-ATGGTCTCAA-3’) que pueden reconocer
e hibridar en sitios específicos o aleatorios del “DNA cebador” y utilizan para
esto el oligonucleótido 5’-T12 MG-3’ y un deoxy nucleótido (dNTP) marcado
con radioactividad o con fluoresceína. Cada uno de estos oligonucleótidos de
10 bases puede generar miles de fragmentos de ADNc amplificados en un
solo tubo de reacción. Las porciones de los ADNc amplificados se separan
por peso molecular mediante electroforesis en geles de poliacrilamida
desnaturalizantes, y el patrón de bandas se visualiza por autorradiografía. La
comparación del número y concentración de bandas de ADNc entre las
350
CAPÍTULO 19
muestras estudiadas, permite identificar el ADN amplificado diferencialmente
lo que implica un aumento o disminución de sus niveles de expresión.
Seguidamente se procede a realizar el aislamiento, clonaje en vectores
plasmídicos y su secuenciación, con vistas a identificar las secuencias
completas de estos genes en bibliotecas de ADNc y poder así estudiar
detalladamente sus funciones (ver Figura 19.1).
La expresión diferencial es un método simple y de fácil realización. Si se utilizan combinaciones de oligonucleótidos de 10 bases en proporciones adecuadas,
es posible detectar todos los ARNm sintetizados por las células, (Figura 19.1).
Esta técnica ha sido utilizada exitosamente en muchas áreas de la investigación, como por ejemplo, el aislamiento de genes relacionados con el crecimiento, el desarrollo y la aparición de enfermedades en el hombre, como
son el cáncer, las enfermedades coronarias y la diabetes, entre otras múltiples
patologías [12-14].
ANÁLISIS DE REPRESENTACIÓN
DIFERENCIADA (RDA)
Esta técnica basada en dos herramientas básicas de la biología molecular, la
hibridación del ADN y la PCR [7], permite determinar la diferencia en la
expresión génica entre muestras de interés; por ejemplo, entre la muestra control y las muestras tratadas o transformadas.
En una primera etapa, los ARNm obtenidos a partir de poblaciones celulares
diferentes (el control y la muestra) se someten a un proceso de transcripción
inversa (TI) (Figura 19.2). Seguidamente se digieren las muestras de ADNc
con una endonucleasa de alta frecuencia de corte. A los múltiples fragmentos
ADNc obtenidos, se les realiza la PCR mediante la utilización de oligonucleótidos
que hibridan en ambos extremos del ADNc. De esta forma se amplifican todos
los ARNm de las diferentes muestras estudiadas.
En una segunda etapa, los oligonucleótidos inicialmente ligados a los extremos
de los fragmentos de ADNc son escindidos y esta región se utliza para ligar
nuevos oligonucleótidos, pero esta vez sólo a los dos extremos de aquellos fragmentos de ADNc en los que se espera encontrar una diferencia o alteración en
la expresión génica (muestra tratada). Posteriormente se procede a la hibridación entre ambas muestras de ADNc (control y muestra tratada) en una relación molar de una molécula de ADNc de muestra tratada por cada mil moléculas
de ADNc control (1:1000), con el propósito de promover la hibridación entre las
cadenas simples comunes en la mezcla de ADNc control y tratado.
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
351
Figura 19.1. Expresión diferencial. El ARN mensajero (ARNm) extraído a partir de células eucariotas,
es procesado mediante la reverso transcripción (TI) con el “cebador” oligo-dt (T12GM,
donde M puede ser una G,A o C). La simple cadena de ADN obtenida es complementaria al ARNm inicial. Un “ADN cebador” secundario (oligonucleótido de 10 bases),
es diseñado para que hibride de forma azarosa con el ADN de simple cadena generado,
el cual en combinación con el oligo-dt es utilizado para amplificar grupos de ADN
complementarios (ADNc) de doble cadena, a partir del ADNc “cebador” generado por
la reverso transcripción. Los ADNc resultantes son visualizados en geles de
poliacrilamida. La banda de interés que representa el ADNc diferencialmente expresado (muestra nombrada como T) en relación con la muestra control (muestra nombrada
como C) es señalada por una flecha.
352
CAPÍTULO 19
Figura 19.2. El ARNm obtenido a partir de diferentes fuentes biológicas (células tratadas y
control) se procesa mediante la reverso transcripción. El ADNc se fragmenta con
una endonucleasa de alta frecuencia de corte. Los fragmentos son amplificados a
través de la PCR, e hibridados, con el objetivo de poder conocer la diferente
representatividad de los transcritos entre ambas poblaciones celulares.
Como tercera etapa, se somete la muestra resultante de la hibridación a una
PCR que sólo amplifica las moléculas homodúplex (ADNc tratado-ADNc tratado, que contienen ambas cadenas del ADNc de la muestra a investigar), por
contar en sus extremos con los oligonucleótidos añadidos en la segunda etapa
de este procedimiento. Las moléculas heterodúplex (ADNc control-ADNc tratado) no son sustrato de la polimerasa durante la amplificación debido a que
contienen en sólo uno de sus extremos el oligonucleótido que sirve como cebador
para iniciar la polimerización [15].
La mayor ventaja de la utilización de la RDA es la posibilidad de amplificar
exclusivamente los fragmentos presentes en la muestra tratada, debido a que
hay un enriquecimiento de aquellos ARNm expresados diferencialmente.
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
353
Al igual que la expresión diferencial, la RDA se ha empleado para aislar genes
expresados diferencialmente durante el desarrollo de los organismos vivos, durante los procesos patológicos y en células estimuladas con factores de crecimiento [16, 17].
“MOTIVOS” DE SECUENCIA EXPRESADOS (EST)
Sólo un por ciento muy bajo del genoma de los organismos superiores corresponde a secuencias que codifican proteínas (en el hombre es el 3 %). En 1991,
Adams y colaboradores [8] describieron por primera vez la aplicación de la
secuenciación rápida de ADNc, procedimiento en el que se seleccionaron
aleatoriamente clones de ADNc de bibliotecas obtenidas a partir de ARNm del
cerebro humano y se secuenciaron de forma parcial. Estos clones representaban los genes expresados en el tejido cerebral y fueron denominados “motivos”
de secuencias expresadas (EST). A partir de ese momento muchos laboratorios
en el mundo siguieron este procedimiento de trabajo para realizar estudios similares en diferentes organos y tejidos de variadas especies de animales y plantas.
Los EST se pueden utilizar para determinar las variaciones en una o más
bases de los genes en estudio, con lo cual se puede determinar su polimorfismo
(single nucleotide polimosphism [SNP], a traducir “polimorfismo de un solo
nucleótido”). Esta posibilidad hace a este procedimiento una herramienta potente para el estudio de las enfermedades humanas de origen genético [18] y
para estudios relacionados con la evolución de las especies [19].
Esta tecnología alberga un gran valor por la posibilidad que brinda de descubrir
nuevos genes y mapear sus posiciones en los cromosomas. Su aplicación permite, además, determinar el perfil de expresión génica de una célula o un tejido
en estudio, los cuales definen sus características biológicas básicas.
Durante la década de 1990, el procedimiento de los EST desempeñó un papel
primordial en el descubrimiento de genes que codifican para los ARNm, y contribuyó enormemente a la definición de las secuencias limites entre intrones y
exones en el genoma. De esta forma ha permitido predecir las regiones
transcripcionales y ha contribuido, en gran medida a la comprensión del genoma
humano, gracias a que ha facilitado distinguir entre las secuencias genómicas
que se expresan y las que no lo hacen.
Los clones de ADNc (aislados de bibliotecas de ADN) son seleccionados al
azar y secuenciados [20]. Seguidamente, el resultado de la secuenciación se
compara con las secuencias almacenadas en las bases de datos de genes disponibles en Internet (GeneBank, dbESt y UniGene), e inmediatamente se
seleccionan las secuencias nuevas, que no han sido informadas en la literatura
internacional, ni en estas bases de datos con anterioridad (Figura 19.3).
354
CAPÍTULO 19
A partir del análisis de la frecuencia de aparición de secuencias en una biblioteca de expresión, es posible calcular, de forma aproximada, los niveles de expresión de cada gen en las células o tejidos en estudio.
Entre las desventajas de este método está la necesidad de facilidades de
secuenciación de ADN en gran escala, lo cual, en la mayoría de los casos, es
incompatible con las posibilidades reales de los pequeños laboratorios de investigación y con pocos recursos.
Figura 19.3. La secuenciación de los fragmentos genómicos, permite comparar con los existentes en las bases de datos de secuencias. Si son secuencias desconocidas hasta el
momento, se procesan mediante un programa que permite predecir la localización
de los EST, mediante la detección del sitio de inicio de la transcripción y los sitios
de posible empalme transcripcional. Una vez definida la localización de los enlaces de intrones/exones, es que se puede tener certeza de la secuencia génica del gen
transcrito (a). Un ejemplo de alineación de secuencia genómica y de ESTs, es la que
permite identificar la posición de los intrones por prevalencia de secuencias GT y
AG en las regiones de enlace con los exones (b).
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
355
ANÁLISIS SERIADO DE LA EXPRESIÓN
GÉNICA (SAGE)
El análisis seriado de la expresión génica permite estudiar todos los transcritos
de una muestra y ha sido utilizada de forma satisfactoria para comparar
cuantitativamente los perfiles de expresión génica de una célula normal y una
célula cancerosa [21, 22]. Esta técnica se basa fundamentalmente en pequeños
“motivos” de secuencia de ADN que contienen suficiente información para
identificar sólo un transcrito dentro de la población de ARNm [23].
Con el empleo de esta técnica, los clones de ADNc son digeridos al azar y
secuenciados desde uno o ambos extremos de cada hebra de ADN clonada. En
el desarrollo del método, el proceso de secuenciación no se realiza sobre un
único fragmento de ADNc, sino sobre una mezcla de fragmentos de ADNc
obtenidos a partir de diferentes transcritos, los cuales forman concatámeros
(Figura 19.4). Luego estas secuencias, las cuales brindan información de múltiples genes, se comparan con las existentes en los bancos de genes y permite
identificar secuencias desconocidas hasta ese momento. Posteriormente, mediante la determinación de la frecuencia con que estos clones (novedosos o no)
aparecen en una biblioteca de expresión, se pueden calcular los niveles de ARNm
de cada gen, siempre que la variación en la expresión génica entre la muestra
control y la muestra en estudio sea altamente significativa. Mediante la
determinación del número de veces que un motivo de secuencia se observa en
una población particular, se puede obtener información directa de los niveles de
expresión de ciertos transcritos, cuyos resultados se analizan finalmente mediante
los análisis estadístico adecuados para estos fines [23].
Las aplicaciones del SAGE son múltiples. Entre los resultados obtenidos se
encuentran la obtención de marcadores para el diagnóstico de enfermedades
basado en la diferencia de expresión de estos marcadores en los tejidos normales y los tejidos enfermos (por ejemplo, en tumores gastrointestinales, cáncer de
páncreas, transformaciones debidas a mutaciones en los genes reguladores de
p53, entre otros) [21, 22].
TECNOLOGÍA DE LOS BIO-ARREGLOS
La técnica más atractiva y poderosa de los HTS son los bio-arreglos. Esta
tecnología permite conocer la expresión génica diferencial a través de la
cuantificación del aumento o disminución en la expresión de genes durante la
manifestación de enfermedades, o el desarrollo de un estado fisiopatológico,
aspecto este de vital importancia para lograr un desarrollo acelerado en el aumento de los niveles de salud en el mundo.
356
CAPÍTULO 19
Figura 19.4. Análisis de la expresión génica (SAGE). En la etapa 1, se aísla el ARN mensajero a
partir del ARN total procesado con oligo dt celulosa. En la etapa 2 mediante la
utilización de la transcripción inversa, y un oligo dt marcado con biotina, se obtiene una primera cadena de ADNc. En la etapa 3, el ADNc obtenido, se fragmenta
mediante una endonucleasa de alta frecuencia de corte. En la etapa 4, se favorece
la unión de los extremos 3’ de los ADNc digeridos, a perlas magnéticas recubiertas
con estreptavidina. En las etapas 5 y 6, los ADNc se dividen en dos fracciones
diferentes a las cuales se les adicionan los oligonucleótidos A y B, respectivamente. Estos oligonucleótidos contienen sitios de unión para la enzima de restricción
tipo II-S (esta enzima fragmenta el DNA a una distancia definida desde su sitio de
reconocimiento), lo que permite que en las etapas 7 y 8, los ADNc sean separados
de los oligonucleótidos A y B. Los ADNc son ligados para formar concatámeros,
y finalmente clonados, amplificados y secuenciados (23).
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
357
Los bio-arreglos ofrecen ventajas evidentes en relación con las demás tecnologías de los HTS explicadas con anterioridad en este capítulo (EST, SAGE, ARN
y expresión diferencial). Estas ventajas están dadas por el hecho de que los bioarreglos son menos laboriosos, más sensibles, no necesitan del conocimiento previo de las secuencias génicas en estudio y, sobre todo, tienden cada vez más a
miniaturizarse y a contener mayor cantidad de genes por área. Todo esto conduce a un procesamiento paralelo de miles de genes con una mayor precisión y
rapidez .
Sin embargo, los bio-arreglos no constituyen la panacea de los estudios de expresión génica, ya que los resultados obtenidos mediante esta tecnología requieren una validación con otras herramientas analíticas, como, por ejemplo, el
Northern blot, la hibridación in situ, la inmunohistoquímica, la proteómica, la
bioinformática y la bioestadística [24].
Hasta la fecha se han desarrollado dos formas de realizar las bio-arreglos: los
macro y los microarreglos, clasificación que está relacionada con el número de
muestras en los soportes, el diámetro del “spot” y el tipo de soporte sobre el
cual se organicen las biomoléculas sometidas a tamizaje.
Las biomoléculas a utilizar en las bio-arreglos pueden ser bibliotecas de DNAc
[25], fragmentos obtenidos por PCR (500 a 5000 pb) [10], oligonucleótidos (20
a 25 mer) [11], y proteínas [26]. Cientos de miles de muestras utilizadas en el
tamizaje se aplican e inmovilizan de forma organizada sobre soportes de vidrio
o de plástico, los cuales son rígidos e impermeables y ofrecen ventajas importantes en relación al uso de las membranas de nylon que también pueden ser
utilizadas con estos fines, por ejemplo son más prácticas, resistentes a los tratamientos de la hibridación molecular y abarcadoras, ya que en ellos se pueden
incluir más de 8000 genes/microarreglo [27].
La hibridación de las bio-arreglos se realiza con las sondas de interés (ARN,
ADN y proteínas) marcadas con radioactividad, fluoresceína, fosfatasa alcalina,
entre otros), cuyos resultados son analizados posteriormente mediante técnicas
imagenológicas basadas en la emisión de señales isotópicas, fluorescentes y
quimioluminescentes. Estas técnicas se pueden realizar de forma manual o
semiautomática.
Finalmente, el estudio y la aplicación de los resultados de la diferencia de expresión génica que se obtienen con la utilización de las bio-arreglos, requiere la
generación de una base de datos que sirva para el manejo de los genes representados en sus soportes y el análisis, la cuantificación y la interpretación de las
señales que se visualicen en cada investigación [28].
358
CAPÍTULO 19
BIO-ARREGLOS DE A D N
C
La primera información sobre el uso de esta tecnología se publicó en la revista
Science en 1995 [10]. Desde entonces se ha ido desarrollando a través de los
años, y actualmente constituye una de las herramientas más poderosa para el
estudio de la expresión génica en los organismos vivos, desde las bacterias, las
levaduras, las plantas, los animales hasta el hombre. Su uso permite cuantificar
la expresión de cientos a miles de genes expuestos simultáneamente a las muestras de ADNc a analizar, lo que permite conocer la diferencia en la expresión
génica en muestras tratadas con fármacos o toxinas, células con estructuras
alteradas y sus respectivos controles no tratados o no alterados.
Los principios básicos de la tecnología de las bio-arreglos de ADNc se basan en
la deposición de pequeñas cantidades, aproximadamente 5 nanolitros (2-10 ng) de
ADN de secuencias conocidas (obtenida de los bancos de datos de secuencias
génicas) o desconocidas (obtenidas de bibliotecas de ADNc) sobre soportes de
vidrio, plástico o membranas de nylon en posiciones conocidas y muy bien
organizadas, utilizando con este fin máquinas organizadoras automatizadas o
semiautomatizadas.
Estos grupos de ADNc a utilizar en los bio-arreglos se pueden obtener por
amplificación mediante la técnica de la PCR, pudiendo ser fragmentos entre
0,5 kb y 0,2 kb), o se pueden utilizar clones de ADNc (ADNc insertado en un
vector plasmídico).
La utilización de soportes sólidos, similares a los portaobjetos de vidrio de los
microscopios, va aparejada con la intención de analizar una gran cantidad de
genes (10 000 a 30 000 muestras). En estos casos el marcaje de la sonda de
ARNm o ADNc se debe realizar con fluorescencia. Los soportes de vidrio deben
ser cubiertos previamente con poli-L-lisina (Sigma, EE.UU.) y a continuación los
ADNc se fijan a esta matriz mediante luz ultravioleta (UV) (ver Figura 19.5).
La sonda de ADNc marcada con fluorescencia se hibrida con los microarreglos
de ADN [29]. Seguidamente, los resultados de la hibridación se obtienen mediante un escáner que genera una imagen y un dato numérico para cada señal
en el soporte.
El lector de bio-microarreglos es generalmente un microscopio confocal fluorescente que tiene acoplado un escáner y una computadora, además de contar
con un sistema doble o múltiple de iluminación a láser (ScanArrayer 4000 y
5000, Estados Unidos).
Por otro lado, la decisión de utilizar soportes de nylon depende de la baja densidad de clones a analizar (1 000 a 10 000 clones), y además, del empleo de
métodos de marcaje de sondas que involucran isótopos radioactivivos (32 P y
33
P) o quimioluminescencia (fosfatasa alcalina).
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
359
Figura 19.5. Etapas básicas para la confección de los microarreglos de ADN. Se realiza el
aislamiento del ARNm de las células o tejidos a estudiar, seguidamente se obtienen los ADNc marcados (con fluoresceina, isótopos radioactivos o fosfatasa
alcalina), y se hibridan con los ADNc organizados en los bio-arreglos. En la figura,
se observa cómo los ADNc son diferencialmente expresados mediante un aumento o disminución de la señal (ver los puntos negros y grises).
El ADNc que se va a organizar en membranas de nailon, puede tener orígenes
similares a los comentados para los soportes sólidos ya sean de vidrio o plástico,
con la diferencia de que las membranas no requieren ningún tratamiento previo
para fijar el ADN. Una vez aplicada la muestra, se logra un enlace óptimo
sobre la superficie de la membrana mediante su exposición a luz UV. Luego, se
realiza la hibridación de la muestra de ADNc marcado con las muestras ancladas al bio-arreglo de ADNc (vea procedimiento detallado en “AtlasTM ADNc
Expresion Arrays User Manual”, sitio web http://www.clontech.com).
El procesamiento, análisis e interpretación de la expresión génica se realiza a
través de potentes programas de análisis de imágenes (AtlasImagenTM , http://
www.clontech.com), los cuales se basan en la integración de toda la información sobre los genes analizados, una eficiente capacidad cuantificadora de la
señal y el acceso directo a una gran cantidad de secuencias almacenadas en los
bancos de genes.
El objetivo de los analizadores de imágenes de los bio-microarreglos es brindarle al investigador la información cuantificada de la intensidad de la señal de
cada ADNc anclado sobre el soporte, y enlazar esta información con su identificación y coordenadas de ubicación. Esto permite interpretar fácilmente los
resultados y poder diseñar etapas posteriores de investigación y análisis.
360
CAPÍTULO 19
Durante años, el uso de los bio-arreglos de ADN ha permitido descubrir nuevos
genes y comprender sus funciones. Un ejemplo lo constituyen los estudios de
diferenciación de la expresión génica en roedores, en presencia o ausencia de
una dieta con restricción calórica. Los resultados obtenidos permitieron demostrar la importancia de este tipo de dieta en el retardo de los procesos celulares
relacionados con la edad y el envejecimiento. Estos estudios podrían proporcionar la clave para lograr una mayor longevidad y duración del tiempo de vida en
los mamíferos [30]. Mediante estudios de la expresión diferencial de genes en
la artritis reumatoide, se han podido identificar cerca de cien genes involucrados
en el proceso inflamatorio de este padecimiento [31], de esta misma manera se
han identificado genes que participan en la resistencia de determinadas células
cancerosas a los tratamientos antitumorales [32].
CHIPS DE ADN
Para construir los chips de ADN se utilizan oligonucleótidos, que se organizan
en el orden de cientos de miles (de 10 000 a 100 000 moléculas por cm2 ), con
una alta resolución espacial y localización precisa sobre soportes sólidos, en
este caso portaobjetos de vidrio a los que se les han añadido sustancias químicas,
por ejemplo, ácidos carboxílicos importantes para la unión irreversible de la
biomolécula al soporte.
Estas biomoléculas pueden ser sintéticas o naturales. La síntesis in situ de los
oligonucleótidos que se utilizarán en los chips de ADN, se realiza con
desprotección selectiva del extremo amino de los nucleótidos y el extremo 5’
de los oligonucleótidos, mediante una pantalla fotolitográfica e irradiación con
luz UV [33]. Varios ciclos de desprotección selectiva y acoplamiento de estas
moléculas sintéticas al soporte sólido, permiten la creación de los chips de
ADN, las cuales pueden contener hasta 96 000 sondas/chip de las biomoléculas
seleccionadas [34].
El consorcio comercial “Affymetrix” (Santa Clara, CA, EE.UU.) es pionero en
el uso de la desprotección fotolitográfica, y en la síntesis de oligonucleótidos
sobre fase sólida. Este consorcio fabrica los chips de ADN y ha expuesto al
mercado los denominados “Genechips”, que contienen información de
aproximadamente 12 000 genes humanos, útiles para los estudios del cáncer,
estudios neurobiológicos, toxicológicos, entre otros.
Las sondas (ARNm) a utilizar en la hibridación de los chips de ADN son marcadas directamente con grupos químicos fluorescentes e introducidos en la cámara de hibridación para su complementación con las biomoléculas ancladas al
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
361
chip. El rayo de excitación láser atraviesa el soporte sólido y la luz emitida por
las moléculas excitadas (fluorescencia) pasa a través de lentes y filtros ópticos
hasta llegar a un detector sensible que, mediante un barrido de la emisión de luz
en los chips, permite cuantificar la intensidad de las imágenes fluorescentes.
Existen varios equipos en el mercado (GenePix TM 4000 scanner, Axon Instrument,
CA, EE.UU.) que brindan una alta resolución e imágenes multicolores de los
resultados de la hibridación de los chips (Figura 19.6). Finalmente se relacionan las señales obtenidas y las secuencias previamente conocidas y organizadas en los chips de ADN con los niveles de expresión génica.
El uso de la tecnología de los chips de ADN ha facilitado el estudio del
polimorfismo genético, y la comprobación de la presencia de miles de alelos
alternativos en poblaciones de animales [35]. Por ejemplo, ha permitido conocer el gran polimorfismo que existe en el gen de la proteasa de clase B del virus
de inmunodeficiencia humana (VIH-1). De este estudio se obtuvo información
importante para la terapia de esta enfermedad [36]. También se han podido
validar nuevos medicamentos y conocer las variaciones en la expresión génica
entre células normales y células con alteraciones particulares [37].
LA APLICACIÓN DE LA BIOINFORMÁTICA
A LA TECNOLOGÍA DE LOS BIO-ARREGLOS
El desarrollo de la bioinformática es crucial para la interpretación de los resultados que se obtienen con la tecnología de los HTS.
La bioinformática es una disciplina que incluye aspectos de la ciencia de la
computación, de la ingeniería de “software”, de las matemáticas y de la biología
molecular [38, 39]. Por eso la bioinformática se considera una ciencia integral
que, utilizada en la “era del genoma funcional”, puede funcionar como enlace
entre la selección de genes de expresión variable, su caracterización y su posible función [40].
El comienzo de la era genómica en la industria farmacéutica se inició con el
desarrollo de los EST en el 1993, año en el que se produjo un salto vertiginoso
en la información de secuencias génicas. Este salto hizo necesario comenzar a
construir toda una infraestructura bioinformática, que se caracterizó rápidamente por la posibilidad de comparar secuencias mediante su alineación. Esta
etapa marcó la creación de una base de datos cuya función es servir como una
herramienta de búsqueda y alineación de secuencias génicas. Esta base de
datos se denominó BLAST (del inglés basic local alignment search tool).
362
CAPÍTULO 19
Figure 19.6. A partir de muestras de células o de tejidos se obtiene el ARNm, que mediante la
transcripción inversa utilizando nucleótidos marcados con fluoresceina dan lugar a
una mezcla de ADNc, que es utilizada como sonda en la hibridación de los chips de
ADN (a). Los chip de ADN son preparados utilizando portaobjetos de microscopios
donde se encuentran punteados de forma organizada miles de oligonucleótidos
(conteniendo las regiones génicas de interés) (b). Finalmente se realiza la hibridación
y lavado de los chip de ADN para crear así los híbridos fluorescentes (c).
El desarrollo de los EST requirió una infraestructura adecuada para el procesamiento de una gran cantidad de datos y la realización de análisis básicos. De
esta forma se aceleró la creación de programas cada vez más sofisticados que
contenían información sobre los genes de diversas bibliotecas de DNAc, procedentes de tejidos, enfermedades y estadios del desarrollo.
Este impetuoso desarrollo se aceleró con la secuenciación de múltiples genes
microbianos [41]. Fue así como se comenzaron a diseñar algoritmos novedosos
que permitieran el ensamblaje de las secuencias leídas, realizándose este desde
secuencias pequeñas (en el rango de las kilobases) hasta secuencias de genomas
completos (en el rango de las megabases). También a partir de estos algoritmos,
fue posible el análisis de la expresión génica, la realización de estudios
filogenéticos, y la dilucidación de la estructura primaria y/o función de genes
novedosos. Todos estos aspectos fueron incorporados paulatinamente al BLAST,
lo que fue de vital importancia para el desarrollo de las compañías biotecnológicas
y farmacéuticas productoras de antibióticos.
En la actualidad la bioinformática ha vuelto a revolucionarse, con la secuenciación
del genoma humano [1, 41], los estudios de polimorfismo de un sólo nucleótido
(SNP) y las investigaciones de la expresión génica mediante el empleo de la
tecnología de los bio-arreglos.
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
363
Los nuevos programas, además de requerir la aplicación de algoritmos específicos y el manejo de datos, necesitan la incorporación de nuevos elementos a la
bioinformática, teniendo en cuenta la interpretación de los datos con el mínimo
error posible, lo cual constituye el verdadero valor de los conocimientos, procedentes de la utilización estas tecnologías.
La ingeniería de los software está sufriendo una transformación cualitativamente
superior que va encaminada hacia la “integración inteligente” de todos los elementos biológicos como son: fragmentos de ácidos nucleicos, cromosomas completos, proteínas, células, organismos y poblaciones (Figura 19.7). Así, con el
desarrollo de analizadores de bases de datos cada vez más potentes, los procedimientos de tamizaje rápido podrán contribuir al desarrollo de nuevos medicamentos, con una velocidad y eficiencia impensables hasta nuestros días [27].
Figura 19.7. Esta figura refleja la integración que debe existir entre todos los datos obtenidos a
partir de muchas fuentes interrelacionadas, para finalmente poder brindar un
análisis global de los resultados mediante el uso de las técnicas de HTS. Por
ejemplo, para poder comprender los patrones de expresión de ciertos genes durante el desarrollo de una enfermedad maligna, es necesario conocer su ubicación
en el genoma, su polimorfismo, sus patrones de expresión durante las diferentes
etapas de la vida, la frecuencia de aparición de esta enfermedad en la población,
las secuencias de las proteínas para las cuales codifican, los receptores a los cuales
se unen estas proteínas y la importancia fisiológica de estos genes, entre otras
múltiples informaciones.
R EFERENCIAS
1. Venter JC, Adams MD, Myers EW, Li PW, Mural RJ, Sutton GG, Smith HO, Yandell M,, et
al. Sequence of human genome. Science 2001;291(550):1304-51.
364
CAPÍTULO 19
2. International Human Genome Sequencing Consortium. Initial sequencing and analysis of
the human genome. Nature 2001;409:860-921.
3. Alwine JC, Kemp DJ, Stark GR. Method for deletion of specific RNAs in agarose gels by
transfer to diazobenzyloxymethyl-paper and hybridization with DNA probes. Proc Natl
Acad Sci 1977;74:5350-4.
4. Berk AJ, Sharp PA. Sizing and mapping of early adenovirus RNAms by gel electrophoresis
of S1 endonuclease-digested hybrids. Cell 1977;12:721-32.
5. St. John TP, Davis RW. Isolation of galactose-inducible DNA sequences from Saccharomyces
Cerevisiae by differential plaque filter hybridization. Cell 1979;16:443-52.
6. Liang P, Pardee AB. Differential exposition of eukaryotic messenger RNA by means of the
polymerase chain reaction. Science 1992;257:967-71.
7. Lisitsyn N, Lisitsyn N, Wigler M. Cloning the differences between two complex genomes.
Science 1993;259:946-51.
8. Adams MD, Kelley JM, Gocayne JD, Dubnick M, Polymeropoulos MH, Xiao H, et al.
Complementary DNA sequencing: expressed sequence tags and human genome project.
Science 1991;252:1651-6.
9. Velculescu VE, Zhang L, Volgelstein B, Kinzler KW. Serial analysis of gene expression.
Science 1995;270:484-7.
10.Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression
patterns with a complementary DNA microarray. Science 1995;270:467-70.
11. Saiki RK, Walsh PS, Levenson CH, Erlich HA. Genetic analysis of amplified DNA with
immobilized sequence-specific oligonucleotide probes. Proc Natl Acad Sci. 1989;86:6230-4.
12. Liang P, Averboukh L, Keyomarsi K, Sager R, Pardee AB. Differential expresion and cloning
of messenger RNAs from human breast cancer versus mammary epithelial cells. Cancer
Res 1992;52:6966–8.
13.Utans U, Liang P, Wyner LR, Kraovsky MJ, Russell M. Chronic cardiac rejection: identification
of five upregulated genes in transplanted hearts by differential RNAm expresion. Proc Natl
Acad Sci USA 1994;91:6463–7.
14. Nishio Y, Aiello LP, King GL. Glucose induced genes in bovine aortic smooth muscle cells
identified by RNAm differential expresion. FASEB J 1994;8:103–6.
15. Kosian DH, Kirschbaum BJ. Comparative gene expression analysis. Trends in Biothecnology
1999;17:73-8.
16. Gress TM, Wallrapp C, Frohme M, Muller-Pillaseh F, Lacher U, Fries H, et al. Identification
of genes with specific expression in pancreatic cancer by DNAc representational difference
analysis. Genes Chromosomes Cancer 1997;19:97-103
17. Wada J, Kumar A, Ota K, Wallner EI, Batlle DC, Kanwar YS. Representational difference
analysis of DNAc of genes expressed in embryonic kidney. Kidney Int 1997;51:1629-38.
18. Collins FS. Positional cloning moves from perditional to traditional. Nat.Genet 1995;9:347-50.
19. Marra MA, Hillier L, Waterston RH. Expressed sequence tags EST ablishing bridges between
genomes.Trends Genet 1998;14:4-7.
20. Okubo K, Hori N, Matoba R, Niiyama T, Fukushima A, Kojima Y, Matsubara K. Large scale
cDNA sequencing for analysis of quantitative and qualitative aspects of gene expression.
Nature Genet. 1992;2:173-9.
T ECNOLOGÍAS NOVEDOSAS DE TAMIZAJE RÁPIDO:
ANÁLISIS COMPARATIVO DE LA EXPRESIÓN GÉNICA Y EL GENOMA
365
21. Zhang L, Zhou W, Velculescu VE, Kern SE, Hruban RH, Hamilton SR, et al. “Gene expression profiles in normal and cancer cells.” Science 1997; 276:1268-72.
22. Polyak K, Xia Y, Zweier JL, Kinzler KW, Vogelstein B. A model for p53-induced apoptosis.
Nature 1997;389:300-4.
23. Bertelsen AH, Velculescu VE. High-throughput gene expresion analysis using SAGE. Drug
Discovery Today 1998;3:152-9.
24. Sundberg SA, Chow A, Nikiforov T, Garrett Wada H. Microchip-based systems for target
validation y HTS. DDT 2000;5(12):S92-103.
25. Walker J. Rigley K. Gene expression profiling in human peripheral blood mononuclear cells
using high-density filter-based DNAc microarray J immunology Methods 2000;239:167-79.
26. Lueking A. Protein microarray for gene expression and antibody screening. Anal Biochem
1999;270:103-11.
27. Lennon GG. High-throughput gene expression analysis for drug discovery. DDT 2000;5(2):59-66.
28. Chen Y, Dougherty ER, Bittner ML. Ratio-base decisions and the quantitative analysis of
DNAc micromatriz images. J Biomedical Optics 1997;2:364-74.
29. Xiang CC. DNAc microarray technology and its applications. Biotechnology Advances
2000;18:35-46.
30. Han ES, Hilsenbeck SG, Richardson J, Nelson JF. DNAc expresion arrays reveal incomplete
reversal of age-related changes in gene expression by calorie restriction. Mechanisms of
Angeing y Development 2000;155:157-74.
31. Heller RA, Schena M, Chai A, Shalon D, Bedilion T, Gilmore J, et al. Discovery y analysis
of inflamatory disease-related genes using DNAc microarray. Proc Natl Acad Sci Estados
Unidos 1997;94:2150-5.
32. Ono K, Tanaka T, Tsunoda T, Kitahara O, Kihara C, Okamoto A, et al. Identification by
cDNA microarray of genes involved in ovarian carcinogenesis. Cancer Res 2000;60(18):5007-11.
33. Pirrung MC, Fallon L, McGall G. Proofing of photolithographic DNA syntesis with 3´ 5´dimethoxybenzoinyloxycarbonyl-protected deoxynucleoside phosphormidites. J Organic
Chem 1998;63:241-6.
34. Hacia G. Detection of heterozygous mutations in BRCA1 using high-density oligonucleotide
arrays and two color fluorescence analysis. Natural Genetic 1996;14:441-7.
35. Lipshutz RJ, Fodor SP, Gingeras TR, Lockhart D. High density synthetic oligonucleotide
arrays. Nature Genetics Supplement 1999;21:20-4.
36. Kozal M. Extensive polymorphisms observed in HIV-1 clase B protrease gene using high
density oligonucleotide arrays: inplications for therapy. Nature Med 1996;7:753-9.
37. Sgroi DC, Teng S, Robinson G, LeVangie R, Hudson JR Jr, Elkahloun AG. In vivo gene
expression profile analysis of human breast cancer progression. Cancer Res 1999;59:5656-61.
38.Waterman MS. Introduction to computational biology: maps, sequences, and genomes.
London: Chapman and Hall; 1995.
39. Gusfield D. Algorithms on Strings, Trees y Sequences. Cambridge: University Press; 1997.
40. Searls DB. Using bioinformatics in gene y drug discovery. DDT 2000;5(4):135-42.
41. Saunders NJ, Jeffries AC. The growing utility of microbial genome sequences. Genome
Biology (Reports) 2000; 1(1):410.1-410.3.
Descargar