El genoma humano - StudentConsult.es

Anuncio
Capítulo 74 El genoma humano & e74-1
[(Figura_1)TD$IG]
El genoma humano consta de unos 25.000 genes, que codifican la
amplia variedad de proteínas presentes en el cuerpo humano. Las
células reproductivas o de la línea germinal contienen una copia (N)
de este complemento genético y son haploides, mientras que las células somáticas (de la línea no germinal) contienen dos copias completas (2N) y son diploides. Los genes se organizan en largos segmentos
de ADN que, durante la división celular, se compactan en estructuras
intrincadas junto con proteínas para formar los cromosomas. Cada
célula somática tiene 46 cromosomas (22 pares de autosomas, o cromosomas no sexuales, y 1 par de cromosomas sexuales [XY en el
varón, XX en la mujer]). Las células germinales (óvulo, espermatozoide) contienen 22 autosomas y 1 cromosoma sexual, lo que suma
un total de 23. En la fecundación se reconstituye el complemento
cromosómico diploide completo de 46 en el embrión.
La mayor parte del material genético está contenido en el núcleo
celular. Las mitocondrias (los orgánulos celulares productores de
energía) contienen su propio genoma específico. El cromosoma
mitocondrial consiste en una porción circular de ADN bicatenario,
que contiene 16.568 pares de bases (pb) de ADN y está presente en
múltiples copias en las mitocondrias en cada célula. Las proteínas
que forman la mitocondria pueden sintetizarse en la misma mitocondria (a partir de la información contenida en el genoma mitocondrial) o producirse a partir de la información contenida en
el genoma nuclear y transportarse al orgánulo. Todas las mitocondrias son de origen materno (porque el espermatozoide no suele
aportar mitocondrias al embrión en desarrollo). Por tanto, la
dotación genética mitocondrial de un niño deriva exclusivamente
de su madre biológica.
© ELSEVIER. Fotocopiar sin autorización es un delito.
FUNDAMENTOS DE GENÉTICA MOLECULAR
El dogma central de la genética molecular afirma que la información codificada en el ADN, localizado predominantemente en
el núcleo celular, se transcribe a un ARN mensajero (ARNm), que a
continuación se transporta al citoplasma, donde se traduce en
proteínas. Un gen es una unidad que consta de una región reguladora y una región codificante donde se almacena la información
correspondiente a la secuencia de aminoácidos de una proteína
específica.
El ADN consiste en un par de cadenas de un esqueleto de
monosacárido-fosfato unidas por bases púricas y pirimidínicas para
formar una doble hélice (fig. 74-1). El monosacárido del ADN es la
desoxirribosa. Las pirimidinas son la citosina (C) y la timina (T),
mientras que las purinas son la guanina (G) y la adenina (A). Las
bases están unidas por puentes de hidrógeno, de modo que la A
siempre se empareja con la T y la G con la C. Cada hebra de la doble
hélice tiene polaridad, con un fosfato libre en un extremo (50 ) y un
grupo hidroxilo no unido en el monosacárido situado en el otro
extremo (30 ). Las dos hebras están orientadas con una polaridad
opuesta entre sí en la doble hélice.
La replicación del ADN sigue el emparejamiento de bases de la
hebra paterna de ADN. Las dos hebras originales se desdoblan
mediante la rotura de los puentes de hidrógeno existentes entre
los pb. Los nucleótidos libres, consistentes en una base unida a un
monosacárido-fosfato, forman nuevos puentes de hidrógeno con
sus bases complementarias en la hebra paterna; la enzima ADN
polimerasa crea nuevos enlaces fosfodiéster. La replicación de los
cromosomas comienza simultáneamente en múltiples sitios, formando burbujas de replicación que se expanden en ambas direcciones hasta que toda la molécula de ADN (cromosoma) se replica. Los
errores en la replicación del ADN, o mutaciones inducidas por mutágenos ambientales, como la radiación o las sustancias químicas, se
detectan y pueden corregirse por los sistemas de reparación del ADN.
Un gen prototipo consta de una región reguladora, segmentos denominados exones que codifican la secuencia de aminoácidos de una
proteína y segmentos interpuestos denominados intrones (fig. 74-2).
La transcripción comienza en la región promotora y continúa a lo
largo de toda la longitud del gen para formar un ARNm. A continuación, los intrones se eliminan y los exones se empalman juntos
para formar un mensajero maduro, que seguidamente se exporta al
Figura 74-1 Doble hélice del ADN con el esqueleto de monosacárido-fosfato y las bases
nitrogenadas. (De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics,
2.a ed., St. Louis, Mosby, 1999, pág. 8.)
[(Figura_2)TD$IG]
Figura 74-2 Resumen de los pasos que llevan del ADN a las proteínas. La replicación y la
traducción se producen en el núcleo celular. A continuación el ARNm se transporta al
citoplasma, donde tiene lugar su traducción en secuencias de aminoácidos que forman la
proteína. (De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics, 2.a ed.,
St. Louis, Mosby, 1999, pág. 12.)
e74-2 & Parte X Genética humana
[(Figura_3)TD$IG]
Figura 74-3 Varios tipos de mutaciones intragénicas. Las mutaciones del promotor alteran la
velocidad de transcripción o la regulación génica. Los cambios de bases en los exones pueden
tener varios efectos, como se muestra en la figura. Las mutaciones en los intrones pueden motivar la inclusión de algunas secuencias intrónicas
en el ARNm procesado final, o pueden provocar
que se salte algún exón.
citoplasma, donde el ARNm se une a los ribosomas y se traduce en
una proteína.
La transcripción se inicia con la unión de la ARN polimerasa a la
región promotora 50 al comienzo de la secuencia codificante. Varias
proteínas específicas se unen a la región para reprimir o activar la
transcripción mediante el despliegue de la cromatina, que es un
complejo de ADN y proteínas histónicas. La acción de estas proteínas reguladoras (factores de transcripción) es lo que determina en
gran medida cuándo un gen se encuentra activado o desactivado.
Algunos genes también se activan o desactivan mediante metilación
de las bases citosina que están adyacentes a las guaninas (bases CpG).
La metilación es un ejemplo de cambio epigenético, es decir, una
modificación que afecta a expresión génica y posiblemente a las
características de una célula u organismo, pero que no implica una
variación de la secuencia genética subyacente. La regulación génica es
flexible y sensible, de modo que los genes se activan o desactivan
durante el desarrollo o en respuesta a condiciones internas y externas,
así como a estímulos ambientales.
La transcripción se produce a lo largo de toda la longitud del
gen, sintetizando el ARNm en dirección 50 a 30 . El ARN, al igual que
el ADN, es una cadena de monosacárido-fosfato con pirimidinas y
purinas. El monosacárido en este caso es la ribosa; el uracilo sustituye a la timina en el ARN. La ARN polimerasa lee una hebra de
ADN para copiar una secuencia complementaria de ARN. En el
extremo 50 del ARN se añade una «capucha» consistente en una
molécula de 7-metilguanosina, con un enlace 50 -50 , y en la mayoría
de los transcritos se añaden de forma enzimática varios cientos de
bases adenina en el extremo 30 después de la transcripción.
El procesamiento del ARNm tiene lugar en el núcleo y consiste
en la escisión de los intrones y el empalme de los exones entre sí.
Unas secuencias específicas en el inicio y el final de los intrones
marcan los sitios donde la maquinaria de empalme actuará sobre
el transcrito. En algunos casos puede haber patrones con especificidad tisular para el empalme, de modo que el mismo transcrito
primario puede producir múltiples proteínas diferentes.
El transcrito procesado se exporta a continuación al citoplasma,
donde se une a los ribosomas, que son complejos de ARN y proteínas. El código genético se lee a continuación en tripletes de bases,
de modo que cada triplete corresponde a un aminoácido específico
o proporciona una señal que termina la traducción. Los codones
tripletes son reconocidos por los ARN de transferencia (ARNt) que
contienen un anticodón complementario y se unen al aminoácido
correspondiente, tras lo que lo llevan al péptido en crecimiento.
Cada aminoácido nuevo se une de forma enzimática al péptido,
y cada vez que esto sucede el ribosoma avanza un paso de un codón triplete a lo largo del ARNm. Al final se alcanza un codón de
terminación, punto en el que la traducción finaliza y el péptido se
libera. En algunas proteínas puede haber modificaciones postraduccionales, como la unión de glúcidos (glucosilación); a continuación,
la proteína se transporta a su destino intra o extracelular mediante
mecanismos de transporte que reconocen distintas porciones del
péptido.
Se está empezado ahora a dilucidar la complejidad de los ARN
no codificantes, que también intervendrían en la regulación
genética. Se trata de ARN que se transcriben a partir del ADN, pero
que no se transportan ni se traducen en proteínas, si no que son
ARN «no codificantes» que desempeñan distintas funciones biológicas, a menudo formando complejos con distintas proteínas. De
forma tradicional, se ha tratado de ARN que actuaban como mediadores del corte y empalme o procesamiento del ARN codificante, o
de la traducción de los ARN codificantes en los ribosomas. Los
pequeños ARN no codificantes, incluidos los microARN (miARN)
son representativos de una clase de pequeños ARN (21-23 pb) que
controlan la expresión génica en la célula al actuar directamente
sobre conjuntos específicos de ARN codificantes mediante unión
directa ARN-ARN. Esta interacción ARN-ARN podría dar lugar
a la degradación del ARN codificante diana o a la inhibición de la
traducción de la proteína especificada por ese ARN codificante. Los
miARN, en general, regulan y actúan sobre varios cientos de ARNm.
VARIACIÓN GENÉTICA
El proceso de síntesis proteica a partir de un gen está sujeto a
perturbaciones en múltiples niveles, debido a alteraciones de la
secuencia codificante (fig. 74-3). Los cambios en la región reguladora pueden alterar la expresión génica, como un aumento o
disminución de la tasa de transcripción, una incapacidad de activar
el gen o una activación del mismo en un momento inadecuado o en
las células incorrectas. Los cambios en la secuencia codificante
pueden provocar una sustitución de un aminoácido por otro
(mutación de aminoácido o no sinónima [missense]) o dar lugar a
un codón de terminación en lugar del codón de un aminoácido.
Capítulo 74 El genoma humano & e74-3
[(Figura_4)TD$IG]
© ELSEVIER. Fotocopiar sin autorización es un delito.
Figura 74-4 Hibridación genómica comparativa basada en micromatriz. Las
muestras de ADN de prueba y de referencia se marcan de forma distinta y se
pasan por una matriz diana de sondas (p. ej., clones BAC u oligonucleótidos) que
contienen fragmentos de ADN de todo el genoma humano. El experimento suele
repetirse intercambiando las tinciones de prueba y de referencia para detectar los
efectos de la tinción o para identificar señales falsas. Las muestras de ADN se
hibridan con su sonda correspondiente, y la proporción de fluorescencia de cada
sonda (prueba:referencia) se usa para detectar las regiones que varían en número
de copias entre la muestra de prueba y de referencia (línea roja: hibridación original;
línea azul: hibridación con cambio de la tinción). La igualdad en el número de copias
de los ADN de prueba y de referencia se identifica por una unión igual, que da lugar a
una proporción 1:1. La duplicación en una región genómica de la muestra de prueba
se identifica por una proporción mayor, mientras que una deleción se detecta por
una reducción de la proporción, pero una deleción en la muestra de prueba es
indistinguible de una duplicación en la muestra de referencia. Estas proporciones
suelen convertirse en una escala log2 para su análisis posterior. (Adaptada de
Feuk L, Carson AR, Scherer SW: Structural variation in the human genome, Nat Rev
Genet 7:85–97, 2006, con autorización de Nature Reviews Genetics.)
Algunos cambios de bases aisladas no afectan al aminoácido (mutación silente), pues puede haber varios codones que correspondan
a un mismo aminoácido. Las sustituciones de aminoácidos pueden
tener un grave efecto sobre la función de la proteína si las propiedades químicas del aminoácido que sustituye son muy distintas a las
del habitual, o bien pueden tener un efecto sutil o nulo sobre dicha
función, sobre todo si el aminoácido sustituido presenta una similitud química con el original.
Los cambios genéticos también pueden consistir en inserciones o
deleciones. Cuando estas alteraciones afectan a un múltiplo no
íntegro de tres bases en la secuencia codificante, se produce un
desplazamiento del marco de lectura, lo que modifica el agrupamiento de las bases en tripletes. Esto da lugar a que se traduzca una
secuencia incorrecta de aminoácidos, y a menudo a una interrupción prematura de la traducción. La inserción o deleción de un
múltiplo íntegro de tres bases en la secuencia codificante insertará
o provocará la deleción del número correspondiente de aminoácidos en la proteína, de modo que se producirán alteraciones en
el marco que mantienen la secuencia de aminoácidos aparte de los
aminoácidos eliminados o duplicados. Las inserciones o deleciones
a mayor escala pueden alterar una secuencia codificante o provocar
la deleción completa de todo un gen o grupo de genes.
Las mutaciones suelen clasificarse en dos grupos: las que producen un aumento de la función o las que causan una pérdida de la
misma. Las mutaciones con pérdida de función causan una reducción del nivel de función de la proteína debido a la menor
expresión o producción de una proteína, que no trabaja de un modo
tan eficaz. En algunos casos, la pérdida de la función proteína de un
gen basta para producir una enfermedad. La haploinsuficiencia es
la situación en la que el mantenimiento de un fenotipo normal requiere la producción de proteínas por ambas copias de un gen, de
modo que una reducción del 50% de la función del mismo provoca
un fenotipo patológico. Por tanto, los fenotipos haploinsuficientes
se heredan, por definición, de forma dominante. Las mutaciones
con pérdida de función pueden tener un efecto negativo dominante
cuando el producto proteico anómalo interfiere con la función del
producto proteico normal. Ambas situaciones causan enfermedades
heredadas de forma dominante (cap. 75). En otros casos, la mutación
con pérdida de función debe estar presente en ambas copias de un gen
antes de que aparezca un fenotipo anómalo. Esta situación suele
producir enfermedades que se heredan de forma recesiva (cap. 75).
Una mutación con ganancia de función suele causar enfermedades heredadas de forma dominante. Estas mutaciones pueden dar
lugar a la síntesis de una molécula proteica con una mayor capacidad para realizar una función normal, o pueden conferir una nueva
propiedad a la proteína. La mutación con ganancia de función que
se produce en la acondroplasia, la forma más frecuente de las displasias con talla baja y extremidades cortas, ejemplifica el aumento
de la función de una proteína normal. La acondroplasia se debe a
una mutación del receptor 3 del factor de crecimiento fibroblástico
(FGFR3), que produce la activación del receptor, incluso en ausencia del factor de crecimiento fibroblástico (FGF). En la drepanocitosis, un aminoácido se sustituye en la molécula de hemoglobina,
con una mínima modificación de la capacidad de la proteína para
transportar oxígeno. Sin embargo, las cadenas de hemoglobina
patológica tienen una nueva propiedad; a diferencia de las cadenas de hemoglobina normal, las de la patológica se agregan en
condiciones de desoxigenación, formando fibras que deforman los
eritrocitos.
Otra categoría de mutaciones con ganancia de función da lugar a
la sobreexpresión o expresión inapropiada de un producto génico.
Muchos genes causantes de cáncer (oncogenes) son reguladores
normales de la proliferación celular durante el desarrollo. Sin embargo, cuando se expresan en la vida adulta y/o en células en las que
no suelen expresarse pueden dar lugar a una neoplasia.
En algunos casos, los cambios en la expresión génica se deben a
variaciones del número de copias (VNC) de un gen presente en el
genoma (fig. 74-4). Aunque algunas VNC son frecuentes y no parecen causar enfermedades ni predisponer a ellas, otras son claramente patógenas. La enfermedad de Charcot-Marie-Tooth tipo 1A
(la forma más frecuente de neuropatía periférica crónica infantil
hereditaria) se debe a duplicaciones del gen de la proteína de la
mielina periférica 22, que dan lugar a una sobreexpresión, debido
a la existencia de 3 copias activas de este gen. Las deleciones de este
e74-4 & Parte X Genética humana
mismo gen (que dejan una sola copia) provocan un trastorno distinto, la neuropatía hereditaria con propensión a la parálisis por
presión.
Las deleciones y duplicaciones pueden tener una extensión variable e, incluso cuando no son visibles con un análisis cromosómico
tradicional, pueden afectar a varios genes. Estos cambios suelen
denominarse microdeleciones y microduplicaciones. Cuando la deleción o duplicación de varios genes en la misma región cromosómica desempeñan funciones distintas en las características clínicas
resultantes, el cuadro final puede denominarse también trastorno
de genes contiguos.
En algunos casos, la identificación de una serie específica de
características hace sospechar al clínico un síndrome de microdeleción o microduplicación específico. Algunos ejemplos de estos
trastornos son los síndromes de Smith-Magenis, DiGeorge y
Williams. En otros casos, el clínico debe estar alerta ante esta posibilidad cuando se presenta una serie inusualmente diversa de características clínicas en un paciente o ante la presencia de características adicionales a un proceso conocido. Por ejemplo, debido a la
íntima proximidad física de una serie de genes, distintas deleciones que afectan al brazo corto del cromosoma X pueden producir
individuos con diferentes combinaciones de las siguientes características: ictiosis, síndrome de Kallmann, albinismo ocular, retraso mental, condrodisplasia punteada y talla baja.
Las reorganizaciones del ADN también se producen en las
células somáticas (las que no producen óvulos ni espermatozoides).
Las mejor comprendidas son las que tienen lugar en las células
linfoides. Algunas de ellas son necesarias para la formación de
inmunoglobulina funcional en los linfocitos B y los receptores para
el reconocimiento de antígenos en los linfocitos T. Unos segmentos
de gran tamaño de ADN, que codifican las regiones variables y
constantes de las inmunoglobulinas o del receptor del linfocito T,
se encuentran físicamente unidos en un estadio específico durante el
desarrollo del linfocito inmunocompetente. Las reorganizaciones
tienen lugar durante el desarrollo de la estirpe celular linfoide en
el ser humano y dan lugar a la gran diversidad de moléculas de
inmunoglobulina y de receptor del linfocito T. Debido a esta reorganización del ADN posterior a la línea germinal, no hay dos
personas, ni siquiera gemelos monocigóticos, que sean verdaderamente idénticas, porque los linfocitos maduros de cada uno habrán
experimentado reordenaciones aleatorias del ADN en estos loci.
Los estudios de la secuencia del genoma humano revelan que dos
personas cualesquiera difieren en alrededor de una de cada 1.000
bases. Algunas de estas diferencias son silentes; otras dan lugar a los
cambios que explican diferencias fenotípicas (color del pelo o de los
ojos, aspecto físico); algunas tienen relevancia médica, al causar
trastornos monogénicos como la drepanocitosis o al explicar la
susceptibilidad a enfermedades habituales como el asma. Las variantes genéticas que se producen con una frecuencia mayor al 1%
en la población se suelen denominar polimorfismos. Pueden ser
silentes o sutiles, o bien causar efectos fenotípicos significativos.
CORRELACIONES GENOTIPO-FENOTIPO
EN LAS ENFERMEDADES GENÉTICAS
El genotipo es la información heredable, codificada internamente,
de una persona y se refiere a qué versión alternativa concreta (alelo)
de un gen está presente en una localización específica (locus) en un
cromosoma. El fenotipo es el conjunto de características estructurales, bioquímicas y fisiológicas observadas en una persona, determinas por el genotipo, y se refiere también a los efectos estructurales
y funcionales observados de un alelo mutante en un locus específico.
Muchas mutaciones provocan fenotipos predecibles. En estos
casos, los médicos pueden predecir la evolución clínica y planificar
las estrategias terapéuticas apropiadas basándose en el genotipo del
paciente.
El síndrome del QT largo ejemplifica un trastorno con unas
correlaciones genotipo-fenotipo predecibles (cap. 429.5). Este síndrome presenta una heterogeneidad genética, lo que significa que las
mutaciones de distintos genes pueden causar el mismo trastorno.
El riesgo de complicaciones cardíacas (síncope, parada cardíaca abortada o muerte súbita) es mayor con las mutaciones que afectan al
gen KCNQ1 (63%) o al gen KCNH2 (46%) que entre los pacientes
con mutaciones en el gen SCN5A (18%). Además, los pacientes con
mutaciones del gen KCNQ1 padecen la mayoría de sus episodios
durante el ejercicio y pocas veces durante el reposo o el sueño; los que
tienen las mutaciones de KCNH2 y SCN5A son más propensos a
presentar episodios durante el sueño o el reposo y pocas veces durante
el ejercicio. Por tanto, las mutaciones en genes específicos (genotipo)
se correlacionan con manifestaciones concretas (fenotipo) del síndrome de QT largo. Estos tipos de relaciones suelen denominarse correlaciones genotipo-fenotipo.
Las mutaciones del gen de la fibrilina-1 asociadas al síndrome de
Marfan representan otro ejemplo de correlaciones predecibles entre
genotipo y fenotipo (cap. 693). Este síndrome se caracteriza por la
combinación de manifestaciones esqueléticas, oculares y aórticas.
La forma más grave de su evolución consiste en la disección de la
raíz aórtica y muerte súbita. El gen de la fibrilina-1 está compuesto
por 65 exones, y se han encontrado mutaciones en casi todos ellos.
La localización de la mutación en el seno del gen (genotipo) puede
desempeñar un papel significativo a la hora de determinar la gravedad de la enfermedad (fenotipo). El síndrome de Marfan neonatal
está causado por mutaciones en los exones 24-27 y 31-32, mientras
que las formas más leves se deben a mutaciones de los exones 59-65
y 37 y 41.
Las correlaciones genotipo-fenotipo se han observado también
en la fibrosis quística (FQ) (cap. 395). Aunque la enfermedad pulmonar es la causa principal de morbimortalidad, la FQ es una
enfermedad multisistémica que afecta no sólo a los epitelios del
aparato respiratorio, sino también al páncreas exocrino, intestino, aparato reproductor masculino, sistema hepatobiliar y glándulas sudoríparas exocrinas. La FQ está causada por mutaciones en el
gen del regulador de la conductancia transmembrana (CFTR) de la
FQ. Se han identificado más de 1.600 mutaciones distintas. La más
frecuente es una deleción de tres nucleótidos que elimina el aminoácido fenilalanina (F) en la posición 508 en la proteína (mutación
DF508), que supone alrededor del 70% de todas las mutaciones y se
asocia a un cuadro de enfermedad grave. Las mejores correlaciones
genotipo-fenotipo en la FQ se observan en el contexto de la función
pancreática, de modo que las mutaciones más frecuentes se clasifican como con suficiencia o insuficiencia pancreática. Las personas
con suficiencia pancreática suelen tener 1 o 2 alelos de suficiencia
pancreática, lo que indica que dichos alelos son dominantes. Por el
contrario, la correlación genotipo-fenotipo en la enfermedad pulmonar es mucho más débil, y las personas con genotipos idénticos
tienen grandes variaciones en la gravedad de su enfermedad pulmonar. Este hallazgo puede explicarse en parte por modificadores
genéticos o factores ambientales.
Hay muchos trastornos en los que los efectos de las mutaciones
sobre el fenotipo pueden modificarse por cambios en el otro alelo
del mismo gen, por modificaciones en genes modificadores específicos y/o por variaciones de un número de genes no especificados
(trasfondo genético). Cuando la anemia drepanocítica se cohereda
con el gen de la persistencia hereditaria de hemoglobina fetal, la
expresión fenotípica de la drepanocitosis es menos grave. Los genes
modificadores de la FQ pueden influir en el desarrollo del íleo
meconial congénito, o en la colonización por P. aeruginosa. Los
genes modificadores también pueden afectar a las manifestaciones
de la enfermedad de Hirschsprung, la neurofibromatosis de tipo 2,
la craneosinostosis y la hiperplasia suprarrenal congénita. La combinación de mutaciones genéticas que producen un déficit de glucosa-6-fosfato deshidrogenasa y versiones más largas del elemento
TATAA en el promotor del gen de la UDP-glucuronosiltransferasa
agravan la hiperbilirrubinemia fisiológica neonatal.
PROYECTO DEL GENOMA HUMANO
Se puede realizar un mapeo génico rudimentario mediante análisis
de ligamiento, que se basa en el principio de que los alelos situados
en dos loci genéticos localizados próximos entre sí se segregarán
© ELSEVIER. Fotocopiar sin autorización es un delito.
Capítulo 74 El genoma humano & e74-5
juntos en una familia a menos que se separen por recombinación
genética. La frecuencia de recombinación entre los loci puede
usarse para estimar la distancia física entre dos puntos. Algunos
de los primeros mapas del genoma humano fueron mapas de ligamiento basados en un conjunto de loci genéticos polimórficos, que
se encuentran a lo largo de todo el genoma humano. El análisis de
ligamiento aún se emplea para mapear la localización de los cambios genéticos responsables de rasgos fenotípicos y trastornos genéticos que se heredan de forma mendeliana.
A diferencia de los mapas de ligamiento, que se basan en frecuencias de recombinación, los mapas físicos aprovechan fragmentos
solapantes de ADN para determinar la localización de los loci entre
sí. Se pueden usar varias estrategias para crear mapas físicos de una
región cromosómica. En una estrategia, los segmentos de la región de
interés, con longitudes que van de cientos o miles hasta unos cuantos
millones de pb, se aíslan y se insertan en microorganismos como
bacterias o levaduras. Las regiones comunes contenidas en distintos
microorganismos se pueden identificar y esta información se puede
usar para componer un mapa constituido por fragmentos solapantes
de ADN, cada uno contenido en un microorganismo diferente. Los
fragmentos contenidos en cada microorganismo se pueden secuenciar a continuación para obtener la secuencia de ADN de toda la
región. Una estrategia alternativa consiste en fragmentar todo el
genoma en porciones aleatorias, secuenciar los fragmentos y después utilizar una computadora para ordenarlos en función de los
segmentos solapantes. Es probable que esta estrategia de «genoma
completo», combinada con las tecnologías de secuenciación de la
«siguiente generación», permita una reducción drástica del coste de
la secuenciación de genomas completos a nivel individual.
En 2003, el National Human Genome Research Institute, el
Department of Energy y sus socios en el International Human
Genome Sequencing Consortium anunciaron la culminación del
Proyecto Genoma Humano y el acceso público a los datos de la
secuencia correspondientes a casi todo el genoma humano. Desde
entonces se han publicado versiones actualizadas que contienen
correcciones e información de secuencias adicionales.
El análisis del genoma humano ha producido también varios
hallazgos sorprendentes. El número de genes aún no se conoce
con precisión, pero parece estar alrededor de los 25.000. Esto es
menor de lo esperado y está en el mismo rango de muchos organismos más simples. Sin embargo, el número de proteínas codificadas por el genoma es mucho mayor, debido a la presencia de
regiones promotoras alternativas en algunos genes, al corte y empalme alternativo y a las modificaciones postraducción, lo que permite que un único gen codifique varios productos proteicos.
También resulta evidente que la mayor parte del genoma
humano no codifica proteínas (menos del 5% se transcribe y se
traduce, aunque un porcentaje mucho mayor puede transcribirse
sin traducción). Muchas secuencias transcritas no se traducen, sino
que representan genes que codifican ARN dotados de un papel
regulador. Una elevada proporción del genoma consiste en secuencias repetidas que se intercalan entre los genes. Algunas de ellas
son elementos genéticos transponibles que tienen la capacidad de
moverse de un sitio a otro del genoma. Otros son elementos estáticos que se expandieron y dispersaron en el pasado durante la
evolución humana. Otras secuencias repetidas pueden desempeñar un papel estructural. También hay regiones de duplicaciones
genómicas. Estas duplicaciones son sustratos para la evolución y
permiten que los motivos genéticos se copien y modifiquen para que
desempeñen nuevas funciones en la célula. Las duplicaciones también pueden formar la base para la reorganización cromosómica, al
permitir que los segmentos de los cromosomas no homólogos se
emparejen durante la meiosis e intercambien material. Ésta es otra
fuente de cambio evolutivo, y también actúa como origen potencial
de inestabilidad cromosómica, dando lugar a anomalías congénitas
o a cáncer. Las repeticiones de bajo número de copias (LCR) también desempeñan un papel destacado como causa de trastornos
genómicos. Cuando las LCR flanquean segmentos genómicos únicos, estas regiones pueden duplicarse o sufrir deleción mediante un
proceso denominado recombinación homóloga no alélica.
[(Figura_5)TD$IG]
Figura 74-5 Micromatriz con 36.000 oligonucleótidos. La micromatriz se expuso al ARN de
fibroblastos normales (marcados en rojo; v. flechas) y de fibroblastos de un paciente con una
enfermedad de Niemann-Pick tipo C (marcados en verde). Las flechas indican las regiones en
las que existía una intensa señal de hibridación con ARN normal o patológico. Esta micromatriz
se empleó para buscar genes con una elevada expresión en los fibroblastos de los pacientes.
(De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics, 3.a ed., St. Louis,
Mosby, 2006, pág. 116.)
La disponibilidad de la secuencia de todo el genoma humano
permite el estudio de grandes grupos de genes, así como la búsqueda
de patrones de expresión génica o de alteración del genoma. Se han
diseñado micromatrices que permiten el análisis de la expresión de
miles de genes en un pequeño fragmento de vidrio. En algunos
casos, los patrones de expresión génica proporcionan el rasgo
característico de estados patológicos especiales, como el cáncer, o
de respuesta a un tratamiento (fig. 74-5).
BIBLIOGRAFÍA
Ali-khan SE, Daar AS, Shuman C, et al: Whole genome scanning:
resolving clinical diagnosis and management amidst complex data,
Pediatr Res 66:357-363, 2009.
Alkan C, Kidd JM, Marques-Bonet T, et al: Personalized copy number
and segmental duplication maps using next-generation sequencing,
Nat Genet 41:1061-1067, 2009.
Ashley EA, Butte AJ, Wheeler MT, et al: Clinical assessment incorporating a personal genome, Lancet 375:1525-1535, 2010.
Bredenoord A, Braude P: Ethics of mitochondrial gene replacement:
from bench to bedside, BMJ 342:87-89, 2011.
Christensen K, Murray JC: What genome-wide association studies can
do for medicine, N Engl J Med 356:1094-1097, 2007.
Cordell HJ, Clayton DG: Genetic association studies, Lancet
366:1121-1130, 2005.
Feero WG, Guttmacher AE, Collins FS: Genomic medicine—an updated primer, N Engl J Med 362:2001-2011, 2010.
Goldstein DB: Common genetic variation and human traits, N Engl J
Med 360:1696-1698, 2009.
Hamburg MA, Collins FS: The path to personalized medicine, N Engl J
Med 363:301-304, 2010.
e74-6 & Parte X Genética humana
Hardy J, Singleton A: Genomewide association studies and human
disease, N Engl J Med 360:1759-1768, 2009.
Hingorani AD, Shah T, Kumari M, et al: Translating genomics into
improved healthcare, BMJ 341:1037-1042, 2010.
Lucassen A, Parker M: Confidentiality and sharing genetic information
with relatives, Lancet 375:1507-1509, 2010.
McCarroll SA: Copy number variation and human genome maps, Nat
Genet 42:365-366, 2010.
McGhee SA, McCabe ERB: Genome-wide testing: genomic medicine,
Pediatr Res 60:243-244, 2006.
Moskowitz SA, Chmiel JF, Sternen DL, et al: CFTR-related disorders
(2008) in GeneReviews at GeneTests: Medical Genetics Information
Resource (database online). www.ncbi.nlm.nih.gov/bookshelf/br.
fcgi?book=gene&part=cf#cf. Accessed March 9, 2009.
Shaw CJ, Lupski JR: Implications of human genome architecture for
rearrangement-based disorders: the genomic basis of disease, Hum
Mol Genet 13:R57-R64, 2004.
Teare MD, Barrett JH: Genetic linkage studies, Lancet 366:1036-1044,
2005.
Veltman JA, Brunner HG: Understanding variable expressivity in
microdeletion syndromes, Nat Genet 42:192-193, 2010.
Wain LV, Armour JAL, Tonin MD: Genomic copy number variation,
human health, and disease, Lancet 374:340-350, 2009.
Descargar