Capítulo 74 El genoma humano & e74-1 [(Figura_1)TD$IG] El genoma humano consta de unos 25.000 genes, que codifican la amplia variedad de proteínas presentes en el cuerpo humano. Las células reproductivas o de la línea germinal contienen una copia (N) de este complemento genético y son haploides, mientras que las células somáticas (de la línea no germinal) contienen dos copias completas (2N) y son diploides. Los genes se organizan en largos segmentos de ADN que, durante la división celular, se compactan en estructuras intrincadas junto con proteínas para formar los cromosomas. Cada célula somática tiene 46 cromosomas (22 pares de autosomas, o cromosomas no sexuales, y 1 par de cromosomas sexuales [XY en el varón, XX en la mujer]). Las células germinales (óvulo, espermatozoide) contienen 22 autosomas y 1 cromosoma sexual, lo que suma un total de 23. En la fecundación se reconstituye el complemento cromosómico diploide completo de 46 en el embrión. La mayor parte del material genético está contenido en el núcleo celular. Las mitocondrias (los orgánulos celulares productores de energía) contienen su propio genoma específico. El cromosoma mitocondrial consiste en una porción circular de ADN bicatenario, que contiene 16.568 pares de bases (pb) de ADN y está presente en múltiples copias en las mitocondrias en cada célula. Las proteínas que forman la mitocondria pueden sintetizarse en la misma mitocondria (a partir de la información contenida en el genoma mitocondrial) o producirse a partir de la información contenida en el genoma nuclear y transportarse al orgánulo. Todas las mitocondrias son de origen materno (porque el espermatozoide no suele aportar mitocondrias al embrión en desarrollo). Por tanto, la dotación genética mitocondrial de un niño deriva exclusivamente de su madre biológica. © ELSEVIER. Fotocopiar sin autorización es un delito. FUNDAMENTOS DE GENÉTICA MOLECULAR El dogma central de la genética molecular afirma que la información codificada en el ADN, localizado predominantemente en el núcleo celular, se transcribe a un ARN mensajero (ARNm), que a continuación se transporta al citoplasma, donde se traduce en proteínas. Un gen es una unidad que consta de una región reguladora y una región codificante donde se almacena la información correspondiente a la secuencia de aminoácidos de una proteína específica. El ADN consiste en un par de cadenas de un esqueleto de monosacárido-fosfato unidas por bases púricas y pirimidínicas para formar una doble hélice (fig. 74-1). El monosacárido del ADN es la desoxirribosa. Las pirimidinas son la citosina (C) y la timina (T), mientras que las purinas son la guanina (G) y la adenina (A). Las bases están unidas por puentes de hidrógeno, de modo que la A siempre se empareja con la T y la G con la C. Cada hebra de la doble hélice tiene polaridad, con un fosfato libre en un extremo (50 ) y un grupo hidroxilo no unido en el monosacárido situado en el otro extremo (30 ). Las dos hebras están orientadas con una polaridad opuesta entre sí en la doble hélice. La replicación del ADN sigue el emparejamiento de bases de la hebra paterna de ADN. Las dos hebras originales se desdoblan mediante la rotura de los puentes de hidrógeno existentes entre los pb. Los nucleótidos libres, consistentes en una base unida a un monosacárido-fosfato, forman nuevos puentes de hidrógeno con sus bases complementarias en la hebra paterna; la enzima ADN polimerasa crea nuevos enlaces fosfodiéster. La replicación de los cromosomas comienza simultáneamente en múltiples sitios, formando burbujas de replicación que se expanden en ambas direcciones hasta que toda la molécula de ADN (cromosoma) se replica. Los errores en la replicación del ADN, o mutaciones inducidas por mutágenos ambientales, como la radiación o las sustancias químicas, se detectan y pueden corregirse por los sistemas de reparación del ADN. Un gen prototipo consta de una región reguladora, segmentos denominados exones que codifican la secuencia de aminoácidos de una proteína y segmentos interpuestos denominados intrones (fig. 74-2). La transcripción comienza en la región promotora y continúa a lo largo de toda la longitud del gen para formar un ARNm. A continuación, los intrones se eliminan y los exones se empalman juntos para formar un mensajero maduro, que seguidamente se exporta al Figura 74-1 Doble hélice del ADN con el esqueleto de monosacárido-fosfato y las bases nitrogenadas. (De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics, 2.a ed., St. Louis, Mosby, 1999, pág. 8.) [(Figura_2)TD$IG] Figura 74-2 Resumen de los pasos que llevan del ADN a las proteínas. La replicación y la traducción se producen en el núcleo celular. A continuación el ARNm se transporta al citoplasma, donde tiene lugar su traducción en secuencias de aminoácidos que forman la proteína. (De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics, 2.a ed., St. Louis, Mosby, 1999, pág. 12.) e74-2 & Parte X Genética humana [(Figura_3)TD$IG] Figura 74-3 Varios tipos de mutaciones intragénicas. Las mutaciones del promotor alteran la velocidad de transcripción o la regulación génica. Los cambios de bases en los exones pueden tener varios efectos, como se muestra en la figura. Las mutaciones en los intrones pueden motivar la inclusión de algunas secuencias intrónicas en el ARNm procesado final, o pueden provocar que se salte algún exón. citoplasma, donde el ARNm se une a los ribosomas y se traduce en una proteína. La transcripción se inicia con la unión de la ARN polimerasa a la región promotora 50 al comienzo de la secuencia codificante. Varias proteínas específicas se unen a la región para reprimir o activar la transcripción mediante el despliegue de la cromatina, que es un complejo de ADN y proteínas histónicas. La acción de estas proteínas reguladoras (factores de transcripción) es lo que determina en gran medida cuándo un gen se encuentra activado o desactivado. Algunos genes también se activan o desactivan mediante metilación de las bases citosina que están adyacentes a las guaninas (bases CpG). La metilación es un ejemplo de cambio epigenético, es decir, una modificación que afecta a expresión génica y posiblemente a las características de una célula u organismo, pero que no implica una variación de la secuencia genética subyacente. La regulación génica es flexible y sensible, de modo que los genes se activan o desactivan durante el desarrollo o en respuesta a condiciones internas y externas, así como a estímulos ambientales. La transcripción se produce a lo largo de toda la longitud del gen, sintetizando el ARNm en dirección 50 a 30 . El ARN, al igual que el ADN, es una cadena de monosacárido-fosfato con pirimidinas y purinas. El monosacárido en este caso es la ribosa; el uracilo sustituye a la timina en el ARN. La ARN polimerasa lee una hebra de ADN para copiar una secuencia complementaria de ARN. En el extremo 50 del ARN se añade una «capucha» consistente en una molécula de 7-metilguanosina, con un enlace 50 -50 , y en la mayoría de los transcritos se añaden de forma enzimática varios cientos de bases adenina en el extremo 30 después de la transcripción. El procesamiento del ARNm tiene lugar en el núcleo y consiste en la escisión de los intrones y el empalme de los exones entre sí. Unas secuencias específicas en el inicio y el final de los intrones marcan los sitios donde la maquinaria de empalme actuará sobre el transcrito. En algunos casos puede haber patrones con especificidad tisular para el empalme, de modo que el mismo transcrito primario puede producir múltiples proteínas diferentes. El transcrito procesado se exporta a continuación al citoplasma, donde se une a los ribosomas, que son complejos de ARN y proteínas. El código genético se lee a continuación en tripletes de bases, de modo que cada triplete corresponde a un aminoácido específico o proporciona una señal que termina la traducción. Los codones tripletes son reconocidos por los ARN de transferencia (ARNt) que contienen un anticodón complementario y se unen al aminoácido correspondiente, tras lo que lo llevan al péptido en crecimiento. Cada aminoácido nuevo se une de forma enzimática al péptido, y cada vez que esto sucede el ribosoma avanza un paso de un codón triplete a lo largo del ARNm. Al final se alcanza un codón de terminación, punto en el que la traducción finaliza y el péptido se libera. En algunas proteínas puede haber modificaciones postraduccionales, como la unión de glúcidos (glucosilación); a continuación, la proteína se transporta a su destino intra o extracelular mediante mecanismos de transporte que reconocen distintas porciones del péptido. Se está empezado ahora a dilucidar la complejidad de los ARN no codificantes, que también intervendrían en la regulación genética. Se trata de ARN que se transcriben a partir del ADN, pero que no se transportan ni se traducen en proteínas, si no que son ARN «no codificantes» que desempeñan distintas funciones biológicas, a menudo formando complejos con distintas proteínas. De forma tradicional, se ha tratado de ARN que actuaban como mediadores del corte y empalme o procesamiento del ARN codificante, o de la traducción de los ARN codificantes en los ribosomas. Los pequeños ARN no codificantes, incluidos los microARN (miARN) son representativos de una clase de pequeños ARN (21-23 pb) que controlan la expresión génica en la célula al actuar directamente sobre conjuntos específicos de ARN codificantes mediante unión directa ARN-ARN. Esta interacción ARN-ARN podría dar lugar a la degradación del ARN codificante diana o a la inhibición de la traducción de la proteína especificada por ese ARN codificante. Los miARN, en general, regulan y actúan sobre varios cientos de ARNm. VARIACIÓN GENÉTICA El proceso de síntesis proteica a partir de un gen está sujeto a perturbaciones en múltiples niveles, debido a alteraciones de la secuencia codificante (fig. 74-3). Los cambios en la región reguladora pueden alterar la expresión génica, como un aumento o disminución de la tasa de transcripción, una incapacidad de activar el gen o una activación del mismo en un momento inadecuado o en las células incorrectas. Los cambios en la secuencia codificante pueden provocar una sustitución de un aminoácido por otro (mutación de aminoácido o no sinónima [missense]) o dar lugar a un codón de terminación en lugar del codón de un aminoácido. Capítulo 74 El genoma humano & e74-3 [(Figura_4)TD$IG] © ELSEVIER. Fotocopiar sin autorización es un delito. Figura 74-4 Hibridación genómica comparativa basada en micromatriz. Las muestras de ADN de prueba y de referencia se marcan de forma distinta y se pasan por una matriz diana de sondas (p. ej., clones BAC u oligonucleótidos) que contienen fragmentos de ADN de todo el genoma humano. El experimento suele repetirse intercambiando las tinciones de prueba y de referencia para detectar los efectos de la tinción o para identificar señales falsas. Las muestras de ADN se hibridan con su sonda correspondiente, y la proporción de fluorescencia de cada sonda (prueba:referencia) se usa para detectar las regiones que varían en número de copias entre la muestra de prueba y de referencia (línea roja: hibridación original; línea azul: hibridación con cambio de la tinción). La igualdad en el número de copias de los ADN de prueba y de referencia se identifica por una unión igual, que da lugar a una proporción 1:1. La duplicación en una región genómica de la muestra de prueba se identifica por una proporción mayor, mientras que una deleción se detecta por una reducción de la proporción, pero una deleción en la muestra de prueba es indistinguible de una duplicación en la muestra de referencia. Estas proporciones suelen convertirse en una escala log2 para su análisis posterior. (Adaptada de Feuk L, Carson AR, Scherer SW: Structural variation in the human genome, Nat Rev Genet 7:85–97, 2006, con autorización de Nature Reviews Genetics.) Algunos cambios de bases aisladas no afectan al aminoácido (mutación silente), pues puede haber varios codones que correspondan a un mismo aminoácido. Las sustituciones de aminoácidos pueden tener un grave efecto sobre la función de la proteína si las propiedades químicas del aminoácido que sustituye son muy distintas a las del habitual, o bien pueden tener un efecto sutil o nulo sobre dicha función, sobre todo si el aminoácido sustituido presenta una similitud química con el original. Los cambios genéticos también pueden consistir en inserciones o deleciones. Cuando estas alteraciones afectan a un múltiplo no íntegro de tres bases en la secuencia codificante, se produce un desplazamiento del marco de lectura, lo que modifica el agrupamiento de las bases en tripletes. Esto da lugar a que se traduzca una secuencia incorrecta de aminoácidos, y a menudo a una interrupción prematura de la traducción. La inserción o deleción de un múltiplo íntegro de tres bases en la secuencia codificante insertará o provocará la deleción del número correspondiente de aminoácidos en la proteína, de modo que se producirán alteraciones en el marco que mantienen la secuencia de aminoácidos aparte de los aminoácidos eliminados o duplicados. Las inserciones o deleciones a mayor escala pueden alterar una secuencia codificante o provocar la deleción completa de todo un gen o grupo de genes. Las mutaciones suelen clasificarse en dos grupos: las que producen un aumento de la función o las que causan una pérdida de la misma. Las mutaciones con pérdida de función causan una reducción del nivel de función de la proteína debido a la menor expresión o producción de una proteína, que no trabaja de un modo tan eficaz. En algunos casos, la pérdida de la función proteína de un gen basta para producir una enfermedad. La haploinsuficiencia es la situación en la que el mantenimiento de un fenotipo normal requiere la producción de proteínas por ambas copias de un gen, de modo que una reducción del 50% de la función del mismo provoca un fenotipo patológico. Por tanto, los fenotipos haploinsuficientes se heredan, por definición, de forma dominante. Las mutaciones con pérdida de función pueden tener un efecto negativo dominante cuando el producto proteico anómalo interfiere con la función del producto proteico normal. Ambas situaciones causan enfermedades heredadas de forma dominante (cap. 75). En otros casos, la mutación con pérdida de función debe estar presente en ambas copias de un gen antes de que aparezca un fenotipo anómalo. Esta situación suele producir enfermedades que se heredan de forma recesiva (cap. 75). Una mutación con ganancia de función suele causar enfermedades heredadas de forma dominante. Estas mutaciones pueden dar lugar a la síntesis de una molécula proteica con una mayor capacidad para realizar una función normal, o pueden conferir una nueva propiedad a la proteína. La mutación con ganancia de función que se produce en la acondroplasia, la forma más frecuente de las displasias con talla baja y extremidades cortas, ejemplifica el aumento de la función de una proteína normal. La acondroplasia se debe a una mutación del receptor 3 del factor de crecimiento fibroblástico (FGFR3), que produce la activación del receptor, incluso en ausencia del factor de crecimiento fibroblástico (FGF). En la drepanocitosis, un aminoácido se sustituye en la molécula de hemoglobina, con una mínima modificación de la capacidad de la proteína para transportar oxígeno. Sin embargo, las cadenas de hemoglobina patológica tienen una nueva propiedad; a diferencia de las cadenas de hemoglobina normal, las de la patológica se agregan en condiciones de desoxigenación, formando fibras que deforman los eritrocitos. Otra categoría de mutaciones con ganancia de función da lugar a la sobreexpresión o expresión inapropiada de un producto génico. Muchos genes causantes de cáncer (oncogenes) son reguladores normales de la proliferación celular durante el desarrollo. Sin embargo, cuando se expresan en la vida adulta y/o en células en las que no suelen expresarse pueden dar lugar a una neoplasia. En algunos casos, los cambios en la expresión génica se deben a variaciones del número de copias (VNC) de un gen presente en el genoma (fig. 74-4). Aunque algunas VNC son frecuentes y no parecen causar enfermedades ni predisponer a ellas, otras son claramente patógenas. La enfermedad de Charcot-Marie-Tooth tipo 1A (la forma más frecuente de neuropatía periférica crónica infantil hereditaria) se debe a duplicaciones del gen de la proteína de la mielina periférica 22, que dan lugar a una sobreexpresión, debido a la existencia de 3 copias activas de este gen. Las deleciones de este e74-4 & Parte X Genética humana mismo gen (que dejan una sola copia) provocan un trastorno distinto, la neuropatía hereditaria con propensión a la parálisis por presión. Las deleciones y duplicaciones pueden tener una extensión variable e, incluso cuando no son visibles con un análisis cromosómico tradicional, pueden afectar a varios genes. Estos cambios suelen denominarse microdeleciones y microduplicaciones. Cuando la deleción o duplicación de varios genes en la misma región cromosómica desempeñan funciones distintas en las características clínicas resultantes, el cuadro final puede denominarse también trastorno de genes contiguos. En algunos casos, la identificación de una serie específica de características hace sospechar al clínico un síndrome de microdeleción o microduplicación específico. Algunos ejemplos de estos trastornos son los síndromes de Smith-Magenis, DiGeorge y Williams. En otros casos, el clínico debe estar alerta ante esta posibilidad cuando se presenta una serie inusualmente diversa de características clínicas en un paciente o ante la presencia de características adicionales a un proceso conocido. Por ejemplo, debido a la íntima proximidad física de una serie de genes, distintas deleciones que afectan al brazo corto del cromosoma X pueden producir individuos con diferentes combinaciones de las siguientes características: ictiosis, síndrome de Kallmann, albinismo ocular, retraso mental, condrodisplasia punteada y talla baja. Las reorganizaciones del ADN también se producen en las células somáticas (las que no producen óvulos ni espermatozoides). Las mejor comprendidas son las que tienen lugar en las células linfoides. Algunas de ellas son necesarias para la formación de inmunoglobulina funcional en los linfocitos B y los receptores para el reconocimiento de antígenos en los linfocitos T. Unos segmentos de gran tamaño de ADN, que codifican las regiones variables y constantes de las inmunoglobulinas o del receptor del linfocito T, se encuentran físicamente unidos en un estadio específico durante el desarrollo del linfocito inmunocompetente. Las reorganizaciones tienen lugar durante el desarrollo de la estirpe celular linfoide en el ser humano y dan lugar a la gran diversidad de moléculas de inmunoglobulina y de receptor del linfocito T. Debido a esta reorganización del ADN posterior a la línea germinal, no hay dos personas, ni siquiera gemelos monocigóticos, que sean verdaderamente idénticas, porque los linfocitos maduros de cada uno habrán experimentado reordenaciones aleatorias del ADN en estos loci. Los estudios de la secuencia del genoma humano revelan que dos personas cualesquiera difieren en alrededor de una de cada 1.000 bases. Algunas de estas diferencias son silentes; otras dan lugar a los cambios que explican diferencias fenotípicas (color del pelo o de los ojos, aspecto físico); algunas tienen relevancia médica, al causar trastornos monogénicos como la drepanocitosis o al explicar la susceptibilidad a enfermedades habituales como el asma. Las variantes genéticas que se producen con una frecuencia mayor al 1% en la población se suelen denominar polimorfismos. Pueden ser silentes o sutiles, o bien causar efectos fenotípicos significativos. CORRELACIONES GENOTIPO-FENOTIPO EN LAS ENFERMEDADES GENÉTICAS El genotipo es la información heredable, codificada internamente, de una persona y se refiere a qué versión alternativa concreta (alelo) de un gen está presente en una localización específica (locus) en un cromosoma. El fenotipo es el conjunto de características estructurales, bioquímicas y fisiológicas observadas en una persona, determinas por el genotipo, y se refiere también a los efectos estructurales y funcionales observados de un alelo mutante en un locus específico. Muchas mutaciones provocan fenotipos predecibles. En estos casos, los médicos pueden predecir la evolución clínica y planificar las estrategias terapéuticas apropiadas basándose en el genotipo del paciente. El síndrome del QT largo ejemplifica un trastorno con unas correlaciones genotipo-fenotipo predecibles (cap. 429.5). Este síndrome presenta una heterogeneidad genética, lo que significa que las mutaciones de distintos genes pueden causar el mismo trastorno. El riesgo de complicaciones cardíacas (síncope, parada cardíaca abortada o muerte súbita) es mayor con las mutaciones que afectan al gen KCNQ1 (63%) o al gen KCNH2 (46%) que entre los pacientes con mutaciones en el gen SCN5A (18%). Además, los pacientes con mutaciones del gen KCNQ1 padecen la mayoría de sus episodios durante el ejercicio y pocas veces durante el reposo o el sueño; los que tienen las mutaciones de KCNH2 y SCN5A son más propensos a presentar episodios durante el sueño o el reposo y pocas veces durante el ejercicio. Por tanto, las mutaciones en genes específicos (genotipo) se correlacionan con manifestaciones concretas (fenotipo) del síndrome de QT largo. Estos tipos de relaciones suelen denominarse correlaciones genotipo-fenotipo. Las mutaciones del gen de la fibrilina-1 asociadas al síndrome de Marfan representan otro ejemplo de correlaciones predecibles entre genotipo y fenotipo (cap. 693). Este síndrome se caracteriza por la combinación de manifestaciones esqueléticas, oculares y aórticas. La forma más grave de su evolución consiste en la disección de la raíz aórtica y muerte súbita. El gen de la fibrilina-1 está compuesto por 65 exones, y se han encontrado mutaciones en casi todos ellos. La localización de la mutación en el seno del gen (genotipo) puede desempeñar un papel significativo a la hora de determinar la gravedad de la enfermedad (fenotipo). El síndrome de Marfan neonatal está causado por mutaciones en los exones 24-27 y 31-32, mientras que las formas más leves se deben a mutaciones de los exones 59-65 y 37 y 41. Las correlaciones genotipo-fenotipo se han observado también en la fibrosis quística (FQ) (cap. 395). Aunque la enfermedad pulmonar es la causa principal de morbimortalidad, la FQ es una enfermedad multisistémica que afecta no sólo a los epitelios del aparato respiratorio, sino también al páncreas exocrino, intestino, aparato reproductor masculino, sistema hepatobiliar y glándulas sudoríparas exocrinas. La FQ está causada por mutaciones en el gen del regulador de la conductancia transmembrana (CFTR) de la FQ. Se han identificado más de 1.600 mutaciones distintas. La más frecuente es una deleción de tres nucleótidos que elimina el aminoácido fenilalanina (F) en la posición 508 en la proteína (mutación DF508), que supone alrededor del 70% de todas las mutaciones y se asocia a un cuadro de enfermedad grave. Las mejores correlaciones genotipo-fenotipo en la FQ se observan en el contexto de la función pancreática, de modo que las mutaciones más frecuentes se clasifican como con suficiencia o insuficiencia pancreática. Las personas con suficiencia pancreática suelen tener 1 o 2 alelos de suficiencia pancreática, lo que indica que dichos alelos son dominantes. Por el contrario, la correlación genotipo-fenotipo en la enfermedad pulmonar es mucho más débil, y las personas con genotipos idénticos tienen grandes variaciones en la gravedad de su enfermedad pulmonar. Este hallazgo puede explicarse en parte por modificadores genéticos o factores ambientales. Hay muchos trastornos en los que los efectos de las mutaciones sobre el fenotipo pueden modificarse por cambios en el otro alelo del mismo gen, por modificaciones en genes modificadores específicos y/o por variaciones de un número de genes no especificados (trasfondo genético). Cuando la anemia drepanocítica se cohereda con el gen de la persistencia hereditaria de hemoglobina fetal, la expresión fenotípica de la drepanocitosis es menos grave. Los genes modificadores de la FQ pueden influir en el desarrollo del íleo meconial congénito, o en la colonización por P. aeruginosa. Los genes modificadores también pueden afectar a las manifestaciones de la enfermedad de Hirschsprung, la neurofibromatosis de tipo 2, la craneosinostosis y la hiperplasia suprarrenal congénita. La combinación de mutaciones genéticas que producen un déficit de glucosa-6-fosfato deshidrogenasa y versiones más largas del elemento TATAA en el promotor del gen de la UDP-glucuronosiltransferasa agravan la hiperbilirrubinemia fisiológica neonatal. PROYECTO DEL GENOMA HUMANO Se puede realizar un mapeo génico rudimentario mediante análisis de ligamiento, que se basa en el principio de que los alelos situados en dos loci genéticos localizados próximos entre sí se segregarán © ELSEVIER. Fotocopiar sin autorización es un delito. Capítulo 74 El genoma humano & e74-5 juntos en una familia a menos que se separen por recombinación genética. La frecuencia de recombinación entre los loci puede usarse para estimar la distancia física entre dos puntos. Algunos de los primeros mapas del genoma humano fueron mapas de ligamiento basados en un conjunto de loci genéticos polimórficos, que se encuentran a lo largo de todo el genoma humano. El análisis de ligamiento aún se emplea para mapear la localización de los cambios genéticos responsables de rasgos fenotípicos y trastornos genéticos que se heredan de forma mendeliana. A diferencia de los mapas de ligamiento, que se basan en frecuencias de recombinación, los mapas físicos aprovechan fragmentos solapantes de ADN para determinar la localización de los loci entre sí. Se pueden usar varias estrategias para crear mapas físicos de una región cromosómica. En una estrategia, los segmentos de la región de interés, con longitudes que van de cientos o miles hasta unos cuantos millones de pb, se aíslan y se insertan en microorganismos como bacterias o levaduras. Las regiones comunes contenidas en distintos microorganismos se pueden identificar y esta información se puede usar para componer un mapa constituido por fragmentos solapantes de ADN, cada uno contenido en un microorganismo diferente. Los fragmentos contenidos en cada microorganismo se pueden secuenciar a continuación para obtener la secuencia de ADN de toda la región. Una estrategia alternativa consiste en fragmentar todo el genoma en porciones aleatorias, secuenciar los fragmentos y después utilizar una computadora para ordenarlos en función de los segmentos solapantes. Es probable que esta estrategia de «genoma completo», combinada con las tecnologías de secuenciación de la «siguiente generación», permita una reducción drástica del coste de la secuenciación de genomas completos a nivel individual. En 2003, el National Human Genome Research Institute, el Department of Energy y sus socios en el International Human Genome Sequencing Consortium anunciaron la culminación del Proyecto Genoma Humano y el acceso público a los datos de la secuencia correspondientes a casi todo el genoma humano. Desde entonces se han publicado versiones actualizadas que contienen correcciones e información de secuencias adicionales. El análisis del genoma humano ha producido también varios hallazgos sorprendentes. El número de genes aún no se conoce con precisión, pero parece estar alrededor de los 25.000. Esto es menor de lo esperado y está en el mismo rango de muchos organismos más simples. Sin embargo, el número de proteínas codificadas por el genoma es mucho mayor, debido a la presencia de regiones promotoras alternativas en algunos genes, al corte y empalme alternativo y a las modificaciones postraducción, lo que permite que un único gen codifique varios productos proteicos. También resulta evidente que la mayor parte del genoma humano no codifica proteínas (menos del 5% se transcribe y se traduce, aunque un porcentaje mucho mayor puede transcribirse sin traducción). Muchas secuencias transcritas no se traducen, sino que representan genes que codifican ARN dotados de un papel regulador. Una elevada proporción del genoma consiste en secuencias repetidas que se intercalan entre los genes. Algunas de ellas son elementos genéticos transponibles que tienen la capacidad de moverse de un sitio a otro del genoma. Otros son elementos estáticos que se expandieron y dispersaron en el pasado durante la evolución humana. Otras secuencias repetidas pueden desempeñar un papel estructural. También hay regiones de duplicaciones genómicas. Estas duplicaciones son sustratos para la evolución y permiten que los motivos genéticos se copien y modifiquen para que desempeñen nuevas funciones en la célula. Las duplicaciones también pueden formar la base para la reorganización cromosómica, al permitir que los segmentos de los cromosomas no homólogos se emparejen durante la meiosis e intercambien material. Ésta es otra fuente de cambio evolutivo, y también actúa como origen potencial de inestabilidad cromosómica, dando lugar a anomalías congénitas o a cáncer. Las repeticiones de bajo número de copias (LCR) también desempeñan un papel destacado como causa de trastornos genómicos. Cuando las LCR flanquean segmentos genómicos únicos, estas regiones pueden duplicarse o sufrir deleción mediante un proceso denominado recombinación homóloga no alélica. [(Figura_5)TD$IG] Figura 74-5 Micromatriz con 36.000 oligonucleótidos. La micromatriz se expuso al ARN de fibroblastos normales (marcados en rojo; v. flechas) y de fibroblastos de un paciente con una enfermedad de Niemann-Pick tipo C (marcados en verde). Las flechas indican las regiones en las que existía una intensa señal de hibridación con ARN normal o patológico. Esta micromatriz se empleó para buscar genes con una elevada expresión en los fibroblastos de los pacientes. (De Jorde LB, Carey JC, Bamshad MJ y cols., editores: Medical Genetics, 3.a ed., St. Louis, Mosby, 2006, pág. 116.) La disponibilidad de la secuencia de todo el genoma humano permite el estudio de grandes grupos de genes, así como la búsqueda de patrones de expresión génica o de alteración del genoma. Se han diseñado micromatrices que permiten el análisis de la expresión de miles de genes en un pequeño fragmento de vidrio. En algunos casos, los patrones de expresión génica proporcionan el rasgo característico de estados patológicos especiales, como el cáncer, o de respuesta a un tratamiento (fig. 74-5). BIBLIOGRAFÍA Ali-khan SE, Daar AS, Shuman C, et al: Whole genome scanning: resolving clinical diagnosis and management amidst complex data, Pediatr Res 66:357-363, 2009. Alkan C, Kidd JM, Marques-Bonet T, et al: Personalized copy number and segmental duplication maps using next-generation sequencing, Nat Genet 41:1061-1067, 2009. Ashley EA, Butte AJ, Wheeler MT, et al: Clinical assessment incorporating a personal genome, Lancet 375:1525-1535, 2010. Bredenoord A, Braude P: Ethics of mitochondrial gene replacement: from bench to bedside, BMJ 342:87-89, 2011. Christensen K, Murray JC: What genome-wide association studies can do for medicine, N Engl J Med 356:1094-1097, 2007. Cordell HJ, Clayton DG: Genetic association studies, Lancet 366:1121-1130, 2005. Feero WG, Guttmacher AE, Collins FS: Genomic medicine—an updated primer, N Engl J Med 362:2001-2011, 2010. Goldstein DB: Common genetic variation and human traits, N Engl J Med 360:1696-1698, 2009. Hamburg MA, Collins FS: The path to personalized medicine, N Engl J Med 363:301-304, 2010. e74-6 & Parte X Genética humana Hardy J, Singleton A: Genomewide association studies and human disease, N Engl J Med 360:1759-1768, 2009. Hingorani AD, Shah T, Kumari M, et al: Translating genomics into improved healthcare, BMJ 341:1037-1042, 2010. Lucassen A, Parker M: Confidentiality and sharing genetic information with relatives, Lancet 375:1507-1509, 2010. McCarroll SA: Copy number variation and human genome maps, Nat Genet 42:365-366, 2010. McGhee SA, McCabe ERB: Genome-wide testing: genomic medicine, Pediatr Res 60:243-244, 2006. Moskowitz SA, Chmiel JF, Sternen DL, et al: CFTR-related disorders (2008) in GeneReviews at GeneTests: Medical Genetics Information Resource (database online). www.ncbi.nlm.nih.gov/bookshelf/br. fcgi?book=gene&part=cf#cf. Accessed March 9, 2009. Shaw CJ, Lupski JR: Implications of human genome architecture for rearrangement-based disorders: the genomic basis of disease, Hum Mol Genet 13:R57-R64, 2004. Teare MD, Barrett JH: Genetic linkage studies, Lancet 366:1036-1044, 2005. Veltman JA, Brunner HG: Understanding variable expressivity in microdeletion syndromes, Nat Genet 42:192-193, 2010. Wain LV, Armour JAL, Tonin MD: Genomic copy number variation, human health, and disease, Lancet 374:340-350, 2009.