CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS 1 Tema 7. Potencial patogénico de repeticiones cortas Mutaciones en secuencias que están repetidas en tándem. Enfermedades causadas por expansión de trinucleótidos: neuropatías por expansiones CAG y enfermedades por expansión de otros trinucleótidos. Otras enfermedades por expansión de secuencias repetidas cortas. Mutaciones en secuencias que están repetidas en tándem Un tipo de mutación que afecta con frecuencia a las repeticiones cortas en tándem de tipo microsatélite es la expansión o contracción de la repetición. Como ya vimos al estudiar los mecanismos de reparación, este fenómeno se produce habitualmente por un mecanismo llamado "desemparejamiento por deslizamiento de cadenas" (slipped-strand mispairing en inglés). Dicho proceso puede tener lugar durante la replicación del ADN que contiene la repetición, si se da un deslizamiento hacia atrás ó hacia delante de la cadena que está siendo sintetizada sobre la cadena molde. Figura 7.1 A continuación se muestra un video que explica el mecanismo de deslizamiento de una cadena durante la replicación de una región que contiene una repetición de microsatélites. Dicho deslizamiento tiene como resultado la expansión de uno de los alelos de esa repetición. Este deslizamiento origina un bucle en una de las cadenas, cuyo resultado final es que la nueva cadena de ADN tendrá una repetición más o una repetición menos que la cadena original, según el desplazamiento haya sido hacia atrás o hacia delante, respectivamente. Este mecanismo explica los polimorfismos de longitud de los microsatélites, que ya hemos estudiado al hablar de estos marcadores. Lo importante ahora es darse cuenta de que si la contracción tiene lugar en la región codificante de un gen que contiene repeticiones en tándem cortas, el resultado será la aparición de deleciones de aminoácidos (si se delecionan 3 nucleótidos) ó cambios en el marco de lectura (si se delecionan repeticiones de 1, 2, 4 ó 5 nucleótidos). Se presentan a continuación dos ejemplos de lo dicho: En el cuadro superior observamos, arriba, la secuencia nativa del gen CFTR (mutado en una enfermedad llamada "Fibrosis Quística del páncreas"), que contiene una repetición en tándem del nucleótido Timina (hay 5 Timinas seguidas en los codones 142 y 143). La deleción de una T por el fenómeno que acabamos de describir provocará un cambio del marco de lectura, como se aprecia en la fila de debajo. En el cuadro inferior vemos un ejemplo de deleción de un trinucleótido TTG en la región codificante del Factor IX de la coagulación: la secuencia nativa (fila superior) contiene dos repeticiones TTG en tándem, de modo que la deleción de una de ellas provoca la deleción de un aminoácido sin alterar el marco de lectura (fila inferior). CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS 2 Lógicamente, lo mismo que se ha ilustrado aquí con deleciones puede decirse de las inserciones. Los microsatélites del tipo trinucleotídico pueden además sufrir expansiones mayores, dando lugar a un grupo de enfermedades conocidas como "enfermedades por expansión de trinucleótidos". Dada su importancia en patología humana, las estudiamos con más detalle en el siguiente apartado. Enfermedades causadas por expansión de trinucleótidos Hay un grupo de enfermedades debidas a la expansión de repeticiones de trinucleótidos, que tienen una serie de rasgos en común. El descubrimiento del mecanismo por el que se desencadenan estas enfermedades ayudó a comprender un fenómeno clínico que se conocía con el nombre de “anticipación”: la aparición de la enfermedad a una edad cada vez más temprana y de forma más severa en sucesivas generaciones de una misma familia. Como veremos, la presencia de secuencias trinucleotídicas inestables, que aumentan de tamaño en cada generación, permitió explicar este fenómeno. Las enfermedades por expansión de trinucleótidos pueden agruparse en dos grandes categorías: (1) enfermedades debidas a expansiones cortas (40 a 70 repeticiones) de un trinucleótido CAG localizado en la región codificante de un gen; y (2) enfermedades debidas a expansiones mayores (desde 50 hasta miles de repeticiones) de trinucleótidos situados en regiones no codificantes. Como ya hemos comentado, el mecanismo de expansión más probable es el desemparejamiento por deslizamiento de cadenas, aunque las grandes expansiones son más fáciles de explicar mediante un mecanismo de reparación por recombinación homóloga. De todas formas, todavía no se explica bien por qué en estas secuencias se dan muchas más expansiones que contracciones. 1. Neuropatías por expansiones CAG Las enfermedades del primer grupo tienen como resultado la expansión de un tracto de poliglutaminas en la proteína codificada por el gen respectivo, y constituyen un grupo de enfermedades neurodegenerativas de gran importancia. La siguiente tabla resume las características más importantes de cada una de estas enfermedades: Repetición Normal Enfermedad Localización Efecto Huntington CAG 11-34 40-121 ORF (HD) Ganancia Smith (Haw-River) (DRPLA) CAG 7-34 49-88 ORF (DRPLA) Ganancia Kennedy (SBMA) CAG 9-36 38-62 ORF (AR) Ganancia SCA1 CAG 6-39 40-82 ORF (SCA1) Ganancia SCA2 CAG 15-24 32-200 ORF (SCA2) Ganancia SCA3/MJD CAG 13-36 61-84 ORF (SCA3) Ganancia SCA6 CAG 4-20 20-29 ORF (CACNA1A) Ganancia SCA7 CAG 4-35 37-306 ORF (SCA7) Ganancia SCA17 CAG 25-42 47-63 ORF (TBP) Ganancia SCA12 CAG 7-45 55-78 5’UTR? (PPP2R2B) ? CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS El modo de expansión, en general, es gradual. Así, la inestabilidad va aumentando con el tamaño de la expansión: por debajo de las 40 repeticiones, la frecuencia de expansiones es baja, pero al llegar a un rango de 40 a 100 repeticiones la inestabilidad ya es prácticamente del 100%. Además, se observan diferencias si la transmisión es materna (las repeticiones de la descendencia se distribuyen normalmente alrededor de la media materna) o paterna (produce repeticiones con una media más alta que la paterna, con tendencia a aumentar en función de la edad paterna). El mecanismo patogénico en estas enfermedades se ha atribuido a la expansión de un tracto de glutaminas en las proteínas implicadas, lo que llevaría al mal plegamiento y/o formación de agregados proteicos que alteran la función neuronal. En general, se piensa que la expansión produce una ganancia de función, ya que mutaciones y deleciones que anulan la función de esos mismos genes no dan lugar a la misma enfermedad que la expansión del trinucleótido. Por ejemplo, la expansión de un trinucleótido CAG en el gen del receptor de andrógenos da lugar a la Atrofia Muscular Espino-Bulbar (SBMA, Enfermedad de Kennedy), mientras que las mutaciones de ese mismo gen provocan el Síndrome de feminización testicular. Por otro lado, la longitud de la expansiones correlaciona con la gravedad de la sintomatología, lo que hace pensar que estas enfermedades se deben a una ganancia de función con un efecto tóxico que aumenta con el número de glutaminas que lleva la proteína, probablemente a partir de un umbral de 35-40 residuos. También se ha demostrado que, para provocar degeneración neuronal, las proteínas mutantes deben entrar en el núcleo, ya que cuando se envían al citoplasma no se observa efecto patogénico alguno. Esto sugiere que pueden interaccionar con factores de transcripción ricos en glutamina y alterar la transcripción de genes necesarios para la supervivencia neuronal. De hecho, se ha demostrado que la acetilasa de histonas CBP (co-activador transcripcional del que hemos hablado en el capítulo 2) es secuestrada en presencia de proteínas con tractos de poliglutaminas, con lo que se altera la expresión de genes necesarios para la supervivencia neuronal. Dado que las proteínas con tractos de poli-glutaminas pueden unirse entre sí por interacciones proteínaproteína, otros factores de transcripción con poli-glutaminas también podrían quedar secuestrados en estas enfermedades. De hecho, se ha visto recientemente que el factor de transcripción TAFII130, un componente de TFIID, interacciona con el factor de transcripción Sp1 a través de regiones con tractos de glutaminas; la presencia de una proteína con tractos largos de poliglutaminas podría impedir esta interacción y cancelar la expresión de los genes regulados por estos factores. En el caso concreto de la huntingtina (la proteína codificada por el gen mutado en la Enfermedad de Hutington) se ha demostrado, por ejemplo, que la presencia de huntingtina con expansión de glutaminas impide la expresión del gen que codifica el receptor D2 de la dopamina, mediante un mecanismo como el descrito. Figura 7.2 Este video ilustra uno de los posibles mecanismos por los que la expansión de un tracto de glutaminas en la huntingtina afecta la expresión de genes importantes para el funcionamiento neuronal. 2. Enfermedades por expansión de otros trinucleótidos El segundo grupo de enfermedades por expansión de trinucleótidos incluye enfermedades más heterogéneas, aunque también se caracterizan por afectar al sistema nervioso. Sus características se resumen en la siguiente tabla, donde se muestra que la inestabilidad propia del rango de 40-100 repeticiones (llamado en estos casos "premutación") no causa la enfermedad, sino que favorece la aparición de una expansión explosiva, llegando de golpe hasta varios miles de repeticiones ("mutación completa"), que ya causa la enfermedad. Esta "explosividad" no se produce cuando la repetición está interrumpida por un triplete distinto; por ejemplo, algunos alelos del gen FRAXA tienen 3 CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS 4 repeticiones del trinucleótido CGG que están interrumpidas por el trinucleótido AGG cada 10 repeticiones CGG, y esos alelos no sufren expansión. Repetición Normal Pre-mutación Mutación Localización Distrofia Miotónica (DM1) CTG 5-37 50-80? 80-2000+ 3’ UTR (DMPK) X Frágil (FRAXA) CGG 6-52 59-230 230-2000+ 5’ UTR (FMRP) X Frágil (FRAXE) GCC 4-35 (35-61)? 200-900 5' UTR (FMR2) Ataxia Friedreich GAA 6-32 (35-40)? 200-1700 Intron (FRDA) SCA8 CTG 16-37 ? 107-127 3’ UTR (SCA8) En estas enfermedades, como regla general, el efecto patogénico es resultado de la pérdida de función de la proteína ó de la alteración en la función del ARNm, ya que las expansiones están en regiones no codificantes. En este grupo destacan: Síndrome del X frágil. Es la causa más frecuente de retraso mental ligado al cromosoma X (un 40% de los casos) y la causa heredada más frecuente de retraso mental aislado. Inicialmente, esta enfermedad se detectaba por el cariotipo, que muestra una rotura en Xq27.3 cuando las células se cultivan en presencia de metrotexato ó en ausencia de folato. Posteriormente, la identificación en 1991 del gen FMR1 reveló la existencia de un gen de 38 kb y 17 exones, con un trinucleótido CGG en una isla CpG de la region promotora del gen. Fue el primer ejemplo de una enfermedad originada por la expansión de una repetición de trinucleótidos. Las mutaciones de la región codificante son raras, pero también provocan la enfermedad cuando implican disminución de la proteína FMRP, lo que sugiere que la expansión del trinucleótido provoca una pérdida de función. La proteína codificada por el gen es citoplasmática y se expresa en cerebro (por igual en todos los tipos de neuronas, aunque no se expresa en células no-neuronales), así como en testículo (en células germinales pero no en células de Sertoli ó de Leydig). La proteína posee dominios de unión al ARN y dominios de unión a otras proteínas, y se ha comprobado que se une a su propio mensajero, a un 4% de todos los ARNm de cerebro fetal, y también a la subunidad 60S de los ribosomas. Podría por tanto entrar en el núcleo, capturar mensajeros y exportarlos al citoplasma como parte de la maquinaria traduccional, específicamente aquellos mensajeros que son cruciales para el desarrollo de las dendritas y para la función sináptica en las neuronas. Curiosamente, se ha visto que la mayor parte de los ARNm que se unen a FMRP forman estructuras secundarias llamadas “cuartetos-G”, debido a la presencia de Guaninas espaciadas regularmente; mediante estas estructuras, los mensajeros se unen al dominio RGG (arginina-glicina-glicina) de la FMRP. La expansión de un trinucleótido en el gen FMR1 provoca la disminución de la proteína FMRP y la desregulación del metabolismo de los ARN mensajeros que habitualmente se unen a ella. También se ha visto que, en Drosophila, la proteína FMRP forma parte del complejo de silenciamiento por interferencia de ARN (RISC), lo que abre la posibilidad de que dicho mecanismo también esté implicado en la fisiopatología del Síndrome del X frágil. Aunque el hallazgo del gen y la elucidación de la estructura de la proteína todavía no han permitido desvelar completamente el mecanismo fisiopatológico de la enfermedad, sí han servido para explicar el modo inusual de transmisión de la misma, que se verá en un capítulo posterior. CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS Figura 7.3 Estructura de los "cuartetos G", presentes en los ARN mensajeros que se unen a la proteína codificada por el gen FMR1 (mutado en el Síndrome del X Frágil). La figura de la izquierda muestra los cuartetos formados por cuatro guaninas espaciadas regularmente y coordinadas por iones potasio; a la derecha se muestra un cuarteto visto desde arriba. La distrofia miotónica se puede producir por alteraciones en 2 loci. La forma más frecuente es la DM1, debida a la expansión del trinucleótido CTG en la región no traducida-3’ del gen DMPK, que codifica una proteín-quinasa. Como la enfermedad se hereda de forma autosómica dominante, parece que el complejo fenotipo de esta enfermedad (que incluye miotonía muscular, cataratas y arritmias cardíacas) debe ser el resultado de la alteración de algún proceso celular importante. De hecho, se ha comprobado que la expansión del trinucleótido CTG en el gen DMPK inhibe la expresión de un gen vecino llamado SIX5. Se ha visto que los ratones knock-out para el gen DMPK tienen una arritmia similar a la que se ve en los pacientes con distrofia miotónica, mientras que los ratones knock-out para SIX5 sufren unas cataratas que recuerdan a las de los enfermos. La miopatía se produce por la presencia de ARN con largas expansiones de repeticiones CUG (esto se ha comprobado también en ratones). La hipótesis más aceptada es que la expansión da lugar a un ARN que es capaz de unirse a varias proteínas de unión a ARN que regulan el fenómeno del ayuste, alterando su función. Como resultado, se altera el ayuste correcto de otros ARNm, y de hecho se han identificado más de 10 genes cuyo ayuste y función está alterada en esta enfermedad. Estos genes incluyen un canal de cloro, el propio SIX5, el gen de la troponina T, el receptor de la insulina, genes con funciones neuronales, etc. En conjunto, se piensa que la sintomatología de la enfermedad es el resultado conjunto de la desregulación de todos estos genes por la presencia de un ARNm con la expansión de CTG. La ataxia de Friedreich, enfermedad autosómica recesiva que no muestra el fenómeno clínico de anticipación, parece también un buen ejemplo de pérdida de función debida a la expansión, ya que los sujetos enfermos deben ser homocigotos (tener ambos alelos con la expansión) o heterocigotos compuestos (un alelo con expansión y el otro alelo con una mutación puntual). El trinucleótido GAA que sufre la expansión está localizado en una secuencia Alu del primer intrón del gen FRDA, que codifica una proteína llamada frataxina. Los alelos normales están interrumpidos por la secuencia (GAGGAA)5-9 y no tienen más de 32 repeticiones GAA. La expansión impide la 5 CAPÍTULO 7: POTENCIAL PATOGÉNICO DE REPETICIONES CORTAS transcripción del gen, al formar un intrón muy largo con estructuras de triple hélice en el ADN genómico. Los niveles bajos de frataxina alteran la función mitocondrial, ya que esta proteína es importante en la homeostasis del hierro en la mitocondria, y dan lugar a una disminución en la producción de energía y a la formación de especies reactivas de oxígeno. Otras enfermedades por expansión de secuencias repetidas cortas Recientemente se ha descrito un tipo de epilepsia mioclónica progresiva de herencia autosómica recesiva, debida a la expansión de una secuencia de 12 nucleótidos (CCCCGCCCCGCG). Este es el primer ejemplo de enfermedad por expansión de un minisatélite, que en este caso se encuentra en la región promotora del gen CSTB (cistatina B, un inhibidor de proteasas). Los alelos normales tienen hasta 3 repeticiones, mientras que sujetos con "premutación" tienen 12 a 17 repeticiones y los enfermos tienen entre 30 y 75 copias (en total, un tamaño de 360-900 nucleótidos). Un 14% de los individuos con esta enfermedad tienen mutaciones en la región codificante del gen, por lo que el mecanismo patogénico parece ser por pérdida de función. De hecho, la presencia de la expansión conduce a disminución de los niveles de ARNm, probablemente debido a la desorganización del promotor del gen CSTB. También se ha identificado un nuevo tipo de ataxia espino-cerebelosa (SCA10), de herencia autosómica dominante. La causa de esta enfermedad reside en la expansión de un pentanucleótido (ATTCT) en el intrón 9 del gen SCA10. Los individuos normales tienen 10 a 22 repeticiones, mientras que los sujetos con esta enfermedad tienen alelos entre 500 y 4500 repeticiones. Posteriormente a este hallazgo, se identificó la primera enfermedad debida a la expansión de un tetranucleótido: la Distrofia Miotónica tipo 2. Los individuos normales tienen menos de 26 repeticiones CCTG en el intrón 1 del gen ZNF9, mientras que las expansiones en pacientes van desde 75 a 11.000 repeticiones. 6