CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD Tema 6. La Mutación como causa de enfermedad Características generales de las mutaciones. Potencial patogénico de las mutaciones en el ADN codificante. El proceso de ayuste y su regulación. Potencial patogénico de mutaciones que afectan al ayuste. Características generales de las mutaciones Ya se ha mencionado que el genoma humano está sujeto a variación genética y que esta capacidad de introducir modificaciones genéticas heredables supone una ventaja para la especie, al permitir la adaptación a condiciones ambientales cambiantes. Sin embargo, la existencia de una tasa mutacional basal tiene el peligro de introducir cambios genéticos deletéreos en un individuo o una familia concreta, provocando enfermedades heredables. Por tanto, de modo general podemos decir que la presencia de mutaciones en una población está sujeta al juego entre la tasa mutacional basal (la velocidad a la que se producen nuevas mutaciones en la línea germinal de esa población) y la presión selectiva frente a cada una de las mutaciones, de forma que aquellas mutaciones que sean muy agresivas no se extenderán al resto de la población tan rápidamente como mutaciones con efectos fenotípicos más leves. Por ejemplo, ya hemos visto en otro capítulo que las aberraciones cromosómicas (trisomías, monosomías, etc) son raras pero casi siempre patogénicas, mientras que los polimorfismos de secuencia —variantes alélicas que no causan ninguna enfermedad— son mucho más frecuentes. En cierto modo, lo mismo sucede con los distintos tipos de mutaciones: aquellas que provocan alteraciones graves del producto proteico suelen ser menos frecuentes por estar sometidas a una fuerte presión selectiva en su contra. Antes de estudiar todos los posibles tipos de mutaciones, será de gran utilidad recordar la estructura y procesamiento de un gen típico, porque esto nos ayudará a comprender cómo se clasifican y sus efectos. Como apreciamos en la siguiente figura, en un gen podemos distinguir (en el ADN genómico) una región 5' no-traducida (desde el inicio de la transcripción hasta el ATG que señala el inicio de la traducción), exones separados por intrones (que contienen las secuencias consenso de ayuste GT-AG), el codón de terminación (TAA en la figura) y la región 3' no traducida, que incluye la señal de poliadenilación (AATAAA). La transcripción del gen y la posterior maduración del transcrito primario dan como resultado el ARNm maduro, que después es traducido en la proteína correspondiente. En general, los distintos tipos de mutaciones que se encuentran en un gen pueden ser tanto mutaciones simples (deleciones, inserciones o substituciones que afectan a un nucleótido o a unas pocas bases) o reordenamientos grandes (deleciones parciales o reordenamientos que dan lugar a duplicaciones o deleciones del gen). 1 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD 2 Figura 6.1 Se muestra un gen con cuatro exones (rectángulos coloreados), el ARNm generado por el proceso de ayuste y la proteína final (línea naranja). La flecha horizontal de la parte superior representa una posible deleción del gen, que incluya varios exones. Las flechas azules representan posibles mutaciones de las regiones codificantes, que afectan al codón de inicio (ATG), al codón de parada (TAA), a la señal de poliadenilación (AATAAA) o a codones codificantes de aminoácidos. De estos últimos, se presenta una mutación que crea un codón de parada (STOP) y otra mutación que provoca un cambio de aminoácido en la proteína (Leucina por Prolina en posición 166). Las flechas de color naranja representan mutaciones que destruyen alguna de las secuencias de ayuste (GT/AG). A C Las substituciones simples de un nucleótido por otro se denominan transiciones ó transversiones, según provoquen el cambio de purina por purina ó pirimidina por pirimidina (transiciones), o el cambio de una purina por pirimidina ó viceversa (transversiones). En el esquema adjunto, las transiciones se representan por flechas grises y las transversiones G T por flechas negras. Como puede apreciarse, las transversiones deberían ser el doble de frecuentes que las transiciones (8 posibles transversiones por 4 posibles transiciones). En cambio, al analizar las mutaciones presentes en enfermedades humanas encontramos que las transiciones son más frecuentes. Esto es debido a que —en general— las transiciones provocan una alteración menos severa del producto proteico, por lo que la presión selectiva contra ellas es menor. Además, el dinucleótido CpG suele estar metilado en la citosina, y la desaminación espontánea de una metil-citosina da lugar a una transición del tipo CT. Como este CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD cambio tiene lugar con relativa frecuencia en el genoma de mamíferos, esto también contribuye a la alta frecuencia de transiciones que se observa en estas especies. Nomenclatura general de mutaciones: Es importante conocer la nomenclatura recomendada para describir los distintos tipos de mutaciones que pueden afectar al genoma. Aunque las recomendaciones van cambiando con el paso de los años, a continuación se resumen las reglas principales: 1. Describir la mutación utilizando la numeración de nucleótidos de la secuencia genómica (g.) o del ADNc (c.) o la numeración de la secuencia de aminoácidos, según los casos. Siempre la Adenina del codón de iniciación ATG se toma como posición +1, por lo que el nucleótido anterior es la posición -1. 2. Describir las substituciones de nucleótidos según el esquema general: Intervalo + secuencia antigua + tipo de cambio + secuencia nueva. Utilizar una flecha ó el signo ">" para las sustituciones, "del" para deleciones, "ins" para inserciones. Los rangos se indican con guión bajo (de subrayado) para evitar confusiones con el signo negativo. Las combinaciones de dos o más alteraciones se separan con el signo + y se incluyen en corchetes. Algunos ejemplos: g.12T>A (Cambio de timina por adenina en el nucleótido 12 de la secuencia genómica) [6T>C + 13_14del] (Dos cambios en el mismo alelo) [6T>C] + [13_14del] (Dos mutaciones, una en cada alelo) 14-15insT (Inserción de timina entre dos nucleótidos) 112_117delAGGTCAinsTG (Inserción de TG en vez de AGGTCA, también se podría indicar como 112_117>TG) 3. En repeticiones en tandem, se asigna por convenio el cambio a la última repetición (la que ocupa una posíción más 3’): por ejemplo, la deleción de un dinucleótido TG en la secuencia ACTGTGTGCC (siendo A el nucleótido 1991) se describiría como 1997-1998del (ó 1997-1998delTG). 4. La variabilidad en microsatélites se designa contando la posición de la primera repetición. Si la secuencia del ejemplo anterior fuese polimórfica, se designaría 1993(TG)3-22, para indicar que en posición 1993 comienza un dinucleótido TG que se encuentra en la población repetido entre 3 y 22 veces. 5. En intrones (cuando no se conoce la secuencia genómica), se señala la posición dentro del intrón con referencia al exón más cercano (utilizando números positivos comenzando con la G de la secuencia de ayuste GT donante, y números negativos contando desde la G de la secuencia AG aceptora). Se puede usar tanto la sigla IVS como sinónimo de ―intrón‖, como la numeración correspondiente a la secuencia del ADNc. Ejemplos: IVS3+1G>T ó c.621+1G>T (621 es el último nucleótido del exón 3, luego +1 es la G de la secuencia donante GT del intrón 3) IVS6-5C>A ó c.1781-5C>A (1781 es el primer nucleótido del exón 7, luego –1 es la G de la secuencia aceptora AG del intrón 6, -2 es la A, y así sucesivamente hasta llegar a -5). 3 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD 6. Para describir substituciones de aminoácidos, se indica el número del aminoácido y el cambio operado, considerando la metionina iniciadora como +1. Se sigue el esquema general aminoácido cambiado + rango + aminoácido nuevo. Se recomienda usar el código de aminoácidos de una letra, aunque también puede utilizarse el de tres letras, empleando la letra X para indicar un codón de parada. Ejemplos: R117H (la Arg en posición 117 pasa a His) G542X (la Gly 542 se convierte en codón de parada) T97del (deleción de la treonina 97) ó T97_C102del (deleción de los aminoácidos 97 a 102) T97_W98insLK (inserción de leucina y lisina entre las posiciones 97 y 98, ocupadas por treonina y triptófano) Potencial patogénico de las mutaciones en el ADN codificante Cuando las substituciones simples tienen lugar en ADN codificante, sus efectos pueden ser de varios tipos: a) substituciones silenciosas (llamadas sinónimas, sin cambio de sentido): no cambian ningún aminoácido en la proteína codificada, debido a que la mutación cambia un codón por otro codón sinónimo. Como son biológicamente neutras, no están sujetas a selección y por tanto son relativamente frecuentes en ADN codificante. Habitualmente se producen por cambios en la tercera base de un triplete, ya que es habitualmente este nucleótido el que varía entre codones sinónimos. b) substituciones no-sinónimas (el cambio de nucleótidos origina un cambio en la capacidad codificante del ARNm). Según el cambio introducido, podemos distinguir: Mutaciones con cambio de sentido (mis-sense, en inglés), cuando el cambio de nucleótidos provoca un cambio de aminoácidos. Se habla de cambio conservativo cuando ambos aminoácidos (el original y el nuevo) pertenecen al mismo grupo bioquímico, o no conservativo cuando pertenecen a grupo distintos. Estos últimos son —en general— más graves, puesto que alteran la estructura de la proteína en mayor grado. También son importantes los cambios que afectan a Cisteínas y Prolinas, que son aminoácidos muy importantes en el mantenimiento de la estructura terciaria de la proteína. Mutaciones sin sentido (non-sense), cuando un codón que codifica un aminoácido se convierte en un codón de parada (UAA, UAG ó UGA). Estas mutaciones dan lugar a proteínas truncadas en la región C-terminal, además de disminuir la estabilidad del ARNm. En general son muy graves, por lo que son menos frecuentes que las mutaciones con cambio de sentido. Figura 6.2 El video muestra distintos tipos de mutaciones puntuales y su efecto sobre la proteína: mutaciones sinónimas, con cambio de sentido ó sin sentido. Mutaciones con ganancia de sentido, cuando la mutación transforma un codón de parada en un codón codificante. Son casos infrecuentes, entre los que destaca el de una variante de la hemoglobina denominada "Hemoglobina Constant Spring" (variante alélica HBA20001), originada por el cambio de UAA (codón de parada) a CAA. Esto tiene como resultado la adición 4 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD de 30 aminoácidos a la secuencia de la hemoglobina alfa-2, que se hace más inestable y provoca una enfermedad de la sangre llamada alfa-talasemia debida a la presencia de cadenas anormales de hemoglobina. Figura 6.3 Esquema de la mutación que origina la hemoglobina “Constant Spring”. c) Deleciones e inserciones de uno ó de unos pocos nucleótidos pueden introducir o eliminar aminoácidos sin cambiar la pauta de lectura, siempre que se trate de inserciones o deleciones de tres nucleótidos (ó múltiplos de tres). Cuando se insertan o delecionan nucleótidos en un número que no es múltiplo de tres, se produce un frameshift (desplazamiento del marco de lectura) con un cambio muy importante en la estructura proteica. Para comprender las mutaciones con cambio del marco de lectura, es importante repasar este concepto. Figura 6.4 Este video explica el concepto de marco de lectura y de cómo se puede buscar un marco de lectura abierto en una secuencia de ADN, dependiendo de la posición de codones de iniciación y parada. Este otro video muestra cómo las inserciones o deleciones de uno ó dos nucleótidos pueden desplazar el marco de lectura (frameshift) y alterar gravemente la secuencia proteica. Al igual que las mutaciones sin sentido, las mutaciones con cambio del marco de lectura provocan alteraciones importantes del producto proteico y, por tanto, están sometidas a mayor presión selectiva, por lo que suelen ser menos frecuentes en ADN codificante que las mutaciones sinónimas. Además, los cambios del marco de lectura suelen introducir codones de parada prematuros, por lo que habitualmente se producen también proteínas truncadas que ven muy comprometida su funcionalidad. 5 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD Otro proceso por el que puede perderse o recuperarse el marco de lectura es la edición del ARN. La edición del ARN es un mecanismo de modificación co- ó post-transcripcional mediante el cual se cambian uno ó varios nucleótidos de un ARNm, con el resultado de que la secuencia del mensajero es ligeramente distinta de la codificada por la secuencia genómica. Este fenómeno, bastante común en otras especies pero más raro en humanos, permite generar diversos ARNm a partir de un mismo gen. Por ejemplo, la apolipoproteína ApoB48, que se produce en el intestino para entrar a formar parte de los quilomicrones, es fruto de un cambio CU en el que una citosina se des-amina para dar lugar a un uracilo; este cambio crea un codón de parada en el ARNm de la ApoB100 y se produce una proteína más corta de lo que sería esperado según la secuencia inicial. Un mecanismo similar está implicado en el origen de enfermedades como la neurofibromatosis tipo I ó el tumor de Wilms, debidas a alteraciones en los genes NF1 y WT1, respectivamente. El video de la Figura 6.5 muestra esquemáticamente la edición del ARN que da lugar a la ApoB48. Una variedad curiosa de edición del ARN surge en unas ratas que tienen una deleción de un solo nucleótido en el gen de la vasopresina, haciendo que desarrollen hipertensión arterial. Estas ratas mejoran espontáneamente al envejecer, debido a un proceso de edición del ARNm mediante el cual se pierde el dinucleótido GA en un motivo GAGAG de ese mismo gen. La deleción de estos dos nucleótidos, añadida a la deleción de un nucleótido que ya tenían, hace que se recupere el marco de lectura original y que se produzcan mayores niveles de vasopresina funcional. Recientemente, se ha visto que algo similar sucede en humanos en el caso de la enfermedad de Alzheimer: un motivo GAGAGA en el gen de la proteína precursora de amiloide- ( -APP) sufre una edición parecida, con deleción de dos bases en el ARNm y la interrupción del marco de lectura que produce una proteína truncada y es causa de algunos casos de enfermedad de Alzheimer. El proceso de ayuste (splicing) y su regulación Los ARN mensajeros de eucariotas tienen una característica muy importante: no son codificantes en su totalidad, desde el principio al fin, sino que las regiones codificantes están interrumpidas por otras regiones no-codificantes. Es decir, no todos los nucleótidos del ARN mensajero son leídos para sintetizar proteínas, sino que existen regiones codificantes llamada exones que alternan con otras regiones nocodificantes llamadas intrones. Debido a esta configuración, la maduración de un ARNm incluye la eliminación de los intrones y el empalme de los exones para formar un mensajero maduro que pueda ser traducido desde el principio hasta el fin y sin interrupciones. Este proceso de corte y eliminación de intrones con empalme de los exones se denomina en inglés splicing, término naútico que corresponde al castellano ayuste (la unión de dos cabos por sus chicotes). El ayuste es un proceso complejo, porque hay que tener en cuenta que un gen puede tener un alto número de exones e intrones, y requiere una maquinaria proteica bastante sofisticada. En primer lugar, es importante definir el punto exacto que delimita la frontera entre un exón y un intrón, para que la maquinaria encargada del ayuste pueda actuar. Estos puntos vienen determinados por secuencias específicas del ARNm. Por ejemplo, los intrones de eucariotas comienzan en la práctica totalidad de los casos por los nucleótidos GuaninaUracilo (secuencia 5' de ayuste, GU) y terminan en Adenina–Guanina (secuencia 3' de ayuste, AG). Estas secuencias se localizan dentro de unas regiones más amplias que cumplen un consenso de secuencia concreto. Por ejemplo, la secuencia de ayuste 5' está formada por el consenso 5'AG|GU[A/G]AGU-3' (la barra vertical indica el sitio de corte donde termina el exón precedente y 6 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD comienza el intrón; [A/G] significa que en esa posición puede haber una A ó una G). Por su parte, la secuencia de ayuste 3' se ajusta al consenso 5'-NCAG|G-3' (siendo N cualquier nucleótido). Además, es importante la presencia de una adenina 20-40 nucleótidos por arriba (es decir, en dirección 5') de la secuencia 3' de ayuste. Esta adenina se encuentra en la secuencia consenso 5'-CU[A/G]A[C/U]-3' (es la adenina en negrita y subrayada), es decir, precedida por A ó G y seguida por C ó U, y se denomina punto de ramificación (en inglés, "branch point"). Entre el punto de ramificación y la secuencia de ayuste 3' se encuentra un tracto rico en pirimidinas, es decir, formado casi exclusivamente por timinas ó citosinas. Finalmente, se han identificado pequeños elementos de secuencia en exones ó en intrones que actúan como potenciadores ó silenciadores del proceso de ayuste, y que tienen gran importancia en la modulación y regulación fina del proceso. Figura 6.6 El video muestra esquemáticamente las distintas secuencias que son importantes en el proceso de ayuste. En la imagen se ven los complejos proteicos que se unen a estas secuencias. El proceso de ayuste implica varias reacciones enzimáticas que realizan cortes endonucleolíticos y unión de extremos libres. El primer paso del proceso es el corte en el sitio de ayuste 5', justo por delante de la guanina del GU inicial del intrón. Este extremo libre se une a la Adenina del punto de ramificación mediante un enlace fosfo-diéster 5'-2', creando una estructura en lazo. Finalmente, se corta la secuencia de ayuste 3' por detrás de la guanina del sitio AG, lo que resulta en la liberación del intrón; los extremos libres de los dos exones flanqueantes son entonces religados. Las moléculas que llevan a cabo estos procesos son unas ribonucleoproteínas nucleares pequeñas (RNPnp), formadas por un ARN nuclear pequeño (ARNnp) y varias subunidades proteicas, dando lugar a un complejo que en su conjunto se denomina ayusteosoma (spliceosome en inglés). Aunque hay muchos tipos de ARNnp que participan en el proceso de ayuste, los principales se llaman U1, U2, U2AF, U4, U5 y U6, que dan su nombre a las correspondientes RNPnp. La RNPnp U1 se une a la secuencia de ayuste 5' por complementariedad de bases, ya que uno de sus extremos es complementario a la secuencia consenso que rodea a la GU del extremo 5' del intrón, y U2AF se une a la secuencia de ayuste 3’ (complejo E). Cuando U2 se une al punto de ramificación se forma el complejo A, que facilita la formación del lazo. A continuación, un complejo formado por la RNPnp U4/6 y la RNPnp U5 se une a la región de ayuste 3' y estabiliza la formación de todo el complejo (complejo B). Diversos cambios en la configuración (con la salida de U4), llevan a cabo el corte 3' (complejo C) y la unión de los exones. Este enlace nos lleva a Virtual Cell Animation Collection, un sitio educativo creado por la National Science Foundation y el U.S. Department of Education. Haciendo click aquí, accedemos directamente al video que muestra el proceso de ayuste (splicing). 7 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD Como se puede suponer, en un genoma eucariota hay miles de sitios que cumplen el consenso de secuencia necesario para funcionar como sitio de ayuste, pero sin embargo sólo unos pocos participan en el procesamiento normal de los genes. De hecho, uno de los temas más interesantes en la regulación del ayuste es cómo se definen exactamente los límites de exones e intrones, de modo que la maquinaria de ayuste los reconozca como tales. Aunque todavía quedan incógnitas por resolver, hoy en día sabemos que hay otros elementos que cooperan para estabilizar el ayusteosoma y permitir que se lleve a cabo el proceso. Entre estos elementos destacan la proteínas SR (llamadas así por ser ricas en los aminoácidos Serina y Arginina), que interaccionan con distintos componentes del ayusteosoma y se unen a secuencias moduladoras como son los potenciadores exónicos del ayuste. Del mismo modo, algunos tipos de ribonucleoproteínas nucleares heterogéneas (hnRNP) se unen a silenciadores del ayuste, tanto exónicos como intrónicos. Todas estas interacciones tienen lugar antes de la unión de las RNPnp U4/6 y RNPnp U5, y son muy importantes para definir los límites de exones e intrones. Figura 6.7 Este video explica la forma en que se definen los exones e intrones, dependiendo de las secuencias presentes en el ARN. Una ventaja del mecanismo de ayuste es que hace posible que distintas células utilicen distintas combinaciones de exones para dar lugar a mensajeros ligeramente diferentes, que se traducen en proteínas distintas. Este fenómeno por el cual un mismo gen puede sufrir distintos patrones de ayuste dependiendo del tejido ó del tipo celular en que se lleva a cabo, se denomina ayuste alternativo. Es muy común en mamíferos, y añade un nivel más de complejidad a la capacidad codificante del genoma. Por ejemplo, se estima que al menos el 90% de los ARN mensajeros humanos están sujetos a ayuste alternativo, bien en distintos tejidos ó bien durante el desarrollo embrionario. Esto da una idea de la importancia de este proceso, y la necesidad de comprender bien cómo se regula. Figura 6.8 Este video ilustra el fenómeno del ayuste alternativo. Un primer nivel de regulación del ayuste alternativo se da en los motivos de secuencia presentes en exones e intrones. Además de los motivos generales que ya hemos visto, existen muchos otros que se unen a otros factores reguladores proteicos. Es precisamente la combinación de éstos, junto con las distancias a las que se encuentran de los límites intrón/exón, lo que lleva a que distintos tejidos o tipos celulares generen diferentes transcritos alternativos. La idea es que los factores de ayuste que se unen a esos motivos de secuencia están presentes en unos tejidos pero no en otros, y eso permite ―leer‖ esas señales de distinta manera. Este “código de ayuste” ha sido revelado recientemente para el ratón, y constituye la primera pieza de la piedra Rosetta que permitirá predecir los patrones de ayuste alternativo. Además, recientemente se ha observado que la generación de transcritos alternativos a partir de un mismo gen no sólo depende de este primer nivel de regulación, sino que hay otros factores genómicos que también intervienen. En primer lugar, está la velocidad de transcripción de un gen: si la polimerasa se enlentece durante la elongación, esto crea una situación que favorece la inclusión de exones ―débiles‖ en el transcrito maduro. En segundo lugar, se ha visto que la cromatina también interviene en el ayuste alternativo, principalmente de dos formas. Por un lado, la posición de los nucleosomas parece ser importante, ya que constituyen una barrera al paso de la polimerasa y por tanto pueden enlentecer la elongación de la transcripción. Además de esto, algunas modificaciones epigenéticas como la trimetilación de la lisina 36 de la histona H3 (H3K36me3) pueden funcionar 8 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD como sitios de unión a factores de ayuste, y favorecer así la inclusión de exones débiles. En tercer lugar, en los últimos años se ha visto que la acción de los ARN no codificantes (ncRNAs) pueden ser importantes en la regulación del ayuste alternativo. Por ejemplo, algunos microARN regulan la expresión de factores de ayuste durante el desarrollo embrionario, como sucede con el mir-124 y el factor de unión al tracto de polipirimidinas. Otra forma de actuación está ejemplificada en el lncRNA MALAT-1, que actúa secuestrando proteínas SR en el núcleo: la ausencia de MALAT-1 hace que haya más proteínas SR disponibles y que cambien los patrones de ayuste de varios genes. Potencial patogénico de mutaciones que afectan al ayuste. Las mutaciones simples que tienen lugar en ADN no codificante intragénico (es decir, en intrones y regiones no traducidas) son silenciosas, excepto cuando afectan a las secuencias de consenso para ayuste (splicing) de los extremos 5' y 3' de los intrones. En este caso, podemos encontrar: Mutaciones que destruyen una de las secuencias de consenso. Si esto tiene lugar en ausencia de secuencias de ayuste crípticas (escondidas) y en intrones pequeños, habitualmente se lee todo el intrón, que queda así incluido en el ARNm. Esto hace que se añadan aminoácidos a la proteína, aunque también es posible que se introduzca un cambio en el marco de lectura y se altere toda la secuencia de aminoácidos a partir de ese punto. Si la mutación que destruye la secuencia de ayuste tiene lugar en presencia de una secuencia de ayuste críptica en ese mismo intrón, el exón vecino será más largo; por el contrario, si la secuencia críptica está en el exón cercano a la mutación, dicho exón será más corto. En ocasiones, las mutaciones que destruyen una de las secuencias consenso de ayuste hacen que se "salte" el exón adyacente (lo que en inglés se denomina skipping del exón), dando lugar a una proteína que ha perdido un cierto número de aminoácidos, aunque también es posible que produzca un cambio en el marco de lectura. El exón afectado será el 5’ o el 3’ a la mutación, según se destruya el GT ó el AG de un intrón, respectivamente. Figura 6.9 El video muestra el efecto de distintas mutaciones que afectan a las secuencias consenso de ayuste. Un caso especial de este tipo de mutaciones es la transición AG en posición +3 de la secuencia donante de ayuste, una alteración que está asociada con desarrollo de enfermedades en −al menos− 8 genes humanos. Como se recordará, la secuencia donante de ayuste (la del extremo 5' del intrón) es complementaria a la secuencia del ARN nuclear pequeño U1 (U1snRNA), cuya presencia es necesaria para que se lleve a cabo el proceso de ayuste. Los dos primeros nucleótidos del intrón son siempre GT (complementarios a CA en el U1snRNA), y el tercer nucleótido de la secuencia de ayuste suele ser adenina (complementaria al uracilo correspondiente en el U1snRNA). En cambio, las posiciones +4 a +6 no siempre son perfectamente complementarias. De hecho, la adenina en posición +3 dota de cierta flexibilidad a los nucleótidos de las posiciones +4 a +6, que pueden ser discordantes de la secuencia del U1snRNA y aun así son capaces de funcionar correctamente como secuencia donante de ayuste. En cambio, si alguna de las posiciones +4 a +6 no son complementarias a la secuencia del U1snRNA, una mutación en la posición +3 tiene como 9 CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD 10 resultado la falta de funcionalidad de esta secuencia de ayuste, con lo que se salta el exon precedente. Figura 6.10 Este video ilustra el ejemplo del gen COLQ, en el que una mutación en la posición +3 del intrón 16 tiene el mismo efecto que una mutación que destruya la secuencia de ayuste 5'. Esto se explica porque la secuencia que rodea a la secuencia de ayuste 5' no es totalmente complementaria a la secuencia del ARN nuclear pequeño U1, por lo que la mutación de la posición +3 (que habitualmente no debería tener ningún efecto) hace que la unión del ARNnp U1 sea ineficaz y el proceso de ayuste no se lleve a cabo correctamente. Finalmente, existen mutaciones que, sin afectar directamente a secuencias consenso de ayuste, pueden activar un lugar críptico en un intrón y producir un exón más grande y posiblemente un cambio en el marco de lectura. Figura 6.11 Este video muestra el proceso por el que una mutación puede activar una secuencia de ayuste críptica en un intrón. Si esta secuencia es más fuerte que la secuencia de ayuste original, se puede alterar el patrón normal de ayuste de esa región. Como regla general, podemos afirmar que las mutaciones que afectan al mecanismo de ayuste son más raras que las substituciones, aunque algunos genes tienen una estructura exónica que les otorga una tendencia especial a sufrir mutaciones de este tipo: se trata, habitualmente, de genes con muchos intrones y con exones pequeños, como sucede con los genes que codifican cadenas del colágeno (COL7A1, por ejemplo, tiene 118 exones), o bien genes con muchos sitios crípticos de ayuste (como es el caso del gen de la beta-globina). Como hemos visto en el apartado anterior, los ESE ó ESS (potenciadores o silenciadores exónicos del ayuste) y los ISE ó ISS (potenciadores o silenciadores intrónicos) constituyen secuencias de unión para proteínas SR (las que se unen a los potenciadores de ayuste) o para proteínas hnRNP (las que se unen a los silenciadores). Por tanto, estas proteínas regulan el proceso de ayuste y determinan si un exón va a estar presente en el transcrito final o, por el contrario, se va a saltar. Es importante tener en cuenta que algunas mutaciones en estos motivos, aunque sean silenciosas porque no cambian el aminoácido (o porque se localizan en intrones), pueden sin embargo tener efectos sobre el mensajero, haciendo que un exón se pierda y alterando así la estructura de la proteína o rompiendo el marco de lectura. De hecho, en algunos genes (ATM o NF1, por ejemplo) se ha estimado que el 50% de las mutaciones que originan enfermedades afectan a regiones que cambian el patrón de ayuste sin cambiar la secuencia de aminoácidos. Un buen ejemplo para ilustrar esta situación es una enfermedad llamada Atrofia Muscular Espinal, debida a deleciones y/o mutaciones del gen SMN1. Cerca de este gen hay un gen parálogo casi idéntico llamado SMN2, en el que un cambio C T modifica el patrón de ayuste (sin cambiar la secuencia de aminoácidos) y hace que el exón 7 se pierda, dando lugar a una proteína truncada no funcional. De todas formas, un pequeño porcentaje de las moléculas siguen un ayuste normal (con el exón 7) y producen proteína normal a partir del gen SMN2. Por tanto, aunque no haya ninguna copia funcional de SMN1 (como sucede en enfermos con atrofia muscular espinal) la CAPÍTULO 6: LA MUTACIÓN COMO CAUSA DE ENFERMEDAD 11 enfermedad tiene distinta gravedad según el número de copias de SMN2 presentes. De hecho, se piensa que esta circunstancia podría utilizarse para corregir la sintomatología de los pacientes con Atrofia Muscular Espinal. Figura 6.12 El video ilustra los distintos patrones de ayuste de los genes SMN1 y SMN2, debidos a un cambio nucleotídico que destruye un potenciador exónico de ayuste en el exón 7 del gen SMN2. Otro tipo de mutaciones del ADN no-codificante intragénico son las que afectan a la señal de poliadenilación, que se encuentra en la región no traducida 3’ de un gen. Estas mutaciones pueden originar proteínas defectuosas llevar a la degradación del ARNm. Por ejemplo, una mutación en la señal de poliadenilación del gen que codifica la hemoglobina alfa-2 (alelo HBA2 0024) convierte la señal AATAAA en AATGAA, con lo que el ARNm no se poli-adenila correctamente, el ARNm se degrada y se desarrolla la enfermedad alfa-talasemia por ausencia de cadenas de hemoglobina alfa-2. Finalmente, las substituciones en el ADN no codificante intergénico serán silenciosas excepto cuando afecten a elementos reguladores de la expresión génica (promotores, potenciadores, etc) o a otros elementos necesarios para el correcto procesamiento del ARNm. Por ejemplo, mutaciones que afectan a la “Región de Control del Locus” de las alfa- y beta-globinas (un conjunto de potenciadores situados unas 40−60 kb en dirección 5' de los genes respectivos) también provocan talasemias, por la síntesis deficiente de globinas.