Nomenclatura de las mutaciones Estas mezclas de cifras y letras obedecen a las estrictas normas de nomenclatura ideadas por la Sociedad de Variaciones del Genoma Humano (HGVS, por sus siglas inglesas), con el fin de normalizar internacionalmente la terminología de las variaciones en la secuencia de los ácidos nucleicos o las proteínas por ellos codificadas. Como toda nomenclatura normalizada, también la nomenclatura de las mutaciones busca la máxima precisión, de tal modo que cada variación génica se nombre de una sola forma en todos los rincones del mundo, y cada denominación utilizada designe siempre una única variación génica. Lo primero de todo es indicar claramente si la variación que vamos a describir afecta al ADN, al ARN o a la proteína resultante. En el primer caso escribiremos en mayúscula las iniciales de los nucleótidos afectados, y haremos preceder la descripción por la letra c (para el ADN copia), por la letra g (para el ADN genómico) o por la letra m (para el ADN mitocondrial). Si se trata de una mutación del ARN, en cambio, escribiremos en minúscula las iniciales de los nucleótidos afectados, y haremos preceder la descripción por la letra r. Por último, si se trata de una variación de la secuencia de una proteína, escribiremos los símbolos de letra única de los aminoácidos afectados, y haremos preceder la descripción por la letra p. Así las cosas, resulta ya obvio que c.67T>G sólo puede corresponder a una mutación del ADN copia; r.67u>g a una mutación del ARN, y p.K16W, a una variación en la secuencia aminoacídica de una proteína. Para describir las variaciones en la secuencia del ADN, que pueden afectar a uno o varios de sus cuatro nucleótidos: adenina (A), citosina (C), guanina (G) y timina (T), denotados con letra mayúscula. La descripción empieza habitualmente con un número que indica la posición del primer nucleótido afectado. Los nucleótidos del ADN se numeran desde la A del codón iniciador ATG hasta el tercer nucleótido del codón finalizador; para indicar el nucleótido 5′ del codón iniciador se usa la posición negativa –1, y para indicar el nucleótido 3′ del codón finalizador, la posición con asterisco *1. Para los nucleótidos intrónicos iniciales se indica el número de posición del último nucleótido del exón precedente, el signo de suma y la posición dentro del intrón (por ejemplo: 67+2T); para los nucleótidos intrónicos finales se indica el número de posición del primer nucleótido del exón siguiente, el signo de resta y la posición dentro del intrón en sentido inverso (por ejemplo: 68–1A). Un intervalo de dos o más nucleótidos se marca con la raya de subrayado entre las posiciones del primer y del último nucleótidos afectados (por ejemplo: 66_68). Una sustitución se designa con el símbolo > entre las iniciales de los nucleótidos implicados. Por ejemplo, 66A>C indica la sustitución de adenina por citosina en la posición 66; 78+1T>G indica la sustitución de timina por guanina en el primer nucleótido del intrón situado entre los nucleótidos 78 y 79, y 79-2C>A indica la sustitución de citosina por adenina en el penúltimo nucleótido del intrón situado entre los nucleótidos 78 y 79. 1 Una eliminación se designa con la abreviatura del (del inglés deletion) tras el intervalo correspondiente a los nucleótidos eliminados. Por ejemplo, 66_68delATC indica la eliminación de una adenina, una timina y una citosina en los nucleótidos 66 a 68, y 87_88delGT indica la eliminación de una guanina y una timina en los nucleótidos 87 y 88. Una duplicación se designa con la abreviatura dup tras el intervalo correspondiente a los nucleótidos duplicados. Por ejemplo, 55_57dupTCG indica la duplicación de la timina, la citosina y la guanina de los nucleótidos 55 a 57. Una inserción se designa con la abreviatura ins tras el intervalo correspondiente a los dos nucleótidos que flanquean la inserción. Por ejemplo, 66_67insA indica la inserción de una adenina entre los nucleótidos 66 y 67, y 91_92insTG describe la inserción de una timina y una guanina entre los nucleótidos 91 y 92. La combinación de los símbolos de eliminación e inserción permite describir sustituciones amplias; por ejemplo, 122_127delinsGA indica que los seis nucleótidos situados entre las posiciones 122 y 127 han sido sustituidos por una guanina y una adenina. Una inversión se designa con la abreviatura inv tras el intervalo correspondiente al primer y al último nucleótidos invertidos. Por ejemplo, 218_527inv310 indica una inversión de los 310 nucleótidos comprendidos entre la posición 218 y la posición 527, ambas inclusive. Por último, dos mutaciones en un mismo alelo se describen dentro de un mismo corchete y separadas por punto y coma (por ejemplo: [56T>C ; 63C>G]), mientras que dos mutaciones en distintos alelos se describen entre corchetes aparte y separadas por el signo de suma (por ejemplo: [56T>C] + [63C>G]). La nomenclatura de las mutaciones del ácido ribonucleico (ARN) sigue básicamente las mismas normas pasada para el ADN, con la diferencia de que la descripción va precedida de la letra r, y que los nucleótidos implicados se designan por la inicial de las cuatro bases en minúscula: adenina (a), citosina (c), guanina (g) y uracilo (u). Por lo demás, las normas básicas de nomenclatura son idénticas a las comentadas al ADN. La numeración de los nucleótidos se hace desde el uracilo del codón iniciador (posición 1) hasta el último nucleótido del codón finalizador, y una mutación como r.75u>a, por ejemplo, indica la sustitución del uracilo en posición 75 por una adenina. Conviene destacar que, cuando una mutación del ADN puede dar lugar a dos o más transcritos de ARN, estos se describen entre corchetes y separados por una coma. Por ejemplo, [r.56c>a, r.56c>a; r.53_68del] indica que la mutación c.56C>A en el ADN copia ocasiona la aparición de dos moléculas de ARN: una portadora únicamente de esa variación, y otra que contiene además una eliminación de los nucleótidos 53 a 68. De forma parecida, una variación descrita como [r.=, r.68_69ins68+1_68+10; r.68+2u>c] indica que la mutación intrónica c.68+2T>C en el ADN copia ocasiona la aparición de dos moléculas de ARN: una normal (r.=) y otra que contiene una inserción de los nucleótidos intrónicos 68+1 a 68+10 con sustitución del uracilo por citosina en el segundo nucleótido del intrón. 2 Nomenclatura de las mutaciones de las variaciones en la secuencia aminoacídica de una proteína: Cada aminoácido se representa por su clave unilítera en mayúscula: A (alanina), C (cisteína), D (ácido aspártico), E (ácido glutámico), F (fenilalanina), G (glicina), H (histidina), I (isoleucina), K (lisina), L (leucina), M (metionina), N (asparagina), P (prolina), Q (glutamina), R (arginina), S (serina), V (valina), W (treonina), Y (tirosina). La letra X se reserva para marcar la presencia de un codón finalizador. Para indicar la posición de un residuo, los aminoácidos se numeran comenzando por la metionina de inicio, y la cifra de posición, a diferencia de la nomenclatura de las mutaciones de los ácidos nucleicos, se coloca tras la letra correspondiente al primer aminoácido implicado. Una sustitución se designa colocando el número de posición entre el aminoácido sustituido y el aminoácido de reemplazo. Por ejemplo, W54C indica que el triptófano de la posición 54 ha sido sustituido por una cisteína, y W54X indica que el triptófano de la posición 54 ha sido sustituido por un codón finalizador. Una eliminación se designa con la abreviatura del (del inglés deletion) tras el o los aminoácidos eliminados y su posición. Por ejemplo, K39del indica la eliminación de la lisina situada en la posición 39, y C38_M40del indica la eliminación de tres aminoácidos: los comprendidos entre la cisteína de la posición 38 y la metionina de la posición 40, ambos inclusive. Una duplicación se designa con la abreviatura dup tras el o los aminoácidos afectados y su posición. Por ejemplo, G42_Q44dup indica la duplicación de los tres aminoácidos comprendidos entre la glicina de la posición 42 y la glutamina de la posición 44. Una inserción se designa con la abreviatura ins tras la inicial y la posición de los dos aminoácidos que flanquean la inserción. Por ejemplo, K39_M40insQFK indica la inserción de la secuencia glutamina-fenilalanina-lisina entre la lisina de la posición 39 y la metionina de la posición 40. La combinación de los símbolos de eliminación e inserción permite describir eliminaciones o inserciones que generan un nuevo aminoácido por ejemplo, C18_R19delinsY indica la eliminación de tres pares de bases en los codones de cisteína 18 y arginina 19, para generar en su lugar un codón que codifica el aminoácido tirosina, y C18delinsYI indica la inserción de tres pares de bases en el codón de cisteína 18, para generar dos codones que codifican los aminoácidos tirosina e isoleucina. Finalmente, una mutación por desplazamiento del marco de lectura se describe recurriendo a la abreviatura fs (del inglés frame shifting). Por ejemplo, E87fsX111 indica un desplazamiento del marco de lectura con el ácido glutámico de la posición 87 como primer aminoácido afectado y apertura de un nuevo marco de lectura para 23 aminoácidos. 3