Clase 3 Genética reversa Genética clásica: se conocía un producto génico (la proteína) y se trataba de identificar el gen Genética reversa: genes identificados sólo por su posición en el genoma, sin ningún conocimiento de su función Llamado también clonaje posicional Anomalías cromosómicas ayudan a identificar genes Anomalía cromosómica balanceada junto con fenotipo: clave de la posición 3 explicaciones: Coincidencia No es en realidad balanceada: hay pérdida o ganancia de material Uno de los rompimientos de cromosoma causa la enfermedad. Puede interrumpir la secuencia codificante o separarla de una secuencia reguladora Translocaciones Xp21-autosoma en mujeres con DMD ayudaron en la identificación del gen Recombinación Segregación independiente Dos cromosomas homólogos segregan independientemente: un alelo en un locus de un cromosoma segrega junto a otro alelo en otro locus de otro cromosoma con una probabilidad del 50% Loci en el mismo cromosoma Alelos en loci en el mismo cromosoma cosegregan a una tasa que está relacionada a la distancia genética entre ellos Esta tasa nos da la probabilidad de que una recombinación ocurra entre dos loci = fracción de recombinación (θ) Loci muy alejados: fracción de recombinación es 0.5 Recombinante/ No recombinante A la hora de formación de los gametos se debe dar un número impar de recombinaciones entre dos loci para poder detectar al cromosoma generado como recombinante Marcador 1 Marcador 2 N.R. 1 recombinación 2 recombinaciones Fracción de recombinación nunca mayor que 0,5 Valores de fracción de recombinación van de: -0 para loci uno a la par del otro a -0,5 para loci lejos uno de otro (o en diferentes cromosomas) Fracción de recombinación da una idea de la distancia genética entre dos loci Distancia genética Unidad: centimorgan 1cM corresponde aproximadamente a una fracción de recombinación de 1% La fracción de recombinación no es una medida de distancia genética aditiva, se usa una función para transformarla en distancia en el mapa Ej: Función de mapa de Haldane transforma un θ=0,27 en 39cM Función de mapa de Kosambi transforma un θ=0,27 en 30cM A2 A2 A2 A1 A1 A1 A2 A1 B2 B2 B2 B1 B2 B1 B1 B1 A2 A1 A1 A1 B2 B1 B1 B1 A2 A1 A1 A1 A1 A1 A1 A1 A2 A1 B2 B1 B1 B1 B2 B1 B1 B1 B1 B1 NR NR R NR R La proporción de gametos recombinantes es la fracción de recombinación entre los loci A y B Distancia física/genética Mapa físico muestra el orden de los genes en el cromosoma y su distancia en kilobases o megabases Mapa genético muestra el orden y la probabilidad de que sean separados por recombinación El orden es el mismo en ambos casos La distancia sólo es igual si la probabilidad de recombinación por megabase de ADN es constante para todas las partes del cromosoma (no es cierto) Distancia física/genética Regla aproximada: 1cM = 1Mb Pero existen “junglas” (>3cM por Mb) y “desiertos” (0,3 cM por Mb) de recombinación Existen “puntos calientes” de recombinación También hay variación en los puntos de recombinación entre sexos Ligamiento Dos loci están ligados si θ < 0,5 Objetivo del análisis de ligamiento: estimar θ y determinar si θ < 0,5. Y si es <0,5 determinar si la diferencia es significativa Ligamiento es entre loci, no entre alelos Mapeo marcador/enfermedad Se requieren marcadores en intervalos de no más de 20-30 cM en el genoma Esto implica varios cientos de marcadores Análisis de ligamiento tradicional: aprox. 400 microsatélites. Hay sets probados (Weber) También se puede hacer análisis de ligamiento con SNPs (varios miles) Análisis de ligamiento Pasos: Familia con herencia aparentemente mendeliana Análisis de marcadores en todo el genoma para individuos clave de la familia Cálculo puntajes LOD Análisis de haplotipos Refinamiento Identificar intervalo de interés Siguiente paso Identificación de genes candidatos en intervalo de interés Análisis de ligamiento Determinar qué región del genoma comparten todos los afectados y no la tienen los no afectados Posibles causas de ligamiento Más probable Análisis de ligamiento requiere modelo Especificar: Autosómico o ligado al X Tipo de herencia, penetrancias, frecuencia de fenocopias Frecuencia de alelo de la enfermedad Frecuencia de nueva mutación Mapeo de dos puntos Generalmente en mapeo de dos puntos los dos puntos son: marcador, enfermedad Para determinar fracción de recombinación: en casos sencillos se cuentan recombinantes y no recombinantes Cuando la fase no está clara hay programas para determinar la probabilidad de ligamiento Determinación fase Colección de alelos en el mismo cromosoma : haplotipo Genotipos 2 1 9 4 1 2 9 2 7 6 1 13 6 15 17 9 6 17 12 12 14 7 Haplotipos Reconstrucción de haplotipos 18 18 1 4 10 10 Fase desconocida 2 6 9 17 1 6 9 2 12 14 7 18 1 10 13 1 15 4 9 2 17 12 7 6 1 18 4 10 Fase conocida Para determinar si hay ligamiento Programas evalúan la probabilidad de una determinada genealogía, bajo diferentes fracciones de recombinación entre dos loci La razón de probabilidad en análisis de ligamiento sería: L(θ)/L(0,5) Denominador: probabilidad de nuestros datos si no hay ligamiento Para determinar si hay ligamiento En análisis de ligamiento la prueba se formula en términos del logaritmo base 10 de esa probabilidad: el puntaje LOD Z(θ)=log10L(θ)/L(0,5) L(θ)= θk(1- θ) n-k n= meiosis informativas k= recombinantes • La fracción de recombinación más probable es aquella para la cual el puntaje LOD es máximo 22 11 1 1 2 1 N N D N 1 2 1 1 1 1 1 2 1 2 1 2 1 1 1 2 N D N N N N N D N D N D N N N N recombinante Todas las grises son meiosis no informativas. Son 8 meiosis informativas, 1 recombinante Cálculo genealogía anterior θ estimado= 1/8 = 0.125 Para θ= 0.125 L(θ)= θk(1- θ) n-k L(0.125)= (0.125)1(1-0125)7 L(0.5)= (0.5)1(1-0.5)7 Puntaje LOD = Z(θ)=log10L(θ)/L(0,5)= 1.099 Software para ligamiento Allegro Fastlink Genehunter Linkage S.A.G.E SuperLink Vitesse Puntaje LOD Me dice si hay evidencia de ligamiento entre dos loci Generalmente: Locus 1 es un marcador molecular Locus 2 es el locus de la enfermedad Puntaje LOD > 3 es evidencia ligamiento. Puntaje de 3 debido al azar se obtiene sólo 1/20 veces. Exclusión de ligamiento: LOD < -2 LOD „sugerente de ligamiento“ entre 2 y 3 Probabilidad de encontrar ligamiento depende de LOD Probabilidad a posteriori de encontrar ligamiento dado un LOD: LOD de 1: 17% probabilidad ligamiento LOD de 2: 67% probabilidad ligamiento LOD de 3: 95% probabilidad ligamiento En 5% de los casos no hay gen responsable, cuando el LOD es 3 Puntaje LOD de dos puntos, todo el genoma Suma de familias Cuando se tienen varias familias, los puntajes LOD se pueden sumar entre familias Para hacer esto hay que estar ABSOLUTAMENTE SEGURO de que se trata del mismo fenotipo (importancia del diagnóstico) Análisis multipunto El análisis de ligamiento es más eficiente si se analizan al mismo tiempo datos de más de dos loci Ayuda a establecer orden correcto de los marcadores Ayuda a sacar información de marcadores poco informativos. Se trata a un haplotipo como un marcador El pico más alto indica la posición más probable Beneficio de genotipar individuos adicionales Aumenta puntaje LOD Se presentan aumentos máximos, cuando θ es 0 Autosómica dominante: Individuo adicional no afectado: aumenta 0,3 Individuo adicional afectado:aumenta 0,3 Autosómica recesiva: Individuo adicional no afectado: aumenta 0,12 Individuo adicional afectado: aumenta 0,6 Estimar poder Caso más sencillo: estimar cuántas meiosis informativas se requieren para llegar a LOD de 3 Casos más complejos: programas para estimar poder de la familia. Ej: Simlink, SLink Refinamiento del mapeo Ideal tener el mayor número de meiosis posibles: mayor probabilidad de un evento de recombinación que refine el intervalo Familias en humanos no muy grandes, limita la resolución Ventaja de estudiar familias en América Latina, más hijos que en otros países Para refinar el mapeo se analizan haplotipos Ejemplo Análisis Ligamiento, glomerulopatía joven Refinamiento del mapeo Mapeo por homocigosis Personas con enfermedades recesivas raras en familias con consanguinidad, son probablemente autocigotas para los marcadores ligados al locus de la enfermedad Autocigosis: homocigosis para marcadores idénticos por descendencia, heredados de un ancestro común reciente No funciona en poblaciones sin uniones consanguíneas Identidad por descendencia Mapeo por homocigosis Si el hijo es homocigota para un alelo podría ser por autocigosis o por una 2a copia del mismo alelo que entró independientemente a la familia Entre más poco común es el alelo hay > probabilidad de que homocigosis represente autocigosis Regiones homocigotas en todos los afectados serían regiones candidatas para tener al gen que causa la enfermedad Mapeo por homocigosis En este caso, familias consanguíneas muy pequeñas pueden dar puntajes significativos Método ha sido aplicado con éxito en el descubrimiento de genes recesivos para sordera Mapeo por homocigosis Homocigosis con microsatélites Papá Mamá Hijo sano 1 Hijo enfermo Hijo sano 2 Mapeo por homocigosis en familias Problemas con análisis de ligamiento Posibilidad de errores Errores al „leer“ los marcadores causan errores en el resultado Casos de no paternidad Si se produce un genotipo que no es posible el programa de computadora lo detecta. El problema es cuando los errores podrían ser posibles Indicador de error, dobles recombinantes muy cercanos Más grave: errores en diagnóstico Problemas de cómputo Con genealogías muy grandes el tiempo de análisis se vuelve muy largo Muchos programas no logran analizar la familia completa Los programas estiman los haplotipos, errores de genotipado pueden llevar a haplotipos erróneos Si dos haplotipos son igualmente posibles, el programa podría „decidirse“ por el equivocado Heterogeneidad de locus Es común que mutaciones en diferentes genes causen el mismo fenotipo El mezclar familias en las que la causa de la enfermedad no es la misma en un análisis de ligamiento puede enmascarar la señal de ligamiento Con enfermedades recesivas está la complicación de que hay que mezclar muchas familias pequeñas. Solución: mapeo por homocigosis Resolución limitada del mapeo meiótico La resolución depende del número de meiosis analizadas Familias humanas están limitadas en este aspecto En las últimas generaciones: aún más marcado Casi imposible encontrar una única familia con suficiente poder estadístico para detectar ligamiento Análisis de ligamiento requiere modelo Análisis de ligamiento requiere por lo general un modelo con modo de herencia, penetrancia, frecuencias génicas Opción: análsis no paramétrico o „libre de modelo“. Pero tiene menor poder (próxima clase) Siguiente paso Cuando análisis de ligamiento es exitoso se obtiene una región candidata El tamaño de la región varía Se identifican todos los genes en esa región Esto es hoy en día mucho más fácil que en el pasado Gracias al proyecto de genoma humano, muchos de los genes en una región son conocidos Genes en la región candidata UCSC, Universidad de California en Santa Cruz Lista de todos los genes en la región candidata http://genome.ucsc.edu/ Estrategia de análisis de genes Establecer prioridades Genes expresados en tejido de interés Genes cuya función „calza“ con lo esperado, o en la vía metabólica apropiada Genes en regiones altamente conservadas Homología con genes de los que se sabe que tienen expresión o función apropiada Búsqueda de mutaciones Mutación en los afectados y no presente en los no afectados No tan sencillo Algunos genes son muy grandes Algunas mutaciones no están en la región codificante o son a nivel de cromosoma Dificultad de distinguir polimorfismo raro de mutación Evidencia a favor Alta conservación Diferentes mutaciones en diferentes familias Mutaciones en grupos de pacientes esporádicos Efecto sobre estructura de la proteína Efecto sobre la función de la proteína Análisis de ligamiento sólo para enfermedades mendelianas No ha sido exitoso con enfermedades complejas Por lo general se requiere modelo La estrategia ha sido tomar familias con una enfermedad compleja en la que la herencia aparenta ser mendeliana esperando encontrar un gen importante para casos esporádicos En la práctica no ha sido exitoso: no se identifica el gen, o se identifica pero no es importante en la población general Pedfile Columna 1: Familia Columna 2: Identificador de individuo Columna 3: Papá si individuo es fundador se pone un 0 Columna 4: Mamá Comuna 5: Sexo 1=Masculino, 2= Femenino Columna 6: Afección 0=desconocido, 1=Sano, 2=Afectado Pedfile familia individuo papá mamá sexo afección Penetrancia incompleta Si la penetrancia incompleta es generalizada se incluye en archivo con parámetros Si la penetrancia es dependiente de la edad porque hay variación en la edad de inicio: se usan „liability classes“. Se agrega una columna al pedfile. ? ? ? II:3 II:4 Familia Pterigión ? III:4 III:5 199 III:7 III:8 305 ? 228 III-11 223 211 225 193 212 III-12 ? 213 214 217 310 311 313 301 296 287 220 Pedfile peterigión básico Pedfile pterigión con “liability” Clase 1: se enferman 50% Clase 2: se enferman 80% Tarea Hacer pedfile a partir de genealogía Hacer genalogía a partir de pedfile