Clase 4-Bases AnAlisis de Ligamiento

Anuncio
Clase 3
Genética reversa
Genética clásica: se conocía un producto génico
(la proteína) y se trataba de identificar el gen
Genética reversa: genes identificados sólo por
su posición en el genoma, sin ningún
conocimiento de su función
Llamado también clonaje posicional
Anomalías cromosómicas ayudan a
identificar genes
Anomalía cromosómica balanceada junto con
fenotipo: clave de la posición
3 explicaciones:
Coincidencia
No es en realidad balanceada: hay pérdida o ganancia
de material
Uno de los rompimientos de cromosoma causa la
enfermedad. Puede interrumpir la secuencia
codificante o separarla de una secuencia reguladora
Translocaciones Xp21-autosoma en
mujeres con DMD ayudaron en la
identificación del gen
Recombinación
Segregación independiente
Dos cromosomas homólogos segregan
independientemente: un alelo en un locus de un
cromosoma segrega junto a otro alelo en otro locus de
otro cromosoma con una probabilidad del 50%
Loci en el mismo cromosoma
Alelos en loci en el mismo cromosoma cosegregan a
una tasa que está relacionada a la distancia genética
entre ellos
Esta tasa nos da la probabilidad de que una
recombinación ocurra entre dos loci = fracción de
recombinación (θ)
Loci muy alejados: fracción de recombinación es 0.5
Recombinante/ No recombinante
A la hora de formación de los gametos se debe dar
un número impar de recombinaciones entre dos
loci para poder detectar al cromosoma generado
como recombinante
Marcador 1
Marcador 2
N.R.
1 recombinación
2 recombinaciones
Fracción de recombinación nunca
mayor que 0,5
Valores de fracción de recombinación van de:
-0 para loci uno a la par del otro a
-0,5 para loci lejos uno de otro (o en diferentes
cromosomas)
Fracción de recombinación da una idea de la
distancia genética entre dos loci
Distancia genética
Unidad: centimorgan
1cM corresponde aproximadamente a una fracción
de recombinación de 1%
La fracción de recombinación no es una medida de
distancia genética aditiva, se usa una función para
transformarla en distancia en el mapa
Ej:
Función de mapa de Haldane transforma un θ=0,27 en
39cM
Función de mapa de Kosambi transforma un θ=0,27 en
30cM
A2 A2
A2 A1
A1 A1
A2 A1
B2 B2 B2 B1
B2 B1 B1 B1
A2 A1
A1 A1
B2 B1
B1 B1
A2 A1
A1 A1
A1 A1
A1 A1
A2 A1
B2 B1
B1 B1
B2 B1
B1 B1
B1 B1
NR
NR
R
NR
R
La proporción de gametos recombinantes es la
fracción de recombinación entre los loci A y B
Distancia física/genética
Mapa físico muestra el orden de los genes en el
cromosoma y su distancia en kilobases o megabases
Mapa genético muestra el orden y la probabilidad de
que sean separados por recombinación
El orden es el mismo en ambos casos
La distancia sólo es igual si la probabilidad de
recombinación por megabase de ADN es constante
para todas las partes del cromosoma (no es cierto)
Distancia física/genética
Regla aproximada: 1cM = 1Mb
Pero existen “junglas” (>3cM por Mb) y “desiertos”
(0,3 cM por Mb) de recombinación
Existen “puntos calientes” de recombinación
También hay variación en los puntos de
recombinación entre sexos
Ligamiento
Dos loci están ligados si θ < 0,5
Objetivo del análisis de ligamiento: estimar θ y
determinar si θ < 0,5. Y si es <0,5 determinar si la
diferencia es significativa
Ligamiento es entre loci, no entre
alelos
Mapeo marcador/enfermedad
Se requieren marcadores en intervalos de no más
de 20-30 cM en el genoma
Esto implica varios cientos de marcadores
Análisis de ligamiento tradicional: aprox. 400
microsatélites. Hay sets probados (Weber)
También se puede hacer análisis de ligamiento con
SNPs (varios miles)
Análisis de ligamiento
Pasos:
Familia con herencia aparentemente mendeliana
Análisis de marcadores en todo el genoma para
individuos clave de la familia
Cálculo puntajes LOD
Análisis de haplotipos
Refinamiento
Identificar intervalo de interés
Siguiente paso
Identificación de genes candidatos en intervalo de
interés
Análisis de ligamiento
Determinar qué región del genoma comparten todos los
afectados y no la tienen los no afectados
Posibles causas de ligamiento
Más probable
Análisis de ligamiento requiere modelo
Especificar:
Autosómico o ligado al X
Tipo de herencia, penetrancias, frecuencia de
fenocopias
Frecuencia de alelo de la enfermedad
Frecuencia de nueva mutación
Mapeo de dos puntos
Generalmente en mapeo de dos puntos los dos
puntos son: marcador, enfermedad
Para determinar fracción de recombinación: en
casos sencillos se cuentan recombinantes y no
recombinantes
Cuando la fase no está clara hay programas para
determinar la probabilidad de ligamiento
Determinación fase
Colección de alelos en el mismo cromosoma : haplotipo
Genotipos
2
1
9
4
1
2
9
2
7
6
1
13
6
15
17
9
6
17
12
12
14
7
Haplotipos
Reconstrucción
de haplotipos
18 18
1 4
10 10
Fase desconocida
2
6
9
17
1
6
9
2
12
14
7
18
1
10
13
1
15
4
9
2
17
12
7
6
1
18
4
10
Fase conocida
Para determinar si hay ligamiento
Programas evalúan la probabilidad de una
determinada genealogía, bajo diferentes fracciones
de recombinación entre dos loci
La razón de probabilidad en análisis de ligamiento
sería:
L(θ)/L(0,5)
Denominador: probabilidad de nuestros datos si
no hay ligamiento
Para determinar si hay ligamiento
En análisis de ligamiento la prueba se formula en
términos del logaritmo base 10 de esa
probabilidad: el puntaje LOD
Z(θ)=log10L(θ)/L(0,5)
L(θ)= θk(1- θ) n-k
n= meiosis informativas
k= recombinantes
• La fracción de recombinación más probable es
aquella para la cual el puntaje LOD es máximo
22
11
1 1
2 1
N N
D N
1 2
1 1
1 1
1 2
1 2
1 2
1 1
1 2
N D
N N
N N
N D
N D
N D
N N
N N
recombinante
Todas las grises son meiosis no informativas. Son 8 meiosis informativas,
1 recombinante
Cálculo genealogía anterior
θ estimado= 1/8 = 0.125
Para θ= 0.125
L(θ)= θk(1- θ) n-k
L(0.125)= (0.125)1(1-0125)7
L(0.5)= (0.5)1(1-0.5)7
Puntaje LOD = Z(θ)=log10L(θ)/L(0,5)= 1.099
Software para ligamiento
Allegro
Fastlink
Genehunter
Linkage
S.A.G.E
SuperLink
Vitesse
Puntaje LOD
Me dice si hay evidencia de ligamiento entre dos loci
Generalmente:
Locus 1 es un marcador molecular
Locus 2 es el locus de la enfermedad
Puntaje LOD > 3 es evidencia ligamiento. Puntaje de 3
debido al azar se obtiene sólo 1/20 veces.
Exclusión de ligamiento: LOD < -2
LOD „sugerente de ligamiento“ entre 2 y 3
Probabilidad de encontrar ligamiento
depende de LOD
Probabilidad a posteriori de encontrar ligamiento
dado un LOD:
LOD de 1: 17% probabilidad ligamiento
LOD de 2: 67% probabilidad ligamiento
LOD de 3: 95% probabilidad ligamiento
En 5% de los casos no hay gen responsable, cuando el
LOD es 3
Puntaje LOD de dos puntos, todo el
genoma
Suma de familias
Cuando se tienen varias familias, los puntajes LOD se
pueden sumar entre familias
Para hacer esto hay que estar ABSOLUTAMENTE
SEGURO de que se trata del mismo fenotipo
(importancia del diagnóstico)
Análisis multipunto
El análisis de ligamiento es más eficiente si se analizan
al mismo tiempo datos de más de dos loci
Ayuda a establecer orden correcto de los marcadores
Ayuda a sacar información de marcadores poco
informativos. Se trata a un haplotipo como un
marcador
El pico más alto indica la posición más probable
Beneficio de genotipar individuos adicionales
Aumenta puntaje LOD
Se presentan aumentos máximos, cuando θ es 0
Autosómica dominante:
Individuo adicional no afectado: aumenta 0,3
Individuo adicional afectado:aumenta 0,3
Autosómica recesiva:
Individuo adicional no afectado: aumenta 0,12
Individuo adicional afectado: aumenta 0,6
Estimar poder
Caso más sencillo: estimar cuántas meiosis
informativas se requieren para llegar a LOD de 3
Casos más complejos: programas para estimar
poder de la familia. Ej: Simlink, SLink
Refinamiento del mapeo
Ideal tener el mayor número de meiosis posibles:
mayor probabilidad de un evento de
recombinación que refine el intervalo
Familias en humanos no muy grandes, limita la
resolución
Ventaja de estudiar familias en América Latina,
más hijos que en otros países
Para refinar el mapeo se analizan haplotipos
Ejemplo Análisis Ligamiento,
glomerulopatía
joven
Refinamiento del mapeo
Mapeo por homocigosis
Personas con enfermedades recesivas raras en
familias con consanguinidad, son probablemente
autocigotas para los marcadores ligados al locus de
la enfermedad
Autocigosis: homocigosis para marcadores
idénticos por descendencia, heredados de un
ancestro común reciente
No funciona en poblaciones sin uniones
consanguíneas
Identidad por descendencia
Mapeo por homocigosis
Si el hijo es homocigota para un alelo podría ser
por autocigosis o por una 2a copia del mismo alelo
que entró independientemente a la familia
Entre más poco común es el alelo hay >
probabilidad de que homocigosis represente
autocigosis
Regiones homocigotas en todos los afectados
serían regiones candidatas para tener al gen que
causa la enfermedad
Mapeo por homocigosis
En este caso, familias consanguíneas muy
pequeñas pueden dar puntajes significativos
Método ha sido aplicado con éxito en el
descubrimiento de genes recesivos para sordera
Mapeo por homocigosis
Homocigosis con microsatélites
Papá
Mamá
Hijo sano 1
Hijo enfermo
Hijo sano 2
Mapeo por homocigosis
en familias
Problemas con análisis de
ligamiento
Posibilidad de errores
Errores al „leer“ los marcadores causan errores en
el resultado
Casos de no paternidad
Si se produce un genotipo que no es posible el
programa de computadora lo detecta. El problema
es cuando los errores podrían ser posibles
Indicador de error, dobles recombinantes muy
cercanos
Más grave: errores en diagnóstico
Problemas de cómputo
Con genealogías muy grandes el tiempo de análisis
se vuelve muy largo
Muchos programas no logran analizar la familia
completa
Los programas estiman los haplotipos, errores de
genotipado pueden llevar a haplotipos erróneos
Si dos haplotipos son igualmente posibles, el
programa podría „decidirse“ por el equivocado
Heterogeneidad de locus
Es común que mutaciones en diferentes genes
causen el mismo fenotipo
El mezclar familias en las que la causa de la
enfermedad no es la misma en un análisis de
ligamiento puede enmascarar la señal de
ligamiento
Con enfermedades recesivas está la complicación
de que hay que mezclar muchas familias pequeñas.
Solución: mapeo por homocigosis
Resolución limitada del mapeo meiótico
La resolución depende del número de meiosis
analizadas
Familias humanas están limitadas en este aspecto
En las últimas generaciones: aún más marcado
Casi imposible encontrar una única familia con
suficiente poder estadístico para detectar
ligamiento
Análisis de ligamiento requiere modelo
Análisis de ligamiento requiere por lo general un
modelo con modo de herencia, penetrancia,
frecuencias génicas
Opción: análsis no paramétrico o „libre de
modelo“. Pero tiene menor poder (próxima clase)
Siguiente paso
Cuando análisis de ligamiento es exitoso se obtiene
una región candidata
El tamaño de la región varía
Se identifican todos los genes en esa región
Esto es hoy en día mucho más fácil que en el pasado
Gracias al proyecto de genoma humano, muchos de los
genes en una región son conocidos
Genes en la región candidata
UCSC, Universidad de California en Santa Cruz
Lista de todos los genes en la región candidata
http://genome.ucsc.edu/
Estrategia de análisis de genes
Establecer prioridades
Genes expresados en tejido de interés
Genes cuya función „calza“ con lo esperado, o en la vía
metabólica apropiada
Genes en regiones altamente conservadas
Homología con genes de los que se sabe que tienen
expresión o función apropiada
Búsqueda de mutaciones
Mutación en los afectados y no presente en los no
afectados
No tan sencillo
Algunos genes son muy grandes
Algunas mutaciones no están en la región codificante o
son a nivel de cromosoma
Dificultad de distinguir polimorfismo raro de mutación
Evidencia a favor
Alta conservación
Diferentes mutaciones en diferentes familias
Mutaciones en grupos de pacientes esporádicos
Efecto sobre estructura de la proteína
Efecto sobre la función de la proteína
Análisis de ligamiento sólo para enfermedades
mendelianas
No ha sido exitoso con enfermedades complejas
Por lo general se requiere modelo
La estrategia ha sido tomar familias con una
enfermedad compleja en la que la herencia aparenta
ser mendeliana esperando encontrar un gen
importante para casos esporádicos
En la práctica no ha sido exitoso: no se identifica el
gen, o se identifica pero no es importante en la
población general
Pedfile
Columna 1: Familia
Columna 2: Identificador de individuo
Columna 3: Papá
si individuo es fundador se
pone un 0
Columna 4: Mamá
Comuna 5: Sexo
1=Masculino, 2= Femenino
Columna 6: Afección
0=desconocido, 1=Sano,
2=Afectado
Pedfile
familia
individuo
papá
mamá
sexo
afección
Penetrancia incompleta
Si la penetrancia incompleta es generalizada se
incluye en archivo con parámetros
Si la penetrancia es dependiente de la edad porque
hay variación en la edad de inicio: se usan „liability
classes“. Se agrega una columna al pedfile.
?
?
?
II:3
II:4
Familia
Pterigión
?
III:4
III:5
199
III:7
III:8
305
?
228
III-11
223
211
225
193
212
III-12
?
213
214
217
310
311
313
301
296
287
220
Pedfile peterigión básico
Pedfile pterigión con “liability”
Clase 1: se enferman 50%
Clase 2: se enferman 80%
Tarea
Hacer pedfile a partir de genealogía
Hacer genalogía a partir de pedfile
Descargar