Curso de Evolución 2014 Facultad de Ciencias Montevideo, Uruguay http://evolucion.fcien.edu.uy/ http://eva.universidad.edu.uy/ Variación geográfica • desde la década de 1960, la electroforesis de proteínas permitió determinar que: • la mayoría de las especies tiene poblaciones estructuradas geográficamente • el grado y escala en que se manifiesta esta subdivisión varía según habitat, modos de vida, etc. 7. Variación geográfica. Filogeografía. El coalescente. Divergencia en aislamiento estricto. • las causas y procesos subyacentes pueden incluir: • aislamiento estricto • aislamiento parcial (con intercambios) • divergencia guiada por selección (no excluyente con las anteriores) • vamos a enfatizar en esta clase el primer caso 1 2 Variación geográfica Filogeografía • en frecuencias alélicas (determinadas por electroforesis para proteínas, o para microsatélites) Campo de estudio interesado en los principios y procesos que gobiernan la distribución geográfica de los linajes, especialmente aquellos dentro y entre especies cercanamente emparentadas • en secuencias de ADN (determinadas directa o indirectamente) Avise et al., 1987. • vamos a enfatizar el segundo abordaje Area A • usaremos el marco de la filogeografía para • ilustrar la existencia de variación geográfica • comenzar a entender los procesos de divergencia en aislamiento estricto, por deriva genética FILO 3 Area B GEO 4 1 ADN mitocondrial Avise: variación en el ADN mitocondrial fuertemente estructurada geográficamente Características “típicas” (hay muchas variantes): • genoma compacto t (~16 ( 16 KB) • numerosas copias por célula • herencia materna • no hay recombinación • evolución rápida La herencia uniparental sin recombinación llevan a que los genomas mitocondriales estén relacionados entre sí por un único árbol genealógico. (“árbol de genes o alelos, no de individuos”) 5 Ejemplo: rata de pajonal (Scapteromys) 6 Ejemplo: tucu-tucu (Ctenomys pearsoni) polifilia monofilia recíproca A1 A2 A6 70a A3 A4 A5 56,58,70b B1 1 11 2 10 3 6 4 5 7 B2 ? 56,58 B3 56 B4 9 56,64 B5 B6 C1 66,70c 70b C3 66 C4 ? C5 70a,70c 64 ? C7 C8 D1 58,70b C2 C6 7 70b 8 ? 64,70b 8 2 Cuatro criterios para postular aislamiento geográfico histórico monofilia recíproca resulta de un proceso (según Avise 2000) barrera geogr ráfica Barrera geográ áfica monofilia recíproca 1. Fuerte apoyo para el árbol (por bootstrap, otros métodos) 95 parafilia 99 polifilia población ancestral 2. Concordancia con una división 2 geográfica independiente (e.g., provincias fitogeográficas) Historia previa 9 10 Concordancia genealógica 3. Concordancia entre especies (analizadas con el mismo gen) Especie 1 especie 2 Distintos genes de una misma especie Burton y Lee, 1994. Pta. Concepción 4. Concordancia entre genes de una misma especie Trigriopus californicus gen 1 gen 2 11 12 3 Concordancia genealógica Concordancia genealógica Diferentes especies en provincias biogeogáficas Diferentes especies con el mismo gen Eizirik et al. 1998 ocelote Leopardus pardalis margay Leopardus weidii 13 14 Tiempo pasado Tiempo pasado Avise 2000 presente 15 presente 16 4 pasado El modelo coalescente Tiempo Modelo demográfico: Fisher-Wright T2 T3 T4 Estudio de las propiedades (genealógicas, mutacionales) de una muestra de alelos. Típicamente, la muestra está tomada en el presente y se traza su historia hacia el pasado. Una realización del proceso: Topología. Tiempos entre eventos de coalescencia {Ti}. Mutaciones sobre la genealogía. demografía mutación T5 17 presente T2 Genealogía • topología ((D,E),(C,(A,B))) • intervalos de tiempo entre eventos de coalescencia { Ti }, i = 2, 3,…, n mutaciones sobre ramas (si las hay) T3 T4 patrón resultante de variación genética (sitios variables) • número • distribución di t ib ió A ggt aca cct ggc B .a. ... g.. t.t Sewall Wright propuso que la probabilidad de que dos genes sean idénticos por descendencia es igual a: siendo, la probabilidad de que no lo sean Probabilidad de que el evento de coalescencia ocurra a un tiempo t Probabilidad de coalescencia a tiempo t Probabilidad de que no coalescan los dos alelos en las anteriores t -1 generaciones T5 A B C D E 5 Aceptando que el tiempo de espera promedio para un evento infrecuente (como un coalescente) es el inverso de la probabilidad de dicho evento: El coalescente con más de dos alelos Para n=3 alelos, podemos pensar en la probabilidad de coalescencia como 1/2N para cada disponible para coalescer, es decir P(coal / n = 3) =3/2N. E (T2) = 2N (despreciando la probabilidad de que los tres alelos coalescan en un mismo ancestro en una generación, lo cual es razonable si 2N>>3) Para una muestra de n alelos tendríamos entonces: lo que equivale a P(coal ) C2i 2N P(coal ) i (i 1) / 2 2N con i = 2, 3, ….n E (T3) = 2N/3 E (Ti ) para i alelos, el tiempo de espera es: El coalescente con más de dos alelos Implícita en estos resultados está la noción de que son aplicables a un número cualquiera de alelos, en un momento cualquiera de la historia genealógica Es decir que la probabilidad de observar un coalescente para i = 5 alelos es la misma si tomamos en el presente o si los consideramos hace 500 generaciones p es q que E(Tn) ( ) < E(Tn ( -11) < E(Tn ( -22) < E(T ( 2)). Otro resultado imporante Es decir, los tiempos medios de espera se alargan a medida que el número de linajes se reduce mediante sucesivos coalescentes. 2N i (i 1) / 2 = E (Ti ) 4N i (i 1) Veremos ahora el tiempo esperado para el ancestro común mas reciente (ACMR) de toda nuestra muestra de alelos, deducido a partir de la ecuación anterior, sumando todos los valores esperados de Ti: E (Ti ) 4N i (i 1) n 1 n E (TACMR ) Ti 4 N 1 i2 Este valor se interpreta como el doble del número efectivo de genes de la población (2 en nuestro modelo, 2N alelos), y esta lectura tiene un valor general. Sustituyendo el 2N por el número efectivo de genes de un locus cualquiera, y el resultado es válido. Ejemplo: 4N = locus dipliode 2N = haploide N = ADNm, cromosoma Y o ADN de los cloroplastos 6 Tiempo esperado de arribo a la monofilia por deriva: depende del tamaño efectivo Tiempo esperado de arribo a la monofilia por deriva: depende del tamaño efectivo A partir del modelo coalescente derivamos: A partir del modelo coalescente derivamos: 1 E (TMRCA ) 4 N 1 n 1 E (TMRCA ) 4 N 1 n Para un sistema diploide autosómico, E(TMRCA) tiende a 4N 2N Si lo p pensamos como 2x2N,, es 2 x número efectivo de genes Para un sistema mitocondrial: 2 x N = 2 x N/2 = N (1/4 del valor en un sistema dipliode autosómico) 25 Variabilidad genética en un contexto genealógico 26 Remplazando E(Ti) por 4N/[i(i-1)] y sacando 4N de la sumatoria como factor común llegamos a: Proceso genealógico + mutación n E (TTOT ) iE (Ti ) i 2 E(s) = T2 Sitios que segregan esperadas en esta rama n 1 1 1 4 N ( 1 ) i i2 i2 i n E (TTOT ) 4 N Asumiendo un modelo de sitios infinitos (tasa de mutación baja y un número alto de clases alélicas posibles) podemos aceptar como una aproximación razonable que todos los alelos de igual estado deben ser descendientes de un único alelo (el mutante original). Los sitios polimórficos esperados estarían dados entonces por: n Tiempo total esperado para toda la genealogía: E (TTOT ) iE (Ti ) i 2 n 1 n 1 1 1 E ( STOT ) 4 N i 2 i i2 i 7 Tiempo esperado de arribo a la monofilia por deriva: aplicaciones Tiempo esperado de arribo a la monofilia por deriva: dos formas de discordancia entre árboles de especie y árboles de genes O G H C O G H C * Un árbol de genes igual al árbol de especies Tiempo esperado de arribo a la monofilia por deriva: dos formas de discordancia entre árboles de especie y árboles de genes O G H C Bajo neutralidad, la prob de observar esta discordancia depende de la prob de que NO haya coalescencia en el intervalo marcado (*) Parentesco cercano 30% de los sitios muestran reparto incompleto de linajes (ILS: “incomplete lineage sorting”) entre humanos, chimpancés y gorila Algunas cifras: Intervalo de tiempo: 2 - 4 MA Tiempo generacional: 20-25 20 25 años Ne actual en humanos: 10.000 E(TMRCA)= del orden de 1 MA * Con 1 alelo por especie. Hay que calcular la prob. de un ancestro de 2-4 o más MA de antigüedad. El resultado en este caso varía entre 13% y 2%. Notar que cambios en estimaciones de Ne y del tiempo generacional pueden cambiar los resultados de modo sustantivo. Más que los detalles, importa entender que pueden surgir discordancias sin flujo génico, por “reparto de linajes” ancestrales. A Scally et al. Nature 483, 169-175 (2012) doi:10.1038/nature10842 8 Conclusiones • las poblaciones naturales están estructuradas en el espacio • la divergencia es la consecuencia inevitable del aislamiento geográfico g g ((deriva g genética, mutación)) • la concordancia de patrones filogeográficos sugiere historias comunes de aislamiento y divergencia • la divergencia pasa por estados de polifilia y parafilia, hasta llegar a la monofilia recíproca • el “ritmo” de la divergencia g p pasiva es 1/2N • el tiempo esperado de llegada a la monofilia es aprox. 4N generaciones (para un locus diploide autosómico neutral) • generalizando, el tiempo de llegada a la monofilia es 2 x no. de genes en la población (ej., 2 veces N = N, para ADN mitocondrial) 33 9