El problema de medir la variación genética Unidad 6. Estructura genética de las poblaciones En poblaciones naturales la variación genética es generalizada y hay una amplia oportunidad para el cambio evolutivo. Ejemplos: Catarinas. Determinación del sexo en el hombre. Describir las leyes que gobiernan la transmisión de la información genética hereditaria de una generación a la siguiente en una población. 6.2 Técnicas para medir la variación genética. 6.3 Polimorfismo y heterocigocidad. 6.4 Variación genética en las poblaciones naturales. •En 2004: 50.4 % de la población humana eran hombres. •El radio natural es de 105-107 machos nacidos por cada 100 hembras nacidas. Hembras mas resistentes y con mayor longevidad, da un radio real de 98-100 m por 100 h. •Este radio ha sido humanamente distorsionado en algunos países (China, India, Corea del sur). Abortos sexo-selectivos - One child policy - preferencia por hijos. Discriminación para mujeres. •Grandes cohortes de hombres solteros adultos de clase baja→marginados→mayor violencia. Tecnología de selección del sexo y cultura familiar. Como hacer para saber cuanta variedad existe en una población ?? -Que proporción de genes en determinados loci son polimorficos (variables) en una población dada. -Que proporción de genes en determinados loci son heterocigotos en un individuo típico de la población. Para determinar cuantos loci son polimorficos en una población Imposible estudiar cada locus de un organismo. No sabemos cuantos loci hay. Hacer esto implicaría mucho trabajo Esto es difícil cuando se examinan individuos que provienen de cruzas entre la progenie. Para lograrlo: Eliminar los genes invariables de la muestra. La solución es observar una muestra de ese loci Si la muestra es aleatoria y representativa de la población Posible extrapolar a la población entera. Ejemplos: -Muestra de 2000 votantes se sabe quien votara en una elección presidencial. Estudiar algunos genes que sean muestra imparcial de todos los loci. Técnicas de genética molecular. DNA → RNA → Proteínas Seleccionar una serie de proteínas aleatoriamente (sean o no variables en la población) que representen una muestra imparcial de todos los genes estructurales del organismo. Si la proteína es invariable entre los individuos, se asume que el gen que codifica para esa proteína también es invariable. Si la proteína es variable, entonces sabemos que el gen es variable. Podemos saber que tan variable es, cuantas formas de la proteína existen y en que frecuencias existen. -Biometrias. Cuantificando la variación genética. Seleccionar 20 proteínas (≥20 loci). Secuenciarlas en 100 individuos (Seleccionados aleatoriamente). Extracción Agar o poliacrilamida Zimograma-Patrón de bandas depende del tamaño de la proteína Evaluar si existe variación para cada una de las proteínas. El promedio de la variación por proteína encontrada en los 100 individuos para las 20 proteínas puede ser un estimado de la cantidad de variación en el genoma de la población. Para analizar estas 2000 proteínas se han desarrollado técnicas como la electroforesis en gel. -Cuantos son homocigotos -Cuantos son heterocigotos y para cuales alelos. La intensidad refleja las proporciones en las que se encuentran los productos génicos. Gel tratado con sol química o substrato especifico y sales que reaccionan con el producto de la reacción catalizada por la enzima. En la posición en el gel donde la enzima especifica ha migrado se lleva a cabo la siguiente reacción: Enzima Substrato → Producto + sal → banda coloreada (mancha o spot) A partir del numero de manchas y su posición en el gel es posible inferir el genotipo de cada individuo en ese locus para esa proteína. 1 2 alelos en cada locus (Ayala y Kiger, 1980) 2 alelos en cada locus (Ayala y Kiger, 1980) 1 spot → homocigotos Pgm100/100 o Pgm108/108 2 spots → heterocigotos Pgm100/108 Cada individuo presenta diferente movilidad electroforetica y por lo tanto diferentes secuencias de aminoácidos, esto a su vez implica que están codificados por diferentes alelos. Pgm108 8= 8 mm de migración en el gel. Pgm para fosfoglucomutasa. Nomenclatura S, M, F Lento, Medio, Rápido. a, b, c Idem Malato deshidrogenasa Mdl Esta enzima consiste de dos polipeptidos (A y B) homocigotos → 1 spot. Ambos alelos hacen la misma subunidad resultando en la misma banda. heterocigotos → tres bandas. Diferentes productos alelicos, cada alelo produce una subunidad diferente. Tres asociaciones son posibles (AA, AB, BB). (Ayala y Kiger, 1980) Mas de 2 alelos Hay proteínas que consisten de cuatro o mas subunidades-pueden ser variantes alelicas localizadas en el mismo locus. Heterocigoto 5 o mas spots. Monomeros 28% Dimeros 43% En humanos Trimeros 4% Tetrameros 24% Octameros 1% Limitantes: -Subestima la cantidad de variación genética. 1) Tripletes sinónimos codifican para el mismo aa. 2) Algunas sustituciones no cambian la movilidad electroforetica de las proteínas. Dos medidas comúnmente usadas para medir la variación genética: Polimorfismo y Heterocigocidad P= Polimorfismo = Proporción de loci polimorficos en una población. Diferencias en el DNA que dan origen a diferentes formas proteicas e individuos Ejemplo: Poblacion 1 Phoronopsis viridis Poliqueto marino de la costa de California Examinamos 30 loci : 12 loci no variables 18 loci variables (Ayala y Kiger, 1980) Promedio del polimorfismo de las 4 poblaciones de P. viridis: (0.6 + 0.5 + 0.53 + 0.47)/4 = 0.525 18/30 = 0.6 de los loci son polimorficos en esa población, o bien el grado de polimorfismo en la población es de 0.6 2 Heterocigocidad Una mejor medida de la variación genética. Limitantes: H= Frecuencia promedio de los individuos heterocigotos por locus = Heterocigocidad de la población. Arbitrariedad Depende de cuantos individuos se examinen. Presencia de diferentes alelos en uno o mas loci en cromosomas homologos. Si N↑ probablemente habrá variación en los 12 loci invariables. Si N↓ algunos de los 18 loci polimorficos podrían aparecer invariables. Se calcula obteniendo: Frecuencia de los individuos heterocigotos en cada locus Para evitar el efecto del tamaño de muestra es necesario aplicar un criterio de polimorfismo = Un locus es considerado polimorfico solo cuando el alelo mas común tiene una frecuencia de < 0.95. Si N↑ y ↑ variantes, la proporción promedio no cambiara. Promediando estas frecuencias sobre todos los loci (4 es solo para ejemplificar, para hacer algo Imprecisión 2 alelos con 0.95 y 0.05 20 alelos con 0.05 Este es mas variable ! Ambos polimorficos con criterio de 0.95 Ejemplo: Estudiamos 4 loci en una población valido usar mas, usualmente 20) Frecuencias de heterocigotos en estos loci son 0.25, 0.42, 0.09, 0 H=(0.25 + 0.42 + 0.09 + 0)/4 = 0.19 La Heterocigocidad de la población es 19% = Heterocigocidad observada. (Ayala y Kiger, 1980) Si se analizan varias poblaciones de la misma spp. Calcular H para cada población y después obtener su promedio. H H H H población 1 es 0.19 población 2 es 0.15 población 3 es 0.13 población 4 es 0.17 H promedio = 0.16 Analizar las diferencias entre ellas mediante pruebas estadísticas. 4.78/71 = 0.067 (Ayala y Kiger, 1980) Ventajas: •Es preferida por muchos genetistas poblacionales porque estima la probabilidad de que dos alelos tomados aleatoriamente de una población sean diferentes. = proporción de genes que son heterocigotos. •Cada gameta de diferente individuo porta un alelo en cada locus que puede ser considerado como muestreado aleatoriamente de la población. = numero de individuos que son heterocigotos para cada gen en particular. Para solventar este problema calcular la Heterocigocidad esperada. Suponer que los individuos se aparean entre ellos aleatoriamente En cada locus hay 4 alelos con frecuencias; F1, F2, F3 y F4 Suponiendo apareamiento aleatorio; F12, F22, F32 y F42 Hesperada = 1 – (F12 + F22 + F32 + F42) Limitantes: •No refleja adecuadamente la cantidad de variación genética en organismos que se reproducen por auto-fertilización (como plantas) o cuando hay endogamia. •En ambos casos habrán mas homocigotos aun cuando diferentes individuos porten diferentes alelos si el locus es variable en la población o las frecuencias alelicas sean idénticas en dos poblaciones diferentes. Si F1 = 0.5 F2 = 0.3 F3 = 0.1 F4 = 0.1 F12 F22 F32 F42 = = = = 0.25 0.09 0.01 0.01 H esperada = 1 – (0.25 + 0.09 + 0.01 + 0.01) = 0.64 3 Variación genética en las poblaciones naturales Se presentan los 27 loci donde se encontraron dos alelos. Existe considerable variación genética en la mayoría de las poblaciones naturales El numero de alelos por locus varia de 1 (12 loci invariables) a 6 (loci Acph-2 y loci G3pd-1). 17 spp. de plantas. 125 spp. de animales. H observada = 7.2 % es < H esperada = 9.4 % Esto se debe a cierta autofertilización porque P. viridis es hermafrodita. Invertebrados en general tienen mayor variación genética que vertebrados, aunque hay excepciones. Usando el criterio de 0.95 de la frecuencia del alelo mas común <0.95, indica que 28.2 % de los 39 loci estudiados son polimorficos (11/39=0.282). H = 13.4 % Invertebrados. H = 6.0 % Vertebrados. H = 4.0 % Plantas. Usando un criterio de 0.99, 51.2 % son polimorficos (20/39). (Ayala y Kiger, 1980) Que tan confiables son estas estimaciones ? -Si la muestra es aleatoria para todos los loci → debe ser representativa. -Si todos los alelos son detectados en cada locus. -Los genes estudiados por electroforesis codifican enzimas y otras proteínas solubles, estas representan un % considerable de todo el genoma. Pero hay genes reguladores que no codifican para proteínas y genes que codifican para proteínas no solubles. Estas no han sido adecuadamente evaluadas. -La electroforesis en gel detecta variaciones solo en regiones codificantes, pero pasa por alto cambios importantes en los elementos reguladores que son la verdadera razón de la evolución de la forma y la función. (Ayala y Kiger, 1980) En Humanos hay 6.7 % de Heterocigocidad detectable por electroforesis. Una gran variedad de especies han sido analizadas mediante electroforesis de proteínas Bacterias Hongos Plantas superiores Vertebrados Invertebrados Resultados altamente consistentes entre spp. 1/3 de los genes codifican proteínas polimorficas (a nivel proteico). El promedio de Heterocigocidad en una población sobre todos los loci muestreados es del 10%, esto significa que si se escaneara el genoma de cualquier sp. se vería que 1 de cada 10 genes en un solo individuo es heterocigoto y que 1/3 de todos los genes tienen dos o mas de esos alelos segregados en cualquiera de sus poblaciones. -La migración diferencial se basa en la configuración molecular y principalmente en diferencias de carga de las proteínas, pero sustituciones de aa pueden ocurrir sin que haya un cambio neto de carga eléctrica o de su configuración. -Sustituciones en el DNA a veces tampoco cambian el aa codificado, estos son poco importantes para la evolución (sustituciones efectivas tienen efectos mayores en la biología del organismo). Niveles de análisis de variación del genoma entre individuos o entre especies: -Numero y forma de los cromosomas (vista a gran escala). -Variación en los sitios reconocidos por enzimas de restricción (vista gruesa de la variación de pares de bases). Digerir el DNA con enzimas de restricción. Cada enzima reconocen una secuencia de bases única y corta el DNA en ese sitio. El resultado son dos fragmentos cuyo tamaño esta determinado por la localización del sitio de corte en la molécula original no cortada. Ejemplo: Si usamos una enzima que reconozca un sitio de 4 pb, reconocerá 44=256 pb (4 nucleótidos). Y si usamos 8 enzimas diferentes de este tipo 256/8 = 32 → cortaran cada 32 pb A excepción de zonas donde se presenten mutaciones, inserciones o deleciones por lo cual el patrón será variable, se obtendrán fragmentos de restricción variable. (Griffiths et al., 2008) 4 -Secuenciación del DNA – Permite observar la variación por cada par de bases (vista mas fina). Se estudian las regiones codificantes. Se puede traducir a aa. •Actualmente muy desarrollada y robotizada. •Muchas compañías ofrecen el servios a precios baratos. •Bases de datos-gran cantidad de secuencias obtenidas de muchos organismos. GenBank-USA http://www.ncbi.nlm.nih.gov/ EMBL – Europa http://www.ebi.ac.uk/embl/ DDBJ – Japon http://www.ddbj.nig.ac.jp/index-e.html Programas computacionales gratuitos (Griffiths et al., 2008) Actualmente hay muchos marcadores moleculares para estudiar genética en peces e invertebrados acuáticos. •Isoenzimas •RFLP – Restriction fragment lenght polymorphism. Polimorfismos de longitud de fragmentos de restricción. •RAPD – Ramdomly amplified polymorphic DNA. DNA polimorfico amplificado al asar. •AFLP – Amplified fragment lenght polymorphism. Polimorifsmo de longitud de fragmentos amplificados. •mtDNA – Mitocondrial DNA analysis. Análisis de DNA mitocondrial. •VNTR – Variable number tandem repeat. Repeticiones en tandem de numero variable (microsatelites). •SSR – Simple sequence repeat. Repeticinoes de secuencia simples. •EST – Expressed sequence tags. Etiquetas de secuencia expresada. •SNP – Single nucleotide polymorphism. Polimorfismos de nucleótido único. •Clonación y secuenciación. En peces también se ha asociado con resistencia a enfermedades. tolerancia a temperatura. velocidad del desarrollo. tolerancia a salinidad. Cuando hay ↑ actividad en branquias de salmón, los juveniles bajan mas rápido al agua de mar. Los grupos con desarrollo enzimático y migración retardada exhiben menor tolerancia comparado con los grupos precoces. Isoenzimas Múltiples formas moleculares de enzimas individuales. =Diferente estructura paro catalizan la misma reacción. -Productos de diferentes loci con copias múltiples de genes haciendo la misma enzima o subunidades enzimáticas. -Alelos diferentes del mismo locus → Allozimas. Diferencias de expresión Temporalmente – En diferentes etapas del desarrollo. Espacialmente – En diferentes tejidos. Variacion alelica- Numero de alelos. Ventajas de su análisis: -Técnicamente es fácil. -Limitado por el numero de loci disponibles. -Limitado por el polimorfismo. -La variación genética medida esta directamente relacionada con los productos que afectan el desempeño. Ejemplo- La variación de isoenzimas esta asociada con el crecimiento en bagre de canal. ↑ variación de isoenzimas ↑ variación del crecimiento Poblaciones de Fundulus heteroclitus del Norte y del Sur tienen diferentes niveles de expresión de la lactato deshidrogenasa LDH-3 (glucólisis, piruvato→lactato). Población del Norte ↑ expresión a ↓ T°C Población del Sur ↑ expresión a ↑ T°C 1 pb en la región reguladora ! Heterocigotos y homocigotos se distinguen fácilmente porque contiene 4 subunidades que pueden asociarse independientemente para formar tetrámeros dando logar a 5 isoenzimas (isoformas de la enzima). 5 - Útiles para Mapeo genético Estudios de genomas de poblaciones. Determinación de parentesco. - En algunos casos es necesario saber de genética evolutiva para entender completamente e interpretar datos de isoenzimas, principalmente con enzimas multimericas. mtDNA -En peces con variación isoenzimatica baja se ha observado alta variación del mtDNA. -Las tasas de mutación son un orden de magnitud mayor que en el DNA nuclear. SSR – Simple sequence repeat. Repeticinoes de secuencia simples. Secuencias cortas de 2- 5 pb que se repiten un cierto numero de veces (9- 30). (ATT)n, (AT)n, (CT)n, (CTT)n, -Útil para estudios de evolución reciente. -Regiones de control son particularmente hipervariables. -Información conservada sobre todo el linaje materno, útil para programas de mejora genética. Detection of SSR length polymorphism using three genotypes, including two inbred parents and their F1. Parent 1 is homozygous for the (CA)n allele and Parent 2, the (CA)n-2 allele and each produces single PCR products. The F1, being heterozygous, produces products corresponding to both alleles. Markers resulting from SSR length polymorphisms are placed on genetic maps in relation to other SSR, RFLP, RAPD, and phenotypic markers in a manner identical to that used with RFLP or RADP markers. EST – Expressed sequence tags. Etiquetas de secuencia expresada. Son secuencias cortas de cDNA de entre 200 y 500 pb retro-transcritos de uno o ambos extremos de un gen expresado (mRNA). Cada EST representa un gen. 6 -Relativamente fácil, rápido y barato. -Es la división de mayor crecimiento en el GenBank. -Indica donde, cuando y como se expresan los genes. El mRNA es especifico en cada tejido y estadios del desarrollo o bajo condiciones medioambientales. Hay diferencias en la expresión de transcritos. Identificar genes. Analizar su expresión. -Útil para análisis de genómica funcional. -Útil para el desarrollo de microarreglos de DNA que permiten el estudio de genes diferencialmente expresados. -Han permitido el mapeo y descubrimiento de muchos genes. Limitantes: mRNA es difícil de aislar en algunos tejidos o cantidades muy bajas. Puede haber regiones reguladoras en los intrones que se pueden pasar por alto. http://www.ncbi.nlm.nih.gov/dbEST/index.html SNP – Single nucleotide polymorphism. Polimorfismos de nucleótido único. Variaciones entre individuos en cualquier sitio del genoma, regiones codificantes o no codificantes. AAGGCT to ATGGCT -Secuenciación del DNA -Tipeado de extensiones de primers -Diseño de oligos alelo-específicos. -Tecnología de DNA chips (microarreglos) Los “SNiP” se clasifican de acuerdo a su localización y su función rSNPs in regulatory regions. cSNPs in coding regions (exons), cSNPs can either be represented as synonymous (s) or non-synonymous (ns) SNPs dependent on their influence. sSNPs represent triplets encoding the same amino acid before and after the polymorphism arise while nsSNPs on the other hand alters the encoded amino acid and may signal chain termination. gSNPs located in intergenomic regions. Desventajas: -Secuenciado. -Pruebas de hibridación. -Costoso. -Genotipado difícil. -Muchos SNP pueden ser neutrales y no cambiar la secuencia de aa. iSNPs located in intronic regions. Preguntas ???? 7