Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca CAPITULO 5 CONCEPTOS ESTADISTICOS EN LA GENETICA FORESTAL PARTE 1. INTRODUCCION A LA GENETICA CUANTITATIVA 1. Constitución Genética de una Población Para describir la constitución genética de un grupo de individuos en una población habría que especificar los genotipos y cuantificar el número de individuos que existen por cada genotipo. Supongamos que tenemos un locus autosómico A, con dos alelos diferentes, A1 y A2 presentes en la población. Los posibles genotipos son: A1A1, A1A2, y A2A2. La constitución genética del grupo estaría totalmente descrita por la proporción (porcentaje) de los individuos que pertenecerían a cada genotipo. Estas proporciones se denominan "frecuencias genotípicas". Genéticamente, una población es un grupo reproductivo y la genética de poblaciones está interesada no solo en la constitución genética de los individuos, sino que también en la transmisión de los genes de una generación a la siguiente. Durante dicha transmisión, los genotipos de los padres se disocian y un nuevo grupo de genotipos se constituye en la progenie, con los genes transmitidos por los gametos. Los genes llevados por la población en esta forma tienen continuidad de generación en generación, pero no los genotipos en los cuales ellos están presentes. 1 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca La constitución genética de una población, en términos de los genes que ésta lleva, se describe a través de las "frecuencias génicas", es decir por la especificación de los alelos presentes en cada locus y el número, proporción o porcentaje de los diferentes alelos en cada locus. Las frecuencias de todos los alelos en cualquier locus deben sumar la unidad, o 100 %. Las frecuencias génicas en un locus en particular dentro de un grupo de individuos puede ser determinada a partir del conocimiento de las frecuencias genotípicas. Por ejemplo, supongamos que existen dos alelos, A1 y A2, clasificamos cien individuos y contamos la cantidad de individuos en cada genotipo: A1A1 A1A2 A2A2 TOTAL # INDIVIDUOS 30 60 10 100 FRECUENCIAS 0.3 0.6 0.1 1.0 A1 60 60 -- 120 A2 -- 60 20 80 TOTAL 200 # GENES Cada individuo tiene dos genes, de manera que habrá un total de 200 genes en este locus en la población, de los cuales 120 genes son A1 y 80 son A2. Por lo tanto las frecuencias génicas son 0.6 y 0.4 respectivamente. Se puede expresar esta relación en una forma más general y de la siguiente manera: A1A1 A1A2 A2A2 TOTAL # INDIVIDUOS a b c N FRECUENCIAS P H Q 1.0 A1 2a b -- 2a+b A2 -- b 2c 2c+b TOTAL 2N # GENES 2 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca La relación entre las frecuencias génicas y genotípicas entre los individuos resulta como sigue: Genes Frecuencias Génicas A1 p= a/N + b/(2N) = P + 1/2 H (1) A2 q= c/N + b/(2N) = Q + 1/2 H (2) Las propiedades genéticas de una población son influidas en el proceso de la transmisión de los genes de una generación a la siguiente por varias razones: 1. Tamaño de la Población. Los genes que pasan de una generación a la siguiente son una muestra de los genes de la población parental. Por lo tanto, las frecuencias génicas se encuentran sujetas a la variación de muestreo entre generaciones sucesivas, y mientras más pequeño sea el número de progenitores mayor será la variación por muestreo. El efecto del tamaño de la población produce lo que se denomina "deriva genética" (ver apunte N° 3). 2. Diferencias de Fertilidad y Viabilidad. Los diferentes tipos entre los progenitores pueden tener diferentes fertilidades y, si ésto sucede, contribuirán en una manera diferente a la formación de los gametos con los cuales se forma la siguiente generación. De esta forma, las frecuencias génicas pueden ser cambiadas en la transmisión. A su vez, los genotipos en los cigotos pueden tener diferentes tasas de sobrevivencia y, por tanto, las frecuencias génicas de la nueva generación pueden cambiarse antes que los individuos sean adultos y ellos mismos sean progenitores. Estos procesos han sido llamados también "selección natural". 3. Migración y Mutación. Las frecuencias génicas en la población pueden también cambiarse por la migración de individuos de otra "población" y por mutación génica. Una mayor discusión sobre estos factores se encuentra en el apunte N° 3. 4. Sistema de Apareamiento. Los genotipos en la progenie están determinados por la unión de los gametos en parejas para formar cigotos y la unión de los gametos está influida por el apareamiento de los progenitores. De esta manera, las frecuencias genotípicas en la generación filial están influidas por los genotipos de las parejas que se aparean en la generación paternal. 3 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca Así tenemos el "apareamiento aleatorio", o "panmixia", que significa que cada individuo tiene la misma oportunidad de aparearse con cualquier otro individuo de la población. Lo fundamental es que no exista una tendencia especial para que los individuos con igual genotipo, o que estén emparentados entre si por ascendencia, se apareen. Si una población habita en un área geográfica extensa, los individuos que viven en una misma localidad tienen una mayor probabilidad que se apareen entre si que aquellos que habitan en localidades distintas. De esta manera, los individuos parentales tenderán a estar más emparentados por ascendencia. Una situación bastante común en poblaciones forestales es que éstas se encuentren altamente dispersas, por lo tanto es factible que estén subdivididas en grupos locales y que el apareamiento sea aleatorio sólo dentro de los grupos. 2. Equilibrio Hardy-Weinberg En una población grande (panmítica) con apareamiento aleatorio, las frecuencias génicas y genotípicas permanecen constantes de generación a generación, en ausencia de migración, mutación y selección, y las frecuencias genotípicas están determinadas por las frecuencias génicas. Estas propiedades de la población son conocidas como la "Ley de Hardy-Weinberg". La deducción de la ley de Hardy-Weinberg comprende tres pasos: (1) de los progenitores a los gametos que ellos producen; (2) de la unión de los gametos a los genotipos en los cigotos producidos; y (3) de los genotipos de los cigotos a las frecuencias génicas en la generación filial. La demostración se entrega de la manera siguiente: (a). La generación parental tiene las siguientes frecuencias génicas y genotípicas: Genes Genotipos A1 A2 A1A1 A1A2 A2A2 p q P H Q 4 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca Se producirán dos clases de gametos, los que tienen el gen A1 y los que tienen el gen A2. Las frecuencias de estos tipos gaméticos son las mismas que las frecuencias génicas, p y q, en la generación que los produce. De manera que la frecuencia de gametos A1 producida por la población total es P + 1/2H, que es la frecuencia génica de A1. (b). El apareamiento aleatorio entre los individuos es equivalente a la unión aleatoria entre sus gametos. Es equivalente a tener una fuente común de gametos a la cual todos los individuos contribuyen igualmente; los cigotos se forman por la unión al azar entre pares de gametos de esta fuente. Las frecuencias genotípicas en los cigotos serán, entonces, los productos de las frecuencias de los tipos gaméticos que se unen para producirlos. Las frecuencias genotípicas en la progenie producidas por el apareamiento aleatorio pueden, por lo tanto, determinarse simplemente multiplicando las frecuencias de los tipos gaméticos que se muestran en la siguiente tabla, en la que se supone que las frecuencias génicas son las mismas, tanto en los gametos masculinos como en los femeninos: Gametos femeninos y sus frecuencias Gametos A1 p A1 A2 p q A1A1 A1A2 p² pq A2A1 A2A2 qp q² masculinos y sus frecuencias A2 q 5 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca De tal manera que las frecuencias genotípicas en los cigotos son: A1A1 A1A2 A2A2 p² 2pq q² (3) Se debe notar que las frecuencias genotípicas dependen sólo de las frecuencias génicas en los progenitores, y no de las frecuencias genotípicas parentales, siempre y cuando los progenitores se apareen al azar. (c) Finalmente, usando las frecuencias genotípicas se puede determinar las frecuencias génicas en la generación filial. Aplicando las fórmulas (1) y (2), encontramos que las frecuencias son: Genes Frecuencias Génicas A1 p= p² + 1/2 (2pq) = p (4) A2 q= q² + 1/2 (2pq) = q (5) Las propiedades de una población con respecto a un sólo locus, expresadas por medio de la ley de Hardy-Weinberg y demostradas arriba, son las siguientes: 1. Una población grande con apareamiento aleatorio, en ausencia de migración, mutación y selección, es estable con respecto a las frecuencias génicas y genotípicas. Es decir, no hay una tendencia clara en el cambio de las propiedades genéticas de una generación a otra. 2. Las frecuencias genotípicas en la progenie producida por apareamiento aleatorio entre los progenitores están determinadas únicamente por las frecuencias génicas en los progenitores. Consecuentemente, una población bajo equilibrio Hardy-Winberg tiene relaciones dadas por la expresión (3), entre las frecuencias génicas y genotípicas en cualquier generación; y estas frecuencias genotípicas se establecen en una sola generación de apareamiento aleatorio, independientemente de las frecuencias genotípicas de los progenitores. 6 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca Para ver una aplicación de la ley de Hardy-Winberg, consideremos el ejemplo numérico dado más arriba. Las frecuencias génicas de p y q fueron estimadas en 0.6 y 0.4 respectivamente. Entonces, las frecuencias esperadas son: A1A1 A1A2 A2A2 0.36 0.48 0.16 La comparación de las frecuencias observadas con las frecuencias esperadas puede considerarse como una prueba de las condiciones bajo las que depende el equilibrio HardyWeinberg se cumplen en la población. Estas condiciones son: apareamiento aleatorio entre los progenitores de los individuos observados, misma fertilidad de los diferentes genotipos en los progenitores e igual viabilidad de los diferentes genotipos en la progenie derivada, desde la fertilización hasta el tiempo en que se hizo la observación. En adición, la clasificación de los individuos de acuerdo a su genotipo debe ser correctamente hecha. Actividad individual: utilice el test de Chi-cuadrado para probar la hipótesis nula que las frecuencias génicas del ejemplo numérico anterior provienen de una población bajo equilibrio Hardy-Weinberg. Asuma 1 grado de libertad. Debe notarse, sin embargo, que las diferencias de fertilidad o viabilidad entre genotipos, aunque pueden ser detectadas, no pueden medirse a través de la comparación de las frecuencias observadas con las esperadas. Las frecuencias esperadas están basadas en las frecuencias génicas observadas después de que las diferencias en fertilidad o viabilidad han manifestado su efecto. Para medir estos efectos, las frecuencias genotípicas o génicas originales deberían haberse conocido. Fue mencionado anteriormente que las frecuencias génicas en un grupo de individuos puede determinarse a partir de sus frecuencias genotípicas, pero esto requiere conocer las frecuencias de los tres genotipos previamente descritos, lo que sería el caso de un locus autosómico sin dominancia. Por lo tanto, la expresión p = P + 1/2 H no puede aplicarse para el caso de un alelo recesivo, cuando el heterocigoto no se distingue del homocigoto dominante, como es el caso de un locus autosomico con dominancia completa. Sin embargo si las condiciones que limitan el equilibrio Hardy-Weinberg se satisfacen, sólo la frecuencia de uno de los genotipos homocigotos es necesaria para determinar la frecuencia génica, y la dificultad que 7 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca presentaba el gen recesivo queda solucionada. Por ejemplo, si el gen recesivo es A2, con una frecuencia génica "q", entonces la frecuencia del homocigoto A2A2 es q². De manera que la frecuencia génica es la raíz cuadrada de la frecuencia del homocigoto. Sucesivamente, se puede calcular la frecuencia del heterocigoto, a través de la expresión 2q(1-q). A veces resulta sorprendente descubrir cuan común es la frecuencia de heterocigotos de una anormalidad recesiva rara. Algunas técnicas estadísticas más sofisticadas permiten estimar las frecuencias de alelos dominantes y recesivos sin asumir el equilibrio Hardy-Weinberg. Tales técnicas no serán cubiertas aquí pero están incluidas en textos clásicos de análisis numérico y estadística avanzada; entre estas se encuentran el método de Newton-Raphson; el algoritmo ME, y el suficientemente conocido análisis de máxima verosimilitud (maximum likelihood). Los aspectos ligados a la determinación de frecuencias génicas para alelos múltiples y genes ligados al sexo está dado por Falconer (1989). 3. Cambios en las Frecuencias Génicas Existen dos clases de procesos a través de los cuales se producen los cambios de las frecuencias génicas, y consecuentemente los de las frecuencias genotípicas. Estos son los procesos sistemáticos, los cuales tienden a cambiar la frecuencia génica en una forma predecible tanto en cantidad como en dirección y los procesos dispersivos, los cuales resultan en las poblaciones pequeñas o finitas, debido a efectos del muestreo, y es predecible en cantidad pero no en dirección. los procesos sistemáticos son: la migración, la mutación y la selección; mientras que el proceso no sistemático se denomina deriva genética (ver apunte n° 3). 4. Variación Continua Para el lego, el bosque parecerá una masa inmutable de arboles tanto en el tiempo como en el espacio; para el forestal, los arboles de dicho rodal seguirán determinadas funciones de desarrollo y lo que observa podrá ser puesto dentro de un continuo en el tiempo y clasificado de acuerdo a su estructura. Pero, para el mejorador forestal, detrás de la masa forestal se esconde una variación que es respuesta a generaciones y generaciones de interacción entre los individuos 8 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca con las presiones de selección ejercidas por el ambiente y el entorno inmediato de cada uno de ellos. Esta variación oculta un gran potencial para su uso y conservación. Si observamos los individuos de un rodal, nos daremos cuenta que ellos difieren en incontables formas, pero todas esas diferencias son ciertamente un asunto de grados y raramente presentan distinciones claramente definidas, atribuibles a la segregación de genes simples o mendelianos. Si, por ejemplo, se fuera a clasificar individuos de acuerdo a su altura, no se podría colocar los arboles en grupos tales como grandes y pequeños, porque existen todos los grados de altura y una división por clase sería erróneamente arbitraria. A la variación de esta clase, sin discontinuidades naturales, se le llama variación continua y a los caracteres que la exhiben se les llama caracteres cuantitativos o caracteres métricos, ya que su estudio depende de la medición en lugar de la enumeración. La rama de la genética que se ocupa de los caracteres métricos se ha llamado variablemente genética de poblaciones, genética biométrica o genética cuantitativa. La importancia de esta rama no necesita subrayarse; la mayor parte de los caracteres de valor económico para los criadores de plantas, arboles y animales son caracteres métricos y la mayor parte de los cambios involucrados en la microevolución son cambios de los caracteres métricos. Es, por lo tanto, en esta rama donde la genética ha tenido una aplicación más importante en los programas de mejoramiento prácticos y también su más directa relación con la teoría evolutiva. ¿Como ha sucedido que la variación discontinua intrínsecamente causada por la segregación genética se haya traducido en la variación continua de los caracteres métricos? Hay dos razones: una es la segregación simultánea de muchos genes que afectan al carácter, y la otra es la sobreposición de la verdadera variación continua producida por causas no genéticas. Consideremos como ejemplo una situación simplificada. Supongamos que hay segregación de seis loci no ligados (linkage), cada uno con dos alelos con frecuencias de 0.5. Supongamos que existe dominancia completa de un alelo en cada locus y que cada uno de los alelos dominantes agrega una unidad a la medición de la altura total. entonces si la segregación de estos genes fuera la única causa de la variación genética, habría 7 clases discretas en las mediciones del carácter, de acuerdo con si el individuo tenía el alelo dominante presente en 0, 1, 2, ...,6 de los loci. 9 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca El significado de los diferentes grados de dominancia están dados en las siguientes figuras: A2A2 A1A2 | A1A1 | a | (a+b)/2 A2A2 No Dominancia b A1A2 A1A1 | | | a c b A2A2 Dominancia Parcial A1A1 A1A2 | Dominancia Completa a A2A2 b A1A1 A1A2 | | | a b c Sobredominancia Si nuestras mediciones fueran lo suficientemente exactas deberíamos reconocer estas clases distintamente y deberíamos poder colocar a cualquier individuo en su clase respectiva sin ninguna duda. Si hubiera más genes segregando y cada uno tuviera un efecto más pequeño, habría más clases con diferencias más pequeñas entre ellas, lo que dificultaría el reconocimiento de cada clase. Si la diferencia entre las clases llegara a ser tan pequeña como el error de medición ya no seríamos capaces de reconocer las discontinuidades. Además, los caracteres métricos están sujetos a la variación producida por causas no genéticas y esta variación es verdaderamente continua. Su efecto es "borrar" los límites de la discontinuidad genética, de manera que la variación tal y como la vemos llega a ser continua, sin importar qué tan exactas sean nuestras mediciones. 10 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca De este modo, la distinción entre genes relacionados con los caracteres mendelianos y aquellos relacionados con los caracteres métricos reside en la magnitud de sus efectos relativa a otras fuentes de variación. "Un gene con un efecto lo suficientemente grande para causar una discontinuidad identificable aun en la presencia de la segregación de otros loci y de la variación no genética puede ser estudiado usando métodos mendelianos, mientras que un gene cuyo efecto no es lo suficientemente grande para causar una discontinuidad no puede ser estudiado individualmente." Esta distinción se refleja en las expresiones gen mayor y gen menor. Existirán, sin embargo, genes que no podrán ser propiamente clasificados como mayores o como menores, sino que en algún grado intermedio. Además, como resultado de la pleiotropía, el mismo gene puede ser clasificado como mayor con respecto a un carácter y como menor con respecto a otro. La distinción, aunque conveniente, no es fundamental y no hay suficiente evidencia que existan dos clases de genes con propiedades diferentes. 5. Caracteres Métricos Los caracteres métricos que podrían ser estudiados en cualquier organismo superior son muy numerosos. Cualquier atributo que varíe continuamente y que pueda ser medido puede, en principio, ser estudiado como un carácter métrico: dimensiones y proporciones anatómicas, funciones fisiológicas de todas las clases y cualidades mentales o psicológicas. La condición esencial es que sea medible. La técnica de la medición, sin embargo, impone una limitación práctica en lo que puede ser estudiado. Usualmente tienen que medirse grandes números de individuos y el estudio de cualquier carácter cuyas mediciones requieran una técnica complicada resulta, por lo tanto, impracticable. Como resultado, los caracteres que han sido usados en los estudios de la genética cuantitativa son predominantemente dimensiones anatómicas o funciones fisiológicas medidas en términos de un producto final, tales como actividad fotosintéticas, fertilidad, o tasa de crecimiento. La variación puede ser representada gráficamente por medio de la distribución de las frecuencias de las mediciones. Las mediciones se encuentran agrupadas en clases igualmente espaciadas y la proporción de individuos que caen en cada clase se encuentra dibujada en la escala vertical. Si los intervalos de clase se hicieran más pequeños y el número de individuos medidos aumentara indefinidamente, el histograma llegaría a ser una curva. La variación de algunos caracteres métricos, tales como número de estomas o número de semillas o conos, estrictamente hablando no es continua porque, al ser medido por medio de cuentas, sus valores 11 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca únicamente pueden ser números enteros. Sin embargo, uno puede considerar las mediciones en tales casos como si se refirieran a un carácter subyacente cuya variación sea verdaderamente continua aunque expresable únicamente en la forma de números enteros, en una forma análoga al agrupamiento de las mediciones en clases. Por ejemplo, el número de semillas puede considerarse como una medida del carácter subyacente, y que varía en forma continua, fertilidad. Para propósitos prácticos, tales caracteres pueden tratarse como si variaran continuamente, siempre y cuando el número de clases no sea demasiado pequeño. Las distribuciones de las frecuencias de la mayor parte de los caracteres métricos se aproximan más o menos a las de las curvas normales. En el estudio de los caracteres métricos es posible, por lo tanto, hacer uso de las propiedades de la distribución normal. 6. Reconocimiento General del Tema Existen dos fenómenos genéticos básicos relacionados con los caracteres métricos y cada uno forma las bases de un método diferente de mejoramiento. El primero es el parecido entre parientes. El hecho que los parientes tienden a parecerse entre si es bien conocido y mientras más sercano es el parentesco, en general el parecido es mayor. Aunque únicamente en nuestra propia especie los parecidos son fácilmente discernibles sin necesidad de mediciones, el fenómeno se encuentra igualmente presente en otras especies. El grado de parecido varía con el carácter, algunos caracteres muestran un grado mayor, otros uno menor. El parecido entre descendiente y progenitores proporciona la base para la reproducción selectiva. El uso de los individuos más deseables como progenitores trae como consecuencia un mejoramiento de nivel medio de la siguiente generación y así como algunos caracteres muestran mayor parecido que otros, asimismo algunos responden mejor a la selección que otros. El grado de parecido entre parientes es una de las propiedades de cualquier población que puede ser observada fácilmente, y uno de los propósitos de la genética cuantitativa es mostrar cómo el grado de parecido entre diferentes clases de parientes puede ser usado para predecir el resultado de la reproducción selectiva y para indicar el mejor método de llevar a cabo la selección. El segundo fenómeno genético básico se refiere a la depresión endogámica, que es lo opuesto al vigor híbrido o heterosis. La endogamia tiende a reducir el nivel medio de todos los caracteres relacionados estrechamente con la aptitud en los animales y en las plantas que se 12 Fco. Zamudio (PhD) Genética & Mej. Forestal Universidad de Talca reproducen naturalmente a través de la polinización cruzada y conduce, en consecuencia, a la perdida del vigor general y de la fertilidad. Puesto que la mayor parte de los caracteres de valor económico en animales y plantas domésticas son aspectos del vigor o de la fertilidad, la endogamia es en general deletérea. El vigor y la fertilidad que han sido reducidos en las líneas endogámicas se restaura a través del cruzamiento y en ciertas circunstancias este vigor híbrido puede usarse como un medio de mejoramiento. El enorme mejoramiento del rendimiento del maíz que se cultiva comercialmente ha sido logrado a través de dicho medio y representa probablemente el logro práctico más grande de la genética. Las propiedades que podemos observar en una población en conexión con un carácter métrico son las medias, las varianzas y las covarianzas. La subdivisión natural de la población en familias nos permite analizar la varianza en componentes que forman la base para la medición del grado de parecido entre parientes. Podemos observar en adición las consecuencias de métodos de reproducción aplicados experimentalmente, tales como la selección, la endogamia y el cruzamiento. El objetivo práctico de la genética cuantitativa es encontrar cómo podemos usar las observaciones hechas en la población para predecir el resultado de cualquier método de reproducción en particular. El propósito más general es encontrar como las propiedades de la población son influidas por los genes involucrados y por las diferentes circunstancias no genéticas que pueden influir en un carácter métrico. Las principales propiedades de los genes que tienen que ser tomadas en cuenta son el grado de dominancia, la manera en que se combinan los efectos de los genes situados en diferentes loci, la pleiotropía, el ligamiento y la aptitud bajo la selección natural. El considerar todas estas propiedades simultáneamente, en adición a la gran variedad de circunstancias no genéticas, haría a estos problemas muy difíciles de manejar. Por lo tanto, tenemos que simplificar la situación trabajando con una sola cosa a la vez, comenzando con las situaciones más simples. 13