Elementos de Análisis Multivariado para el estudio de la interacción GxE Eduardo Martínez H. Y Edmundo Acevedo H. • El rendimiento es el principal resultado de los experimentos agronómicos. • Es un resultado muy caro. • Se necesitan análisis estadísticos que estimen el rendimiento y sus fuentes de variación , lo más precisamente posible. • La experiencia y la teoría han probado la efectividad del modelo AMMI . El diseño de experimentos y el análisis de ensayos multilocalidades tienen los siguientes objetivos (Crossa, 2004): •Estimar contrastes entre genotipos. •Predecir el desempeño de genotipos en nuevos sitios y años. •Estudiar la interacción GE y la estabilidad del rendimiento. •Seleccionar genotipos superiores. •Maximizar la ganancia genética. Medioambiente: conjunto de variables no genéticas que afectan el valor fenotípico asociado a un genotipo (Crossa, 2004). Suelo. Clima. Plagas, enfermedades, malezas, etc. Condiciones de manejo, años. Genotipo: Cultivar con material genéticamente homogéneo (líeas puras o clones) o heterogéneo como las poblaciones de polinización abierta (híbridos de maíz). Efectos principales. Medio ambiente (puro). Refleja los distintos potenciales ecológicos de los sitios y las condiciones de manejo, no tiene directa relación para el mejoramiento o recomendación de variedades Efecto Genotipo (puro). Refleja el efecto de los genotipos independientemente del medioambiente. Relevante sólo en ausencia de interacción GE. Interacción GE. Cuando dos o más genotipos varían su respuesta fenotípica (cambian de ranking) en los distintos medioambientes. Desventajas interacción GE (Annicchiaro, P.,2002): -Obstáculo al mejoramiento de cultivos en una región objetivo. -Inestabilidad espacial y temporal de los rendimientos. -Inestabilidad de ingresos a nivel local y nacional. Ventajas interacción GE (Annicchiaro, 2002): -Genotipos con interacción positiva con la localidad y sus condiciones ambientales prevalecientes (explotación de una adaptación específica). -Genotipos con baja frecuencia de pobres rendimientos o fracaso en condiciones ambientales pobres (Simmonds, 1991; Ceccarelli, 1996). Se pueden esperar interacción cuando existe: -Amplia variación entre genotipos con caracteres morfofisiológicos que le confieren resistencia o escape a uno o más estreses. -Amplia variación entre medioambientes con la incidencia del mismo estrés. Para el estudio de la interacción GE se han desarrollado varios modelos: Modelos Aditivos: ANDEVA Modelos Multiplicativos: ACP Modelos mixtos: AMMI, SREG, PLS. MODELOS ADITIVOS 1°. Rijr = m + Gi + Lj + GLij + eijr donde m = media general; G = genotipo; L = Sitio ; eijr = error. 2°. Rijkr = m + Gi + Lj + Yk + GLij + GYik + LYjk + GLYijk + eijkr donde Y = efecto de año. Los años se cruzan con las localidades 3° Yij = µ + Gi + E j + (GEij ) + ε ij Con ε N(0, σ/n) (donde σ es la varianza del error dentro de cada medioambiente, supuesto como constante). Este modelo no permite el uso del principio de parsimonia ya que agrupa en GE diferentes interacciones. No es informativo debido a que los parámetros son complicados y difíciles de interpretar. El ANDEVA por si solo muchas veces revela una interacción No Significativa aunque algunos genotipos tengan interacción con el medioambiente. Zobel et al., 1988 MODELO DE EFECTOS ADITIVOS PRINCIPALES E INTERACCIÓN MULTIPLICATIIVA (AMMI) Modelo AMMI ANDEVA (principales efectos aditivos e interacción). + ACP (estructura multiplicativa dentro de la interacción) Yij = µ + Gi + E j + ∑ λk α ik γ jk + ε ij Donde λ es el valor singular del eje componente principal α y γ son autovectores del genotipo i y el medioambiente j Zobel et al., 1998 ACP REQUISITOS. Los únicos requerimientos para la aplicación del ACP son: a) Continuidad en las variables. b)El número n de individuos o elementos observados debe ser mayor que el número p de variables originales. Por otra parte, el ACP tiene la ventaja de no exigir supuestos tales como la normalidad u homogeneidad de las varianzas. 3 2 1 Las q nuevas variables (componentes principales) son obtenidas como combinaciones lineales de las variables originales. APLICACIONES 1) Como técnica de análisis exploratorio, permite descubrir interrelaciones entre los datos y, de acuerdo con los resultados, proponer los análisis estadísticos más apropiados. 2) Reducir la dimensionalidad de la matriz de datos. 3) Construir variables no observables (componentes) a partir de variables observables. Por ejemplo, la inteligencia de una persona no es observable directamente, en cambio, se puede medir distintos aspectos de ésta mediante pruebas psicométricas. BIPLOTS Los biplots son gráficos bidimensionales informativos que permiten analizar y resumir los aspectos principales de un conjunto de datos multivariados (varias dimensiones) (Graffelman y Aluja-Banet, 2003). Los biplots permiten visualizar observaciones y variables en un mismo espacio. Así, es posible identificar asociaciones entre observaciones, entre variables y entre variables y observaciones (Balzarini, 2004). Aplicación de un Biplot: “Factores fisiológicos asociados con la interacción genotipo medioambiente en trigo” Reynolds,M.,P., Trethowan,P., Crossa,J., Vargas,M., y Sayre, K. 2003 Objetivos: Identificar los factores asociados a la interacción GxE Ensayo de rendimientos potenciales históricos en trigo harinero (BW, 7 genotipos), trigo candeal (DW, 7 genotipos), y triticale (TCL, 4 genotipos) cultivados entre 1990 y 1995. Métodos Mínimos Cuadrados Parciales (PLS). Además de las especies y genotipos, en el análisis se consideraron variables climáticas: temperaturas máximas, mínimas, medias y radiación solar,para cada cada año en 5 estados de desarrollo de los cultivos. PLS: Método estadístico donde las interacciones pueden ser explicadas por varios ambientes colectados cada año. Los genotipos, años y las covariables ambientales pueden ser representadas en un biplot. Modelo: X = t1p’1 + t2p’2...+ E = TP’ + E Y= t1q’1 + t2q’2... + F = TQ’ + F con T matriz de coeficientes, P matriz de datos transformados, Q matriz de respuestas transformadas, E y F son matrices de residuos. El resultado del PLS puede graficarse en un biplot donde las coordenadas para medioambiente, genotipos y covariables ambientales corresponden a los 2 primeros componentes PLS, y se grafican en el espacio simultáneamente mediante vectores que nacen del origen (0,0) y puntos terminales determinados por la magnitud del vector. Resultados INTERPRETACIÓN DE LOS GRÁFICOS. Los genotipos y las variables se representan como puntos en planos formados por cada par de componentes, que constituyen los ejes de un sistema de coordenadas. La nube de variables está situada en una superficie circular de radio =1; la nube de genotipos, sin embargo, puede que no esté en una superficie de radio=1. Rendimiento α Biomasa Rendimiento BW ANEXOS Algoritmo Se calcula la matriz de varianzas covarianzas “S” o la matriz de correlaciones “R”si se emplean los datos estandarizados. Resolviendo (R - λ I) X = 0 Se obtienen pares de autovalores (λ) y autovectores (X) Cada autovector define un componente principal AMMI