Elementos de Análisis Multivariado para el estudio de la interacción

Anuncio
Elementos de Análisis
Multivariado para el estudio
de la interacción GxE
Eduardo Martínez H. Y Edmundo Acevedo H.
•
El rendimiento es el principal resultado
de los experimentos agronómicos.
• Es un resultado muy caro.
• Se necesitan análisis estadísticos que
estimen el rendimiento y sus fuentes de
variación , lo más precisamente
posible.
• La experiencia y la teoría han probado
la efectividad del modelo AMMI .
El diseño de experimentos y el análisis de ensayos
multilocalidades
tienen los siguientes objetivos
(Crossa, 2004):
•Estimar contrastes entre genotipos.
•Predecir el desempeño de genotipos en nuevos sitios y
años.
•Estudiar la interacción GE y la estabilidad del
rendimiento.
•Seleccionar genotipos superiores.
•Maximizar la ganancia genética.
Medioambiente: conjunto de variables no genéticas
que afectan el valor fenotípico asociado a un genotipo
(Crossa, 2004).
Suelo.
Clima.
Plagas, enfermedades, malezas, etc.
Condiciones de manejo, años.
Genotipo: Cultivar con material genéticamente
homogéneo (líeas puras o clones) o heterogéneo como
las poblaciones de polinización abierta (híbridos de
maíz).
Efectos principales.
Medio ambiente (puro).
Refleja los distintos potenciales ecológicos de los sitios y
las condiciones de manejo, no tiene directa relación para el
mejoramiento o recomendación de variedades
Efecto Genotipo (puro).
Refleja el efecto de los genotipos independientemente
del medioambiente. Relevante sólo en ausencia de
interacción GE.
Interacción GE.
Cuando dos o más genotipos varían su respuesta fenotípica
(cambian de ranking) en los distintos medioambientes.
Desventajas interacción GE (Annicchiaro, P.,2002):
-Obstáculo al mejoramiento de cultivos en una
región objetivo.
-Inestabilidad espacial y temporal de los
rendimientos.
-Inestabilidad de ingresos a nivel local y nacional.
Ventajas interacción GE (Annicchiaro, 2002):
-Genotipos con interacción positiva con la localidad
y sus condiciones ambientales prevalecientes
(explotación de una adaptación específica).
-Genotipos con baja frecuencia de pobres
rendimientos o fracaso en condiciones ambientales
pobres (Simmonds, 1991; Ceccarelli, 1996).
Se pueden esperar interacción cuando existe:
-Amplia variación entre genotipos con caracteres
morfofisiológicos que le confieren resistencia o
escape a uno o más estreses.
-Amplia variación entre medioambientes con la
incidencia del mismo estrés.
Para el estudio de la interacción GE se han
desarrollado varios modelos:
Modelos Aditivos: ANDEVA
Modelos Multiplicativos: ACP
Modelos mixtos: AMMI, SREG, PLS.
MODELOS ADITIVOS
1°. Rijr = m + Gi + Lj + GLij + eijr
donde m = media general; G = genotipo; L = Sitio ; eijr = error.
2°. Rijkr = m + Gi + Lj + Yk + GLij + GYik + LYjk +
GLYijk + eijkr
donde Y = efecto de año. Los años se cruzan con las localidades
3°
Yij = µ + Gi + E j + (GEij ) + ε ij
Con ε N(0, σ/n) (donde σ es la varianza del error
dentro de cada medioambiente, supuesto como
constante).
Este modelo no permite el uso del principio de
parsimonia ya que agrupa en GE diferentes
interacciones.
No es informativo debido a que los parámetros
son complicados y difíciles de interpretar.
El ANDEVA por si solo muchas veces revela una
interacción No Significativa aunque algunos
genotipos tengan interacción con el medioambiente.
Zobel et al., 1988
MODELO DE EFECTOS ADITIVOS
PRINCIPALES E INTERACCIÓN
MULTIPLICATIIVA (AMMI)
Modelo AMMI
ANDEVA (principales efectos aditivos e interacción).
+
ACP (estructura multiplicativa dentro de la interacción)
Yij = µ + Gi + E j + ∑ λk α ik γ jk + ε ij
Donde λ es el valor singular del eje
componente principal α y γ son autovectores
del genotipo i y el medioambiente j
Zobel et al., 1998
ACP
REQUISITOS.
Los únicos requerimientos para la aplicación del
ACP son:
a) Continuidad en las variables.
b)El número n de individuos o elementos
observados debe ser mayor que el número p
de variables originales.
Por otra parte, el ACP tiene la ventaja de no exigir
supuestos tales como la normalidad u
homogeneidad de las varianzas.
3
2
1
Las q nuevas variables (componentes principales) son
obtenidas como combinaciones lineales de las
variables originales.
APLICACIONES
1) Como técnica de análisis exploratorio, permite
descubrir interrelaciones entre los datos y, de acuerdo
con los resultados, proponer los análisis estadísticos más
apropiados.
2) Reducir la dimensionalidad de la matriz de datos.
3) Construir variables no observables (componentes) a
partir de variables observables. Por ejemplo, la
inteligencia de una persona no es observable
directamente, en cambio, se puede medir distintos
aspectos de ésta mediante pruebas psicométricas.
BIPLOTS
Los biplots son gráficos bidimensionales informativos que
permiten analizar y resumir los aspectos principales de un
conjunto de datos multivariados (varias dimensiones)
(Graffelman y Aluja-Banet, 2003).
Los biplots permiten visualizar observaciones y variables en
un mismo espacio. Así, es posible identificar asociaciones
entre observaciones, entre variables y entre variables y
observaciones (Balzarini, 2004).
Aplicación de un Biplot:
“Factores fisiológicos asociados con la
interacción genotipo medioambiente en trigo”
Reynolds,M.,P., Trethowan,P., Crossa,J., Vargas,M., y Sayre, K.
2003
Objetivos:
Identificar los factores asociados a la interacción GxE
Ensayo de rendimientos potenciales históricos en trigo
harinero (BW, 7 genotipos), trigo candeal (DW, 7
genotipos), y triticale (TCL, 4 genotipos) cultivados
entre 1990 y 1995.
Métodos
Mínimos Cuadrados Parciales (PLS).
Además de las especies y genotipos, en el análisis se consideraron
variables climáticas: temperaturas máximas, mínimas, medias y
radiación solar,para cada cada año en 5 estados de desarrollo de los
cultivos.
PLS:
Método estadístico donde las interacciones pueden ser
explicadas por varios ambientes colectados cada año.
Los genotipos, años y las covariables ambientales pueden ser
representadas en un biplot.
Modelo:
X = t1p’1 + t2p’2...+ E = TP’ + E
Y= t1q’1 + t2q’2... + F = TQ’ + F
con T matriz de coeficientes, P matriz de datos
transformados, Q matriz de respuestas
transformadas, E y F son matrices de residuos.
El resultado del PLS puede graficarse en un biplot
donde las coordenadas para medioambiente,
genotipos y covariables ambientales corresponden a
los 2 primeros componentes PLS, y se grafican en el
espacio simultáneamente mediante vectores que
nacen del origen (0,0) y puntos terminales
determinados por la magnitud del vector.
Resultados
INTERPRETACIÓN DE LOS GRÁFICOS.
Los genotipos y las variables se representan como puntos
en planos formados por cada par de componentes, que
constituyen los ejes de un sistema de coordenadas. La
nube de variables está situada en una superficie circular
de radio =1; la nube de genotipos, sin embargo, puede
que no esté en una superficie de radio=1.
Rendimiento
α
Biomasa
Rendimiento BW
ANEXOS
Algoritmo
Se calcula la matriz de varianzas covarianzas “S” o la matriz
de correlaciones “R”si se emplean los datos estandarizados.
Resolviendo
(R - λ I) X = 0
Se obtienen pares de autovalores (λ) y
autovectores (X)
Cada autovector define un componente principal
AMMI
Descargar