Subido por Carlos Javier Navarro

TutorialMM esp

Anuncio
See discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/283506567
Modelos Mixtos en Infostat. Manual de Usuario
Book · June 2011
CITATIONS
READS
0
1,009
3 authors:
Julio Alejandro Di Rienzo
Raul Macchiavelli
National University of Cordoba, Argentina
University of Puerto Rico at Mayagüez
211 PUBLICATIONS 2,447 CITATIONS
111 PUBLICATIONS 900 CITATIONS
SEE PROFILE
Fernando Casanoves
CATIE - Centro Agronómico Tropical de Investigación y Enseñanza
329 PUBLICATIONS 5,903 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Statistical consulting View project
Resistance induction in mango View project
All content following this page was uploaded by Fernando Casanoves on 11 December 2015.
The user has requested enhancement of the downloaded file.
SEE PROFILE
Modelos Lineales
Mixtos
Aplicaciones en
InfoStat
Julio A. Di Rienzo
Raúl Macchiavelli
Fernando Casanoves
Actualizado en febrero de 2012
Modelos Lineales Mixtos en InfoStat
Julio A. Di Rienzo es Profesor Asociado de Estadística y
Biometría de la Facultad de Ciencias Agropecuarias de la
Universidad Nacional de Córdoba, Argentina. Director del
grupo de desarrollo de InfoStat y responsable de la
implementación de la interfase con R que se presenta en
esta obra (dirienzo@agro.uncor.edu).
Raúl E. Macchiavelli es Catedrático de Biometría en el
Facultad de Ciencias Agrícolas, Universidad de Puerto
Rico - Mayagüez (raul.macchiavelli@upr.edu)
Fernando Casanoves es el Jefe de la Unidad de
Bioestadística
del
Centro
Agronómico
Tropical
de
Investigación y Enseñanza (CATIE). Anteriormente trabajó
en la Facultad de Ciencias Agropecuarias de la Universidad
Nacional de Córdoba, Argentina, donde participó del
desarrollo de InfoStat (casanoves@catie.ac.cr).
Modelos Lineales Mixtos en InfoStat
Di Rienzo, Julio Alejandro
Modelos lineales mixtos : aplicaciones en InfoStat / Julio Alejandro Di Rienzo
Raúl Edgardo Macchiavelli.; Fernando Casanoves - 1a. ed. - Córdoba : Grupo
Infostat, 2011.
193 p. : il. ; 23x15 cm.
ISBN 978-987-27045-0-6
1. Estadísticas. 2. Aplicaciones Informaticas. I. Casanoves, Fernando II.
Macchiavelli, Raúl Edgardo. III. Título.
CDD 310.4
Fecha de catalogación: 27/06/2011
AGRADECIMIENTOS
Los autores agradecen a las Estadísticas Yuri Marcela García Saavedra y Jhenny Liliana
Salgado Vásquez, de la Universidad del Tolima, Colombia, por la lectura crítica del
manuscrito, la reproducción de la ejemplificación de este manual y los aportes sobre
algunos detalles de la interfaz.
Modelos Lineales Mixtos en InfoStat
INDICE DE CONTENIDOS
Introducción ................................................................................................................................ 1
Requerimientos ........................................................................................................................... 1
Invocación del procedimiento de modelos lineales generales y mixtos .................................. 1
Especificación de los efectos fijos............................................................................................... 2
Especificación de los efectos aleatorios ..................................................................................... 4
Comparación de medias de tratamientos.................................................................................. 8
Especificación de la estructura de correlación y de varianza de los errores ....................... 13
Especificación de la estructura de correlación........................................................................ 13
Especificación de la parte fija .......................................................................................................... 15
Especificación de la parte aleatoria ................................................................................................. 16
Especificación de la correlación de los errores ............................................................................... 17
Especificación de la estructura de varianzas de los errores .................................................... 25
Análisis de un modelo ajustado .............................................................................................. 28
Ejemplos de Aplicación de Modelos Lineales Generales y Mixtos ....................................... 33
Estimación de componentes de varianza ................................................................................ 34
Efectos aleatorios cruzados con interacción ........................................................................... 56
Aplicación de modelos mixtos para datos estratificados ........................................................ 60
Parcelas divididas ............................................................................................................................ 60
Parcelas divididas en un arreglo en bloques.................................................................................... 61
Parcelas divididas en un arreglo en diseño completamente aleatorizado........................................ 71
Parcelas subdivididas (split-split plot) ............................................................................................. 79
Aplicación de modelos mixtos para mediciones repetidas en el tiempo ................................ 88
Datos longitudinales ......................................................................................................................... 88
Análisis de un ensayo de establecimiento de forrajeras ................................................................... 89
Análisis de un ensayo de drogas para asma ................................................................................... 108
Análisis de ensayo de descomposición ........................................................................................... 124
Uso de modelos mixtos para el control de la variabilidad espacial en ensayos agrícolas .... 138
Correlación espacial ...................................................................................................................... 138
Análisis de un ensayo comparativo de rendimientos en maní ........................................................ 139
Aplicaciones de modelos mixtos en otros diseños experimentales ...................................... 161
Diseño en franjas (strip-plot) ......................................................................................................... 161
Diseño experimental con dos factores y dependencia espacial ...................................................... 169
Diseños de testigos apareados........................................................................................................ 182
Aplicaciones en regresión lineal ........................................................................................... 194
Regresión con coeficientes aleatorios ............................................................................................ 194
Regresion heteroscedástica ............................................................................................................ 198
Bloques incompletos y diseños relacionados ....................................................................... 212
ii
Modelos Lineales Mixtos en InfoStat
Diseños Alfa látices ........................................................................................................................ 212
Diseño fila-columna latinizado ....................................................................................................... 220
Diseño en látice cuadrado equilibrado .......................................................................................... 227
Referencias............................................................................................................................... 237
Índice de cuadros .................................................................................................................... 240
Índice de figuras ...................................................................................................................... 240
iii
Modelos Lineales Mixtos en InfoStat
Introducción
InfoStat implementa una interfase amigable de la plataforma R para la estimación de
modelos lineales generales y mixtos a través de los procedimientos gls y lme de la
librería nlme. La bibliografía de referencia de esta implementación, así como alguno de
los ejemplos utilizados, corresponde a Pinheiro y Bates (2004). La interfaz con R fue
escrita en Delphi® y depende de R-DCOM, un servidor de R que permite correr R en
background. R-DCOM es debido a Thomas Baier y Erich Neuwirth. El R-DCOM es
accedido desde Delphi gracias a las rutinas desarrolladas por Dieter Menne.
Requerimientos
Para que InfoStat pueda tener acceso a R, debe estar instalado en su sistema el
componente DCOM y R. Para ello consulte la ayuda en línea (aquí) o utilice el enlace
que se encuenta en el menú. Aplicaciones de InfoStat.
Invocación del procedimiento de modelos lineales generales y mixtos
En el menú Estadísticas seleccionar el submenú Modelos lineales generales y mixtos,
allí encontrará dos opciones. La primera, con el rótulo Estimación, invoca la ventana de
diálogo que permite especificar la estructura del modelo. La segunda, rotulada Análisis
–exploración de modelos estimados, se activa cuando algún modelo ha sido estimado
previamente y contiene un conjunto de herramientas para el análisis diagnóstico.
1
Modelos Lineales Mixtos en InfoStat
Especificación de los efectos fijos
Comenzaremos indicando cómo ajustar un modelo de efectos fijos, utilizando el archivo
Atriplex.IDB2 del conjunto de datos de prueba de InfoStat. Una vez abierto este archivo
activar el menú Estadísticas, submenú Modelos lineales mixtos, opción Estimación. En
la ventana de selección de variables, los factores de clasificación, covariables y
variables dependientes pueden ser especificados como en un análisis de la varianza para
efectos fijos. Para los datos en el archivo Atriplex.IDB2 especificar PG como variable
respuesta y como criterios de clasificación a Tamaño y Episperma. Una vez que se
acepta la selección realizada se mostrará la ventana principal de la interfase para
modelos mixtos. Esta ventana contiene cinco solapas (Figura 1).
Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto.
La primera permite especificar los efectos fijos del modelo y seleccionar opciones para
la presentación de resultados y la generación de predicciones, obtener residuos del
modelo y especificar el método de estimación. Por defecto el método de estimación es
máxima verosimilitud restringida (REML).
A la derecha de la ventana aparecerá una lista conteniendo las variables de clasificación
y las covariables declaradas en la ventana de selección de variables. Para incluir un
factor (variable de clasificación) o una covariable a la parte fija del modelo, basta hacer
doble clic sobre el nombre del factor o covariable que se quiere incluir. Esta acción
agregará una línea en la lista de efectos fijos. Doble clics adicionales sobre un factor o
una covariable agregarán términos en líneas sucesivas, implícitamente separados por un
signo “+” (modelo aditivo). Seleccionando con el ratón los factores principales y
accionando el botón “*” se introduce un término que especifica la interacción entre los
factores. Para el conjunto de datos en el archivo Atriplex.IDB2, incluir en el modelo de
efectos fijos los factores Tamaño, Episperma y su interacción (Figura 2). Algunos de los
textos en estas ventanas han sido aumentados de tamaño para mejorar su visualización
(esto se logra moviendo el roller del ratón mientras la tecla Ctrl del teclado esta
apretada).
2
Modelos Lineales Mixtos en InfoStat
Si aceptamos esta especificación, en la ventana de resultados de InfoStat se obtendrá la
salida que se muestra a continuación de la Figura 2. La salida que se obtiene es la más
sencilla ya que no se han especificado características adicionales del modelo u otras
opciones de análisis. La primera parte contiene la especificación de la forma en que se
invocó la estimación del modelo en la sintaxis de R, e indica el nombre del objeto R que
contiene al modelo y su estimación. En este caso modelo001_PG_REML. Esta
especificación es sólo de interés para aquellos que están acostumbrados a ver las
sentencias en R.
La segunda parte muestra medidas de ajuste que son útiles para comparar distintos
modelos ajustados a un conjunto de datos. AIC hace referencia al criterio de Akaike,
BIC al Criterio Bayesiano de Información, logLik al logaritmo de la verosimilitud y
Sigma a la desviación estándar residual.
La tercera parte de esta salida presenta una tabla de análisis de la varianza mostrando las
pruebas de hipótesis de tipo secuencial.
Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2.
3
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo001_PG_REML<-gls(PG~1+Tamano+Episperma+Tamano:Episperma
,method="REML"
,na.action=na.omit
,data=R.data01)
Resultados para el modelo: modelo001_PG_REML
Variable dependiente:PG
Medidas de ajuste del modelo
N
27
AIC
160.36
BIC
169.26
logLik
-70.18
Sigma R2_0
9.07 0.92
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Tamano
Episperma
Tamano:Episperma
numDF F-value
1 1409.95
2
10.49
2
90.53
4
2.29
p-value
<0.0001
0.0010
<0.0001
0.0994
Especificación de los efectos aleatorios
Los efectos aleatorios están asociados a grupos de observaciones. Ejemplos típicos son
las medidas repetidas sobre un mismo individuo o las respuestas observadas en grupos
de unidades experimentales homogéneas (bloques) o en los individuos de un mismo
grupo familiar, etc. Estos efectos aleatorios son “agregados” a los efectos fijos de
manera selectiva. Por lo tanto, en la especificación de los efectos aleatorios es necesario
tener uno o más criterios de agrupamiento o estratificación, y elegir sobre qué efectos
fijos se agregan los efectos aleatorios asociados. En el procedimiento lme de R, sobre el
que se basa esta implementación, cuando hay más de un criterio de agrupamiento
admisible, el criterio por omisión es que estos son anidados o encajados. Sin embargo
existe la posibilidad de declarar términos aleatorios cruzados. En el módulo de Modelos
lineales generales y mixtos de InfoStat, solapa Efectos aleatorios, se usa el símbolo >
para declarar un factor anidado (A>B indica que B esta anidados en A); el símbolo + se
usa para declarar factores cruzados (A+B indica que A y B son factores cruzados); el
símbolo * se usa para declarar interacciones (A*B explicita la interacción entre A y B).
Estos símbolos pueden directamente escribirse en la ventana, o bien, pulsando el botón
4
Modelos Lineales Mixtos en InfoStat
derecho del ratón sobre dos o más factores, previamente seleccionados, aparece una
ventana con estas opciones.
En la segunda solapa del diálogo de especificación del modelo podemos elegir los
criterios de estratificación o agrupamiento y la forma en que éstos incorporan efectos
aleatorios a los componentes fijos. Para ejemplificar la especificación de los efectos
aleatorios consideremos el archivo de prueba Bloque.IDB2. Este archivo contiene tres
columnas: Bloque, Tratamiento y Rendimiento. En este ejemplo indicaremos que los
bloques fueron seleccionados en forma aleatoria o producen un efecto aleatorio (por
ejemplo, si los bloques son conjuntos de parcelas, el efecto de estos puede ser
considerado aleatorio ya que su respuesta dependerá entre otras cosas de condiciones
ambientales que no son predecibles), mientras que los tratamientos agregan efectos
fijos. Para especificar este modelo, las dos primeras columnas del archivo de pruebas
Bloque.IDB2 (Bloque y Tratamiento) se ingresarán como criterios de clasificación y la
última (Rendimiento) como variable dependiente. El factor Tratamiento se incluirá en la
solapa Efectos fijos como el único componente de esa parte del modelo. Para agregar el
efecto aleatorio de los bloques, seleccionaremos la solapa Efectos aleatorios. Cuando se
selecciona ésta solapa la lista Criterios de estratificación está vacía. Haciendo doble clic
sobre Bloque en la lista de variables, se agrega este factor de clasificación, como criterio
de agrupamiento. La inclusión de un criterio de estratificación activa, en el panel
inferior, un dispositivo que permite detallar la forma en que el efecto aleatorio entra en
el modelo. En éste dispositivo hay una lista de componentes de la parte fija de modelo.
El primer componente hace referencia a la Constante y el resto a los otros términos, en
este caso Tratamiento (Figura 3).
5
Modelos Lineales Mixtos en InfoStat
Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo
Bloque.IDB2.
Dentro de la lista de términos fijos aparecen los criterios de estratificación previamente
especificados. La combinación de ambas listas define los efectos aleatorios. Para ello,
cada criterio de estratificación, dentro de cada efecto fijo, tiene asociado un check box.
Cuando éste está tildado indica que hay un conjunto de efectos aleatorios asociados al
efecto fijo correspondiente. El número de efectos aleatorios es igual al número de
niveles que tiene el término fijo del modelo o a 1 en el caso de la constante o de las
covariables. En el ejemplo que se ilustra se está incluyendo un efecto aleatorio inducido
por los bloques sobre la constante.
Esta especificación representa al siguiente modelo:
yij = µ + τ i + b j + ε ij ; i = 1,.., T ; j = 1,..., B
(1)
donde yij es la respuesta al i-ésimo tratamiento en el j-ésimo bloque, µ la media
general de rendimientos, τ i los efectos fijos de los tratamientos, b j el cambio del nivel
medio de yij asociado al j-ésimo bloque y ε ij el término de error asociado a la
6
Modelos Lineales Mixtos en InfoStat
observación yij . T y B son el número de niveles del factor de clasificación
correspondiente al efecto fijo Tratamiento y al número de bloques respectivamente. Los
b j se consideran, a diferencia de un efecto fijo, como variables aleatorias idénticamente
(
distribuidas N 0, σ b2
)
y cuyas realizaciones se interpretan como los efectos de los
distintos grupos o estratos (bloques, en este ejemplo). Luego, en estos modelos, los b j
no se estiman, lo que se estima es el parámetro σ b2 que caracteriza a su distribución.
Los ε ij también se interpretan como variables aleatorias idénticamente distribuidas
N ( 0, σ ε2 ) y describen a los errores aleatorios asociados a cada observación. Se supone,
además, que las variables aleatorias b j y ε ij son independientes.
La salida del ejemplo se muestra a continuación. La parte nueva de esta salida, respecto
del ejemplo con el modelo lineal de efectos fijos, es que tiene una sección de parámetros
para los efectos aleatorios.
Especificación del modelo en R
modelo002_Rendimiento_REML<-lme(Rendimiento~1+Tratamiento
,random=list(Bloque=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data03
,keep.data=FALSE)
Resultados para el modelo: modelo003_Rendimiento_REML
Variable dependiente:Rendimiento
Medidas de ajuste del modelo
N
20
AIC
218.77
BIC
223.73
logLik
-102.39
Sigma
160.65
R2_0
0.89
R2_1
0.93
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Tratamiento
numDF denDF F-value
1
12 2240.00
4
12
41.57
p-value
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.57
7
Modelos Lineales Mixtos en InfoStat
En este caso se presenta la estimación de σ b (la desviación estándar de los b j relativa al
residual) como 0.57. Al comienzo de la salida puede observarse la estimación de σ ε , la
desviación estándar de los ε ij , como 160.65. Así, la varianza de los bloques puede
calcularse como: σ b2 =
(0.57 ×160.65) 2 =
8385.15
Comparación de medias de tratamientos
Siguiendo en la solapa Comparaciones (Figura 4), si en el panel que lista los términos
fijos del modelo se tilda alguno de ellos, se obtiene una tabla de medias y errores
estándares y una comparación múltiple entre medias del tipo LSD de Fisher (esta prueba
está basada en una prueba de Wald) o la prueba de formación de grupos excluyentes
DGC (Di Rienzo et ál. 2002). También se presentan varias opciones de corrección por
comparaciones múltiples.
Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2.
8
Modelos Lineales Mixtos en InfoStat
La salida correspondiente a la comparación de las medias de tratamientos se presenta a
continuación.
Medias ajustadas y errores estándares para Tratamiento
LSD Fisher (alfa=0.05)
Procedimiento de corrección de p-valores: No
Tratamiento
300
225
150
75
0
Medias
3237.75
3093.50
2973.00
2498.50
1972.75
E.E.
92.47 A
92.47 A
92.47
92.47
92.47
B
B
C
D
Medias con una letra común no son significativamente diferentes(p<= 0.05)
La comparación de medias de tratamientos se muestra de la forma clásica como una
lista ordenada en forma decreciente.
Si el usuario desea controlar el error tipo I para la familia de todas las comparaciones de
a pares, puede optar por alguno de los cuatro criterios implementados: Bonferroni (Hsu
1996), Sidak (Hsu 1996), Benjamini-Hochberg (Benjamini y Hochberg 1995) o
Benjamini-Yekutieli (Benjamini y Yekutieli 2001). Si para este mismo conjunto de
datos se selecciona la opción Bonferroni, se obtiene el siguiente resultado:
Medias ajustadas y errores estándares para Tratamiento
LSD Fisher (alfa=0.05)
Procedimiento de corrección de p-valores: Bonferroni
Tratamiento
300
225
150
75
0
Medias
3237.75
3093.50
2973.00
2498.50
1972.75
E.E.
92.47 A
92.47 A
92.47 A
92.47
92.47
B
B
B
B
Medias con una letra común no son significativamente diferentes(p<= 0.05)
En el caso de que haya más de un efecto aleatorio, InfoStat permite especificar
estructuras complejas de anidamiento (jerarquización) y/o cruzamiento (con o sin
interacción). Supongamos que hay un factor fijo (A) y tres factores aleatorios (B, C, y
D). Para especificar los términos de efectos aleatorios anidados (la opción por defecto),
simplemente se listan los factores en orden jerárquico en la solapa de Efectos aleatorios
(Figura 5)
9
Modelos Lineales Mixtos en InfoStat
Figura 5: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que
hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se
incluyen como efectos aleatorios anidados.
Esta formulación es equivalente a escribir la siguiente sentencia (Figura 6).
Figura 6: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que
hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se
incluyen como efectos aleatorios anidados (forma explícita).
La incorporación de efectos cruzados sin interacción se realiza seleccionando todos los
factores a cruzar en la ventana de variables, y oprimiendo el ratón derecho para colocar
los efectos cruzados en la ventana de Criterios de estratificación (Figura 7)
10
Modelos Lineales Mixtos en InfoStat
Figura 7: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen
como efectos aleatorios cruzados.
La incorporación de efectos cruzados con interacción se realiza agregando a la
especificación anterior el(los) efecto(s) de interacción deseados (Figura 8)
Figura 8: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen
como efectos aleatorios cruzados con interacción.
Para combinar efectos aleatorios anidados y cruzados se pueden usar diferentes líneas
en la ventana Criterios de estratificación. Por ejemplo, para especificar un modelo con
C y D cruzados con interacción y el efecto B anidado en el efecto principal de C
especificamos como en la Figura 9.
11
Modelos Lineales Mixtos en InfoStat
Figura 9: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que
hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se
incluyen como efectos aleatorios cruzados con interacción y B esta anidado en C.
Para especificar los efectos de B y C ambos anidados dentro de A (recordemos que A es
fijo), escribimos en la ventana de Criterios de estratificación como en la Figura 10.
Figura 10: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que
hay cuatro factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B y C se
incluyen como efectos aleatorios cruzados, ambos anidados dentro del factor fijo A.
Para especificar el efecto de B y los efectos de D y C (todos aleatorios) ambos anidados
dentro de B (cruzados entre sí), escribimos en la ventana de Criterios de estratificación
como en la Figura 11.
Figura 11: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso C y D se incluyen
como efectos aleatorios cruzados, ambos anidados en el efecto aleatorio B.
12
Modelos Lineales Mixtos en InfoStat
En todos los casos en que se usan arreglos no anidados de efectos aleatorios, la única
estructura de la matriz de covarianza de estos efectos aleatorios disponible es la
estructura de independencia entre efectos aleatorios y varianzas iguales para
realizaciones distintas de un mismo efecto. Se pueden también especificar modelos de
regresión con coeficientes aleatorios, pero la sintaxis es diferente (ver ejemplo de
Aplicaciones en regresión lineal).
Especificación de la estructura de correlación y de varianza de los errores
Las estructuras de varianzas y de covarianzas pueden modelarse separadamente. Para
ello, InfoStat presenta dos solapas: en la solapa Correlación se encuentran las opciones
para especificar la estructura de correlación de los errores y la solapa
Heteroscedasticidad permite seleccionar distintos modelos para la función de varianza.
A continuación se describen los contenidos de estas solapas.
Especificación de la estructura de correlación
Para ejemplificar la utilización de esta herramienta recurriremos a un ejemplo citado en
Pinheiro y Bates (2004). Corresponde al archivo “Ovary” que contiene los datos de un
estudio de Pierson y Ginther (1987) sobre el número de folículos mayores de 10 mm en
ovarios de yeguas (mare). Estos números se registraron a los largo del tiempo desde 3
días antes de la ovulación y hasta 3 días después de la siguiente ovulación. Los datos
pueden cargarse desde la librería nlme utilizando el ítem de menú Aplicaciones>>Data
set de R. Cuando se activa esta opción aparece la siguiente ventana de diálogo, que
puede diferir en el número de librerías que estén instaladas en su configuración local de
R (Figura 12).
13
Modelos Lineales Mixtos en InfoStat
Figura 12: Ventana de diálogo para importar datos desde las librerías de R.
En ella se muestra tildada la librería nlme y a la derecha la lista de archivos de datos en
esa librería. Haciendo doble clic sobre “Ovary, nlme” se abrirá una tabla de datos de
InfoStat conteniendo los datos correspondientes. El encabezamiento de la tabla abierta
se muestra a continuación (Figura 13).
Figura 13: Encabezamiento de la tabla de datos del archivo Ovary.
14
Modelos Lineales Mixtos en InfoStat
Una gráfica de la relación entre número de folículos y el tiempo se muestra a
continuación (Figura 14).
25
Follicles
20
15
10
5
0
-0,25
0,00
0,25
0,50
0,75
1,00
1,25
Time
Figura 14: Relación entre el número de folículos (follicles) y el tiempo (Time).
Pinheiro y Bates (2004) proponen ajustar un modelo donde el número de folículos
depende linealmente del seno(2*pi*Time) y el coseno(2*pi*Time). Este modelo trata de
reflejar las variaciones cíclicas del número de folículos mediante la inclusión de
funciones trigonométricas. Además proponen la inclusión de un efecto aleatorio de
yegua (Mare) sobre la constante del modelo y una auto-correlación de orden 1 de los
errores dentro de cada hembra. El efecto aleatorio se incluyó para romper con la falta de
independencia debida a efectos sujeto-dependientes que se expresan como perfiles
paralelos del número de folículos a través del tiempo. El modelo propuesto tendría la
siguiente forma general:
yit = β 0 + β1sin ( 2* pi * Time ) + β 2 cos ( 2* pi * Time ) + b0i + ε it
(
)
(
(2)
)
donde los componentes aleatorios son b0i ~ N 0, σ bo2 y ε it ~ N 0, σ 2 .
Por otra parte, la inclusión de una auto-correlación de orden 1 AR1 dentro de cada
yegua tiene como propósito modelar una eventual correlación serial. Para especificar
este modelo en InfoStat, indicaremos que follicles es la variable dependiente, que Mare
es un criterio de clasificación y que Time es una covariable.
Especificación de la parte fija
La parte fija del modelo quedará indicada como se muestra en la Figura 15. InfoStat
verifica que los elementos en esta ventana se corresponden con los factores y
covariables listados en la parte derecha de la ventana.
15
Modelos Lineales Mixtos en InfoStat
Figura 15: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary.
Si no es así, porque no se han respetado minúsculas y mayúsculas (R es sensible a la
tipografía), entonces InfoStat substituye eso términos por los apropiados. Pero si aún
así, hay palabras que InfoStat no puede interpretar (como en este caso sin, cos y pi),
entonces la línea queda marcada en rojo. Esto no quiere decir que esté incorrecta sino
que puede estarlo y advierte al usuario para que la verifique.
Especificación de la parte aleatoria
La parte aleatoria se indica agregando a la lista de criterios de estratificación el factor
Mare y especificando que el efecto yegua (Mare) es sobre la constante. Esto se indica
tildando Mare dentro de Constante como se muestra en la Figura 16 (este tildado se
agrega por defecto). Los términos sin(2*pi*Time) y cos(2*pi*Time) no presentan, en
este caso, efectos aleatorios asociados.
16
Modelos Lineales Mixtos en InfoStat
Figura 16: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary.
Especificación de la correlación de los errores
La especificación de la correlación autorregresiva de orden 1 para los errores dentro de
cada hembra, se indica en la solapa Correlación 1 como se ilustra en la Figura 17. En R
hay dos grupos de modelos de correlación. El primero corresponde a modelos de
correlación serial, donde se supone que los datos están ordenados en una secuencia, y el
segundo grupo modela correlaciones espaciales. En el primer grupo encontramos los
modelos de simetría compuesta, sin estructura, autorregresivo de orden 1,
autorregresivo continuo de orden 1 y el modelo ARMA(p,q), donde p indica el número
de términos autorregresivos y q el número de términos de medias móviles (moving
average). Todos estos modelos suponen que los datos están ordenados en una
1
Si los errores se suponen independientes (no correlacionados), entonces debe seleccionarse la primera
opción de la lista de estructura de correlación (seleccionada por defecto).
17
Modelos Lineales Mixtos en InfoStat
secuencia. Por defecto, InfoStat asume la secuencia en la que los datos están dispuestos
en el archivo, pero si existe una variable que los ordena de manera diferente, ésta debe
indicarse en el casillero Variable que indica el orden de las observaciones (para que
este casillero se active hay que seleccionar alguna de las estructuras de correlación).
Esta variable debe ser entera para la opción autorregresiva. Por este motivo, InfoStat
agrega en la sentencia traducida al lenguaje R, una indicación para que la variable sea
interpretada como entera. En el ejemplo que estamos ilustrando, la variable Time es un
número real que codifica el tiempo relativo a un punto de referencia y está en una escala
inapropiada para usarla como criterio de ordenamiento. Sin embargo, como los datos
están ordenados por tiempo dentro de cada yegua (Mare), esta especificación puede
omitirse (Figura 17).
Figura 17: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary.
Si los datos no estuvieran ordenados en forma ascendente dentro del criterio de
agrupamiento (Mare), habría que agregar una variable que identifique el orden. Para
18
Modelos Lineales Mixtos en InfoStat
agregar una variable de ordenamiento su nombre puede escribirse o arrastrarse con el
ratón desde la lista de variables al casillero correspondiente. Es usual que la estructura
de correlación esté asociada a un criterio de agrupamiento, en este caso Mare. Esto se
indica en el panel rotulado Criterios de agrupamiento (para que este casillero se active
hay que seleccionar alguna de las estructuras de correlación). Si se incluye más de un
criterio, InfoStat construye tantos grupos como combinación de niveles en los factores
de clasificación que se especifiquen. En la parte inferior de la ventana, rotulada
Expresión resultante, se muestra la expresión R que se está especificando para la
componente “corr=” de gls o lme. Esta expresión es sólo informativa y no puede
editarse.
A continuación se presenta la salida completa del modelo ajustado conteniendo la tabla
de análisis de la varianza de los efectos fijos, que en este caso son pruebas secuenciales
sobre las pendientes asociadas a las covariables sin(2*pi*Time) y cos(2*pi*Time). Se
observa que la desviación estándar del componente aleatorio de la ordenada al origen es
0.77 veces la desviación estándar residual y que el parámetro phi del modelo
autorregresivo es 0.61.
Modelos lineales generales y mixtos
Especificación del modelo en R
Modelo000_follicles_REML<lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time)
,random=list(Mare= pdIdent(~1))
,correlation=corAR1(form=~1|Mare)
,method="REML"
,na.action=na.omit
,data=R.data2
,keep.data=FALSE)
Variable dependiente:follicles
Medidas de ajuste del modelo
N
308
AIC
1562.45
BIC
1584.77
logLik
-775.22
Sigma R2_0
3.67 0.21
R2_1
0.56
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
sin(2 * pi * Time)
cos(2 * pi * Time)
numDF denDF F-value
1
295 163,29
1
295
34,39
1
295
2,94
p-value
<0,0001
<0,0001
0,0877
Parámetros de los efectos aleatorios
19
Modelos Lineales Mixtos en InfoStat
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Mare
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
0.77
Estructura de correlación
Modelo de correlación: AR(1)
Formula: ~ 1 | Mare
Parámetros del modelo
Phi
Estimación
0.61
Los valores predichos por el modelo ajustado anteriormente versus el tiempo se
presentan en la Figura 18. La línea de trazo negro representa la estimación del promedio
poblacional y corresponde a las estimaciones de la parte fija del modelo. Para obtener
las estimaciones para obtener la curva, el usuario debe solicitar en la solapa de efectos
fijos los predichos. Por defecto el nivel de los valores predichos es cero (indicado en el
campo de edición: Niveles) lo que indica que las predicciones están basadas solamente
en la parte fija del modelo.
Las curvas punteadas, paralelas a la curva promedio, son las predicciones para el perfil
de cada yegua derivadas de la inclusión de un efecto aleatorio (sujeto específico) sobre
la constante. Para obtener las predicciones para obtener estas curvas el usuario debe
solicitar también, en la solapa de efectos fijos, los valores predichos del nivel 1. Para
obtener ambas predicciones el usuario deber escribir en el campo de edición de Niveles
la expresión: 0;1.
Para probar la adecuación del modelo identificamos los puntos correspondientes a cada
yegua y dibujamos una curva suavizada para cada una ellas como se muestra en la
Figura 19. Comparando la Figura 18 y la Figura 19 se observa que cada yegua tiene un
perfil diferente que esta sobresimplificado por el modelo representado en la Figura 18.
¿Cómo incluiríamos en el modelo la variabilidad sujeto específica observada en la
Figura 19? La forma más simple de incluir este comportamiento sujeto-específico es
agregar más efectos aleatorios al modelo de la ecuación (2). Como resultado tenemos el
siguiente modelo:
20
Modelos Lineales Mixtos en InfoStat
yit =
β 0 + β1 sin ( 2* pi * Time ) + β 2 cos ( 2* pi * Time )
(3)
+ b0i + b1i sin ( 2* pi * Time ) + b2i cos ( 2* pi * Time ) + ε it
(
(
)
)
(
donde los components aleatorios son b0i ~ N 0, σ bo2 , b1i ~ N 0, σ b21 , b2i ~ N 0, σ b22
(
and ε it ~ N 0, σ 2
)
)
y, como una primera aproximación los supondremos mutuamente
independientes.
Para ajustar el modelo (3) debemos hacer algunos cambios en el conjunto de datos
debido a algunas restricciones en el uso de formula en la solapa de los efectos
aleatorios.
Por
lo
tanto
calculamos
sin T = sin ( 2* pi * Time )
y
cos T = β 2 cos ( 2* pi * Time ) como nuevas variable en el conjunto de datos.
En la parte fija del modelo en vez de especificar una lista de variable especificaremos en
una línea única 1 + sin T + cos T como se muestra en la Figura 20. Esta manera de
especificar la parte fija no afecta las estimaciones de los efectos fijos pero nos permite
introducir fácilmente los efectos aleatorios b0i , b1i y b2i . Luego, en la solapa de efectos
aleatorios especificamos los efectos aleatorios como se muestra en la Figura 21. Notar
que la estructura de covariación supuesta para los efectos aleatorios ha sido especificada
como pdDiag, lo que indica que las varianzas de cada componente aleatorios son
diferentes y que estas componentes no están correlados. Los resultados del ajuste de este
modelo se muestran en la Figura 22. En esta figura se puede observar que el efecto de
ajustar curvas sujeto-específicas para cada yegua, lo que permite una representación
más realista de los ciclos individuales. A pesar de esto, desde un punto de vista
estadístico no es apropiado suponer independencia entre efectos aleatorios de los
parámetros de un modelo de regresión. Para especificar correlación entre efectos
aleatorios indicamos la estructura de covarianza como pdSymm. Esto se muestra en la
Figura 23 y el resultado del ajuste se muestra en la Figura 24.
21
Modelos Lineales Mixtos en InfoStat
22
Poblacional
Mare 03
Mare 06
Mare 09
Mare 01
Mare 04
Mare 07
Mare 10
Mare 02
Mare 05
Mare 08
Mare 11
follicles
17
12
7
2
-0,30
0,10
0,50
0,90
1,30
Time
Figura 18: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para
cada yegua originada por el efecto aleatorio sobre la constante (archivo Ovary).
25
Follicles
20
15
10
5
0
-0.25
0.00
0.25
0.50
0.75
1.00
1.25
Time
Figura 19: Valores suavizados (polinómico de tercer grado) para el número de folículos (lineas
sólidas) para cada yegua (Archivo Ovary).
22
Modelos Lineales Mixtos en InfoStat
Figura 20: Especificación de la parte fija del modelo (3)
Figura 21: Especificación de la parte aleatoria del modelo (3).
23
Modelos Lineales Mixtos en InfoStat
22
18
follicles
14
10
6
2
-0,30
0,10
0,50
0,90
1,30
Time
Figura 22: Valores predichos para el número de folículos para cada yegua generados por la incluisión
de efectos aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos
aleatorios: pdSymm.
Figura 23: Especificación de la parte aleatoria del modelo (3) pero permitiendo que éstos varien en
varianza y estén correlacionados.
24
Modelos Lineales Mixtos en InfoStat
22
20
PRED_1_follicles
18
16
14
12
10
8
6
4
-0.2
-0.1
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
Time
Mare 1
Mare 7
Mare 2
Mare 8
Mare 3
Mare 9
Mare 4
Mare 10
Mare 5
Mare 11
Mare 6
Figura 24: Valores predichos para el número de folículos para cada yegua generados por la incluisión
de efectos aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos
aleatorios: pdSymm.
Especificación de la estructura de varianzas de los errores
Este módulo permite contemplar modelos heteroscedásticos. La heteroscedasticidad sin
embargo no tiene un origen único y así como se modela la correlación entre los errores,
la heteroscedasticidad también puede modelarse. El modelo para las varianzas de los
errores se puede especificar de la siguiente manera: var(ε i ) = σ 2 g 2 ( µi , zδi , ) donde
g (.) se conoce como función de varianza. Esta función puede depender de la esperanza
( µi ) de Yi (la variable de respuesta), de un conjunto de covariables ( z i ) y de un vector
de parámetros ( δ ) . InfoStat, a través de R, estima los parámetros ( δ ) de acuerdo a la
función de varianza seleccionada. La solapa Heteroscedasticidad se muestra en la
Figura 25. Las funciones de varianza admitidas pueden ser identidad (varIdent),
exponencial (varExp), potencia (varPower), potencia corrida por una constante
(varConstPower), o fija (varFixed). R admite que varios modelos de varianza puedan
superponerse, es decir, que para ciertos grupos de datos la varianza puede estar asociada
con alguna covariable y para otros con otra. La especificación simultánea de varios
modelos para la función de varianza se obtiene, simplemente, marcando y especificando
cada uno de los componentes y agregándolos a la listas de funciones de varianza.
InfoStat arma la sentencia apropiada para R.
25
Modelos Lineales Mixtos en InfoStat
En la solapa Heteroscedasticidad para el ejemplo de los folículos, hemos indicado que
la varianza de los errores es distinta para cada yegua, seleccionando varIdent como
modelo de la función de varianza y escribiendo Mare en Criterios de agrupamiento.
Figura 25: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary.
A continuación se presenta la salida del ajuste incluyendo estimaciones de la desviación
estándar del error para cada yegua. También aquí las desviaciones estándar están
expresadas en términos relativos a la desviación estándar residual. Además, el primer
nivel del criterio de agrupamiento especificado para calcular estas desviaciones estándar
diferenciales, es siempre inicializado en 1 porque de otra forma el modelo no es
identificable. En la salida se observa que la hembra 5 tiene una variabilidad en el
número de folículos comparativamente mayor que las otras hembras.
El modelo considerado en la Ecuación (4) con varianzas residuales para estos datos
heterogéneas es:
26
Modelos Lineales Mixtos en InfoStat
yit = β 0 + β1sin ( 2* pi * Time ) + β 2 cos ( 2* pi * Time ) + b0i + ε it
(
)
(
(5)
)
donde los componentes aleatorios son b0i ~ N 0, σ bo2 y ε it ~ N 0, σ i2 .
Obsérvese que la varianza residual está sub-indicada con el índice que identifica a las
yeguas.
Como es usual, los componentes aleatorios del modelo se suponen independientes.
Luego si tomamos una yegua al azar la varianza de la respuesta sería la suma de las
varianzas de la parte aleatoria, es decir var( y=
σ b20 + σ i2 , o sea (3.57*0.8)2 +
it )
(3.57*gi)2, donde gi es la función de varianza para una yegua elegida aleatoriamente.
Ahora bien, cuando se condiciona a una yegua dada (por ejemplo la 5), el efecto
individuo ( b0i ) está fijado, así que la varianza de la yegua 5 solo está asociada a la parte
residual y además la función de varianza queda especificada, (es decir, hay que usar g5)
y la varianza sería (3.57*1.34)2.
Modelos lineales generales y mixtos
Especificación del modelo en R
Modelo001_follicles_REML<lme(follicles~1+sin(2*pi*Time)+cos(2*pi*Time)
,random=list(Mare= pdIdent(~1))
,weight=varComb(varIdent(form=~1|Mare))
,correlation=corAR1(form=~1|Mare)
,method="REML"
,na.action=na.omit
,data=R.data5
,keep.data=FALSE)
Variable dependiente:follicles
Medidas de ajuste del modelo
N
308
AIC
1569.02
BIC
1628.55
logLik
-768.51
Sigma R2_0
3.57 0.21
R2_1
0.56
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
sin(2 * pi * Time)
cos(2 * pi * Time)
numDF denDF F-value
1
295 156.36
1
295
34.22
1
295
3.18
p-value
<0.0001
<0.0001
0.0756
27
Modelos Lineales Mixtos en InfoStat
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Mare
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
0.80
Estructura de correlación
Modelo de correlacion: AR(1)
Formula: ~ 1 | Mare
Parámetros del modelo
Phi
Estimación
0.61
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Mare
Parámetros del modelo
Parámetro
1
2
3
4
5
6
7
8
9
10
11
Estim
1.00
1.01
1.20
0.82
1.34
1.05
0.92
1.06
0.93
0.99
0.77
Análisis de un modelo ajustado
Cuando InfoStat ajusta un modelo lineal general o mixto con el menú Estimación, se
activa el menú Análisis-exploración de modelos estimados. En este diálogo aparecen
varias solapas como se muestra en la Figura 26.
28
Modelos Lineales Mixtos en InfoStat
Figura 26: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada
(archivo Atriplex.IDB2).
El ejemplo usado en este caso es el del archivo Atriplex.IDB2, sobre el que se estimaron
2 modelos de efectos fijos, el modelo000_PG_REML que contiene los efectos Tamaño,
Episperma y su interacción, y el modelo001_PG_REML que solo contiene los efectos
principales de Tamaño y Episperma.
La solapa Modelos sólo aparece en el caso que haya más de un modelo estimado y
presenta una lista de los modelos evaluados en un “check-list”. Los modelos tildados,
aparecen en una lista con sus estadísticos resumen y una prueba de hipótesis de igualdad
de modelo cuya aplicabilidad debe tomarse con cautela ya que no todos los modelos son
estrictamente comparables. De todas formas los criterios AIC y BIC son buenos
indicadores para seleccionar el modelo más parsimonioso.
La solapa Combinaciones lineales tiene como propósito probar hipótesis sobre
combinaciones lineales. La hipótesis que se prueba es que la esperanza de la
combinación lineal es cero. En esta ventana de diálogo aparecen listados los parámetros
fijos del modelo que se haya seleccionado de la lista que aparece en la parte derecha de
29
Modelos Lineales Mixtos en InfoStat
la pantalla (Importante: por defecto siempre está seleccionado el último de la lista). En
la parte inferior de la pantalla hay un campo de edición donde pueden especificarse las
constantes de la combinación lineal. A medida que los coeficientes se van agregando,
los parámetros correspondientes se van coloreando para facilitar la especificación de las
constantes, como se ilustra en la Figura 27.
Figura 27: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales
desplegada (archivo Atriplex.IDB2).
Finalmente la solapa Diagnóstico tiene 3 subsolapas (Figura 26). La primera,
identificada como “Residuos vs…” tiene dispositivos que sirven para generar de manera
sencilla gráficos del tipo boxplot para los residuos estandarizados vs. cada uno de los
factores fijos del modelo o diagramas de dispersión entre los residuos estandarizados y
las covariables del modelo o los valores predichos. Asimismo, es posible obtener el
gráfico Q-Q plot normal. La segunda solapa, identificada como “ACF-SV”, permite
generar un gráfico de la función de auto-correlación (útil para el diagnóstico de
correlaciones seriales) y la tercera, identificada como LevelPlot, permite generar
gráficos de residuos vs. coordenadas espaciales para generar un mapa del sentido e
30
Modelos Lineales Mixtos en InfoStat
intensidad de los residuos. Esta herramienta es útil en el diagnóstico de estructuras de
correlación espacial.
Para ejemplificar el uso de la solapa ACF-FV consideremos el ejemplo de los folículos
(archivo Ovary). En este ejemplo se argumentó que la inclusión del término
autorregresivo de orden 1 tenía por objeto corregir una falta de independencia generada
por las discrepancias entre los ciclos individuales de cada yegua respecto de los ciclos
individuales que solo diferían del ciclo promedio poblacional por una constante (Figura
18). El gráfico de la autocorrelación serial de los residuos correspondiente a un modelo
sin la inclusión de la autocorrelación de orden 1 muestra un claro patrón autorregresivo
(Figura 28). Por otra parte, el gráfico de la autocorrelación de los residuos para el
modelo que contempla la autocorrelación mediante un término autorregresivo de orden
1, corrige la falta de independencia (Figura 29).
Figura 28: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2)
excluyendo la modelación de la autocorrelación serial.
31
Modelos Lineales Mixtos en InfoStat
Figura 29: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2)
incluyendo la modelación de la autocorrelación serial.
Las facilidades de la solapa Diagnóstico tienen por propósito permitir al investigador un
rápido diagnóstico de los eventuales problemas de adecuación tanto de la parte fija
como aleatoria del modelo ajustado. En la presentación de ejemplos se ilustrará más
extensamente el uso de estas herramientas.
32
Modelos Lineales Mixtos en InfoStat
Ejemplos de Aplicación de
Modelos Lineales Generales y Mixtos
Modelos Lineales Mixtos en InfoStat
Estimación de componentes de varianza
En áreas como el mejoramiento genético animal o vegetal es de particular interés el
cálculo de componentes de varianza. Estos son usados para obtener heredabilidades,
respuesta a la selección, coeficientes de variabilidad genética aditiva, coeficientes de
diferenciación genética, etc. Los modelos lineales mixtos pueden usarse para estimar los
componentes de varianza, por medio del estimador de máxima verosimilitud restringida
(REML).
En muchos estudios de genética de poblaciones se trabaja con varias poblaciones que a
su vez están representadas por uno o más individuos de distintas familias. En este caso
se cuenta con dos factores en el modelo, las poblaciones y las familias dentro de cada
población. Para ejemplificar el uso de componentes de varianza se usan los datos que se
presentan en el archivo Compvar.IDB2 (Navarro et ál. 2005). Estos datos provienen de
un ensayo de siete poblaciones de cedro (Cedrela odorata L.) con un total de 115
familias. Para algunas familias se cuenta con repeticiones y para otras no. Además, el
número de familias dentro de cada población no es el mismo. Las variables registradas
son el largo promedio de las semillas (largo), el diámetro, el largo del tallo y número de
hojas de plantines de cedro.
Además de estimar los componentes de varianza, los investigadores están también
interesados en comparar las medias de las poblaciones. Podemos considerar varios
espacios de inferencia, de acuerdo al diseño y a los intereses de los investigadores. Si
las poblaciones son una muestra aleatoria de un conjunto grande de poblaciones,
entonces la inferencia estará orientada a este conjunto grande de poblaciones. El efecto
de las poblaciones estudiadas es aleatorio, y el interés será la estimación de los
componentes de varianza debida a poblaciones y a familias dentro de poblaciones. Otro
aspecto de interés serán los predictores BLUP de los efectos aleatorios (en especial los
de poblaciones).
Si la inferencia se orienta solamente a las poblaciones estudiadas, el efecto de población
es fijo, y el interés principal es estimar y comparar las medias de poblaciones. Si la
media de una población se interpreta como un promedio a través de todas las posibles
familias de dicha población (no solamente las estudiadas), entonces el efecto de familia
Modelos Lineales Mixtos en InfoStat
es aleatorio. En este caso interesará estimar el componente de varianza debido a familia
dentro de poblaciones, y predecir los efectos de las familias estudiadas (BLUP).
Un tercer espacio de inferencia es cuando el interés reside solamente en las poblaciones
y las familias estudiadas. En este caso ambos efectos son fijos. Este tipo de modelo
presenta severas limitaciones, tanto en su interpretación como en su implementación.
Debido a esto, este modelo no se considerará en este tutorial.
Para el análisis de los datos del archivo Compvar.IDB2 se ajustarán los dos primeros
casos discutidos:
Modelo 1: Poblaciones aleatorias y familias aleatorias
Modelo 2: Poblaciones fijas y familias aleatorias
Primero se selecciona el menú Estadísticas, submenú Modelos lineales generales y
mixtos y escogemos Estimación. Al realizar esta selección aparecerá la ventana de
selección de variables, donde especificamos como variables dependientes a Largo,
Diametro, Largodetallo y Numerodehojas y como criterios de clasificación a Población
y Familia (Figura 30).
Figura 30: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
archivo Compvar.IDB2.
35
Modelos Lineales Mixtos en InfoStat
Modelo 1: Para el cálculo de los componentes de varianza se deben especificar las
variables como en la Figura 30. Posteriormente, en la solapa Efectos aleatorios se debe
declarar primero a Población y luego a Familia, ya que R asume que las distintas
componentes aleatorias que se van agregando secuencialmente están anidadas en los
factores declarados con anterioridad. En la subventana Mostrar se tildaron las opciones
que se muestran en la Figura 31, y se sacó el tilde que tiene por defecto para presentar
los Desvíos estándares relativos al desvío estándar residual.
Figura 31: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
Compvar.IDB2 para la especificación del Modelo 1.
En la solapa Efectos fijos no debe aparecer ningún efecto, y el método de estimación
debe ser el de máxima verosimilitud restringida (REML), que es la opción por defecto.
Observar que se desactivó la opción por defecto Desvíos estándares relativos al desvío
estándar residual, por lo que las estimaciones que aparecen serán directamente los
desvíos estándares absolutos. A continuación se presenta la salida obtenida con estas
especificaciones solo para la variable Largo.
36
Modelos Lineales Mixtos en InfoStat
Especificación del modelo en R
modelo000_Largo_REML<-lme(Largo~1
,random=list(Poblacion=pdIdent(~1)
,Familia=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo000_Largo_REML
Variable dependiente:Largo
Medidas de ajuste del modelo
N
214
AIC
2016.47
BIC
2029.91
logLik
-1004.23
Sigma R2_0
21.53
R2_1
0.51
R2_2
0.76
AIC y BIC menores implica mejor
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Poblacion
Desvíos estándares y correlaciones
(const)
(const)
27.16
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Familia dentro de Poblacion
Desvíos estándares y correlaciones
(const)
(const)
14.80
Intervalos de confianza (95%) para los parámetros de los efectos
aleatorios
Formula: ~1|Poblacion
sd(const)
LI(95%)
15.09
Est. LS(95%)
27.16
48.89
Formula: ~1|Familia dentro de Poblacion
sd(const)
LI(95%)
10.72
Est. LS(95%)
14.80
20.43
Intervalo de confianza (95%) para sigma
lower est. upper
sigma 18.77 21.53 24.70
37
Modelos Lineales Mixtos en InfoStat
A partir de las estimaciones de desvíos e intervalos de confianza para los desvíos, se
obtienen las componentes de varianza y sus intervalos de confianza (Cuadro 1).
Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2
Componente
Población
Varianza estimada
2
2
=
σ pob
27.16
=
737.66
2
Familia dentro de σ 2fam
=
14.80
=
219.04
( pob )
población
Residual
2
2
=
σ res
21.53
=
463.54
IC para la
varianza
Variabilidad
relativa al total
(%)
(15.092 , 48.882 )
52.0
(10.722 , 20.432 )
15.4
(18.77 2 , 24.702 )
32.6
De acuerdo a los resultados presentados en la tabla anterior, es interesante resaltar que
la variabilidad de la familias dentro de poblaciones es menor que la variabilidad residual
con lo cual no hay una diferenciación de familias dentro de poblaciones. La mayor
variación, en tanto, es atribuible a diferencias entre poblaciones.
Ahora veremos cómo es el diagnóstico para el Modelo 1, es decir, tanto los efectos de
familia como los de población aleatorios. Para esto vamos al submenú Análisisexploración de modelos estimados y se solicitan los gráficos de diagnóstico (Figura 32).
El análisis diagnóstico de este modelo permite determinar una fuerte falta de
homogeneidad de varianzas residual (Figura 33).
38
Modelos Lineales Mixtos en InfoStat
2
-1
-2
-2
-1
0
1
Cuantiles muestrales
1
0
Res.cond.estand.Pearson
2
Figura 32: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada
para el Modelo 1 con los datos del archivo Compvar.IDB2.
20
40
60
Valores ajustados
80
-3
-2
-1
0
1
2
3
Cuantiles teóricos
Figura 33: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del
archivo Compvar.IDB2.
39
Modelos Lineales Mixtos en InfoStat
En la Figura 33 los residuos estandarizados de Pearsons son aproximaciones de errores
y por lo tanto la heteroscedasticidad observada debe modelarse a este nivel.
Para corregir la falta de homogeneidad a este nivel se considera el Modelo 1 (Población
y Familia como factores aleatorios) con varianzas residuales heterogéneas. Para
incorporar las varianzas residuales eventualmente distintas para cada nivel de
Población, en la solapa heterogeneidad se debe especificar el factor población como se
muestra en la Figura 34.
Figura 34: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Compvar.IDB2 para la especificación de varianzas heterogéneas para poblaciones.
A continuación se presenta la salida para el Modelo 1 con varianzas residuales
heterogéneas por Población y tildando en la solapa de Efectos aleatorios la opción
Matriz de efectos aleatorios para obtener los estimadores BLUP.
40
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo004_Largo_REML<-lme(Largo~1
,random=list(Poblacion=pdIdent(~1)
,Familia=pdIdent(~1))
,weight=varComb(varIdent(form=~1|Poblacion))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo002_Largo_REML
Variable dependiente:Largo
Medidas de ajuste del modelo
N
214
AIC
1872.14
BIC
1905.75
logLik
-926.07
Sigma R2_0
2.32
R2_1
0.51
R2_2
0.51
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
numDF denDF F-value
1
108
21.59
p-value
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Poblacion
Desvíos estándares y correlaciones
(const)
(const)
27.72
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Familia dentro de Poblacion
Desvíos estándares y correlaciones
(const)
(const)
1.56
Intervalos de confianza (95%) para los parámetros de los efectos
aleatorios
Formula: ~1|Poblacion
sd(const)
LI(95%)
15.61
Est. LS(95%)
27.72
49.24
Formula: ~1|Familia dentro de Poblacion
sd(const)
LI(95%)
0.47
Est.
1.56
LS(95%)
5.14
41
Modelos Lineales Mixtos en InfoStat
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Poblacion
Parámetros de la función de varianza
Parámetro
Charagre
Escarcega
Esclavos
La Paz
Pacífico Sur
Xpujil
Yucatán
Estim
1.00
13.09
11.64
15.94
2.81
13.38
12.54
Coeficientes (BLUP) de los efectos aleatorios (~1|Poblacion)
Charagre
Escarcega
Esclavos
La Paz
Pacífico Sur
Xpujil
Yucatán
const
-41.20
15.42
16.12
19.80
-36.51
23.29
3.08
Coeficientes (BLUP) de los efectos aleatorios (~1|Familia in
Poblacion)
Charagre/Ch_71
Charagre/Ch_710
Charagre/Ch_711
Charagre/Ch_712
Charagre/Ch_713
Charagre/Ch_714
Charagre/Ch_715
Charagre/Ch_72
Charagre/Ch_73
Charagre/Ch_74
Charagre/Ch_75
Charagre/Ch_76
Charagre/Ch_77
Charagre/Ch_78
Charagre/Ch_79
Escarcega/Es_1126
Escarcega/Es_1127
Escarcega/Es_1128
Escarcega/Es_1129
Escarcega/Es_1130
Escarcega/Es_1131
Escarcega/Es_1132
Escarcega/Es_1133
Escarcega/Es_1134
Escarcega/Es_1135
Escarcega/Es_1136
Escarcega/Es_1137
const
-1.07
0.59
1.31
1.42
-0.95
-1.07
-0.70
0.70
-0.83
-0.35
-0.59
-0.08
-0.47
0.48
1.48
7.2E-04
0.18
0.14
0.07
3.6E-04
-0.06
0.21
0.01
-0.11
-0.09
-0.08
-0.17
42
Modelos Lineales Mixtos en InfoStat
Escarcega/Es_1138
Escarcega/Es_1139
Escarcega/Es_1142
Escarcega/Es_1148
Esclavos/Ec_31
Esclavos/Ec_310
Esclavos/Ec_311
Esclavos/Ec_312
Esclavos/Ec_313
Esclavos/Ec_314
Esclavos/Ec_315
Esclavos/Ec_316
Esclavos/Ec_317
Esclavos/Ec_318
Esclavos/Ec_319
Esclavos/Ec_32
Esclavos/Ec_320
Esclavos/Ec_33
Esclavos/Ec_34
Esclavos/Ec_35
Esclavos/Ec_36
Esclavos/Ec_37
Esclavos/Ec_38
Esclavos/Ec_39
La Paz/LP_41
La Paz/LP_410
La Paz/LP_411
La Paz/LP_412
La Paz/LP_413
La Paz/LP_414
La Paz/LP_415
La Paz/LP_42
La Paz/LP_43
La Paz/LP_44
La Paz/LP_45
La Paz/LP_46
La Paz/LP_48
La Paz/LP_49
Pacífico Sur/PS_6204
Pacífico Sur/PS_6206
Pacífico Sur/PS_6207
Pacífico Sur/PS_6208
Pacífico Sur/PS_6209
Pacífico Sur/PS_6210
Pacífico Sur/PS_6211
Pacífico Sur/PS_6212
Pacífico Sur/PS_6213
Pacífico Sur/PS_6214
Pacífico Sur/PS_6215
Pacífico Sur/PS_6216
Pacífico Sur/PS_6217
Pacífico Sur/PS_6218
Pacífico Sur/PS_6219
Pacífico Sur/PS_6220
Pacífico Sur/PS_6221
Pacífico Sur/PS_6222
Pacífico Sur/PS_660
Xpujil/Xp_11
Xpujil/Xp_110
Xpujil/Xp_112
Xpujil/Xp_113
0.16
-0.08
0.08
-0.20
-0.08
0.08
-0.07
-0.03
-0.22
0.28
-0.34
0.15
0.04
-0.08
0.04
-0.07
0.18
-3.7E-03
-0.11
0.15
-0.17
0.18
0.08
0.05
-0.13
0.14
0.11
0.16
-0.08
-0.01
-0.13
0.01
-0.01
-0.01
0.02
-0.07
-0.01
0.07
-0.46
-0.58
0.52
-0.33
-0.15
0.31
-0.22
-0.43
0.03
-0.56
-0.07
1.80
-0.12
0.88
-0.35
-0.51
-0.12
-0.48
0.72
-0.12
0.02
3.8E-03
-0.07
43
Modelos Lineales Mixtos en InfoStat
Xpujil/Xp_114
Xpujil/Xp_115
Xpujil/Xp_116
Xpujil/Xp_117
Xpujil/Xp_118
Xpujil/Xp_119
Xpujil/Xp_12
Xpujil/Xp_120
Xpujil/Xp_122
Xpujil/Xp_123
Xpujil/Xp_15
Xpujil/Xp_16
Xpujil/Xp_17
Xpujil/Xp_18
Xpujil/Xp_19
Yucatán/Yu_1111
Yucatán/Yu_1114
Yucatán/Yu_1115
Yucatán/Yu_1116
Yucatán/Yu_1117
Yucatán/Yu_1118
Yucatán/Yu_1119
Yucatán/Yu_1121
Yucatán/Yu_1122
Yucatán/Yu_1123
Yucatán/Yu_1124
Yucatán/Yu_1125
0.02
-0.12
0.17
0.11
0.08
0.18
-0.01
0.19
-0.21
-0.27
0.02
0.03
0.03
-0.05
0.07
-0.17
-0.19
-0.04
0.02
0.05
0.03
0.10
-0.06
0.20
-0.09
-0.05
0.20
Intervalo de confianza (95%) para sigma
sigma
lower est.
1.59 2.32
upper
3.38
Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas
heterogéneas para Población y Familia dentro de Población. Observamos que las
varianzas de las poblaciones son bien diferentes: La población La Paz tiene la mayor
varianza estimada en (15.94*2.32)2 = 1367.57 mientras que la de menor varianza es
(1*2.32)2 = 5.38. Al comparar los modelos con varianzas heterogéneas y homogéneas
mediante una prueba de cociente de verosimilitud se corrobora que el modelo con
varianzas heterogéneas es el mejor (p<0.0001) como se muestra en la siguiente salida.
Comparación de modelos
Call Model df
AIC
BIC
Modelo000_Largo_REML 1
1
4 2016.47 2029.91
Modelo001_Largo_REML 2
2 10 1872.14 1905.75
logLik
Test
L.Ratio
-1004.23
-926.07
1 vs 2 156.33
p-value
<0.0001
44
Modelos Lineales Mixtos en InfoStat
Los residuos obtenidos para el Modelo 1 con varianzas distintas en cada población no
muestran problemas de heteroscedasticidad y presentan una mejora en los supuestos
3
2
-2
-1
0
1
Cuantiles muestrales
2
1
-2
-1
0
Res.cond.estand.Pearson
3
distribucionales respecto al Modelo 1 con varianzas homogéneas (Figura 35).
10
20
30
40
50
60
70
-3
Valores ajustados
-2
-1
0
1
2
3
Cuantiles teóricos
Figura 35: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas
residuales heterogéneas para poblaciones y los datos del archivo Compvar.IDB2.
Modelo 2: Para este modelo se debe declarar Población en la solapa de Efectos fijos.
Observar que en esta solapa se ha seleccionado además Coeficientes de los efectos fijos
(Figura 36). En la solapa de Efectos aleatorios se ha declarado familias como aleatorio,
se ha deseleccionado la opción por defecto de familia como efecto sobre la Constante
(intercepto), y se ha seleccionado familia como afectando los parámetros del efecto
población. La matriz de covarianzas de los efectos aleatorios asignados a poblaciones se
suponen independientes (pdIdent). Se han seleccionado además las opciones Matriz de
efectos aleatorios, Intervalo de confianza para los parámetros de la parte aleatoria e
Intervalo de confianza para sigma (Figura 37). En la solapa Comparaciones se
seleccionó la opción DGC para Población (Figura 38).
45
Modelos Lineales Mixtos en InfoStat
Figura 36: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2
para la especificación del Modelo 2.
Figura 37: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
Compvar.IDB2 para la especificación del Modelo 2.
46
Modelos Lineales Mixtos en InfoStat
Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo
Compvar.IDB2 para la especificación del Modelo 2.
A continuación se presenta la salida correspondiente a estas especificaciones:
Especificación del modelo en R
modelo001_Largo_REML<-lme(Largo~1+Poblacion
,random=list(Familia=pdIdent(~Poblacion-1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo001_Largo_REML
Variable dependiente:Largo
Medidas de ajuste del modelo
N
214
AIC
1967.65
BIC
1997.64
logLik
-974.82
Sigma R2_0
21.54 0.51
R2_1
0.75
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Poblacion
numDF denDF F-value
1
108 601.79
6
108
27.23
p-value
<0.0001
<0.0001
47
Modelos Lineales Mixtos en InfoStat
Efectos fijos
(Intercept)
PoblacionEscarcega
PoblacionEsclavos
PoblacionLa Paz
PoblacionPacífico Sur
PoblacionXpujil
PoblacionYucatán
Value Std.Error
8.23
5.75
56.89
8.03
57.72
7.46
62.24
8.13
4.65
7.53
65.45
7.72
44.44
8.40
DF
108
108
108
108
108
108
108
t-value
1.43
7.08
7.74
7.66
0.62
8.48
5.29
p-value
0.1551
<0.0001
<0.0001
<0.0001
0.5382
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Poblacion - 1|Familia
Desvíos estándares y correlaciones
Charagre
Charagre
14.79
Escarcega
0.00
Esclavos
0.00
La Paz
0.00
Pacífico Sur 0.00
Xpujil
0.00
Yucatán
0.00
Escarcega
0.00
14.79
0.00
0.00
0.00
0.00
0.00
Esclavos
0.00
0.00
14.79
0.00
0.00
0.00
0.00
La Paz Pacífico Sur
0.00
0.00
0.00
0.00
0.00
0.00
14.79
0.00
0.00
14.79
0.00
0.00
0.00
0.00
XpujilYucatán
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
14.79
0.00
0.00 14.79
Intervalos de confianza (95%) para los parámetros de los efectos
aleatorios
Formula: ~Poblacion - 1|Familia
sd( - 1)
LI(95%)
10.71
est.
14.79
LS(95%)
20.42
Coeficientes (BLUP) de los efectos aleatorios (~Poblacion - 1|Familia)
Ch_71
Ch_710
Ch_711
Ch_712
Ch_713
Ch_714
Ch_715
Ch_72
Ch_73
Ch_74
Ch_75
Ch_76
Ch_77
Ch_78
Ch_79
Ec_31
Ec_310
Ec_311
Ec_312
Ec_313
Ec_314
Ec_315
Ec_316
Ec_317
Ec_318
Ec_319
Ec_32
Ec_320
Ec_33
Charagre
-1.08
0.62
1.34
1.47
-0.96
-1.08
-0.71
0.73
-0.84
-0.35
-0.60
-0.07
-0.48
0.50
1.53
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
Escarcega
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
Esclavos
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-6.04
5.36
-5.56
-2.65
-16.00
20.66
-25.46
10.95
2.69
-5.80
2.94
-5.56
12.89
-0.46
La Paz Pacífico Sur
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
Xpujil Yucatán
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
48
Modelos Lineales Mixtos en InfoStat
Ec_34
Ec_35
Ec_36
Ec_37
Ec_38
Ec_39
Es_1126
Es_1127
Es_1128
Es_1129
Es_1130
Es_1131
Es_1132
Es_1133
Es_1134
Es_1135
Es_1136
Es_1137
Es_1138
Es_1139
Es_1142
Es_1148
LP_41
LP_410
LP_411
LP_412
LP_413
LP_414
LP_415
LP_42
LP_43
LP_44
LP_45
LP_46
LP_48
LP_49
PS_6204
PS_6206
PS_6207
PS_6208
PS_6209
PS_6210
PS_6211
PS_6212
PS_6213
PS_6214
PS_6215
PS_6216
PS_6217
PS_6218
PS_6219
PS_6220
PS_6221
PS_6222
PS_660
Xp_11
Xp_110
Xp_112
Xp_113
Xp_114
Xp_115
Xp_116
Xp_117
Xp_118
Xp_119
Xp_12
Xp_120
Xp_122
Xp_123
Xp_15
Xp_16
Xp_17
Xp_18
Xp_19
Yu_1111
Yu_1114
Yu_1115
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-0.06
16.20
16.63
6.49
-0.04
-7.09
19.12
1.15
-10.25
-10.94
-7.58
-16.32
14.26
-10.30
7.71
-18.99
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-7.99
10.95
-12.84
12.89
5.36
3.67
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-18.43
18.95
14.82
20.89
-12.12
-2.41
-18.67
1.23
-1.93
-1.68
1.96
-9.69
-2.39
9.48
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-2.13
-2.73
2.48
-1.52
-0.67
1.51
-1.03
-2.01
0.18
-2.61
-0.31
8.55
-0.55
4.18
-1.64
-2.37
-0.55
-2.25
3.46
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-14.96
2.35
-0.09
-7.12
1.61
-12.46
15.93
10.11
6.95
16.91
-2.14
18.36
-20.72
-27.03
1.86
2.99
3.95
-4.94
8.44
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-14.89
-16.59
-3.24
49
Modelos Lineales Mixtos en InfoStat
Yu_1116
Yu_1117
Yu_1118
Yu_1119
Yu_1121
Yu_1122
Yu_1123
Yu_1124
Yu_1125
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
1.86
4.53
2.83
8.66
-5.18
17.15
-7.85
-4.45
17.15
Intervalo de confianza (95%) para sigma
sigma
lower
18.77
est.
21.54
upper
24.71
Medias ajustadas y errores estándares para Poblacion
DGC (alfa=0.05)
Poblacion
Xpujil
La Paz
Esclavos
Escarcega
Yucatán
Pacífico Sur
Charagre
Medias
73.68
70.47
65.95
65.12
52.67
12.88
8.23
E.E.
5.16
5.74
4.75
5.61
6.13
4.87
5.75
A
A
A
A
A
B
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
A continuación se muestra como ejemplo el cálculo de los BLUP para algunas familias
de la población Charagre:
Yˆcha ,71 = µˆ + αˆ cha + βˆ71( cha ) = 8.2296 + 0 + (−1.0823) = 7.1473
Yˆcha ,72 = µˆ + αˆ cha + βˆ72( cha ) = 8.2296 + 0 + 0.7277 = 8.9573
Yˆcha ,73 = µˆ + αˆ cha + βˆ73( cha ) = 8.2296 + 0 + (−0.8396) = 7.3900
Yˆcha ,74 = µˆ + αˆ cha + βˆ74( cha ) = 8.2296 + 0 + (−0.3542) = 7.8754
El BLUP de la familia 42 de la población La Paz se calcula como:
Yˆlpaz ,42 =+
µˆ αˆlpaz + βˆ42(lpaz ) =
8.2296 + 62.2374 + 1.2297 =
71.6967
Ahora realizaremos el análisis del ajuste del Modelo 2. En el submenú Análisisexploración de modelos estimados se pidieron los gráficos de diagnóstico (Figura 39).
50
Modelos Lineales Mixtos en InfoStat
Figura 39: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada
para el Modelo 2 con los datos del archivo Compvar.IDB2.
El gráfico de residuos condicionales estandarizados de Pearson vs. Valores ajustados
(Figura 40) muestra varianzas residual heterogéneas para la variable Largo.
51
Modelos Lineales Mixtos en InfoStat
Figura 40: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del
archivo Compvar.IDB2
Respecto a los supuestos distribucionales, es importante destacar que, existiendo
heteroscedasticidad, el Q-Q plot no debe ser interpretado hasta tanto no se corrija este
problema. Para incorporar las varianzas heterogéneas del efecto Población, en la solapa
heterogeneidad se debe especificar el factor Población como se mostró en la Figura 34.
Este modelo presenta valores más bajos de AIC y BIC que el modelo sin varianzas
heterogéneas para Población. Observamos que las varianzas de las poblaciones son bien
diferentes: La población La Paz tiene la mayor varianza estimada en (15.94*2.32)2 =
1367.57, mientras que la de menor varianza es Charagre con (1*2.32)2 = 5.38.
Modelos lineales generales y mixtos
Especificación del modelo en R
52
Modelos Lineales Mixtos en InfoStat
modelo002_Largo_REML<-lme(Largo~1+Poblacion
,random=list(Familia=pdIdent(~Poblacion-1))
,weight=varComb(varIdent(form=~1|Poblacion))
,method="REML"
,na.action=na.omit
,data=R.data01
,keep.data=FALSE)
Resultados para el modelo: modelo002_Largo_REML
Variable dependiente:Largo
Medidas de ajuste del modelo
N
214
AIC
1823.20
BIC
1873.20
logLik
-896.60
Sigma R2_0
2.32 0.51
R2_1
0.51
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Poblacion
numDF denDF F-value
1
108 509.60
6
108
86.55
p-value
<0.0001
<0.0001
Efectos fijos
(Intercept)
PoblacionEscarcega
PoblacionEsclavos
PoblacionLa Paz
PoblacionPacífico Sur
PoblacionXpujil
PoblacionYucatán
Value Std.Error
8.23
0.61
57.32
5.90
57.72
4.33
62.33
7.16
4.65
1.28
65.43
5.54
44.44
6.00
DF
108
108
108
108
108
108
108
t-value
13.42
9.72
13.33
8.70
3.65
11.81
7.41
p-value
<0.0001
<0.0001
<0.0001
<0.0001
0.0004
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Poblacion - 1|Familia
Desvíos estándares y correlaciones
Charagre
Escarcega
Esclavos
La Paz
Pacífico Sur
Xpujil
Yucatán
Charagre Escarcega
1.56
0.00
0.00
1.56
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
Esclavos La Paz
0.00 0.00
0.00 0.00
1.56 0.00
0.00 1.56
0.00 0.00
0.00 0.00
0.00 0.00
Pacífico Sur
0.00
0.00
0.00
0.00
1.56
0.00
0.00
Xpujil
0.00
0.00
0.00
0.00
0.00
1.56
0.00
Yucatán
0.00
0.00
0.00
0.00
0.00
0.00
1.56
Intervalos de confianza (95%) para los parámetros de los efectos
aleatorios
Formula: ~Poblacion - 1|Familia
sd( - 1)
LI(95%)
0.45
Est.
1.56
LS(95%)
5.38
Estructura de varianzas
Modelo de varianzas: varIdent
53
Modelos Lineales Mixtos en InfoStat
Formula: ~ 1 | Poblacion
Parámetros de la función de varianza
Parámetro
Charagre
Esclavos
Escarcega
La Paz
Pacífico Sur
Xpujil
Yucatán
Estim
1.00
11.64
13.09
15.94
2.81
13.38
12.55
Para probar que este modelo menos parsimonioso es el de mejor ajuste se realizó una
prueba del cociente de verosimilitud cuya salida se presenta a continuación.
Comparación de modelos
Model
001
df
9
AIC
1967.65
BIC
1997.64
logLik
-974.82
Test
L.Ratio
p-value
002
15
1823.20
1873.20
-896.60
1 vs 2
156.44
<0.0001
El modelo con varianzas heterogéneas para las distintas poblaciones es mejor que el de
varianzas homogéneas (p<0.0001). Podemos observar que con la inclusión de varianzas
heterogéneas para las distintas poblaciones el ajuste ha mejorado respecto a los ajustes
anteriores (Figura 41). Tanto en los box-plot de los residuos condicionales
estudentizados de Pearson como en el diagrama de dispersión de residuos condicionales
estudentizados de Pearson versus predichos, ya no se evidencian problemas graves de
falta de homogeneidad de varianzas. En el gráfico Q-Q plot se observa una mejora en el
supuesto distribucional.
54
Modelos Lineales Mixtos en InfoStat
Figura 41: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del
archivo Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población.
55
Modelos Lineales Mixtos en InfoStat
Efectos aleatorios cruzados con interacción
Existen muchas situaciones en las que resulta de interés estimar componentes de
varianza asociados con dos factores cruzados y su interacción. Milliken y Johnson
(1992, p. 265) presentan un ejemplo donde se analizan datos de eficiencia de
producción para tres líneas de producción aleatoriamente escogidas en una fábrica. Se
escogieron aleatoriamente cuatro operarios, y estos operarios trabajaron en cada una de
las líneas de producción. Originalmente cada operario iba a trabajar en cada línea de
producción cinco veces, pero por diversas razones hay combinaciones que se repitieron
menos veces (hay entre uno y cinco datos en cada combinación de operario y línea de
producción).
Como tanto el efecto de la línea de producción como el del operario son aleatorios, y
además interesa la variabilidad adicional generada por la combinación específica
operario × línea, vamos a usar un modelo con dos efectos aleatorios y su interacción:
Yijk = µ + ai + b j + abij + eijk
ai ~ N ( 0, σ a2 ) , b j ~ N ( 0, σ b2 )
(6)
2
abij ~ N ( 0, σ ab
) , eijk ~ N ( 0,σ e2 )
donde todos los efectos aleatorios son mutuamente independientes.
Para ajustar este modelo usaremos el conjunto de datos Produccion.IDB2 (Milliken y
Johnson, 1992). Eficiencia se declara en la ventana Variables, Línea y Operario se
declaran en la ventana Criterios de clasificación. Como no hay ningún efecto fijo
(excepto la media general), no se pone nada en la solapa Efectos fijos. En la solapa
Efectos aleatorios se selecciona Línea y Operario, y al oprimir el botón derecho del
ratón con ambas variables seleccionadas aparecerá la opción Factores aleatorios
cruzados más interacciones. Para simplificar la lectura de la salida (recordemos que el
objetivo principal de este tipo de modelos es la estimación de las componentes de
varianza), hemos desactivado la opción Desvíos estándares relativos al desvío estándar
residual.
56
Modelos Lineales Mixtos en InfoStat
Figura 42: Ventana Modelos lineales generales y mixtos con la solapa Efectos aleatorios desplegada
para los datos del archivo Producciones.IDB2 con los efectos aleatorios Linea y Operario cruzados y
su interacción.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.001_eficiencia_REML<-lme(eficiencia~1
,random=list(.U.=pdBlocked(list(pdIdent(~linea-1)
,pdIdent(~operario-1)
,pdIdent(~linea:operario-1))))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data01
,keep.data=FALSE)
Resultados para el modelo: modelo.001_eficiencia_REML
Variable dependiente: eficiencia
57
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
AIC
BIC
logLik
Sigma R2_0 R2_1
47 249.6353 258.7785 -119.8176 1.9947
0.9497
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
numDF denDF F-value p-value
1
46 478.2937 <0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdBlocked
Formula: ~linea + operario + linea:operario - 1
Desvíos estándares y correlaciones
linea1
linea2
linea3
operario1
operario2
operario3
operario4
linea1:operario1
linea2:operario1
linea3:operario1
linea1:operario2
linea2:operario2
linea3:operario2
linea1:operario3
linea2:operario3
linea3:operario3
linea1:operario4
linea2:operario4
linea3:operario4
D.S.
5.6672
5.6672
5.6672
1.7353
1.7353
1.7353
1.7353
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
5.9618
A partir de esta salida podemos observar los estimadores de las desviaciones estándares
de cada efecto aleatorio:
=
σˆ a 5.6672,
=
σˆ b 1.7353,
=
σˆ ab 5.9618,
=
σˆ e 1.9947
Esta información puede usarse, por ejemplo, para estimar distintos tipos de
correlaciones Intra-clase. Por ejemplo, la correlación entre dos observaciones de la
misma línea de producción y del mismo operario es:
58
Modelos Lineales Mixtos en InfoStat
 (Y , Y )
cov
σˆ a2 + σˆ b2 + σˆ ab2
ijk
ijk '

corr
=
(Yijk , Yijk ' ) =
 (Y )
σˆ a2 + σˆ b2 + σˆ ab2 + σˆ e2
var
ijk
=
5.66722 + 1.73532 + 5.96182
0.9467
=
5.66722 + 1.73532 + 5.96182 + 1.9947 2
Por otro lado, la correlación entre dos observaciones del mismo operario pero en líneas
de producción diferentes es mucho menor:
 (Y , Y )
cov
ijk
i ' jk '

corr (Yijk , Yi ' jk ' ) =
 (Y )
var
ijk
=
σˆ b2
1.73532
=
= 0.0403.
σˆ a2 + σˆ b2 + σˆ ab2 + σˆ e2 5.66722 + 1.73532 + 5.96182 + 1.9947 2
59
Modelos Lineales Mixtos en InfoStat
Aplicación de modelos mixtos para datos estratificados
Parcelas divididas
Supongamos un experimento bifactorial en el que no es posible asignar al azar las
combinaciones de ambos factores a las parcelas experimentales (PE). En algunos casos,
grupos de PE reciben aleatoriamente los distintos niveles de uno de los factores de
clasificación y dentro de estos grupos de parcelas, los niveles del segundo factor son
asignados al azar.
El experimento descripto anteriormente difiere de un experimento bifactorial
convencional en que, si bien los niveles de los factores son asignados aleatoriamente a
las PE, no son los tratamientos (i.e. las combinaciones de los niveles de los factores) los
que están siendo asignados de esta forma.
Esta manera particular de asignar los distintos niveles de los factores a las parcelas
representa una restricción a la aleatorización, e induce estructuras de correlación que
deben ser tenidas en cuenta en el momento del análisis. Este diseño se conoce como
parcela dividida.
El nombre surge de la idea de que PARCELAS principales reciben los niveles de un
factor (también llamado a veces factor principal) y que estas parcelas son DIVIDIDAS
en SUBPARCELAS que reciben los niveles del segundo factor de clasificación.
Aunque en las parcelas divididas los niveles de un factor son asignados dentro de los
niveles de otro factor, este NO ES un diseño anidado. Se trata de un experimento
típicamente factorial donde los factores están cruzados. Es sólo la aleatorización la que
se ha realizado en forma secuencial.
De acuerdo a la forma en que están arregladas las parcelas principales, el diseño puede
ser de:
•
Parcelas divididas en un arreglo en bloques
•
Parcelas divididas en un arreglo completamente aleatorizado
•
Parcelas divididas en otros diseños
60
Modelos Lineales Mixtos en InfoStat
Parcelas divididas en un arreglo en bloques
El análisis clásico de un diseño en parcelas divididas con parcelas principales
distribuidas en bloques completos incluye los siguientes términos en el modelo:
Factor asociado a la parcela principal (FPP)
Bloque
Bloque*FPP (error de la parcela principal)
Factor asociado a la subparcela (FSP)
FPP*FSP
Error (error para la subparcela)
El punto clave para completar el análisis de este modelo es comprender que el error
experimental para el FPP es diferente que para los términos del modelo que incluyen al
FSP. El error experimental de las parcelas principales es mayor que el de las
subparcelas.
La varianza del error experimental de las parcelas principales en un diseño de parcelas
divididas con parcelas principales repetidas en bloque completamente aleatorizados, se
estima como el cuadrado medio (CM) de la interacción Bloque*FPP (se asume que no
hay interacción Bloque*FPP y en consecuencia este CM estima el error entre parcelas
principales tratadas de la misma forma). El CM de esta “interacción” es el que se usa
como referencia para calcular el estadístico F de la prueba de hipótesis para el factor
principal. El resto de las pruebas el CM residual es el apropiado para construir el
estadístico F.
El análisis de este diseño mediante un modelo lineal mixto se basa en la identificación
de dos niveles de agrupamiento de las observaciones. El primer nivel está dado por los
bloques y el segundo nivel por las parcelas principales dentro de los bloques. Cada uno
de estos niveles de agrupamiento genera una correlación, conocida como correlación
intraclase, entre las observaciones que contiene.
El modelo lineal mixto para este diseño es el siguiente:
yijk = µ + τ i + γ j + δ ij + bk + pik + ε ijk ; i = 1,.., T ; j = 1,..., G; k = 1,..., B
(7)
61
Modelos Lineales Mixtos en InfoStat
donde yijk representa la respuesta observada en el k-ésimo bloque, i-ésimo nivel del
factor principal y j-ésimo nivel de factor asociado a las subparcelas, µ representa la
media general de la respuesta, τ i representa el efecto del i-ésimo nivel del factor
asociado a las parcelas principales, γ j representa el efecto del j-ésimo nivel del factor
asociado a las subparcelas y δ ij representa el efecto de la interacción del ij-ésimo
tratamiento. Por otra parte bk , pik y ε ijk corresponden a efectos aleatorios de los bloques,
de las parcelas dentro de los bloques y de los errores experimentales. Las suposiciones
sobre
estos
componentes
aleatorios
es
que
bk ~ N ( 0, σ b2 ) ,
pik ~ N ( 0, σ p2 ) ,
ε ijk ~ N ( 0, σ ε2 ) y que estos tres componentes aleatorios son independientes. A
continuación ejemplificaremos el análisis de un diseño en parcelas divididas en bloques
mediante la aplicación de un modelo lineal mixto.
En este ejemplo (Di Rienzo 2007) se evalúan 4 variedades de trigo: BUCK-Charrua
(BC), Las Rosas-INTA (LI), Pigué (Pe) y Pro-INTA Puntal (PP) bajo riego y secano
con el diseño a campo presentado en la Figura 43.
Bloque 1
BC
Pe
PP
LI
LI
BC
Pe
PP
Bloque 2
PP
BC
Pe
LI
PP
Pe
LI
BC
Bloque 3
Pe
LI
BC
PP
BC
PP
Pe
LI
Figura 43: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo
Trigo.IDB2 (gris oscuro=parcelas bajo riego, gris claro=parcelas en secano)
62
Modelos Lineales Mixtos en InfoStat
Los datos de este ejemplo se encuentran en el archivo Trigo.IDB2. El encabezamiento
de la tabla de datos es la siguiente (Figura 44).
Figura 44: Encabezamiento de la tabla de datos del archivo Trigo.IDB2.
El factor en la parcela principal es Agua, el factor asociado a las subparcelas es
Variedad y la variable de respuesta es el Rendimiento. Los bloques están claramente
identificados, pero las parcelas principales no aparecen explícitamente. Esto es así
porque en un diseño en parcelas divididas, las parcelas principales dentro de un bloque
están confundidas con el factor principal. De esta forma las observaciones bajo “Riego”
en el bloque 1, representan las observaciones de una de las parcelas principales de ese
bloque.
Para analizar este ejemplo invocaremos la estimación de un modelo lineal mixto. Esta
invocación nos presentará, como es usual, la ventana de selección de variables. Su
imagen, con la selección apropiada de variables de respuesta y factores se muestra en la
Figura 45.
Figura 45: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
archivo Trigo.IDB2.
63
Modelos Lineales Mixtos en InfoStat
Aceptando esta especificación, se mostrará el diálogo que permite especificar el
modelo. La solapa de la parte fija, ya especificada, se muestra en la Figura 46. En ella
aparecen los efectos principales Agua, Variedad y la interacción Agua*Variedad.
Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2.
Para la especificación de la parte aleatoria, en la solapa Efectos aleatorios se debe
incorporar primero al factor Bloque y después al factor Agua. Esta es la forma de indicar
que Agua está dentro de Bloque. La especificación de la parte aleatoria queda como se
muestra en la Figura 47.
64
Modelos Lineales Mixtos en InfoStat
Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2
con bloque y agua como criterios de estratificación.
La salida correspondiente a esta estimación es la siguiente:
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_Rendimiento_REML<lme(Rendimiento~1+Agua+Variedad+Agua:Variedad
,random=list(Bloque=pdIdent(~1)
,Agua=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo000_Rendimiento_REML
Variable dependiente:Rendimiento
Medidas de ajuste del modelo
N
24
AIC
206.59
BIC
215.09
logLik
-92.30
Sigma R2_0
51.65 0.84
R2_1
0.89
R2_2
0.91
AIC y BIC menores implica mejor
65
Modelos Lineales Mixtos en InfoStat
Pruebas de hipótesis secuenciales
(Intercept)
Agua
Variedad
Agua:Variedad
numDF denDF F-value
1
12 363.93
1
2
55.24
3
12
6.38
3
12
2.36
p-value
<0.0001
0.0176
0.0078
0.1223
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.55
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Agua dentro de Bloque
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.47
Las pruebas de hipótesis secuenciales dan los mismos resultados que las marginales en
este caso porque los datos son balanceados.
Antes de continuar con nuestro análisis, haremos algunas validaciones simples de las
suposiciones de estos modelos, revisando residuales estandarizados vs. predichos y
otros criterios de clasificación, así como el Q-Q plot normal de residuos estandarizados.
Estos residuos son condicionales a los efectos aleatorios (es decir, aproximan los
errores). Para ello invocaremos el submenú Análisis-exploración de modelos estimados.
En el diálogo, seleccionaremos la solapa Diagnóstico y dentro de ella la subsolapa
Residuos vs. (Figura 48).
66
Modelos Lineales Mixtos en InfoStat
Figura 48: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada
para los datos del archivo Trigo.IDB2.
Si se seleccionan los ítems dentro de la lista disponible, como se muestra en la Figura
48, se obtendrá el gráfico siguiente (Figura 49). Este aparece en una nueva ventana que
genera R y su contenido puede copiarse oprimiendo el botón derecho del ratón, sobre la
imagen. En el menú que se despliega se podrá optar por “Copy as metafile” o “Copy as
bitmap”.
67
Modelos Lineales Mixtos en InfoStat
Figura 49: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2.
Un examen rápido de la figura sugiere una posible heterogeneidad de varianzas entre
variedades. Para poder probar si es necesario incluir la estimación de varianzas
residuales diferentes para cada variedad hay que ajustar un modelo heteroscedástico y
compararlo con el homoscedástico, utilizando algún criterio como el AIC o BIC (o una
prueba del cociente de verosimilitud, ya que el modelo homoscedástico es un caso
particular del heteroscedástico).
Para ajustar el modelo heteroscedástico invocamos nuevamente al módulo de
estimación de los modelos mixtos y en la solapa Heteroscedasticidad seleccionamos el
modelo varIdent y una vez seleccionado hacemos doble clic sobre Variedad (en la lista
a la derecha de la ventana) para especificar a esta variable como criterio de
agrupamiento (Figura 50). Luego accionamos el botón Agregar para hacer efectiva la
68
Modelos Lineales Mixtos en InfoStat
incorporación de esta especificación del modelo. Si por algún motivo la especificación
ingresada no es deseada, haciendo doble clic sobre la misma, ésta se borra.
Figura 50: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Trigo.IDB2 con selección de función varIdent con variedad como criterio de agrupamiento.
Las medidas de ajuste del modelo especificado son las siguientes:
Medidas de ajuste del modelo
N
24
AIC
209.47
BIC
220.28
logLik
-90.73
Sigma R2_0
24.49 0.84
R2_1
0.89
R2_2
0.90
AIC y BIC menores implica mejor
Comparadas con las del modelo homoscedástico, no se observa una mejoría, por lo
contrario tanto AIC como BIC aumentaron. Por este motivo se descarta el modelo
heteroscedástico.
69
Modelos Lineales Mixtos en InfoStat
Luego volviendo al modelo homoscedástico, realizaremos comparaciones múltiples del
tipo LSD de Fisher para evaluar diferencias entre variedades. Para ello en la solapa
Comparaciones subsolapa Medias, tildaremos la opción Variedad como se muestra la
Figura 51.
Figura 51: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y
selección de la subsolapa Medias.
Al final de la salida del programa se encontrará la comparación de medias. Se observa
que solo BUCK-Charrua tuvo los rendimientos más bajos y esto ocurrió
independientemente de si tenía riego o no. En tanto las otras variedades tuvieron
rendimientos estadísticamente indistinguibles.
Medias ajustadas y errores estándares para Variedad
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Variedad
Pro-INTA Puntal
Pigue
LasRosas-INTA
BUCK-Charrua
Medias
469.50
430.98
423.98
342.73
E.E.
28.48 A
28.48 A
28.48 A
28.48
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
70
Modelos Lineales Mixtos en InfoStat
Parcelas divididas en un arreglo en diseño completamente aleatorizado
A
continuación
ejemplificamos
mediante
un
experimento cuyo objetivo fue evaluar el efecto de un
coadyuvante sobre la cobertura de gotas y uniformidad
de aplicación en distintas ubicaciones de las hojas
dentro del canopeo de un cultivo de soja (Di Rienzo
2007). Para ello se seleccionaron 16 sitios en cada uno
de los cuales se dispusieron 4 tarjetas hidro-sensibles,
ubicadas a dos alturas del canopeo (inferior, superior) y
apuntando, sus caras sensibles, en dos direcciones: hacia
arriba y hacia abajo. Las tarjetas hidrosensibles
muestran una mancha en el lugar donde cae una gota de
agua. La superficie manchada en estas tarjetas es una
medida de cuanto penetra y se dispersa el agua en una zona dada del canopeo. En 8 de
los 16 sitios se agregó al agua de pulverización un coadyuvante (para disminuir la
tensión superficial del agua y mejorar la dispersión de las gotas) y en los 8 restantes no.
Por lo tanto en cada sitio de pulverización se obtienen 4 lecturas correspondientes a las
combinaciones de las alturas (inferior y superior) y la ubicación de la cara sensible de la
tarjeta (abajo y arriba). Luego en cada sitio hay una repetición completa de un
experimento con 4 tratamientos SuAr, SuAb, InAr y InAb, y que se combinan con la
utilización o no del coadyuvante en la solución de rociado.
El experimento resultante es un trifactorial, con un factor principal (coadyuvante)
asociado a parcelas principales (sitios donde se realiza el rociado) y dos factores (altura
y ubicación de cara sensible de la tarjeta) asociados a las subparcelas (tarjetas dentro de
sitio). El archivo conteniendo los datos se llama Cobertura de gotas.IDB2 y el
encabezamiento de la tabla de datos se presenta en la Figura 52.
71
Modelos Lineales Mixtos en InfoStat
Figura 52: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2.
En la tabla de datos hay una columna que identifica a la parcela y va numerada de 1 a
16. Este va a ser el único efecto aleatorio de nuestro modelo.
El modelo lineal para las observaciones de este experimento es el siguiente:
yijkl = µ + τ i + γ j + ηk + δ ij + ϕik + λ jk + θijk + bl + ε ijkl ;
(8)
=i 1,..,
=
=
=
2; j 1,...,
2; k 1,...,
2; l 1,...,16
donde yijkl representa la respuesta observada en i-ésimo nivel del factor coadyuvante y
j-ésimo nivel de factor altura, k-ésimo nivel del factor cara en la l-ésima parcela, µ
representa la media general de la respuesta, τ i representa el efecto del i-ésimo nivel del
factor asociado a las parcelas principales (coadyuvante), γ j representa el efecto del
j-ésimo nivel del factor altura, η k el k-ésimo nivel del factor cara, ambos asociados a
las subparcelas y δ ij , ϕik , λ jk y θijk las interacciones de segundo y tercer orden
correspondientes de los factores coadyuvante, altura y cara. Por otra parte pl y ε ijkl
representan los efectos aleatorios de las parcelas y de los errores experimentales
respectivamente. Las suposiciones sobre estos componentes aleatorios son que
pl ~ N ( 0, σ p2 ) , que ε ijkl ~ N ( 0, σ ε2 ) , y que estas dos componentes aleatorias son
independientes.
A continuación presentamos la forma en que se especifica el modelo anterior en
InfoStat, su salida, interpretación y algunas acciones complementarias de validación del
modelo.
Para
ello
invocaremos
el
Menú:
Modelos
lineales
generales
y
mixtos>>Estimación. El diálogo de selección de variables para este caso se presenta en
la Figura 53.
72
Modelos Lineales Mixtos en InfoStat
Figura 53: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
archivo Cobertura de gotas.IDB2.
La especificación de la parte fija del modelo para este ejemplo contiene los tres factores
y sus interacciones dobles y triples (Figura 54).
Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de
gotas.IDB2.
El efecto aleatorio que consideramos en este ejemplo es el de Parcela (Figura 55).
73
Modelos Lineales Mixtos en InfoStat
Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura
de gotas.IDB2 con Parcela como criterio de estratificación.
Luego de aceptar las especificaciones anteriores obtendremos la siguiente salida:
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_Cobertura_REML<lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coa
d:Altura:Cara
,random=list(Parcela=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo000_Cobertura_REML
Variable dependiente:Cobertura
Medidas de ajuste del modelo
N
64
AIC
670.38
BIC
690.63
logLik
-325.19
Sigma R2_0
65.17 0.76
R2_1
0.82
AIC y BIC menores implica mejor
74
Modelos Lineales Mixtos en InfoStat
Pruebas de hipótesis secuenciales
numDF denDF F-value
(Intercept)
1
42 233.37
Coad
1
14
1.89
Altura
1
42
72.86
Cara
1
42
95.32
Coad:Altura
1
42
1.58
Coad:Cara
1
42
0.01
Altura:Cara
1
42
34.77
Coad:Altura:Cara
1
42
0.21
p-value
<0.0001
0.1909
<0.0001
<0.0001
0.2152
0.9271
<0.0001
0.6476
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Parcela
Desvíos estándares relativos al residual y correlaciones
(Intercept)
(Intercept)
0.40
Una revisión de los residuos estandarizados de este modelo mediante las herramientas
de diagnóstico en el Menú: Modelos lineales generales y mixtos>>Análisis-exploración
de modelos estimados muestra una posible heterogeneidad de varianzas cuando se
comparan las observaciones obtenidas cuando la cara sensible de la tarjeta hidrosensible
se presenta hacia arriba o hacia abajo (Figura 56).
Figura 56: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor
Cara. Archivo Cobertura de gotas.IDB2.
75
Modelos Lineales Mixtos en InfoStat
Para tener en cuenta la posible falta de homogeneidad de varianzas entre posiciones de
la cara sensible, invocaremos nuevamente el menú de estimación del modelo. Todas las
especificaciones anteriores se han preservado por lo que sólo tenemos que
concentrarnos en la especificación de la función varianza. Para ello utilizaremos la
solapa heteroscedasticidad como se muestra en la Figura 57.
Figura 57: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Cobertura de gotas.IDB2 con Cara como criterio de agrupamiento.
La salida resultante es la siguiente:
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo001_Cobertura_REML<lme(Cobertura~1+Coad+Altura+Cara+Coad:Altura+Coad:Cara+Altura:Cara+Coa
d:Altura:Cara
,random=list(Parcela=pdIdent(~1))
,weight=varComb(varIdent(form=~1|Cara))
,method="REML"
,na.action=na.omit
76
Modelos Lineales Mixtos en InfoStat
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo001_Cobertura_REML
Variable dependiente:Cobertura
Medidas de ajuste del modelo
N
64
AIC
636.54
BIC
658.82
logLik
-307.27
Sigma R2_0
21.26 0.76
R2_1
0.81
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Coad
Altura
Cara
Coad:Altura
Coad:Cara
Altura:Cara
Coad:Altura:Cara
numDF denDF F-value
1
42 176.66
1
14
4.19
1
42
53.72
1
42
98.43
1
42
13.83
1
42
0.01
1
42
35.90
1
42
0.22
p-value
<0.0001
0.0599
<0.0001
<0.0001
0.0006
0.9259
<0.0001
0.6423
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Parcela
Desvíos estándares relativos al residual y correlaciones
DS(Const)
DS(Const)
1.06
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Cara
Parámetros del modelo
Parámetro
Ab
Ar
Estim
1.00
4.15
El modelo para estos datos sería yijkl = µi jk + pl + ε ijkl , donde µi jk representa el efecto
fijo de i-ésimo tratamiento en la j-ésima cara (cara puede ser Ab o Ar), bl es el efecto
(
)
(
)
aleatorio de la k-esima parcela experimental que se supone N 0, σ p2 y ε ijkl ~ N 0, σ k2 .
Luego la varianza de una observación tomada en una parcela seleccionada
aleatoriamente va a depender si se hace en la cara de abajo o arriba de la tarjeta. Así si
77
Modelos Lineales Mixtos en InfoStat
tomamos una observación de la cara de abajo la varianza va a ser (21.26*1.06)2 +
(21.26*1)2 y si la tomamos en la cara de arriba: (21.26*1.06)2 + (21.26*4.15)2.
A continuación se presentan las medidas resumen del modelo homoscedástico y del
heteroscedástico.
Medidas de ajuste del modelo homoscedástico
N
64
AIC
670.38
BIC
690.63
logLik
-325.19
Sigma R2_0
65.17 0.76
R2_1
0.82
AIC y BIC menores implica mejor
Medidas de ajuste del modelo heteroscedástico
N
AIC
BIC
logLik
64
636.54
658.82
-307.27
AIC y BIC menores implica mejor
Sigma R2_0
21.26 0.76
R2_1
0.81
Si comparamos los AIC y BIC veremos que el último modelo ajustado es mejor y por lo
tanto la interpretación de la pruebas de hipótesis debe basarse en este último.
Obsérvese que en la estructura de varianzas, la desviación estándar residual de las
observaciones en las tarjetas que apuntan hacia arriba es 4.15 veces mayor que la
desviación estándar residual de las observaciones en las tarjetas que apuntan hacia
abajo.
Por otra parte, observando los resultados de las pruebas de hipótesis resulta que la
interacción Coad:Altura:Cara no resultó significativa, por lo que se pueden observar
las interacciones dobles (Figura 58). Entre estas, Coad:Altura y Altura:Cara son
significativas. Estas interacciones se analizan utilizando la solapa Comparaciones de la
ventana Modelos lineales generales y mixtos y tildando las correspondientes
interacciones en la lista de términos del modelo que se presenta en esa ventana. Este
procedimiento creará una tabla con las medias de todas las combinaciones resultantes de
los niveles de los factores que intervienen en la interacción. El resultado, al final de la
salida, presenta las siguientes tablas.
Medidas ajustadas y errores estándares para Coad*Altura
LSD Fisher (alfa=0,05)
Procedimiento de corrección de p-valores: No
Coad
Si
No
Si
No
Altura
Su
Su
In
In
Medias
253.94
204.69
94.38
86.13
E.E.
17.89 A
17.89 A
17.89
17.89
B
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
78
Modelos Lineales Mixtos en InfoStat
Medidas ajustadas y errores estándares para Altura*Cara
LSD Fisher (alfa=0,05)
Procedimiento de corrección de p-valores: No
Altura
Su
In
Su
In
Cara
Ar
Ar
Ab
Ab
Medias
356.88
121.75
101.75
58.75
E.E.
22.74 A
22.74
7.73
7.73
B
B
C
Medias con una letra común no son significativamente diferentes (p<= 0.05)
a)
b)
400
300
250
300
Cobertura
Cobertura
200
150
200
100
100
50
0
0
Superior
Inferior
Superior
Sin coadyuvante
Inferior
Altura
Altura
Con coadyuvante
Cara abajo
Cara arriba
Figura 58: Diagramas de puntos para estudiar la interacción entre Coad y Altura (a) y entre Cara y
Altura (b).
Parcelas subdivididas (split-split plot)
Este diseño utiliza el mismo principio que las parcelas divididas, excepto que lo
extiende un paso más. El principio puede extenderse arbitrariamente a niveles más
profundos de división. El modelo lineal para este diseño, suponiendo las parcelas
principales agrupadas en bloques completos aleatorizados, es el siguiente:
yijkl = µ + α i + β j + χ k + δ ij + φik + γ jk + ηijk + bl + pil + sp jil + ε ijkl
(9)
En la expresión anterior µ representa la media general, α i el i-ésimo nivel del factor
asociado a las parcelas principales, β j el j-ésimo nivel del factor asociado a las
subparcelas dentro de las parcelas principales, χ k el k-ésimo nivel del factor asociado a
las sub-subparcelas (dentro de las subparcelas) y δ ij , φik , γ jk y ηijk las correspondientes
79
Modelos Lineales Mixtos en InfoStat
interacciones. Los términos aleatorios de este modelo corresponden a los efectos de
(
)
bloques, bl ~ N 0, σ b2 , los efectos de parcelas,
(
subparcelas, sp jil ~ N 0, σ sp2
)
pil ~ N ( 0, σ p2 ) , los efectos de
(
)
y el error experimental, ε ijkl ~ N 0, σ ε2 . Todos ellos,
como siempre, se suponen independientes.
Consideremos ahora un ejemplo. Los datos están en el archivo Calidad del
almidón.IDB2 (Di Rienzo 2007). En este experimento se evalúa el índice de absorción
de agua (IAA) del almidón cocido y crudo obtenido de dos genotipos de Quínoa
cultivada bajo 4 niveles de fertilización nitrogenada. Las variedades son Faro y
UDEC10. Éstas se asignaron a grandes parcelas dispuestas en 3 bloques. Las parcelas
en las que fueron sembradas las variedades fueron divididas en 4 subparcelas a las que
se les asignaron 4 dosis de fertilización: 0, 75, 150 y 225 kg/ha. Las subparcelas fueron
nuevamente divididas en 2 para asignar el tratamiento de cocción o sin cocción (crudo).
El esquema para este diseño de experimento se presenta en la Figura 59.
Sub-Parcela
Parcela principal
Bloque 1
Bloque 2
Bloque 3
Sub-sub Parcela
Figura 59: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo
Calidad del almidón.IDB2.
Para el análisis de este diseño mediante un modelo mixto, además de la especificación
de la parte fija, como en un clásico experimento tri-factorial, sólo debemos especificar
la parte aleatoria para incluir el efecto aleatorio de los Bloques, de las Parcelas
80
Modelos Lineales Mixtos en InfoStat
Principales dentro de Bloques y de las Subparcela dentro de Parcelas. El
encabezamiento del archivo Calidad del Almidón.IDB2 se presenta en la Figura 60.
Figura 60: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2.
La ventana de selección de variables para este ejemplo tendrá que contener la
información que se presenta en la Figura 61.
Figura 61: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
archivo Calidad del Almidón.IDB2.
La especificación de la parte fija deberá contener los factores e interacciones
presentados en la Figura 62.
81
Modelos Lineales Mixtos en InfoStat
Figura 62: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del
Almidón.IDB2.
La parte aleatoria deberá tener declarados a los bloques (Bloque), a las parcelas
principales dentro de Bloques (Genotipo) y a las subparcelas dentro de parcelas
principales (Nitrógeno) (Figura 63).
82
Modelos Lineales Mixtos en InfoStat
Figura 63: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del
Almidón.IDB2.
La salida correspondiente es la siguiente:
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_IAA_REML<lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Cocci
on+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion
,random=list(Bloque=pdIdent(~1)
,Genotipo=pdIdent(~1)
,Nitrogeno=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo000_IAA_REML
Variable dependiente:IAA
83
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
48
AIC
116.45
BIC
145.76
logLik
-38.22
Sigma R2_0
0.61 0.75
R2_1
0.75
R2_2
0.75
R2_3
0.75
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Genotipo
Nitrogeno
Coccion
Genotipo:Nitrogeno
Genotipo:Coccion
Nitrogeno:Coccion
Genotipo:Nitrogeno:Coccion..
numDF denDF F-value
1
16 1389.20
1
2
14.49
3
12
0.78
1
16
32.90
3
12
0.88
1
16
37.67
3
16
1.74
3
16
0.46
p-value
<0.0001
0.0626
0.5287
<0.0001
0.4769
<0.0001
0.1998
0.7108
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
1.3E-05
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Genotipo dentro de Bloque
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
5.0E-06
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Nitrogeno dentro de Genotipo dentro de Bloque
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
1.8E-05
Podríamos seguir realizando pruebas de diagnóstico pero asumiremos que el modelo es
correcto. La interpretación de las pruebas de hipótesis indica que sólo la interacción
Genotipo:Cocción es significativa. Las comparaciones múltiples para las medias de
tratamientos correspondientes a esta interacción se presentan a continuación. En estas
pruebas se observa que sólo el almidón cocido del genotipo UDEC10 presenta un IAA
significativamente mayor que el resto de combinaciones de Genotipo y Cocción.
84
Modelos Lineales Mixtos en InfoStat
Medidas ajustadas y errores estándares para Genotipo*Coccion
LSD Fisher (alfa=0,05)
Genotipo
UDEC10
Faro
Faro
UDEC10
Coccion
Cocido
Crudo
Cocido
Crudo
Medias
4.64
2.97
2.90
2.56
E.E.
0.18
0.18
0.18
0.18
A
B
B
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Una manera alternativa de formular el modelo anterior consiste en dejar los efectos fijos
como en la Figura 62 y especificar los efectos aleatorios como se muestra en la Figura
64. Los resultados son exactamente los mismos que antes, excepto por el cálculo de los
grados de libertad del denominador y por ende los valores de probabilidad. Esta es una
aproximación también válida aunque la versión anterior es acorde con el análisis
tradicional basado en efectos fijos. Además, las estimaciones de varianza están
presentadas en forma diferente.
Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del
Almidón.IDB2 que contempla otra forma de especificar la parte aleatoria.
85
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo001_IAA_REML<lme(IAA~1+Genotipo+Nitrogeno+Coccion+Genotipo:Nitrogeno+Genotipo:Cocci
on+Nitrogeno:Coccion+Genotipo:Nitrogeno:Coccion
,random=list(Bloque=pdIdent(~1)
,Bloque=pdIdent(~Genotipo-1)
,Bloque=pdIdent(~Genotipo:Nitrogeno-1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo001_IAA_REML
Variable dependiente:IAA
Medidas de ajuste del modelo
N
48
AIC
116.45
BIC
145.76
logLik
-38.22
Sigma R2_0
0.61 0.75
R2_1
0.75
R2_2
0.75
R2_3
0.75
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Genotipo
Nitrogeno
Coccion
Genotipo:Nitrogeno
Genotipo:Coccion
Nitrogeno:Coccion
Genotipo:Nitrogeno:Coccion..
numDF denDF F-value
1
30 1389.20
1
30
14.49
3
30
0.78
1
30
32.90
3
30
0.88
1
30
37.67
3
30
1.74
3
30
0.46
p-value
<0.0001
0.0006
0.5157
<0.0001
0.4605
<0.0001
0.1807
0.7089
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(Const)
(Const)
1.3E-05
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Genotipo - 1|Bloque
Desvíos estándares relativos al residual y correlaciones
Faro
UDEC10
Faro
5.0E-06
0.00
UDEC10
0.00
5.0E-06
86
Modelos Lineales Mixtos en InfoStat
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Genotipo:Nitrogeno - 1|Bloque
Desvíos estándares relativos al residual y correlaciones
Faro:0
Faro:0 1.8E-05
UDEC10:0
0
Faro:75
0
UDEC10:75 0
Faro:150
0
UDEC10:150 0
Faro:225
0
UDEC10:225 0
UDEC10:0
0
1.8E-05
0
0
0
0
0
0
Faro:75 UDEC10:75
0
0
0
0
1.8E-05
0
0
1.8E-05
0
0
0
0
0
0
0
0
Faro:150
0
0
0
0
1.8E-05
0
0
0
UDEC10:150
0
0
0
0
0
1.8E-05
0
0
Faro:225 UDEC10:225
0
0
0
0
0
0
0
0
0
0
0
0
1.8E-05
0
0
1.8E-05
87
Modelos Lineales Mixtos en InfoStat
Aplicación de modelos mixtos para mediciones repetidas en el tiempo
Datos longitudinales
Para la modelación de datos longitudinales el aspecto más importante a considerar es la
estructura de la matriz de covarianza residual, que es posible modelar especificando la
matriz de correlación. En algunos casos también las varianzas pueden ser distintas para
algún criterio de agrupamiento y se debe modelar la heteroscedasticidad. Recordemos
que existe correlación residual entre observaciones que comparten el mismo valor del
criterio de estratificación, conocido también como sujeto, (por ejemplo, tomadas sobre
la misma persona, la misma parcela, el mismo animal, el mismo árbol, etc.). Así, la
matriz de covarianza residual para todas las observaciones será una matriz diagonal por
bloques, y en cada bloque se reflejará la estructura deseada, i.e. simetría compuesta,
autorregresiva de orden 1, etc.
Para especificar esto, InfoStat presenta dos solapas. En la solapa Correlación se
encuentran las opciones que permiten especificar la estructura de correlación de los
errores y en la solapa Heteroscedasticidad se pueden seleccionar distintos modelos de
varianza. Así, las distintas estructuras de la matriz de covarianza residual que se pueden
ajustar resultan de combinar las distintas estructuras de correlación con la posible
heteroscedasticidad en el tiempo. Si adicionalmente se desea especificar un efecto
aleatorio también es posible hacerlo usando la solapa correspondiente. En este caso se
debe tener mucha precaución de no combinar efectos aleatorios, estructuras de
correlación y de heteroscedasticidad tales que el modelo final no sea identificable. Esto
sucede cuando existe un conjunto infinito de valores de los parámetros para los cuales el
modelo es indistinguible, y por lo tanto las soluciones a las ecuaciones de verosimilitud
no son únicas.
Ejemplos de estas situaciones ocurren cuando se especifica una estructura de
correlación de simetría compuesta con un criterio de estratificación (por ejemplo, la
parcela) y un efecto aleatorio de ese mismo criterio de estratificación sobre la constante.
En este caso la estructura de covarianza de las observaciones será una matriz diagonal
por bloques, y cada bloque tendrá una estructura de simetría compuesta. Por lo tanto,
esta estructura tiene intrínsecamente dos parámetros. Pero de la manera que la hemos
especificado aparecen tres parámetros (varianza del efecto aleatorio, correlación
88
Modelos Lineales Mixtos en InfoStat
intraclase de la estructura de correlación residual y varianza residual). Esta
sobreparametrización hace que existan infinitas soluciones, y por lo tanto los
estimadores no se pueden interpretar (y en muchos casos el algoritmo numérico no
converge). Otra situación común es la de una correlación sin estructura (corSymm) con
un criterio de estratificación dado (por ejemplo la parcela) y un efecto aleatorio de ese
mismo criterio de estratificación sobre la constante (intercept).
Análisis de un ensayo de establecimiento de forrajeras
A continuación se presenta un ejemplo de modelación de observaciones repetidas en el
tiempo. Los datos provienen de un ensayo de establecimiento de forrajeras para
comparar cinco métodos de labranza (T1 = labranza mínima, T2 = labranza mínima con
herbicida, T3 = labranza mínima con herbicida y arado de disco a los 45 días,
T4 = labranza cero, y T5 = labranza convencional) en la región central húmeda de
Puerto Rico. La especie usada fue Brachiaria decumbens cv. Basilik. El experimento
estaba diseñado en tres bloques completos aleatorizados, y se analizan aquí las medidas
de cobertura (porcentaje de cobertura estimado en cada parcela). Hay 5 medidas
repetidas, tomadas con intervalos de un mes entre agosto y diciembre de 2001 (Moser y
Macchiavelli 2002). Los datos se encuentran en Cobertura forrajes.IDB2 en la carpeta
de datos de prueba de InfoStat.
Los perfiles promedio de cobertura observados en los cinco tiempos para cada uno de
los tratamientos se presentan en la Figura 65.
50
Cobertura (%)
40
30
20
10
0
1
2
3
4
5
Tiempo
T1
T2
T3
T4
T5
Figura 65: Relación entre cobertura y tiempo para cinco tratamientos del archivo
Cobertura forrajes.IDB2.
89
Modelos Lineales Mixtos en InfoStat
Como estrategia general para analizar estos datos primero se ajustarán modelos con
distintas estructuras de covarianza, combinando apropiadamente estructuras de
correlación residual, heteroscedasticidad residual y efectos aleatorios. Mediante criterios
de verosimilitud penalizada (AIC y BIC) se elegirá el modelo que mejor describa los
datos, y usando este modelo se realizarán inferencias acerca de las medias (comparar
tratamientos, estudiar el efecto del tiempo, analizar si los perfiles promedio varían en el
tiempo, si son paralelos, etc.).
Para elegir el mejor modelo comenzaremos proponiendo un modelo sencillo con pocos
parámetros a estimar (i.e. parsimonioso), e iremos adicionando parámetros hasta llegar
al modelo sin estructura, que es el menos parsimonioso. Se usarán las siguientes
estructuras de covarianza para los datos (covarianza marginal):
1. Efecto aleatorio de bloque y errores independientes y homoscedásticos.
2. Efectos aleatorios de bloque y parcela dentro de cada bloque, errores independientes y
homoscedásticos.
3. Efecto aleatorio de bloque y errores independientes y heteroscedásticos.
4. Efectos aleatorios de bloque y parcela dentro de cada bloque, errores independientes y
heteroscedásticos.
5. Efectos aleatorios de bloque, correlación constante entre errores de la misma parcela y
varianza residual constante en el tiempo (equivalente al modelo 2).
6. Efectos aleatorios de bloque, correlación constante entre errores de la misma parcela y
varianza residual diferente en los distintos tiempos.
7. Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores de
la misma parcela y varianza residual constante en el tiempo.
8. Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura autorregresiva
de orden 1 entre los errores de la misma parcela y varianza residual constante en el
tiempo.
9. Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores de
la misma parcela y varianza residual diferente en los distintos tiempos.
10. Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura autorregresiva
de orden 1 entre los errores de la misma parcela y varianza residual diferente en los
distintos tiempos
11. Efectos aleatorios de bloque, sin estructura para las correlaciones entre errores
provenientes de la misma parcela y varianzas residuales diferentes en el tiempo.
Para ajustar estos modelos en primer lugar se deben declarar las variables como se
indica en la Figura 66.
90
Modelos Lineales Mixtos en InfoStat
Figura 66: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
ejemplo Cobertura forrajes.IDB2.
En todos los casos se usó el mismo modelo de medias, ya que la parte fija del modelo
referido no cambió (imprescindible si se desea comparar estructuras de covarianza
usando REML, y por ende los criterios de AIC y BIC) (Figura 67). A continuación se
detallará la forma de declarar cada uno de los modelos a evaluar seguido por una salida
de InfoStat con las medidas de ajuste correspondientes.
91
Modelos Lineales Mixtos en InfoStat
Figura 67: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura
forrajes.IDB2.
Modelo 1: Efecto aleatorio de bloque, errores independientes y homoscedásticos.
En la solapa Efectos Aleatorios se debe seleccionar Bloque (Figura 68), y en la solapa
Correlación se debe declarar Errores independientes (Figura 69), que es la opción por
defecto, y en la solapa Heteroscedasticidad no se declara nada.
92
Modelos Lineales Mixtos en InfoStat
Figura 68: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de efectos aleatorios de Bloque.
93
Modelos Lineales Mixtos en InfoStat
Figura 69: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de Errores independientes (Modelo 1).
Medidas de ajuste del modelo
N
75
AIC
476.39
BIC
528.01
logLik
-211.19
Sigma R2_0
12.19 0.56
R2_1
0.63
AIC y BIC menores implica mejor
Modelo 2: Efectos aleatorios de bloque y parcela dentro de bloque, errores independientes y
homoscedásticos.
En la solapa Efectos Aleatorios se debe seleccionar Bloque y Parcela (que queda por
defecto anidada dentro de bloque) (Figura 70), y en la solapa Correlación se debe
declarar Errores independientes, que es la opción por defecto, y en la solapa
Heteroscedasticidad no se declara nada (como en el modelo 1).
94
Modelos Lineales Mixtos en InfoStat
Figura 70: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de efectos aleatorios de Bloque y Parcela dentro de bloques.
Medidas de ajuste del modelo
N
75
AIC
470.00
BIC
523.54
logLik
-207.00
Sigma R2_0
9.95 0.56
R2_1
0.61
R2_2
0.78
AIC y BIC menores implica mejor
Modelo 3: Efecto aleatorio de bloque, errores independientes y heteroscedásticos.
Las solapas Efectos aleatorios y Correlación se declaran como en el modelo 1 (Figura
68 y Figura 69), y en la solapa Heteroscedasticidad se declara varIdent y en criterio de
agrupamiento se declara Tiempo (Figura 71).
95
Modelos Lineales Mixtos en InfoStat
Figura 71: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo
Cobertura forrajes.IDB2 con selección de función varIdent con tiempo como criterio de agrupamiento.
Medidas de ajuste del modelo
N
75
AIC
475.13
BIC
534.40
logLik
-206.57
Sigma R2_0
6.50 0.56
R2_1
0.59
AIC y BIC menores implica mejor
Modelo 4: Efectos aleatorios de bloque y parcela dentro de cada bloque, errores
independientes y heteroscedásticos.
Las solapas Efectos aleatorios y Correlación se declaran como en el modelo 2 (Figura
70 y Figura 69 respectivamente), y la solapa Heteroscedasticidad se declara como en el
modelo 3 (Figura 71).
Medidas de ajuste del modelo
N
75
AIC
470.54
BIC
531.73
logLik
-203.27
Sigma R2_0
4.20 0.56
R2_1
0.56
R2_2
0.70
AIC y BIC menores implica mejor
96
Modelos Lineales Mixtos en InfoStat
Modelo 5: Efecto aleatorio de bloque, correlación constante entre datos de la misma parcela y
varianza constante en el tiempo.
En la solapa Correlación se eligió la opción Simetría Compuesta. Se debe declarar
también el Criterio de agrupamiento, en este caso Parcela y Bloque para indicar que se
está modelando la correlación de datos provenientes de una misma parcela en un bloque
dado (Figura 72). En la solapa Heteroscedasticidad se dejó la opción por defecto, es
decir no se eligió ningún criterio (para esto ir a la solapa Heteroscedasticidad y borrar la
selección anterior desactivando todas las opciones y oprimiento Borrar en la última
caja).
Figura 72: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de Simetría compuesta para datos
agrupados por parcela.
97
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
75
AIC
470,00
BIC
523,54
logLik
-207,00
Sigma R2_0
12,59 0,56
R2_1
0,61
AIC y BIC menores implica mejor
Se debe observar que este modelo obtiene los mismos valores de ajuste (AIC, BIC, y
log verosimilitud) que el modelo 2, ya que ambos son esencialmente el mismo modelo
(excepto en el caso que la correlación constante dentro de una parcela sea negativa).
Observar que el modelo 2 incorpora la correlación entre datos de la misma parcela a
través del efecto aleatorio de parcela, mientras que el modelo 5 lo hace a través de la
estructura de correlación de simetría compuesta.
Debido a esto, no es posible intentar ajustar un modelo que incluya efecto aleatorio de
parcela dentro de bloques y simetría compuesta en el mismo nivel de agrupamiento: este
modelo no sería identificable, y sus estimadores no serían válidos (aunque a veces el
programa puede mostrar una salida, ésta no sería válida).
Modelo 6: Efecto aleatorio de bloque, correlación constante entre datos de la misma parcela y
varianza diferente en los distintos tiempos.
En la solapa Correlación se eligió la opción Simetría compuesta (Figura 72) y en la
solapa Heteroscedasticidad eligió la opción varIdent y en Criterios de agrupamiento se
declara Tiempo (Figura 71).
Medidas de ajuste del modelo
N
75
AIC
466.67
BIC
527.85
logLik
-201.33
Sigma R2_0
6.77 0.56
R2_1
0.56
AIC y BIC menores implica mejor
Modelo 7: Efecto aleatorio de bloque, estructura autorregresiva de orden 1 entre los errores
de la misma parcela y varianza residual constante en el tiempo.
En la solapa Efectos aleatorios se declaro a Bloque (como en Figura 68) y en la solapa
Correlación se eligió la opción Autorregresivo de orden 1 (Figura 74). Debido a que
este modelo tiene en cuenta el orden en que fueron tomadas las observaciones, la
variable que indica esto se debe declarar en la ventana correspondiente (en este caso la
variable Tiempo). Para incorporar esta variable, arrastrar Tiempo desde la ventana de la
derecha. Si los tiempos no fuesen equidistantes, la estructura corAR1 no es aplicable, y
se debe usar su análoga continua (corCAR1). Para este ejemplo ambas estructuras son
equivalentes debido a que los tiempos son equidistantes.
98
Modelos Lineales Mixtos en InfoStat
En la solapa Heteroscedasticidad se dejó la opción por defecto, es decir no se eligió
ningún criterio (para esto ir a la solapa Heteroscedasticidad y borrar la selección
anterior desactivando todas las opciones y oprimiendo Borrar).
Figura 73: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de modelo Autorregresivo de orden 1 para datos agrupados por Bloque y
Parcela y orden de las observaciones indicado por la variable Tiempo.
Medidas de ajuste del modelo
N
75
AIC
460.93
BIC
514.47
logLik
-202.47
Sigma R2_0
12.36 0.56
R2_1
0.62
AIC y BIC menores implica mejor
99
Modelos Lineales Mixtos en InfoStat
Modelo 8: Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura
autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual constante
en el tiempo.
Medidas de ajuste del modelo
N
75
AIC
462.93
BIC
518.38
logLik
-202.47
Sigma R2_0
12.36 0.56
R2_1
0.62
R2_2
0.62
AIC y BIC menores implica mejor
Este modelo tiene un ajuste muy parecido al modelo anterior (modelo 7) ya que su
verosimilitud es similar. Sin embargo, si se aumenta el número de decimales se verá que
son un poco distintos. Lo mismo ocruirirá cuando se comparen los modelos 9 y 10.
Modelo 9: Efectos aleatorios de bloque, estructura autorregresiva de orden 1 entre los errores
de la misma parcela y varianza residual diferente en los distintos tiempos.
En la solapa Correlación se eligió la opción Autorregresivo de orden 1. En la solapa
Heteroscedasticidad se eligió la opción varIdent y se especificó el criterio de
agrupamiento que en este caso es la variable tiempo.
Medidas de ajuste del modelo
N
75
AIC
462.70
BIC
523.89
logLik
-199.35
Sigma R2_0
7.49 0.56
R2_1
0.58
AIC y BIC menores implica mejor
Modelo 10: Efectos aleatorios de bloque y parcela dentro de cada bloque, estructura
autorregresiva de orden 1 entre los errores de la misma parcela y varianza residual diferente en
los distintos tiempos.
Medidas de ajuste del modelo
N
75
AIC
464.70
BIC
527.80
logLik
-199.35
Sigma R2_0
7.49 0.56
R2_1
0.58
R2_2
0.58
AIC y BIC menores implica mejor
Modelo 11: Efectos aleatorios de bloque, sin estructura para las correlaciones entre errores
provenientes de la misma parcela y varianzas residuales diferentes en el tiempo.
En la solapa Correlación se eligió la opción Sin estructura (Figura 74) y en la solapa
Heteroscedasticidad se dejó tildada la opción varIdent.
100
Modelos Lineales Mixtos en InfoStat
Recordemos que mo es posible ajustar un modelo que incluya efecto aleatorio de
parcela y sin estructura en el mismo nivel de agrupamientos. El modelo en este caso
seria no identificable y su estimadores no son valiodos aunque el programa muester una
salida (lo mismo que ocurría con el modelo de simetría compuesta).
Figura 74: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de modelo Sin estructura para datos agrupados por parcela y orden de las
observaciones indicado por la variable Tiempo (Modelo 11).
Medidas de ajuste del modelo
N
75
AIC
434.74
BIC
513.14
logLik
-176.37
Sigma R2_0
6.48 0.56
R2_1
0.59
AIC y BIC menores implica mejor
101
Modelos Lineales Mixtos en InfoStat
Selección de la estructura de covarianza
Si comparamos los valores de AIC (o los de BIC) para las estructuras que hemos
ajustado, se puede observar que el menor valor se obtiene con el Modelo 11 (AIC =
434.74, BIC = 513.14), por lo tanto elegimos la covarianza sin estructura. Observemos
los parámetros estimados bajo este modelo:
Medidas de ajuste del modelo
N
75
AIC
434.7426
BIC
513.1355
logLik
-176.3713
Sigma
6.4813
R2_0
0.5611
R2_1
0.5854
AIC y BIC menores implica mejor
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.3942
Estructura de correlación
Modelo de correlación: General correlation
Formula: ~ (as.integer(Tiempo)) | Bloque/Parcela
0
1.0000
0.2937
0.7012
0.1182
0.0953
1
0.2937
1.0000
0.2476
0.1535
0.1766
2
0.7012
0.2476
1.0000
0.4755
0.4718
3
0.1182
0.1535
0.4755
1.0000
0.9953
4
0.0953
0.1766
0.4718
0.9953
1.0000
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Tiempo
Parámetros de la función de varianza
Parámetro
Estim
1
1.0000
2
1.2400
3
2.0278
4
2.5759
5
2.4614
Las varianzas residuales estimadas para cada uno de los 5 tiempos se calculan de la
siguiente manera:
102
Modelos Lineales Mixtos en InfoStat
2
σˆ12 6.4813
=
=
42.0072
σˆ 22 =(1.2400 × 6.4813) =64.5903
2
σˆ 32 =( 2.0278 × 6.4813) =172.7327
2
σˆ 42 =( 2.5759 × 6.4813) =278.7291
2
σˆ 52 =( 2.4614 × 6.4813) =254.5005
2
Las 10 correlaciones residuales estimadas aparecen directamente como una matriz en
Estructura de Correlación. Para obtener una estimación de la varianza marginal (es
decir la varianza de una observación en un tiempo específico), se debe sumar a cada
varianza residual la varianza de bloque y de parcela dentro de bloque:
2
=( 0.3942 × 6.4813) =6.5277
σˆ bloque
2
Inferencia sobre las medias
Una vez elegida la estructura de covarianza de los datos (en este caso el modelo sin
estructura) podemos proceder a realizar inferencias acerca de las medias. Los perfiles
promedios observados para cada tratamiento se presentaron en la Figura 65.
En un experimento factorial como este, donde se tiene el factor tratamiento y el factor
tiempo, lo primero que se debe indagar es si existe interacción entre los tratamientos y
el tiempo. Para ello podemos realizar una prueba de Wald, que aparece directamente en
InfoStat como Trat:Tiempo en las pruebas marginales o secuenciales (recordemos que
la interacción es el último término que colocamos en el modelo, por lo que ambas
pruebas en este caso son equivalentes). Otra opción es realizar una prueba del cociente
de verosimilitudes (LRT por sus siglas en inglés). Para esta última no podemos usar
REML debido a que estamos probando modelos con efectos fijos diferentes, y por lo
tanto los estimadores REML no son comparables. En su lugar se usa el estimador
máximo verosímil (ML).
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Tratam
Tiempo
Tratam:Tiempo
numDF denDF F-value
1
48
82.60
4
48
4.05
4
48
16.77
16
48
1.49
p-value
<0.0001
0.0065
<0.0001
0.1417
103
Modelos Lineales Mixtos en InfoStat
Para realizar una prueba de cociente de verosimilitudes podemos ajustar (con ML) dos
modelos con la misma estructura de covarianza (en este ejemplo el modelo sin
estructura) pero que difieren en su parte fija: uno contiene la interacción (modelo
completo) y el otro no la contiene (modelo reducido):
Modelo completo:
Medidas de ajuste del modelo
N
75
AIC
539.51
BIC
634.52
logLik
-228.75
Sigma R2_0
5.29 0.56
R2_1
0.59
logLik
-240.59
Sigma R2_0
5.52 0.33
R2_1
0.35
AIC y BIC menores implica mejor
Modelo reducido:
Medidas de ajuste del modelo
N
75
AIC
531.19
BIC
589.12
AIC y BIC menores implica mejor
Si bien la prueba LRT se puede obtener directamente desde el menú Análisisexploración de modelos estimados, solapa Modelos, a continuación se muestra otra
forma de calcularla. En primer lugar se obtiene el estadístico de la prueba LRT,
G = 2 log lik completo − 2 log lik reducido = 2(−228.75) − 2(−240.59) = 23.68 . Este tiene 42-
26=16 grados de libertad, y arroja un valor p=0.0967, por lo que podemos decir que no
existe interacción con un nivel de significancia del 5%. Este valor de probabilidad se
obtiene a partir de una distribución chi-cuadrado con 16 grados de libertad, y puede ser
calculado con la herramienta Calculador de probabilidades y cuantiles del menú
Estadísticas de InfoStat (Figura 75).
104
Modelos Lineales Mixtos en InfoStat
Figura 75: Ventana del Calculador de probabilidades y cuantiles de InfoStat.
Ambas pruebas (Wald y LRT) indican una interacción no significativa (aunque los
p-valores no son demasiado altos, p=0.1417 y p=0.0967 respectivamente), por lo que
podemos (con precaución) realizar pruebas de efectos de tratamiento y tiempo por
separado.
Contrastando tiempos sucesivos
Para comparar los tiempos sucesivos, es decir el tiempo 1 con el tiempo 2, el tiempo 2
con el tiempo 3 y así sucesivamente, se debe activar la solapa Comparaciones y dentro
de esta la subsolapa Contrastes y seleccionar el efecto Tiempo (Figura 76). El resto de
las ventanas debe quedar como en el Modelo 11, que fue elegido como el de mejor
estructura de correlación para explicar el comportamiento de estos datos en el tiempo.
105
Modelos Lineales Mixtos en InfoStat
Figura 76: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura
forrajes.IDB2 y selección de la subsolapa Contrastes.
Pruebas de hipótesis para contrastes
Tiempo
Ct.1
Ct.2
Ct.3
Ct.4
Total
Contraste
-9.80
-5.77
1.76
0.26
E.E.
2.25
3.51
4.02
0.45
F
gl(num)
18.94
1
2.70
1
0.19
1
0.34
1
16.77
4
gl(den)
48
48
48
48
48
p-valor
0.0001
0.1070
0.6640
0.5645
<0.0001
Las salidas presentadas aquí corresponden a las estimaciones REML. Está claro a partir
de estos resultados que, en promedio para los cuatro tratamientos, se ve un cambio
significativo entre los tiempos 1 y 2, pero en tiempos posteriores la cobertura promedio
no cambia significativamente. Las mismas conclusiones se obtienen realizando una
comparación de medias de cada tiempo (LSD):
106
Modelos Lineales Mixtos en InfoStat
Medias ajustadas y errores estándares para Tiempo
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Tiempo
3
4
5
2
1
Medias
30.29
28.53
28.27
24.53
14.73
E.E.
3.70
4.56
4.38
2.55
2.23
A
A
A
A
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Comparación de tratamientos
Medias ajustadas y errores estándares para Tratam
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Tratam
5
1
4
3
2
Medias
39.60
31.27
24.96
17.33
13.19
E.E.
5.47
5.47
5.47
5.47
5.47
A
A
A
B
B
B
C
C
C
Medias con una letra común no son significativamente diferentes (p<= 0.05)
A partir de esta comparación de medias ajustadas se puede concluir que los tratamientos
5, 1 y 4 son los que proveen mayor cobertura y no se diferencian significativamente
entre sí.
107
Modelos Lineales Mixtos en InfoStat
Análisis de un ensayo de drogas para asma
Una compañía farmacéutica ha examinado los efectos de dos drogas (A y B) sobre la
capacidad respiratoria de pacientes de asma (Littell et ál. 2002, 2006). Las dos drogas y
un placebo (P) fueron administradas a un grupo de pacientes en forma aleatoria. Se
contó con 24 pacientes por cada uno de los tres tratamientos. A cada paciente se le
midió la capacidad respiratoria basal (Cap_Rep_Bas) inmediatamente antes de aplicarle
el tratamiento y la capacidad respiratoria cada hora durante las 8 horas siguientes
(Cap_Respirat). Los datos están en el archivo CapacidadRespiratoria.IDB2.
Usando nuevamente la estrategia definida en los ejemplos anteriores, primero se
ajustarán modelos con distintas estructuras de covarianza, combinando apropiadamente
estructuras de correlación residual, heteroscedasticidad residual y efectos aleatorios.
Mediante criterios de verosimilitud penalizada (AIC y BIC) y pruebas de cociente de
verosimilitud se elegirá el modelo que mejor describa los datos. Una vez seleccionado el
modelo de estructura de covarianza adecuado se realizarán inferencias acerca de las
medias (comparar medias de drogas, estudiar el efecto del tiempo, analizar si los
perfiles promedio varían en el tiempo, si son paralelos, etc.). Es importante destacar que
toda la inferencia sobre las medias estará basada en el modelo de estructura de
covarianza seleccionado.
Debido a que la variable que identifica al paciente (Paciente) en la base de datos toma
valores iguales dentro de cada droga, para identificar a los 72 pacientes de este estudio
se ha debido crear una nueva variable (paciente_droga) que identifica completamente al
paciente. Para hacer esto se ha usado el menú Datos, submenú Cruzar categorías para
formar una nueva variable (seleccionado Paciente y Droga en la ventana del selector de
variables). Este es un experimento bifactorial y se usa un modelo que contempla los
factores Droga, Hora y su interacción y la covariable Cap_Rep_Bas (todos de efectos
fijos). Para realizar el análisis de este modelo, se deben declarar las variables de la
siguiente forma (Figura 77).
108
Modelos Lineales Mixtos en InfoStat
Figura 77: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2.
En primer lugar se evaluará un conjunto de modelos para determinar cuál es el que
mejor ajusta. Los modelos evaluados son:
1. Errores independientes y varianzas residuales homoscedásticas.
2. Simetría compuesta y varianzas residuales homoscedásticas.
3. Auto regresivo de orden 1 y varianzas residuales homoscedásticas.
4. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas.
5. Auto regresivo de orden 1 y varianzas residuales homoscedásticas y efecto aleatorio
de paciente.
6. Auto regresivo de orden 1 y varianzas residuales heteroscedásticas y efecto aleatorio
de paciente.
7. Matriz de varianzas y covarianzas sin estructura y varianzas residuales
heteroscedásticas.
La especificación de la parte fija del modelo es la misma para los 7 modelos evaluados
(Figura 78). Para obtener el ajuste del Modelo 1 solo se debe activar el botón Aceptar
con el modelo de efectos fijos presentado a continuación:
109
Modelos Lineales Mixtos en InfoStat
Figura 78: Ventana con la solapa Efectos fijos desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.
Para ajustar el Modelo 2, se deben especificar las ventanas como en la Figura 78 y la
Figura 79. El Modelo 3 se especifica como en la Figura 78 y la Figura 80. El Modelo 4
se especifica como el anterior más el agregado de varianzas residuales heterogéneas
como en la Figura 81. El Modelo 5 se especifica con las ventanas presentadas en la
Figura 78, la Figura 80 y la Figura 82. El Modelo 6 es como el Modelo 5 más la
especificacion de varianzas residuales heterogéneas (Figura 81). El modelo 7 se
especifica como se muestra en la Figura 78, Figura 81 y Figura 83).
110
Modelos Lineales Mixtos en InfoStat
Figura 79: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos
del archivo CapacidadRespiratoria.IDB2.
111
Modelos Lineales Mixtos en InfoStat
Figura 80: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los
datos del archivo CapacidadRespiratoria.IDB2.
112
Modelos Lineales Mixtos en InfoStat
Figura 81: Ventana con la solapa Heteroscedasticidad desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.
113
Modelos Lineales Mixtos en InfoStat
Figura 82: Ventana con la solapa Efectos aleatorios desplegada con los datos del archivo
CapacidadRespiratoria.IDB2.
114
Modelos Lineales Mixtos en InfoStat
Figura 83: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del
archivo CapacidadRespiratoria.IDB2.
Luego de ajustar todos los modelos estos son los resultados:
Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo
CapacidadRespiratoria.IDB2.
Modelo
Efecto
aleatorio
paciente
Correlación
residual
Varianzas
residuales
heterogéneas
en el tiempo
AIC
BIC
log lik
1
NO
NO
NO
968.94
1081.04
-458.47
2
NO
Simetría
Compuesta
NO
401.29
517.71
-173.65
3
NO
AR1
NO
329.04
445.45
-137.52
4
NO
AR1
SÍ
324.57
471.17
-128.28
5
SÍ
AR1
NO
303.03
423.76
-123.52
6
SÍ
AR1
SÍ
287.80
438.71
-108.90
7
NO
Sin estructura
SÍ
270.27
533.29
-74.14
115
Modelos Lineales Mixtos en InfoStat
A partir del Cuadro 2 podemos observar que los modelos 6 y 7 presentan los valores
más bajos de AIC mientras que los modelos 5 y 6 presentan los valores más bajos para
BIC. Una prueba formal de cociente de verosimilitud para comparar los modelos 5 y 6
puede obtenerse mediante:
X 2 = −2(log lik modelo reducido - log lik modelo completo)
=−2(−123.52 + 108.90) =29.24
Como ambos modelos difieren en 7 parámetros (el Modelo 5 tiene una única varianza
residual y el Modelo 6 tiene 8 varianzas residuales), el estadístico de verosimilitud se
compara con un valor crítico de una distribución chi-cuadrado con 7 grados de libertad.
Al hacer esto con el calculador de probabilidades y cuantiles de InfoStat obtenemos un
p-valor de 0.0001, lo que nos lleva a escoger el modelo completo (Modelo 6).
La misma prueba se puede realizar con el menú Estadísticas>>Modelos lineales
generales y mixtos>> Análisis-exploración de modelos estimados. Para comparar ambos
modelos seleccionamos la solapa Modelos y obtenemos los siguientes resultados:
Comparación de modelos
Model
5
6
df
28
35
AIC
303.03
287.80
BIC
423.76
438.71
logLik
-123.52
-108.90
Test
1 vs 2
L.Ratio
p-value
29.23
0.0001
Los resultados de la prueba del cociente de verosimilitud indican que entre estos dos
modelos el mejor es el Modelo 6. Luego, resta solo comparar el Modelo 6 con el 7. En
este caso el modelo reducido es el 6 y el completo es el 7. Los resultados para esta
comparación son:
Comparación de modelos
Model
7
6
df
61
35
AIC
270.27
287.80
BIC
533.29
438.71
logLik
-74.14
-108.90
Test
1 vs 2
L.Ratio
p-value
69.53
<0.0001
Los resultados indican que el Modelo 7 es el mejor. Por lo tanto el modelo seleccionado
tiene una estructura de correlación residual sin estructura y varianzas residuales
heterogéneas en el tiempo. La salida completa para este modelo se presenta a
continuación:
116
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo007_Cap_Respirat_REML<gls(Cap_Respirat~1+Droga+Hora+Droga:Hora+Cap_Resp_base
,weight=varComb(varIdent(form=~1|Hora))
,correlation=corSymm(form=~as.integer(as.character(Hora))|Paciente_Dro
ga)
,method="REML"
,na.action=na.omit
,data=R.data09)
Resultados para el modelo: modelo007_Cap_Respirat_REML
Variable dependiente:Cap_Respirat
Medidas de ajuste del modelo
N
576
AIC
270.27
BIC
533.29
logLik
-74.14
Sigma R2_0
0.48 0.55
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales(SC tipo III)
(Intercept)
Droga
Hora
Cap_Resp_base
Droga:Hora
numDF F-value
1
6.49
2
7.25
7
13.72
1
92.57
14
4.06
p-value
0.0111
0.0008
<0.0001
<0.0001
<0.0001
Pruebas de hipótesis secuenciales
(Intercept)
Droga
Hora
Cap_Resp_base
Droga:Hora
numDF F-value
1 3936.01
2
13.87
7
13.72
1
92.57
14
4.06
p-value
<0.0001
<0.0001
<0.0001
<0.0001
<0.0001
Estructura de correlación
Modelo de correlación: General correlation
Formula: ~ as.integer(as.character(Hora)) | Paciente_Droga
Matriz de correlación común
1
2
3
4
5
6
7
8
1
1.00
0.89
0.88
0.78
0.69
0.67
0.52
0.65
2
0.89
1.00
0.91
0.87
0.81
0.70
0.59
0.70
3
0.88
0.91
1.00
0.91
0.81
0.75
0.64
0.74
4
0.78
0.87
0.91
1.00
0.82
0.73
0.67
0.75
5
0.69
0.81
0.81
0.82
1.00
0.85
0.73
0.84
6
0.67
0.70
0.75
0.73
0.85
1.00
0.81
0.88
7
0.52
0.59
0.64
0.67
0.73
0.81
1.00
0.82
8
0.65
0.70
0.74
0.75
0.84
0.88
0.82
1.00
117
Modelos Lineales Mixtos en InfoStat
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Hora
Parámetros de la función de varianza
Parámetro
1
2
3
4
5
6
7
8
Estim
1.00
1.07
1.06
1.15
1.12
1.07
1.09
1.15
Medias ajustadas y errores estándares para Droga
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Droga Medias
B
3.33
A
3.11
P
2.82
E.E.
0.09
0.09
0.09
A
A
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Medias ajustadas y errores estándares para Hora
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Hora
1
2
3
4
5
6
7
8
Medias
3.33
3.30
3.22
3.12
3.02
2.96
2.88
2.87
E.E.
0.06
0.06
0.06
0.06
0.06
0.06
0.06
0.06
A
A
B
C
D
D
E
E
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Medias ajustadas y errores estándares para Droga*Hora
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Droga
B
B
B
A
B
A
B
A
B
A
Hora
1
2
3
1
4
2
5
3
6
5
Medias
3.69
3.63
3.58
3.47
3.44
3.39
3.25
3.18
3.08
3.05
E.E.
0.10
0.10
0.10
0.10
0.11
0.10
0.11
0.10
0.10
0.11
A
A
A
A
B
B
B
B
B
C
C
C
C
D
D
D
D
E
E
E
E
F
F
F
G
G
H
118
Modelos Lineales Mixtos en InfoStat
A
B
A
B
P
P
P
A
A
P
P
P
P
P
4
8
6
7
3
2
4
7
8
1
6
7
5
8
3.04
3.01
2.98
2.98
2.90
2.89
2.87
2.87
2.86
2.83
2.82
2.79
2.77
2.73
0.11
0.11
0.10
0.11
0.10
0.10
0.11
0.11
0.11
0.10
0.10
0.11
0.11
0.11
E
E
E
F
F
F
F
F
G
G
G
G
G
G
G
G
G
G
G
H
H
H
H
H
H
H
H
H
H
H
H
H
I
I
I
I
I
I
I
I
I
I
I
I
I
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Podemos ver que hay interacción significativa entre la droga y el tiempo (p<0.0001),
por lo que procederemos a realizar un Gráfico de interacción. Para realizar este gráfico
en primer lugar se copiaron las Medias ajustadas y errores estándares para
Droga*Hora y se pegaron en una nueva tabla de InfoStat. Esta tabla fue guardada como
MedCapRes.IDB2. Luego en el menú Gráficos>>Gráficos de puntos se declararon las
variables como se muestra a continuación (Figura 84 y Figura 85):
Figura 84: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2.
119
Modelos Lineales Mixtos en InfoStat
Figura 85: Ventana de selector de variables con solapa Particiones activada para los datos del archivo
MedCapRes.IDB2.
Es importante recalcar que debido a que los errores estándar de cada una de las
combinaciones de tratamientos y horas son diferentes éstos deben ser tenidos en cuenta
al momento de solicitar el gráfico. Esto se logra declarando la medida de error en la
subventana Error. Con estas especificaciones se obtiene el gráfico para estudiar la
interacción (Figura 86).
120
Modelos Lineales Mixtos en InfoStat
3.80
3.70
3.60
Droga A
Droga B
Placebo
Capacidad respiratoria media
3.50
3.40
3.30
3.20
3.10
3.00
2.90
2.80
2.70
2.60
1
2
3
4
5
6
7
8
Hora
Figura 86: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del
archivo CapacidadRespiratoria.IDB2.
Podemos observar que mientras el placebo tiene una respuesta prácticamente constante,
las drogas A y B aumentan la capacidad respiratoria después de su aplicación. Esta
capacidad va disminuyendo con el tiempo, y siempre es superior el valor medio de la
droga B respecto a la droga A. Para encontrar diferencias significativas entre los
tratamientos en cada una de las horas se pueden realizar contrastes. En este caso, dentro
de cada hora se pueden probar hipótesis sobre igualdad de medias entre drogas y
placebo, y entre las dos drogas. Para la obtención de los contrastes (en este caso
ortogonales) se deben declara en la solapa Comparaciones, subsolapa Contrastes como
en la Figura 87.
121
Modelos Lineales Mixtos en InfoStat
Figura 87: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo
CapacidadRespiratoria.IDB2.
A continuación se presentan lo valores de probabilidad para los contrastes solicitados:
Pruebas de hipótesis para contrastes
Droga*Hora
Ct.1
Ct.2
Ct.3
Ct.4
Ct.5
Ct.6
Ct.7
Ct.8
Ct.9
Ct.10
Ct.11
Ct.12
Ct.13
Ct.14
Ct.15
Ct.16
Total
F
gl(num)
40.08
1
2.54
1
23.46
1
2.46
1
14.55
1
7.36
1
7.39
1
6.37
1
8.11
1
1.63
1
2.86
1
0.53
1
1.09
1
0.53
1
2.13
1
0.94
1
5.19
16
gl(den)
551
551
551
551
551
551
551
551
551
551
551
551
551
551
551
551
551
p-valor
<0.0001
0.1119
<0.0001
0.1170
0.0002
0.0069
0.0068
0.0119
0.0046
0.2022
0.0914
0.4651
0.2965
0.4656
0.1446
0.3319
<0.0001
122
Modelos Lineales Mixtos en InfoStat
Los Contrastes 1, 3, 5, 7 y 9 comparan el placebo con el promedio de las drogas para las
horas 1, 2, 3 ,4 y 5 respectivamente. Debido a que todos estos son significativos
(p<0.05) podemos decir que recién a la hora 6 de aplicadas las drogas estas pierden su
efecto, ya que los contrastes 11, 13 y 15 no son significativos. Respecto a la
comparación de las drogas entres sí, la superioridad de la B sobre la A se manifiesta
(p<0.05) solo en las horas 3 y 4 (contrastes 6 y 8 respectivamente).
123
Modelos Lineales Mixtos en InfoStat
Análisis de ensayo de descomposición
En los ensayos de descomposición de hojarasca la materia seca remanente en cada
tiempo es analizada, generalmente, mediante ANCOVA, usando el tiempo como
covariable y transformación logarítmica de la respuesta, o ANOVA para un diseño en
parcelas divididas, cuando los periodos de evaluación son equi-distantes. Las unidades
de observación consisten en bolsas conteniendo el material vegetal. Usualmente estas
bolsas son agrupadas para conformar una repetición y permitir su evaluación a lo largo
del tiempo, evaluando el contenido de una bolsa en cada instancia de valoración.
Aunque en cada tiempo las bolsas evaluadas son distintas, en muchas ocasiones la
estructura de correlación que supone independencia o simetría compuesta (inducida por
la agrupación de bolsas que representan una repetición) no es suficiente para explicar
las correlaciones observadas. Las observaciones cercanas en el tiempo suelen estar más
correlacionadas que las lejanas, o las correlaciones entre observaciones en los primeros
tiempos son diferentes a las de los últimos. El uso de modelos mixtos permite no sólo
manejar estructuras de correlación más complejas sino también la posibilidad de
modelar varianzas heterogéneas. En estos modelos los tratamientos pueden ser incluidos
como factores de clasificación y el tiempo puede modelarse tanto como una covariable
o como un factor. Este último caso produce modelos menos parsimoniosos pero más
flexibles para modelar diferentes tendencias en el tiempo. Por otra parte, la introducción
de efectos aleatorios sobre los parámetros que involucran al tiempo puede ser usada
para corregir falta de ajuste.
En el ejemplo, que se presenta a continuación, se analizan un conjunto de datos
proveniente de un ensayo de descomposición realizado en ambiente acuático tropical
(Martinez 2006). Los tratamientos comparados consisten en: dos especies (Guadua sp. y
Ficus sp.) de las cuales se obtiene el material vegetal y dos tamaño de la trama de la
bolsa donde se coloca el material (tramado fino y grueso). Los cuatro tratamientos
contaron con 5 repeticiones (conteniendo 7 bolsas cada una) y fueron evaluados en 7
tiempos. El propósito de este ensayo fue establecer el efecto de los factores y el tiempo
sobre la tasa de descomposición. Los datos se encuentran en el archivo
Descomposicion.IDB2.
Los datos originales (materia seca remanente) fueron transformados a logaritmos. El
gráfico del logaritmo de la materia seca remanente (en adelante la respuesta) en función
del tiempo y para cada tratamiento (Figura 88) muestra un decaimiento del peso seco
124
Modelos Lineales Mixtos en InfoStat
remanente en función del tiempo. Se insinúa también una posible falta de
homoscedasticidad en función del tiempo y dependiente de la especie y el tramado de la
tela de la bolsa. Una primera aproximación a la modelación de estos datos podría ser el
ajuste de un modelo de regresión con ordenadas al origen y pendientes diferentes. Para
realizar este ajuste se invocó al módulo de modelos mixtos indicando como variable
dependiente al LnPesoSeco, como factores de clasificación a Especie y Bolsa y como
covariable al Tiempo. Luego en la solapa de la parte fija del modelo se indicaron los
términos que se presentan en la Figura 89. El gráfico del modelo ajustado se presenta en
la Figura 90.
1.5
1.0
0.5
0.0
LnPesoSeco
-0.5
-1.0
-1.5
-2.0
-2.5
-3.0
-3.5
-4.0
0
10
20
30
50
40
60
70
90
80
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 88: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para
los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.
125
Modelos Lineales Mixtos en InfoStat
Figura 89: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes
diferentes para el logaritmo de la materia seca remanente en función del tiempo para cuatro
tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que lo
almacena. Archivo Descomposición.IDB2.
126
Modelos Lineales Mixtos en InfoStat
1.5
1.0
0.5
0.0
LnPesoSeco
-0.5
-1.0
-1.5
-2.0
-2.5
-3.0
-3.5
-4.0
0
10
20
30
40
50
60
70
80
90
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 90: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para
los cuatro tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2.
La Figura 90 muestra que el ajuste de rectas específicas por tratamiento, es una
aproximación que, aunque plausible, no da cuenta de algunas particularidades de la
pérdida de peso seco. Esto se refleja en la presencia de curvatura en los residuos (Figura
91). Una forma de resolver el problema de la presencia de curvatura es la imposición de
un modelo que incluya términos cuadráticos para el tiempo. Para ello tendremos que
extender el modelo propuesto en Figura 89, incluyendo todos los términos
correspondientes al tiempo al cuadrado. Para simplificar la notación hemos creado tres
variables T1 y T2 que representan el tiempo y el tiempo al cuadrado y Especie_Bolsa
que identifica los cuatro tratamientos. T1 es el tiempo centrado respecto del valor 30
(días) y T2 el cuadrado de T1. La razón para centrar las covariables es romper la
colinealidad que resulta de utilizar una regresora y su cuadrado y mejorar la condición
de la matriz X’X. Las variables T1 y T2 así como Especie_Bolsa se incluyen en el
archivo Descomposición.IDB2. En la invocación del módulo de modelos mixtos debería
incluirse Especie_Bolsa como factor de clasificación y T1 y T2 como covariables.
Luego en la solapa de los efectos fijos del modelo debería verse como se muestra en la
Figura 92.
127
Modelos Lineales Mixtos en InfoStat
Figura 91: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de
la materia seca residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes
ordenadas y pendientes. Archivo Descomposición.IDB2.
Figura 92: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el
logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la
especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposición.IDB2.
128
Modelos Lineales Mixtos en InfoStat
1.50
1.00
0.50
0.00
LnPesoSeco
-0.50
-1.00
-1.50
-2.00
-2.50
-3.00
-3.50
-4.00
0
10
20
30
40
50
60
70
80
90
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 93: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes
diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado
de la bolsa que lo almacena. Archivo Descomposición.IDB2.
Los residuos del modelo ajustado según Figura 92, muestran dos problemas:
heteroscedasticidad (que depende del tiempo y los tratamientos) y falta de ajuste, ya que
para algunos tratamientos y tiempos, los residuos de Pearson aparecen por encima o por
debajo de la línea del cero (Figura 94).
En este punto optaremos por modelar primeramente, el problema de heteroscedasticidad
utilizando varianzas diferentes para cada combinación Especie-Bolsa. Para ello, en la
ventana de especificación del modelo dejaremos la parte fija tal cual se indicó en la
Figura 92, pero en la solapa Heteroscedasticidad indicaremos que la varianza debe ser
estimada de manera diferente para la combinación de tiempo y tratamiento según se
muestra en la Figura 95. Los residuos estudentizados vs. tiempo para este modelo se
presentan en la (Figura 96). Aún cuando se pudo subsanar, en gran medida, el problema
de la heteroscedasticidad, persisten problemas de falta de ajuste que se visualizan en
conjuntos de residuos de un único tratamiento en un tiempo dado que quedan ya sean
todos positivos o negativos.
129
Modelos Lineales Mixtos en InfoStat
4.00
Residuos LnPesoSeco (Pearson)
3.00
2.00
1.00
0.00
-1.00
-2.00
-3.00
-4.00
-5.00
-6.00
-7.00
0
23
45
68
90
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 94: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de
orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en
función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.
Figura 95: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2
con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del
tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material
vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.
130
Modelos Lineales Mixtos en InfoStat
Una forma de resolver esta falta de ajuste, es agregar efectos aleatorios sobre el nivel
medio para las combinaciones de tiempo y tratamientos. Si en la solapa Efectos
aleatorios agregamos
Tiempo_Especie_Bolsa
y dejamos tildado
el casillero
correspondiente a la Constante estamos indicando que se trata de un corrimiento
aleatorio respecto al valor esperado para cada tratamiento y tiempo bajo el modelo de
regresión utilizado (Figura 97). Finalmente, el gráfico de residuos estudentizados de
este modelo muestra una imagen donde no hay evidencia de falta de ajuste o presencia
de heteroscedasticidad (Figura 98).
Residuos LnPesoSeco (Pearson)
2.50
1.25
0.00
-1.25
-2.50
68
45
23
0
90
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 96: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión
con ordenadas y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente
en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de
origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.
131
Modelos Lineales Mixtos en InfoStat
Figura 97: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de
orden 2 con ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en
función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2.
Residuos LnPesoSeco (Pearson)
2.50
1.25
0.00
-1.25
-2.50
0
10
20
30
50
40
60
70
80
90
Tiempo
Ficus:Fino
Ficus:Grueso
Guadua:Fino
Guadua:Grueso
Figura 98: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión
con ordenadas y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la
constante que es particular para cada combinación de tiempo y tratamiento, para el logaritmo de la
materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos
dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposición.IDB2.
132
Modelos Lineales Mixtos en InfoStat
Finalmente, como el propósito de este ensayo fue calcular las tasas de descomposición y
lo que hemos ajustado es un modelo lineal para el logaritmo del peso de materia seca
remanente, podemos estimar la tasa de descomposición como la derivada de
-exp(modelo ajustado). Utilizaremos la interfase con R para obtener estas derivadas.
Apretando la tecla F9 se invoca la ventana del intérprete de R (Figura 99). A la derecha
de la ventana aparecerán una lista de los objetos R que se hayan creado durante la sesión
de trabajo. En esta lista debe aparecer el modelo ajustado utilizando el modulo de
modelos mixtos, el nombre de estos objetos es “modelo”+ número correlativo_nombre
de la variable dependiente_método de estimación. En nuestro ejemplo debería aparecer
modelo#_LnPesoSeco_REML
(en la posición # debe haber un número que depende del
número de veces que se ajusto un modelo para la misma variable dependiente). En el
ejemplo figura el modelo modeloOO1_LnPesoSeco_REML.
Figura 99: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren
ejecutar. Output: la salida de la ejecución de un script o de la visualización de un objeto, Objetos: la
lista de los objetos residente en la memoria de R. Finalmente un panel inferior muestra los mensajes y
reporte de errores que envía R a la consola.
Para calcular las tasas de descomposición tenemos que comprender qué es lo que hemos
ajustado con el modelo lineal estimado. La parte fija de modelo propuesto fue:
133
Modelos Lineales Mixtos en InfoStat
Especie_Bolsa
T1
T2
Especie_Bolsa*T1
Especie_Bolsa*T2
Este modelo es equivalente a:
Especie_Bolsa-1
Especie_Bolsa*T1
Especie_Bolsa*T2
La ventaja de esta forma resumida de especificarlo es que los coeficientes de la parte
fija aparecen directamente como en la equación (10).
Este modelo especifica una regresión polinómica de segundo grado en el tiempo
(centrado alrededor de 30 días) para cada una de las combinaciones de Especie y
tramado de Bolsa. Así, lo que estimamos es una función de la forma:
ln PesoSeco = βi 0 + βi1 (T − 30 ) + βi 2 (T − 30 )
2
(10)
Donde el índice i indica el tratamiento (en este caso i identifica a las cuatro
combinaciones de Especie y tramado de Bolsa). Es decir que vamos a tener una
ecuación como (10) específica para cada condición. Los coeficientes estimados de la
parte fija pueden obtenerse durante la estimación del modelo tildando, en la solapa
Efectos fijos, la opción Mostrar coeficientes de la parte fija.
Como vamos a utilizar R para calcular las derivadas de (10), revisaremos estos
coeficientes desde R. Si en la ventana Script escribimos:
Modelo004_LnPesoSeco_REML$coefficients$fixed
y apretamos al final de la línea Shift Enter aparecerá en el output la siguiente salida:
Especies_BolsaFicus_Fino
-0.7738921650
Especies_BolsaGuadua_Fino
0.8162357629
Especies_BolsaFicus_Fino:T1
Especies_BolsaFicus_Grueso
-1.3680878569
Especies_BolsaGuadua_Grueso
0.7630705376
Especies_BolsaFicus_Grueso:T1
134
Modelos Lineales Mixtos en InfoStat
-0.0326126598
-0.0508364778
Especies_BolsaGuadua_Fino:T1 Especies_BolsaGuadua_Grueso:T1
-0.0086055613
-0.0192635993
Especies_BolsaFicus_Fino:T2 Especies_BolsaFicus_Grueso:T2
0.0002938702
0.0004422140
Especies_BolsaGuadua_Fino:T2 Especies_BolsaGuadua_Grueso:T2
0.0000571603
-0.0002451274
Los primeros 4 coeficientes (leyendo de izquierda a derecha), corresponden a las
ordenadas
al
origen
( βi 0 )
de:
Ficus_Fino,
Ficus_Grueso,
Guadua_Fino
y
Guadua_Grueso.
Los segundos 4 coeficientes (-0.0326126598,…,,-0.0192635993) son los coeficientes
( βi1 )
del término lineal de (10) y los últimos 4 (0.0002938702,…, -0.0002451274) son
los coeficientes
( βi 2 )
del término cuadrático en (10). Por ejemplo, el peso seco
remanente para la Especie Ficus con Bolsa de tramado Fino la ecuación será:
ln PesoSeco =
−0.7738921651 − 0.0326126598 (T − 30) + 0.0002938702(T − 30) 2
Como la función (10) representa el peso seco remanente, el peso descompuesto debería
calcularse como:
(
)
(11)
+ 2 βi 2 (T − 30 ) )
(12)
PesoSecoConsumido
= PesoInicial − exp βi 0 + βi1 (T − 30 ) + βi 2 (T − 30 )
2
En tanto la tasa de descomposición, sería la derivada de esta función, es decir:
(
TasaDescomp =
− exp βi 0 + βi1 (T − 30 ) + βi 2 (T − 30 )
2
)(β
i1
El siguiente script genera una tabla cuya primera columna es el tiempo y las restantes
las tasas de descomposición para cada uno de los tratamientos. Tener en cuenta que se
debe especificar el modelo que mejor ajustó (en nuestro caso modelo004):
a=modelo004_LnPesoSeco_REML$coefficients$fixed
T=seq(0,90,1)
dFF = -exp(a[1]+(T-30)*a[5]+(T-30)*(T-30)*a[9]) *(a[5]+2*(a[9] *(T-30)))
dFG = -exp(a[2]+(T-30)*a[6]+(T-30)*(T-30)*a[10])*(a[6]+2*(a[10]*(T-30)))
dGF = -exp(a[3]+(T-30)*a[7]+(T-30)*(T-30)*a[11])*(a[7]+2*(a[11]*(T-30)))
dGG = -exp(a[4]+(T-30)*a[8]+(T-30)*(T-30)*a[12])*(a[8]+2*(a[12]*(T-30)))
Tasas=as.data.frame=cbind(T,dFF,dFG,dGF,dGG)
135
Modelos Lineales Mixtos en InfoStat
En la lista de objetos aparecerán los objetos a, T, dFF, dFG, dGF, dGG y Tasas.
Haciendo clic sobre Tasas, con el botón derecho del ratón aparecerá un menú de
acciones entre las que se encuentra Convertir matriz, data frame o vector a tabla
InfoStat. Seleccionando esta opción obtendremos una nueva tabla InfoStat como la que
se muestra a la derecha de este párrafo.
Utilizando el submenú Diagrama de dispersión en el menú Gráficos podemos obtener
una representación de las tasas de descomposición. Para ello se asignaron las variables
dFF, dFG, dGF y dGG al Eje Y y la variable T al Eje X, en la ventana de diálogo
emergente del submenú Diagrama de dispersión (Figura 100).
136
Modelos Lineales Mixtos en InfoStat
0.15
Tasa de descomposición
0.14
0.13
0.12
0.11
0.10
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
0
10
20
30
50
40
60
70
80
90
Tiempo
Ficus Fino
Ficus Grueso
Guadua Fino
Guadua Grueso
Figura 100: Curvas de tasas de descomposición según especie y tramado de la bolsa de
almacenamiento.
137
Modelos Lineales Mixtos en InfoStat
Uso de modelos mixtos para el control de la variabilidad espacial en
ensayos agrícolas
Correlación espacial
La estratificación o bloqueo de parcelas es una técnica usada para controlar los efectos
de variación entre las unidades experimentales. Los bloques son grupos de unidades
experimentales formados de manera tal que las parcelas dentro de los bloques sean lo
más homogéneas posible. Los diseños con estratificación de parcelas tales como el
diseño en bloques completos aleatorizados (DBCA), los diseños en bloques incompletos
y los látices son más eficientes que el diseño completamente aleatorizado cuando las
diferencias entre unidades experimentales que conforman un mismo estrato (bloque) son
mínimas y las diferencias entre los estratos son máximas. Cuando esta condición no se
cumple puede ocurrir una sobrestimación de la varianza del error y, si los datos son
desbalanceados, también puede presentarse un sesgo en las estimaciones de los efectos
de tratamientos. Cuando se evalúan muchos tratamientos en parcelas a campo, el
tamaño de los bloques necesarios para lograr una repetición del ensayo es grande y por
tanto resulta difícil asegurar la homogeneidad de las parcelas que conforman el bloque;
las parcelas más próximas pueden ser más similares que las más distantes, generando
variabilidad espacial (Casanoves et ál. 2005). La variabilidad espacial se refiere a la
variación entre observaciones realizadas sobre parcelas con arreglos espaciales sobre el
terreno. Debido a la existencia de variabilidad espacial dentro de bloques, el análisis de
varianza estándar para los diseños que involucran el bloqueo de unidades
experimentales no siempre elimina los sesgos en las comparaciones de efectos de
tratamientos. La variación de parcela a parcela dentro de un mismo bloque puede
deberse a competencia, heterogeneidad en la fertilidad del suelo, dispersión de insectos,
malezas, enfermedades del cultivo o labores culturales, entre otros. Por este motivo se
han propuesto procedimientos estadísticos que contemplan la variación espacial entre
parcelas y que van desde el ajuste de medias de tratamientos en función de lo observado
en las parcelas vecinas más cercanas (Papadakis 1937), hasta el uso de modelos que
contemplan las correlaciones espaciales en términos del error y que también producen
ajustes de medias de tratamientos (Mead 1971, Besag 1974, 1977, Ripley 1981).
Gilmour et ál. (1997) particionan la variabilidad espacial entre parcelas de un ensayo en
variabilidad espacial local y global. La variabilidad espacial local hace referencia a las
138
Modelos Lineales Mixtos en InfoStat
diferencias entre parcelas a pequeña escala, donde se contemplan las variaciones intrabloque. La tendencia espacial local y la heterogeneidad residual se modelan mediante la
matriz de varianza y covarianza residual. A través de un sistema de coordenadas
bidimensionales es posible definir la ubicación de las parcelas en el campo.
La modelación de la estructura espacial de parcelas a partir de funciones de distancia
puede realizarse en el contexto de los modelos lineales mixtos (Zimmerman y Harville
1991, Gilmour et ál. 1997, Cullis et ál. 1998), donde además de contemplar la estructura
de correlación entre observaciones provenientes de distintas parcelas es posible modelar
heterogeneidad de varianza residual. Esto es muy útil en los ensayos comparativos de
rendimiento ya que estos se llevan a cabo en distintos ambientes. Si la correlación solo
depende de la distancia (magnitud y/o dirección de las distancias), los modelos que
estiman las covarianzas entre observaciones se denominan estacionarios. Las funciones
de correlación para modelos estacionarios pueden ser isotrópicas o anisotrópicas. Las
primeras son idénticas en cualquier dirección (sólo dependen de la magnitud de las
distancias) mientras que las segundas permiten diferentes valores de sus parámetros en
diferentes direcciones (i.e. dependen también de la dirección sobre la cual se calculan
las distancias).
Análisis de un ensayo comparativo de rendimientos en maní
Para ejemplificar las alternativas de análisis usaremos los datos que se encuentran en el
archivo ECRmaní.IDB2 y provienen de un año agrícola de un ensayo comparativo de
rendimientos (ECR) de líneas experimentales (genotipos) de maní (Arachis hypogaea
L.) del Programa de Mejoramiento de Maní de la EEA-Manfredi, INTA, Argentina. En
cada campaña los ECR se realizaron en tres localidades del área de cultivo en la
provincia de Córdoba: Manfredi, General Cabrera y Río Tercero. El conjunto de líneas
evaluadas fue el mismo para cada localidad. En cada una de las tres localidades los
ensayos fueron conducidos según un DBCA con cuatro repeticiones, registrándose los
valores de rendimiento en grano (kg/parcela).
Los datos de rendimiento fueron analizados usando distintas modificaciones del
siguiente modelo:
yijk = µ + τ i + γ j + ηk + δ jk + ϕik + ε ijk ; i = 1,..,16; j = 1,..., 4; k = 1,...,3
(13)
139
Modelos Lineales Mixtos en InfoStat
donde yijk representa la respuesta observada en i-ésimo nivel del factor genotipo,
j-ésimo nivel de factor bloque, y k-ésimo nivel del factor localidad, µ representa la
media general de la respuesta, τ i representa el efecto del i-ésimo nivel del factor
genotipo, γ j representa el efecto del j-ésimo nivel del factor bloque, η k el k-ésimo nivel
del factor localidad y ϕik la interacción entre los factores genotipo y localidad, δ ik el
efecto de bloque dentro de localidad, y ε ijkl representa el error experimental. La
(
)
suposición usual es que ε ijkl ~ N 0, σ ε2 .
Excepto por εijk y los efectos de bloque (cuando son considerados aleatorios) en la
mayoría de los casos, todos los factores del modelo serán considerados como de efectos
fijos. Esto tiene la finalidad de restringir la comparación de los modelos a su estructura
de parcelas. Las distintas estructuras de parcela inducen una estructura de correlación
entre las observaciones que puede ser contemplada en el marco de los modelos mixtos,
incluyendo técnicas de análisis para el control de la variabilidad espacial.
Se usarán las siguientes estructuras de covarianza para los datos (covarianza marginal):
1. Modelo BF: Efecto de Bloques fijos, errores independientes y varianza entre
localidades constante.
2. Modelo BA: Efecto de Bloques aleatorios, errores independientes y varianza entre
localidades constante.
3. Modelo BFH: Efecto de Bloques fijos, errores independientes y varianzas diferentes
entre localidades.
4. Modelo BAH: Efecto de Bloques aleatorios, errores independientes y varianzas
diferentes entre localidades.
5. Modelo Exp: Correlación espacial exponencial sin efecto de bloques y varianza entre
localidades constante.
6. Modelo BFExp: Correlación espacial exponencial, efecto de bloques fijos, y varianza
entre localidades constante.
7. Modelo ExpH: Correlación espacial exponencial sin efecto de bloques y varianzas
diferentes entre localidades.
8. Modelo Gau: Correlación espacial Gaussiana sin efecto de bloques y varianza entre
localidades constante.
9. Modelo Esf: Correlación espacial esférico sin efecto de bloques y varianza entre
localidades constante.
En los dos primeros modelos los εijk se asumirán como independientes con varianza
constante σ2, i.e. se supone que no existe variación espacial local (intrabloque) y
además existe homogeneidad de varianzas residuales entre localidades. Los efectos de
140
Modelos Lineales Mixtos en InfoStat
bloque serán considerados fijos y aleatorios, denotando los procedimientos como
Modelo BF y Modelo BA respectivamente.
Los procedimientos denotados como Modelo BFH y Modelo BAH se basarán también
en un modelo para un DBCA pero contemplando la posibilidad de varianzas residuales
heterogéneas según los distintos niveles del factor localidad.
El quinto procedimiento consistirá en ajustar para cada localidad un modelo de
correlación espacial isotrópico con función de correlación potencia (Modelo Exp) sin
declarar el efecto de bloques. Este modelo supone que la función exponencial no solo
contemplará la variación intrabloque sino también la variación entre bloques.
El sexto procedimiento fue igual al anterior pero agregando un efecto fijo de bloque
(Modelo BFExp).
El séptimo modelo consistió en un modelo como el Exp pero permitiendo la posibilidad
de varianzas (y correlaciones) diferentes para cada localidad.
Los dos últimos procedimiento consistirán en ajustar para cada localidad un modelo de
correlación espacial isotrópico con función de correlación Gaussiana (Modelo Gau) y
con función de correlación Esférica, sin declarar el efecto de bloques.
En todos los casos se utilizó estimación REML. En el selector de variables se indica al
rendimiento (Rendim) como dependiente y bloque, local y geno como clasificatorias.
Para ajustar el Modelo BF, en la solapa de efectos fijos se deben declarar los efectos
como se muestra en la Figura 101. No se declara nada en el resto de las solapas.
Para ajustar el Modelo BA, en la solapa efectos fijos y efectos aleatorios debe declararse
los factores como se presenta en la Figura 102 y Figura 103 respectivamente. No se
declara nada en el resto de las solapas.
141
Modelos Lineales Mixtos en InfoStat
Figura 101: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2
y el Modelo BF.
Figura 102: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2
y el Modelo BA.
142
Modelos Lineales Mixtos en InfoStat
Figura 103: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo
ECRmaní.IDB2 y el Modelo BA.
Los modelos BFH y BAH contemplan errores independientes y varianzas entre
localidades diferentes. Para especificar estos modelos, se procede igual que en los dos
casos anteriores (i.e. BF y BA) pero agregando una función varIdent en la solapa
Heteroscedasticidad, indicando como criterio de agrupamiento a la localidad (local).
Una vez declarada la función y el criterio de agrupamiento hacer clic en Agregar
(Figura 104).
143
Modelos Lineales Mixtos en InfoStat
Figura 104: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento
para los datos del archivo ECRmaní.IDB2 y los Modelos BFH y BAH.
El quinto modelo no incluye el efecto de bloque y modela la variabilidad entre bloques
e intra-bloque por medio de una función exponencial isotrópica (modelo Exp) con
varianzas constantes entre localidades. Par usar la función exponencial deberemos
agregar al modelo las variables que denotan las coordenadas espaciales. Para esto en el
selector de variables debemos colocar las variables la y lon en Covariables. En la solapa
Efectos fijos dejamos geno, local y geno*local y en la solapa Efectos aleatorios no se
declara ningún factor. En la solapa Heteroscedasticidad no debe quedar ninguna
función declarada. Para declarar la correlación espacial tipo exponencial, en la solapa
Correlación se debe seleccionar la función correspondiente y declarar las coordenadas
en X y en Y, y el criterio de agrupamiento, en este caso local, ya que hay un sistema de
coordenadas dentro de cada localidad (Figura 105).
144
Modelos Lineales Mixtos en InfoStat
Figura 105: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e
Y respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y
los Modelos Exp y BFExp.
El sexto modelo, Modelo BFExp, es igual que el anterior pero declarando los efectos de
bloque dentro de localidad como fijos (como en la Figura 101). La inclusión de los
bloques fijos restringe la modelación de la variación espacial únicamente a la variación
dentro de bloque. La variación entre bloques está siendo contemplada, en un sentido
clásico, por la inclusión de los bloques en la parte fija. Así, declarar como coordenadas
del modelo de correlación espacial a la y lon, parece redundante ya que bastaría con
declarar sólo lon (coordenada que varia dentro de bloque). Sin embargo para omitir la
coordenada la sería necesario declara un nuevo criterio de estratificación consistente en
la combinación de los niveles de local y bloque. Esta forma alternativa produce
idénticos resultados a los mostrados en el modelo BFExp.
El séptimo modelo, modelo ExpH, es como el modelo Exp pero permitiendo varianzas
heterogéneas entre las localidades (como en la Figura 104). Los modelos Gau y Esf se
ajustan al igual que el Exp sin el efecto de bloque, y como se muestra en la Figura 105,
145
Modelos Lineales Mixtos en InfoStat
pero eligiendo la función de correlación espacial Gaussiana y esférica respectivamente.
En la solapa Heteroscedasticidad no debe quedar nada declarado.
A continuación se presentan las salidas con las medidas de ajuste de los diferentes
modelos.
Modelo BF
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,method="REML"
,na.action=na.omit
,data=R.data00)
Resultados para el modelo: modelo000_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
299.71
BIC
468.22
logLik
-91.86
Sigma R2_0
0.35 0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
local
geno
local:geno
local:bloque
numDF F-value
1 8372.75
2 280.56
15
6.02
30
4.32
9
4.77
p-value
<0.0001
<0.0001
<0.0001
<0.0001
<0.0001
Modelo BA
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo001_rendim_REML<-lme(rendim~1+local+geno+local:geno
,random=list(bloque_local=pdIdent(~1))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo001_rendim_REML
Variable dependiente:rendim
146
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
192
AIC
283.41
BIC
431.90
logLik
-91.71
Sigma R2_0
0.35 0.81
R2_1
0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
local
geno
local:geno
numDF denDF F-value
1
135 1754.21
2
9
58.78
15
135
6.02
30
135
4.32
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|bloque_local
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.49
Modelo BFH
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo002_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,weight=varComb(varIdent(form=~1|local))
,method="REML"
,na.action=na.omit
,data=R.data00)
Resultados para el modelo: modelo002_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
303.44
BIC
477.75
logLik
-91.72
Sigma R2_0
0.36 0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
numDF F-value
(Intercept)
1 8547.37
local
2 292.67
geno
15
6.02
local:geno
30
4.36
local:bloque
9
4.76
Estructura de varianzas
p-value
<0.0001
<0.0001
<0.0001
<0.0001
<0.0001
147
Modelos Lineales Mixtos en InfoStat
Modelo de varianzas: varIdent
Formula: ~ 1 | local
Parámetros de la función de varianza
Parámetro
gralcabr
manf
rio3
Estim
1.00
0.92
0.96
Modelo BAH
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo003_rendim_REML<-lme(rendim~1+local+geno+local:geno
,random=list(bloque_local=pdIdent(~1))
,weight=varComb(varIdent(form=~1|local))
,method="REML"
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo003_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
287.12
BIC
441.55
logLik
-91.56
Sigma R2_0
0.36 0.81
R2_1
0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
local
geno
local:geno
numDF denDF F-value
1
135 1765.74
2
9
59.53
15
135
6.01
30
135
4.36
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|bloque_local
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.46
Estructura de varianzas
148
Modelos Lineales Mixtos en InfoStat
Modelo de varianzas: varIdent
Formula: ~ 1 | local
Parámetros de la función de varianza
Parámetro
gralcabr
manf
rio3
Estim
1.00
0.92
0.95
Modelo Exp
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo004_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)
Resultados para el modelo: modelo004_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
273.43
BIC
421.92
logLik
-86.72
Sigma R2_0
0.39 0.81
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
geno
local
geno:local
numDF F-value
1 1687.54
15
7.27
2
56.18
30
5.33
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
0.96
149
Modelos Lineales Mixtos en InfoStat
Modelo BFExp
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo005_rendim_REML<-gls(rendim~1+geno+local+local:geno+local/bloque
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)
Resultados para el modelo: modelo005_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
284.85
BIC
456.26
logLik
-83.42
Sigma R2_0
0.35 0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
geno
local
geno:local
local:bloque
numDF F-value
1 2785.57
15
7.86
2
92.79
30
5.74
9
3.46
p-value
<0.0001
<0.0001
<0.0001
<0.0001
0.0007
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
0.78
150
Modelos Lineales Mixtos en InfoStat
Modelo ExpH
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo006_rendim_REML<-gls(rendim~1+geno+local+local:geno
,weight=varComb(varIdent(form=~1|local))
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)
Resultados para el modelo: modelo006_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
275.01
BIC
429.44
logLik
-85.50
Sigma R2_0
0.43 0.81
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
geno
local
geno:local
numDF F-value
1 1633.46
15
7.15
2
61.51
30
5.53
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
0.99
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | local
Parámetros de la función de varianza
Parámetro
gralcabr
manf
rio3
Estim
1.00
0.85
0.81
151
Modelos Lineales Mixtos en InfoStat
Modelo Gau
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo007_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corGaus(form=~as.numeric(as.character(la))+as.numeric(as.
character(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)
Resultados para el modelo: modelo007_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
277.81
BIC
426.30
logLik
-88.90
Sigma R2_0
0.37 0.81
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
geno
local
geno:local
numDF F-value
1 3399.06
15
7.36
2 113.57
30
4.97
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Estructura de correlación
Modelo de correlación: Gaussian spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
0.87
152
Modelos Lineales Mixtos en InfoStat
Modelo Esf
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo008_rendim_REML<-gls(rendim~1+geno+local+local:geno
,correlation=corSpher(form=~as.numeric(as.character(la))+as.numeric(as
.character(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data05)
Resultados para el modelo: modelo008_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
277.72
BIC
426.21
logLik
-88.86
Sigma R2_0
0.38 0.81
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
geno
local
geno:local
numDF F-value
1 3170.04
15
7.61
2 105.96
30
5.15
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Estructura de correlación
Modelo de correlación: Spherical spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
1.91
Comparación de los modelos ajustados
Debido a que los modelos ajustados tienen distintas componentes en su parte fija, se
compararán por medio de los criterios AIC y BIC aquellos que comparten los mismos
efectos fijos. En primer lugar se comparan entonces el BF, BFH y BFExp (Cuadro 3).
153
Modelos Lineales Mixtos en InfoStat
Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los
datos del archivo ECRmani.IDB2
Modelo
AIC
BIC
BF
299.72
468.22
BFH
303.44
477.75
BFExp
284.85
456.26
Para este grupo de modelos que contemplan efecto de bloques fijos se puede ver que el
modelo con bloques fijos más una función de correlación exponencial provee el mejor
ajuste. Esto implica la existencia de una correlación intra-bloque que es removida por la
función de correlación exponencial. También se puede observar que no hay una mejora
en estos modelos al permitir varianzas heterogéneas entre localidades (BF respecto a
BFH). Si se calculan las varianzas a partir de los coeficientes para las distintas
localidades se puede ver que estas son realmente similares:
Varianza de gralcabr = (1*0.36)2 = 0.129
Varianza de manf = (0.92*0.36)2 = 0.109
Varianza de rio3 = (0.96*0.36)2 = 0.119
Los restantes 6 modelos se pueden comparar entre sí ya que todos comparten los
mismos efectos fijos, i.e. geno, local y geno*local (Cuadro 4).
Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los
datos del archivo ECRmani.IDB2
Modelo
AIC
BIC
BA
283.41
431.90
BAH
287.12
441.55
Exp
273.43
421.92
ExpH
275.01
429.44
Gau
277.81
426.30
Esf
277.72
426.21
154
Modelos Lineales Mixtos en InfoStat
Dentro de los modelos que contemplan efectos de bloque aleatorio se puede ver
nuevamente que al permitir varianzas heterogéneas entre localidades el modelo no
mejora, ya que AIC y BIC son más pequeños en BA comparados con BAH. Lo mismo
ocurre cuando sólo se modela la variabilidad espacial por medio de una función de
correlación exponencial, ya que al permitir varianzas heterogéneas (ExpH) no se logra
una mejoría respecto a Exp.
Comparando distintos modelos de correlación espacial, no se encontraron diferencias
importantes para AIC y BIC entre los modelos Gau y Esf, pero estos criterios tuvieron
valores inferiores para la función de correlación espacial exponencial. Este último
modelo fue el de mejor ajuste dentro de los modelos sin efecto de bloque fijo.
Si bien el primer grupo de modelos (BF, BFH y BFExp) no son comparables por medio
de AIC y BIC con este último grupo, el investigador deberá poder discernir si sus
bloques deben ser considerados fijos o aleatorios. La elección de uno u otro grupo de
modelos tendrá efecto sobre las inferencias que se realicen. Esto se visualiza fácilmente
al ver que los errores estándar usados para las comparaciones de medias cambian entre
los modelos. Una discusión más detallada sobre la elección de bloques fijos o aleatorios
puede encontrarse en Casanoves et ál. (2007).
En este ejemplo los mejores modelos dentro de cada grupo (i.e. BFExp y Exp para el
primero y segundo grupo de modelos respectivamente) tienen la misma estructura de
covarianza pero difieren en su parte fija: unos contienen el efecto de bloque y otros no.
Para decidir cuál de los dos modelos es el que conviene, podemos realizar una prueba de
cociente de verosimilitudes, usando las estimaciones por ML para los modelos con y sin
efectos de bloque (recordemos que para comparar modelos con distintos efectos fijos se
debe usar ML):
Modelo con bloque (completo BFExp):
Medidas de ajuste del modelo
N
192
AIC
163.82
BIC
356.01
logLik
-22.91
Sigma R2_0
0.29 0.86
logLik
-41.43
Sigma R2_0
0.34 0.81
AIC y BIC menores implica mejor
Modelo sin bloque (reducido Exp):
Medidas de ajuste del modelo
N
192
AIC
182.85
BIC
345.73
AIC y BIC menores implica mejor
155
Modelos Lineales Mixtos en InfoStat
Así, el estadístico G =
2 log lik completo − 2 log lik reducido =−
2 ( 22.91 + 41.43) =
37.04 con 9
grados de libertad, y un valor p<0.0001, por lo que podemos decir, con una
significancia del 5%, que conviene dejar el efecto de bloques fijos y la función de
correlación exponencial. La comparación se puede hacer manualmente, o utilizando el
módulo Análisis exploratorio de un modelo estimado. Seleccionando la solapa, Modelos
y tildando los modelos estimados correspondientes a BFExp y ExP, se obtienen la salida
mostrada a continuación.
Comparación de modelos
modelo009_rendim_ML
modelo010_rendim_ML
Model
1
2
df
59
50
logLik
-22.91
-41.43
Test
1 vs 2
L.Ratio
p-value
37.04
<0.0001
A continuación se presenta la salida completa correspondiente al modelo BFExp. Las
pruebas de hipótesis para la interacción entre genotipo y localidad son significativas
(p<0.0001) por lo que la recomendación de un genotipo puede cambiar dependiendo de
la localidad. Puede observarse que debido al ajuste de la función de correlación espacial
los EE de los genotipos no son únicos. Las comparaciones múltiples presentadas se
realizaron mediante la aplicación del procedimiento DGC (Di Rienzo et ál. 2002). Esta
procedimiento fue adaptado para contemplar las particularidades de la estructura de
correlación entre estimaciones emergente de los modelos mixtos. La aplicación de este
procedimiento es recomendada por el gran número de medias a comparar, ya que
asegura una interpretación más sencilla que la que puede obtenerse de la aplicación de
un test tipo LSD de Fisher. Para hacer recomendaciones se pueden usar las
comparaciones de medias de las combinaciones de localidades y genotipos como así
también el grafico de interacción (Figura 106).
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo010_rendim_REML<-gls(rendim~1+local+geno+local:geno+local/bloque
,correlation=corExp(form=~as.numeric(as.character(la))+as.numeric(as.c
haracter(lon))|local
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data03)
156
Modelos Lineales Mixtos en InfoStat
Resultados para el modelo: modelo010_rendim_REML
Variable dependiente:rendim
Medidas de ajuste del modelo
N
192
AIC
284.85
BIC
456.26
logLik
-83.42
Sigma R2_0
0.35 0.86
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
local
geno
local:geno
local:bloque
numDF F-value
1 2785.57
2
92.79
15
7.86
30
5.74
9
3.46
p-value
<0.0001
<0.0001
<0.0001
<0.0001
0.0007
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(la)) +
as.numeric(as.character(lon)) | local
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
0.78
Medias ajustadas y errores estándares para local
DGC (alfa=0.05)
local
manf
gralcabr
rio3
Medias
3.00
2.27
1.56
E.E.
0.08
0.08
0.08
A
B
C
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Medias ajustadas y errores estándares para geno
DGC (alfa=0.05)
geno
mf435
mf407
mf429
mf415
mf420
mf421
mf431
mf405
manf68
mf408
manf393
colirrad
mf404
mf433
mf432
mf410
Medias
2.73
2.59
2.51
2.49
2.38
2.36
2.34
2.31
2.24
2.22
2.22
2.21
2.14
1.96
1.96
1.78
E.E.
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
0.10
A
A
A
A
B
B
B
B
B
B
B
B
B
C
C
C
Medias con una letra común no son significativamente diferentes (p<= 0.05)
157
Modelos Lineales Mixtos en InfoStat
Medias ajustadas y errores estándares para local*geno
DGC (alfa=0.05)
local
manf
manf
manf
manf
manf
manf
manf
manf
manf
manf
gralcabr
manf
manf
gralcabr
gralcabr
manf
gralcabr
manf
gralcabr
manf
gralcabr
gralcabr
gralcabr
gralcabr
gralcabr
gralcabr
gralcabr
rio3
rio3
manf
rio3
gralcabr
rio3
rio3
gralcabr
gralcabr
rio3
rio3
rio3
gralcabr
rio3
rio3
rio3
rio3
rio3
rio3
rio3
rio3
geno
mf407
mf421
mf405
mf431
mf435
manf68
mf420
mf429
colirrad
manf393
mf435
mf408
mf415
mf420
mf404
mf433
mf415
mf410
mf429
mf432
mf421
mf408
manf393
mf407
mf405
mf431
manf68
mf435
mf415
mf404
mf429
colirrad
mf432
mf407
mf410
mf433
mf404
mf431
colirrad
mf432
mf433
manf68
mf408
manf393
mf405
mf420
mf421
mf410
Medias
3.67
3.54
3.38
3.28
3.24
3.23
3.17
3.08
3.05
3.02
2.96
2.90
2.90
2.82
2.71
2.64
2.61
2.53
2.52
2.48
2.42
2.32
2.30
2.30
2.25
2.05
2.04
1.99
1.98
1.97
1.93
1.92
1.89
1.81
1.79
1.77
1.74
1.70
1.64
1.50
1.47
1.45
1.44
1.33
1.32
1.16
1.14
1.02
E.E.
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
0.17
A
A
B
B
B
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
D
D
D
D
D
E
E
E
E
E
E
E
E
E
Medias con una letra común no son significativamente diferentes (p<= 0.05)
158
Modelos Lineales Mixtos en InfoStat
Rendimiento (kg/parcela)
4
3
2
1
mf407
mf421
mf405
mf435
manf68
mf431
mf420
colirrad
mf429
mf408
manf393
mf415
mf433
mf410
mf432
mf404
0
Genotipo
Manfredi
General Cabrera
Río Tercero
Figura 106: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la
variable Rendimiento.
159
Modelos Lineales Mixtos en InfoStat
Aplicaciones de modelos mixtos en otros diseños experimentales
Diseño en franjas (strip-plot)
El diseño strip-plot es un resultado de las restricciones a la aleatorización. Al igual que
en el diseño en parcelas divididas, el strip-plot es un resultado de cómo fue llevado a
cabo un experimento que involucra dos o más factores. Estos factores (o sus
combinaciones) se aplican en diferentes etapas, generalmente 2, y las restricciones a la
aleatorización producen las unidades experimentales de diferentes tamaños y por ende
diferentes términos de error para cada una de los factores o sus combinaciones (Milliken
y Johnson 1992).
Consideremos un ejemplo donde se desean evaluar tres niveles de fertilización con N (0,
50 y 100 kg/ha de N) y dos niveles de riego (bajo y alto) sobre los rendimientos de
maíz. El ensayo se condujo bajo un diseño en bloques completos al azar con cuatro
bloques (datos: StripPlot.IDB2).
Debido a restricciones de la aplicación de los tratamientos, en una primera etapa, en
cada uno de los bloques, se aleatorizan los tres niveles de nitrógeno y en la segunda
etapa, en cada bloque y en sentido trasversal al sentido de aplicación de los niveles de
nitrógeno, se aleatorizan los niveles del factor riego.
Si bien en el siguiente esquema (Figura 107) se presenta la aleatorización dentro de un
bloque en particular, el experimento ha sido repetido en bloques, esquema necesario
para poder obtener los distintos términos de error y que el modelo resultante tenga
sentido. Si en alguna etapa del diseño hubiera más de un factor, por ejemplo en las filas
se combianan dos fertilizantes con sus niveles y estos no interactuaran entre sí, se
podrían usar las interacciones de más alto orden como términos de error y así poder
obtener las pruebas F sin necesidad de repeticiones.
Modelos Lineales Mixtos en InfoStat
Etapa 1
100 kg N/ha
0 kg N/ha
50 kg N/ha
Etapa 2
Riego alto
Riego bajo
Figura 107: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques
completos al azar, con la aleatorización para un bloque particular de los factores cantidad de
nitrógeno y cantidad de riego. Datos del archivo StripPlot.IDB2.
Los datos de rendimiento se analizaron usando el siguiente modelo:
yijk = µ + τ i + γ j + λij + bk + f ki + ckj + ekij ; i = 1,..,3; j = 1, 2; k = 1,..., 4
(14)
donde yijk representa la respuesta observada en el i-ésimo nivel del factor nitrógeno,
j-ésimo nivel de factor riego y k-ésimo nivel del factor bloque (efecto aleatorio) µ
representa la media general de la respuesta, τ i representa el efecto del i-ésimo nivel del
factor nitrógeno, γ j representa el efecto del j-ésimo nivel del factor riego, λij la
interacción entre los factores nitrógeno y riego, bk el k-ésimo nivel del factor bloque,
162
Modelos Lineales Mixtos en InfoStat
f ki el efecto del bloque k en el nivel i de nitrógeno (efecto aleatorio), ckj el efecto del
bloque k en el nivel j de riego (efecto aleatorio), y ekij representa el error residual. La
suposición usual es que bk ~ N ( 0, σ b2 ) , f ki ~ N ( 0, σ 2f ) , ckj ~ N ( 0, σ c2 ) y ekij ~ N ( 0, σ e2 ) ,
siendo todos mutuamente independientes.
Para explorar las medias observadas en cada combinación de nitrógeno y riego se
construyó un gráfico de puntos (Figura 108).
80
Rendimiento
75
70
Riego Alto
Riego Bajo
65
60
55
0
50
100
Nitrogeno
Figura 108: Diagramas de puntos de las medias de rendimiento para cada combinación de Riego y
Nitrógeno. Datos archivo StripPlot.IDB2.
Este modelo puede ajustarse en InfoStat en el menú Modelos lineales generales y
mixtos, declarando a Rendimiento como variable dependiente y a Riego, Nitrógeno y
Bloque como variables clasificatorias. Luego, en la solapa Efectos fijos se declaran los
siguientes términos (Figura 109).
163
Modelos Lineales Mixtos en InfoStat
Figura 109: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los
datos del archivo StripPlot.IDB2.
En la solapa Efectos aleatorios se debe declarar el efecto de Bloque tanto en la
constante ( bk ) como en los factores fijos Nitrógeno y Riego ( f ki y ckj respectivamente)
(Figura 110).
164
Modelos Lineales Mixtos en InfoStat
Figura 110: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con
los datos del archivo StripPlot.IDB2.
Medidas de ajuste del modelo
N
24
AIC
106.09
BIC
115.00
logLik
-43.05
Sigma R2_0
1.20 0.85
R2_1
0.94
R2_2
0.95
R2_3
0.99
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo
numDF denDF F-value
(Intercept)
1
15 3061.88
Nitrogeno
2
15
60.13
Riego
1
15
52.18
Nitrogeno:Riego
2
15
33.12
III)
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
1.83
165
Modelos Lineales Mixtos en InfoStat
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Nitrogeno - 1|Bloque
Desvíos estándares relativos al residual y correlaciones
0
100
50
0
0.70 0.00 0.00
100
0.00 0.70 0.00
50
0.00 0.00 0.70
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Riego - 1|Bloque
Desvíos estándares relativos al residual y correlaciones
Alto Bajo
Alto 1.49 0.00
Bajo 0.00 1.49
Una formulación alternativa de este modelo (con efectos aleatorios cruzados) se puede
obtener si se seleccionan Nitrogeno y Riego, y con el ratón derecho se selecciona
Efectos aleatorios cruzados, según lo indicado en la Figura 111. Las componentes de
varianza aparecen en otro orden, pero son los mismos que bajo la otra formulación.
Figura 111: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con
los factores Nitrógeno y Riego cruzados para los datos del archivo StripPlot.IDB2.
166
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
24
AIC
106.09
BIC
115.00
logLik
-43.05
Sigma R2_0
1.20 0.85
R2_1
0.99
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Nitrogeno
Riego
Nitrogeno:Riego
numDF denDF F-value
1
15 3061.88
2
15
60.13
1
15
52.18
2
15
33.12
p-value
<0.0001
<0.0001
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdBlocked
Formula: ~Nitrogeno + Riego|Bloque
Desvíos estándares relativos
(const)
0
(const)
1.83
0.00
0
0.00
0.70
100
0.00
0.00
50
0.00
0.00
Alto
0.00
0.00
Bajo
0.00
0.00
al residual
100
50
0.00 0.00
0.00 0.00
0.70 0.00
0.00 0.70
0.00 0.00
0.00 0.00
y correlaciones
Alto Bajo
0.00 0.00
0.00 0.00
0.00 0.00
0.00 0.00
1.49 0.00
0.00 1.49
Las comparaciones de medias, según los resultados de las pruebas marginales, deben
hacerse a partir de las medias de las combinaciones de niveles de factores que
interactúan significativamente (medias de la interacción).
Medias ajustadas y errores estándares para Nitrogeno
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Nitrogeno
100
50
0
Medias
77.38
71.75
68.25
E.E.
1.40
1.40
1.40
A
B
C
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Medias ajustadas y errores estándares para Riego
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Riego Medias
Alto
77.33
Bajo
67.58
E.E.
1.47
1.47
A
B
Medias con una letra común no son significativamente diferentes (p<= 0.05)
167
Modelos Lineales Mixtos en InfoStat
Medias ajustadas y errores estándares para Nitrogeno*Riego
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Nitrogeno
100
50
100
0
50
0
Riego Medias
Alto
79.50
Alto
77.50
Bajo
75.25
Alto
75.00
Bajo
66.00
Bajo
61.50
E.E.
1.59
1.59
1.59
1.59
1.59
1.59
A
A
B
B
C
C
D
E
Medias con una letra común no son significativamente diferentes (p<= 0.05)
Podemos observar que los mejores rendimientos se obtienen con niveles de riego alto y
nitrógeno 50 o 100, confirmando lo observado en la gráfica de medias (Figura 108).
168
Modelos Lineales Mixtos en InfoStat
Diseño experimental con dos factores y dependencia espacial
En muchas situaciones se presentan niveles de un factor de interés que, por su
naturaleza, no se pueden asignar en forma aleatoria. Este es el caso de las tomas de
muestras de agua a lo largo de un río, cuando se evalúan efectos a distintas distancias en
un bosque o cuando se toman muestras de suelo a distintas profundidades. El hecho de
que no se puedan aleatorizar los niveles de un factor genera una dependencia espacial
que debe ser contemplada. Aquí presentamos un ejemplo (datos Lombrices.IDB2) en
donde se evalúan cuatro tipo de sombra en cultivos de café: testigo con sol (sol),
leguminosa1 (SombraL1), leguminosa2 (SombraL2) y no leguminosa (SombraNL) en
tres profundidades (1=0-10 cm, 2=10-20 cm y 3=20-30 cm). En cada una de las
unidades experimentales (combinación de tratamientos y repeticiones) se tomaron
muestras de 30×30 cm con 10 cm de profundidad en cada una de las tres profundidades.
En cada muestra se recolectaron las lombrices y se obtuvo su peso vivo (biomasa). Las
unidades experimentales estaban arregladas en un diseño completamente aleatorizado
con tres repeticiones. La variable tratam_rep identifica a las unidades experimentales
sobre las que se miden las distintas profundidades y fue generada desde el menú Datos,
sub menú Cruzar categorias para formar una nueva variable (en la ventana de
selección de variables se declaró a tratam y rep como variables).
Para realizar el análisis de los datos del archivo Lombrices.IDB2, se deben declarar las
variables como se muestra a continuación (Figura 112).
169
Modelos Lineales Mixtos en InfoStat
Figura 112: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del
archivo Lombrices.IDB2.
Luego, en la solapa Efectos fijos se deben declarar las variables como se muestra en la
siguiente figura (Figura 113).
170
Modelos Lineales Mixtos en InfoStat
Figura 113: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los
datos del archivo Lombrices.IDB2.
Por último, se declara en la solapa Correlación el modelo de Correlación espacial
exponencial, identificando a profund como coordenada X y a tratam_rep como criterio
de agrupamiento (Figura 114).
171
Modelos Lineales Mixtos en InfoStat
Figura 114: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con
correlación espacial exponencial en los datos del archivo Lombrices.IDB2.
La salida correspondiente se presenta a continuación.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,correlation=corExp(form=~as.numeric(as.character(Profund))|Tratam_Rep
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data00)
Resultados para el modelo: modelo000_Biomasa_REML
Variable dependiente:Biomasa
172
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
36
AIC
161.03
BIC
177.52
logLik
-66.52
Sigma R2_0
3.46 0.97
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Tratam
Profund
Tratam:Profund
numDF F-value
1 3725.04
3
66.75
2 303.14
6
4.86
p-value
<0.0001
<0.0001
<0.0001
0.0022
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(Profund)) | Tratam_Rep
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
2.12
Todos los factores resultaron significativos, presentándose interacción entre
tratamientos y profundidad (p=0.0022). El parámetro range tiene un valor estimado de
2.12. Este parámetro debe interpretarse con cuidado, dependiendo del modelo de
correlación espacial usado. En la bibliografía geoestadística, el range se define, para
procesos espaciales estacionales de segundo orden, como la distancia a partir de la cual
las observaciones pueden considerarse independientes. El parámetro range que se
muestra en la salida está relacionado a esta definición, pero no es la distancia a partir de
la cual no hay más correlación (excepto en los modelos esférico y lineal). En los
modelos de correlación espacial, en los que la covarianza alcanza cero solo
asintóticamente (todos excepto el esférico y el lineal), no existe una distancia a la cual la
correlación espacial se haga 0, por lo que se usa el concepto de practical range
(distancia a partir de la cual la covarianza espacial se reduce al 5%, o equivalentemente,
la distancia a la cual el semivariograma alcanza el 95% de su máximo). Esta distancia
depende del modelo usado: para correlación espacial exponencial es 3 veces el range
estimado, mientras que para correlación espacial Gaussiana√3esveces el
range
estimado (Littel et ál. 2006). Para la correlación racional cuadrática este factor es
aproximadamente 4.36.
173
Modelos Lineales Mixtos en InfoStat
En este ejemplo se usó un modelo de correlación espacial exponencial. La profundidad
1 era entre 0 y 10 cm, la 2 entre 10 y 20 cm y la 3 entre 20 y 30 cm, es decir, la
diferencia entre la profundidad 1 y 2 de la forma en que fueron declaradas, es de 1, sin
embargo en la escala original esta diferencia es de 10. Por lo tanto, el practical range en
la escala original es de 3×21.2 cm=63.6 cm. Esto implica que, para las profundidades
estudiadas (0 a 30 cm), las observaciones de biomasa de lombrices nunca serán
independientes (para que pudieran considerarse prácticamente independientes las
observaciones deberían estar a más de 63.6 cm, lo que es imposible con estos datos).
El modelo de correlación espacial exponencial isotrópico presentado aquí es equivalente
a un modelo autorregresivo de orden 1 (Casanoves et ál. 2005). Si con este mismo
conjunto de datos usamos ahora un modelo Autorregresivo de orden 1 (Figura 115) se
obtiene la siguiente salida.
Figura 115: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con
correlación autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2.
174
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo001_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep
)
,method="REML"
,na.action=na.omit
,data=R.data00)
Resultados para el modelo: modelo001_Biomasa_REML
Variable dependiente:Biomasa
Medidas de ajuste del modelo
N
36
AIC
161.03
BIC
177.52
logLik
-66.52
Sigma R2_0
3.46 0.97
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Tratam
Profund
Tratam:Profund
numDF F-value
1 3725.05
3
66.75
2 303.14
6
4.86
p-value
<0.0001
<0.0001
<0.0001
0.0022
Estructura de correlación
Modelo de correlación: AR(1)
Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep
Parámetros del modelo
Parámetro
Phi
Estim
0.62
La única diferencia entre esta salida y la anterior es que en ésta se muestra el parámetro
Phi de correlación (0.62) en vez del parámetro range.
A continuación estudiaremos la validez de los supuestos de este modelo. Para esto, en el
submenú Análisis-exploración de los modelos estimados se solicitaron los gráficos de
diagnóstico que se presentan a continuación (Figura 116).
175
Modelos Lineales Mixtos en InfoStat
Figura 116: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo
Lombrices.IDB2.
Como se puede observar la variabilidad de los residuos bajo los distintos tratamientos
parece diferente. Para evaluar un modelo heteroscedástico por tratamientos, en la solapa
Heteroscedasticidad se declararon las variables como en la (Figura 117) y se obtuvo la
siguiente salida.
176
Modelos Lineales Mixtos en InfoStat
Figura 117: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con
en los datos del archivo Lombrices.IDB2.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo002_Biomasa_REML<-gls(Biomasa~1+Tratam+Profund+Tratam:Profund
,weight=varComb(varIdent(form=~1|Tratam))
,correlation=corAR1(form=~as.integer(as.character(Profund))|Tratam_Rep
)
,method="REML"
,na.action=na.omit
,data=R.data00)
Resultados para el modelo: modelo002_Biomasa_REML
Variable dependiente:Biomasa
177
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
36
AIC
164.03
BIC
184.06
logLik
-65.02
Sigma R2_0
4.20 0.97
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Tratam
Profund
Tratam:Profund
numDF F-value
1 4300.37
3
54.19
2 511.72
6
6.32
p-value
<0.0001
<0.0001
<0.0001
0.0004
Estructura de correlación
Modelo de correlación: AR(1)
Formula: ~ as.integer(as.character(Profund)) | Tratam_Rep
Parámetros del modelo
Parámetro
Phi
Estim
0.73
Estructura de varianzas
Modelo de varianzas: varIdent
Formula: ~ 1 | Tratam
Parámetros de la función de varianza
Parámetro
sol
sombraL1
sombraL2
sombraNL
Estim
1.00
0.65
0.66
1.22
Los criterios AIC y BIC son mayores en el modelo heteroscedástico que en el
homoscedástico, indicando que este último es el mejor. Similar conclusión se obtiene a
partir de la prueba del cociente de verosimilitud (p=0.3916) al pedir la comparación de
los modelos como se mostró en la sección Análisis de un modelo ajustado.
Comparación de modelos
df
14
AIC
161.03
BIC
177.52
logLik
-66.52
Test
modelo001_Biomasa_REML
modelo002_Biomasa_REML
17
164.03
184.06
-65.02
1 vs 2
L.Ratio
p-value
3.00
0.3916
Por este motivo, nos quedamos con el modelo homoscedástico y, debido a la presencia
de interacción entre los dos factores, se realiza un diagrama de puntos para visualizar el
comportamiento de las medias de biomasa de lombrices (Figura 118).
178
Modelos Lineales Mixtos en InfoStat
90
80
Biomasa
70
60
50
40
30
20
1
2
3
Profundidad
Sol
SombraL1
SombraL2
SombraNL
Figura 118: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su
efecto sobre la biomasa. Datos archivo Lombrices.IDB2.
Como se puede observar, este gráfico sugiere la presencia de un comportamiento lineal
para sol y uno cuadrático para los otros tratamientos. Para probar estas hipótesis se
realizan contrastes ortogonales polinómicos a partir de la solapa Comparaciones,
subsolapa Contrastes (Figura 119).
179
Modelos Lineales Mixtos en InfoStat
Figura 119: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar
un modelo mixto con los datos del archivo Lombrices.IDB2.
A continuación se muestran los resultados de los contrastes. Se puede ver que el único
tratamiento que presenta solo tendencia lineal y no cuadrática es el de sol (p<0.0001 y
p=0.8147 respectivamente). El resto de los tratamientos, además de la tendencia lineal,
presentan una tendencia cuadrática.
Pruebas de hipótesis para contrastes
Tratam*Profund
Cont.1
Cont.2
Cont.3
Cont.4
Cont.5
Cont.6
Cont.7
Cont.8
Total
F
111.81
0.06
222.11
26.66
164.40
10.52
92.62
7.26
79.43
gl(num)
1
1
1
1
1
1
1
1
8
gl(den)
24
24
24
24
24
24
24
24
24
p-valor
<0.0001
0.8147
<0.0001
<0.0001
<0.0001
0.0035
<0.0001
0.0127
<0.0001
180
Modelos Lineales Mixtos en InfoStat
Coeficientes de los contrastes
Tratam
sol
sol
sol
sombraL1
sombraL1
sombraL1
sombraL2
sombraL2
sombraL2
sombraNL
sombraNL
sombraNL
Profund
1
2
3
1
2
3
1
2
3
1
2
3
Cont.1 Cont.2 Cont.3 Cont.4 Cont.5 Cont.6 Cont.7 Cont.8
-1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -2.00
0.00
0.00
0.00
0.00
0.00
0.00
1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -2.00
0.00
0.00
0.00
0.00
0.00
0.00
1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -2.00
0.00
0.00
0.00
0.00
0.00
0.00
1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -1.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00 -2.00
0.00
0.00
0.00
0.00
0.00
0.00
1.00
1.00
181
Modelos Lineales Mixtos en InfoStat
Diseños de testigos apareados
Este tipo de arreglo de tratamientos es común en la evaluación de nuevos cultivares
(variedades, híbridos, etc.) en mejoramiento genético vegetal. Básicamente consisten en
ubicar en forma aleatoria el conjunto de cultivares a evaluar intercalando siempre entre
ellos un testigo común. La presencia de este testigo es la que permite de alguna forma
modelar los efectos sistemáticos de la calidad del terreno donde se ubican las parcelas
experimentales. Para ejemplificar su análisis se presenta un ejemplo con 16 híbridos
(H1,…, H16) y un testigo, y así se tiene un total de 32 unidades experimentales. Los
datos se encuentran en el archivo Testigos apareados.IDB2.
Una alternativa básica y muy poco eficiente para analizar estos datos es realizar un
ANOVA a una vía de clasificación, y comparar los tratamientos usando una estimación
del término de error a partir de la varianza entre los testigos (únicos niveles del factor
tratamiento que están repetidos). Este modelo es incapaz de contemplar los sesgos
producidos por las diferencias sistemáticas entre unidades experimentales. Para obtener
este modelo, se declara en el selector de variables a Rendimiento como variable
dependiente y a Hibrido como variable de clasificación.
En la solapa de Efectos fijos se declara al Hibrido como en la Figura 120. Luego, en la
solapa Comparaciones se solicitó la prueba LSD de Fisher para Hibrido.
182
Modelos Lineales Mixtos en InfoStat
Figura 120: Ventana con la solapa Efectos fijos desplegada para los datos del archivo
Testigos_apareados.IDB2.
La salida correspondiente se presenta a continuación.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo000_Rendimiento_REML<-gls(Rendimiento~1+Hibrido
,method="REML"
,na.action=na.omit
,data=R.data21)
Resultados para el modelo: modelo000_Rendimiento_REML
Variable dependiente:Rendimiento
Medidas de ajuste del modelo
N
32
AIC
219.90
BIC
232.64
logLik
-91.95
Sigma
101.35
R2_0
0.69
AIC y BIC menores implica mejor
183
Modelos Lineales Mixtos en InfoStat
Pruebas de hipótesis secuenciales
(Intercept)
Hibrido
numDF F-value
1 3580.56
16
2.12
p-value
<0.0001
0.0763
Medias ajustadas y errores estándares para Hibrido
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Hibrido
H4
H3
H14
H10
H11
Testigo
H5
H9
H2
H12
H8
H7
H16
H6
H1
H13
H15
Medias
1230.00
1222.00
1193.00
1168.00
1116.00
1115.81
1099.00
1063.00
1037.00
1033.00
975.00
966.00
928.00
907.00
886.00
876.00
756.00
E.E.
101.35
101.35
101.35
101.35
101.35
25.34
101.35
101.35
101.35
101.35
101.35
101.35
101.35
101.35
101.35
101.35
101.35
A
A
A
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
Letras distintas indican diferencias significativas(p<= 0.05)
La prueba F para Hibrido no resultó significativa (p = 0.0763) por lo cual no deben
interpretarse las diferencias de medias presentadas en la prueba LSD de Fisher.
La alternativa a este modelo es el uso de correlaciones espaciales para corregir las
medias de cada híbrido por el “efecto del sitio” en donde fueron ubicadas por azar. Para
esto, se procede a colocar la Posicion de la parcela como una covariable.
En la solapa Efectos fijos se deja igual que en la Figura 120. En la solapa Correlación se
especifican los diferentes modelos:
Modelo 1: Correlación espacial exponencial ( Figura 121).
Modelo 2: Correlación espacial Gaussiana (Figura 122).
Modelo 3: Correlación espacial lineal (Figura 123).
Modelo 4: Correlación espacial “rational quadratic” (Figura 124).
Modelo 5: Correlación espacial esférica (Figura 125).
184
Modelos Lineales Mixtos en InfoStat
A continuación se muestran las ventanas de selección de correlación espacial y las
medidas de ajuste de cada uno de los modelos estimados.
Figura 121: Ventana con la solapa Correlación desplegada para los datos del archivo
Testigos_apareados.IDB2 y selección de Correlación espacial exponencial.
Medidas de ajuste del modelo
N
32
AIC
218.62
BIC
232.08
logLik
-90.31
Sigma
112.79
R2_0
0.58
AIC y BIC menores implica mejor
185
Modelos Lineales Mixtos en InfoStat
Figura 122: Ventana con la solapa Correlación desplegada para los datos del archivo
Testigos_apareados.IDB2 y selección de Correlación espacial Gaussiana.
Medidas de ajuste del modelo
N
32
AIC
219.17
BIC
232.62
logLik
-90.58
Sigma
106.78
R2_0
0.58
AIC y BIC menores implica mejor
186
Modelos Lineales Mixtos en InfoStat
Figura 123: Ventana con la solapa Correlación desplegada para los datos del archivo
Testigos_apareados.IDB2 y selección de Correlación espacial lineal.
Medidas de ajuste del modelo
N
32
AIC
219.13
BIC
232.58
logLik
-90.56
Sigma
107.52
R2_0
0.56
AIC y BIC menores implica mejor
187
Modelos Lineales Mixtos en InfoStat
Figura 124: Ventana con la solapa Correlación desplegada para los datos del archivo
Testigos_apareados.IDB2 y selección de Correlación espacial “rational quadratic”.
Medidas de ajuste del modelo
N
32
AIC
218.81
BIC
232.26
logLik
-90.40
Sigma
106.92
R2_0
0.59
AIC y BIC menores implica mejor
188
Modelos Lineales Mixtos en InfoStat
Figura 125: Ventana con la solapa Correlación desplegada para los datos del archivo
Testigos_apareados.IDB2 y selección de Correlación espacial esférica.
Medidas de ajuste del modelo
N
32
AIC
219.21
BIC
232.66
logLik
-90.60
Sigma
137.39
R2_0
0.56
AIC y BIC menores implica mejor
Todos los modelos ajustan bien, ya que sus valores de AIC y BIC son muy parecidos. El
modelo con menores valores es el de Correlación espacial exponencial (AIC=218.62,
BIC=232.08). La salida correspondiente a este modelo se presenta a continuación.
189
Modelos Lineales Mixtos en InfoStat
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo028_Rendimiento_REML<-gls(Rendimiento~1+Hibrido
,correlation=corExp(form=~as.numeric(as.character(Posicion))
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data28)
Resultados para el modelo: modelo028_Rendimiento_REML
Variable dependiente:Rendimiento
Medidas de ajuste del modelo
N
32
AIC
218.62
BIC
232.08
logLik
-90.31
Sigma
112.79
R2_0
0.58
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
(Intercept)
Hibrido
numDF F-value
1 582.79
16
5.27
p-value
<0.0001
0.0012
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(Posicion))
Metrica: euclidean
Parámetros del modelo
Parámetro
range
Estim
2.74
Medias ajustadas y errores estándares para Hibrido
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Hibrido
H3
H4
H10
H5
Testigo
H2
H11
H9
H14
H1
H12
H6
Medias
1248.31
1244.19
1145.64
1128.65
1096.98
1091.07
1078.43
1078.28
1070.07
1005.46
979.80
966.31
E.E.
85.33
85.33
85.33
85.33
45.09
85.33
85.33
85.33
85.33
85.33
85.33
85.33
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
190
Modelos Lineales Mixtos en InfoStat
H7
H8
H16
H13
H15
936.21
933.40
902.87
727.55
653.36
85.33
85.33
85.33
85.33
85.33
B
B
C
C
C
D
D
D
D
E
E
Letras distintas indican diferencias significativas(p<= 0.05)
Se encontraron diferencias entre híbridos (p = 0.0012). Mediante la prueba LSD de
Fisher de comparación de medias se pudo determinar que los híbridos de mayor
rendimiento fueron los H2, H3, H4, H5, H9, H10, H11, H14, y que éstos a su vez no
difieren del testigo.
Otra alternativa es pensar el problema como en los orígenes de la modelación espacial
(Papadakis 1937), y utilizar un análisis de covarianza para ajustar las medias de los
híbridos en las distintas posiciones. Para realizar una aproximación a este tipo de
análisis se construyó una nueva variable llamada Tes, la cual contiene los rendimientos
correspondientes a los testigos, luego se adicionó una nueva columna (Hib) en la que se
copiaron los valores del rendimiento del hibrido más cercano a cada testigo. Se calculó
luego la diferencia del rendimiento del testigo frente al hibrido (Dif).
A continuación se realizó un análisis de regresión lineal considerando a Dif como
variable dependiente y a Posicion como variable regresora. Se guardaron los predichos
de este modelo con el fin de utilizarlos como una covariable en el análisis de las medias
de híbridos.
Luego, en la ventana del selector de variables de Modelos lineales generalizados y
mixtos se declaran las variables como se muestra en la Figura 126.
191
Modelos Lineales Mixtos en InfoStat
Figura 126: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del
archivo Testigos_apareados.IDB2.
En la ventana de Efectos fijos se declara a Hibrido y a PRED_Dif. En la solapa
Comparaciones se solicitó la prueba LSD de Fisher. La salida correspondiente se
presenta a continuación.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo029_Rendimiento_REML<-gls(Rendimiento~1+Hibrido+PRED_Dif
,method="REML"
,na.action=na.omit
,data=R.data29)
Resultados para el modelo: modelo029_Rendimiento_REML
Variable dependiente:Rendimiento
Medidas de ajuste del modelo
N
32
AIC
215.09
BIC
227.23
logLik
-88.54
Sigma R2_0
79.89 0.82
AIC y BIC menores implica mejor
192
Modelos Lineales Mixtos en InfoStat
Pruebas de hipótesis secuenciales
(Intercept)
Hibrido
PRED_Dif
numDF F-value
1 5763.58
16
3.42
1
10.15
p-value
<0.0001
0.0129
0.0066
Medias ajustadas y errores estándares para Hibrido
LSD Fisher (alfa=0.05)
Procedimiento de correccion de p-valores: No
Hibrido
H4
H3
H10
H5
H2
H14
Testigo
H11
H9
H12
H1
H8
H7
H6
H16
H13
H15
Medias
1295.07
1293.92
1150.88
1143.52
1129.47
1121.08
1115.81
1078.33
1052.73
988.48
985.32
985.27
983.12
944.67
828.68
810.93
663.53
E.E.
82.46
83.02
80.07
81.10
85.00
83.02
19.97
80.76
79.95
81.10
85.76
79.95
80.07
80.76
85.76
82.46
85.00
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
D
D
D
Letras distintas indican diferencias significativas(p<= 0.05)
Si bien se llega a la misma conclusión con respecto a los cultivares que en el análisis
usando correlación espacial exponencial, podemos observar que las medias ajustadas y
los errores estándares son diferentes. También difiere el orden o ranking presente entre
los híbridos que presentan los mayores rendimientos. Por último, el contemplar la
correlación espacial es una alternativa mucho más sencilla para realizar este tipo de
análisis.
193
Modelos Lineales Mixtos en InfoStat
Aplicaciones en regresión lineal
Regresión con coeficientes aleatorios
En este ejemplo se está evaluando el aprendizaje de estudiantes de matemáticas en sexto
grado. Ocho maestros se seleccionaron aleatoriamente para participar del estudio. Al
comenzar el año académico, los estudiantes de los maestros participantes tomaron una
prueba diagnóstica (pre-prueba) con contenidos matemáticos de sexto grado. Al
finalizar el año los mismos estudiantes tomaron una prueba (post-prueba) evaluando los
mismos contenidos (Cáceres et ál., 2011).
Cada maestro tenía entre 10 y 30 estudiantes, y algunos estudiantes completaron la preprueba pero no la post-prueba. Se desea estudiar si hay relación entre la ganancia de
aprendizaje (diferencia entre la calificación de la post-prueba y la calificación de la preprueba) y la calificación de la pre-prueba. Si graficamos esta relación usando los datos
del archivo Ganancia en Aprendizaje.IDB2, se puede observar una relación negativa
entre ganancia y resultado de la pre-prueba. Además, agregando una línea suavizada
para los datos de cada maestro se puede apreciar que las tendencias son
aproximadamente lineales, y que los parámetros de estas líneas varían de maestro a
maestro (Figura 127):
75
60
Ganancia
45
30
15
0
-15
-30
-45
0
15
30
45
60
75
Calificacion Pre
Figura 127: Relación entre la Ganancia en aprendizaje y la Calificacion previa al entrenamiento
suavizada para cada uno de los maestros. Archivo Ganancia en aprendizaje.IDB2.
194
Modelos Lineales Mixtos en InfoStat
Para ajustar un modelo en InfoStat que describa estos datos se debe recordar que los
maestros han sido escogidos aleatoriamente, por lo que la variabilidad entre las líneas es
aleatoria. Un modelo apropiado para estos datos es el de una regresión lineal simple con
efectos aleatorios para el intercepto y la pendiente. Estos efectos aleatorios claramente
deben estar correlacionados (en términos generales, si la pendiente aumenta el
intercepto debería disminuir para que los datos se mantengan en la nube de datos
observada). Por lo tanto el modelo se debe especificar en InfoStat de manera tal que sea
posible incorporar efectos aleatorios de intercepto y pendiente que puedan estar
correlacionados. Para ello, en la ventana de selección de variables para Modelos lineales
generales y mixtos se declara a Ganancia como variable, a Maestro como criterio de
clasificación y a Calificacion.Pre como covariable en la primera ventana). Luego, en la
solapa Efectos fijos se declara Calificacion.Pre y además se agrega la definición
explícita del intercepto (para poder luego declarar ambos como efectos aleatorios). El
intercepto se declara agregando un 1 en la solapa de Efectos fijos (Figura 128). También
se debe marcar la opción de Coeficientes de los efectos fijos para obtener la ecuación de
la línea recta promedio.
195
Modelos Lineales Mixtos en InfoStat
Figura 128: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos fijos para
los datos del archivo Ganancia en aprendizaje.IDB2.
La especificación de los efectos aleatorios se realiza agregando Maestro como criterio
de estratificación, e indicando que este efecto es sobre 1+Calificacion.Pre (es decir, hay
efecto aleatorio de maestro sobre el intercepto y sobre la pendiente) (Figura 129).
Además, al indicar pdSymm se están especificando varianzas diferentes para el efecto
del intercepto y de la pendiente (obvio dada la naturaleza diferente de ambos
parámetros) y correlación entre ambos efectos aleatorios.
196
Modelos Lineales Mixtos en InfoStat
Figura 129: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos aleatorios
para los datos del archivo Ganancia en aprendizaje.IDB2.
La salida correspondiente a este modelo presenta, además de las partes usuales en
modelos mixtos, los coeficientes de la recta promedio,
=
Yˆ 30.13 − 0.81x . Como se
esperaba, a medida que la calificación en la pre-prueba es mayor, la ganancia
disminuye. Se puede observar además la alta correlación entre los efectos de maestros
sobre intercepto y pendiente (-0.876), que confirma la necesidad de incorporar este
parámetro al modelo.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.002_Ganancia_REML<-lme(Ganancia~1+Calificacion.Pre
random=list(Maestro=pdSymm(~1+Calificacion.Pre))
method="REML"
197
Modelos Lineales Mixtos en InfoStat
control=lmeControl(msMaxIter=200)
na.action=na.omit
data=R.data02
keep.data=FALSE)
Resultados para el modelo: modelo.002_Ganancia_REML
Variable dependiente: Ganancia
Medidas de ajuste del modelo
N
184
AIC
1485.954
BIC
1505.178
logLik
-736.977
Sigma
13.1736
R2_0
0.339
R2_1_
0.366
AIC y BIC menores implica mejor
Pruebas de hipótesis secuenciales
numDF denDF F-value
(Intercept)
1
175 29.007004
Calificacion.Pre
1
175 78.129020
p-value
<0.0001
<0.0001
Efectos fijos
(Intercept)
Calificacion.Pre
Value
30.132848
-0.810821
Std.Error
2.943507
0.091732
DF
175
175
t-value
10.237058
-8.839062
p-value
<0.0001
<0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdSymm
Formula: ~1 + Calificacion.Pre|Maestro
Desvíos estándares relativos al residual y correlaciones
(const)
Calificacion.Pre
(const)
0.200769
-0.875547
Calificacion.Pre -0.875547
0.008462
Regresion heteroscedástica
En un trabajo para evaluar la productividad primaria en pasturas y su relación con la
precipitación, se evaluaron nueve potreros, cinco con pastura semi-natural y cuatro con
pasturas sembradas. La productividad primaria en periodos de 22 días de crecimiento se
midió varias veces a lo largo del año en cada potrero (la mayoría de los potreros 12
veces). Paralelamente, se registraban los milímetros de lluvia caídos en el periodo de
crecimiento de 22 días (Ospina 2011, Ospina et ál. 2012). Los datos se encuentran en el
archivo Productividad primaria.IDB2. Para realizar un análisis de regresión con tipo de
pastura como variable clasificatoria, en la ventana de selección de variables del módulo
Modelos lineales generales y mixtos, declaramos las variables como en la Figura 130.
198
Modelos Lineales Mixtos en InfoStat
Figura 130: Ventana de selección de variables del módulo Modelos lineales generales para los datos
del archivo Productividad primaria.IDB2.
En la solapa Efectos fijos declaramos las variables como en la Figura 131 y en la de
efectos aleatorios declaramos a Potrero (Figura 132). Con estas especificaciones del
modelo de regresión ajustamos un modelo de regresión con dos interceptos (ordenadas
al origen) y un efecto aleatorio de potrero. Los residuos obtenidos luego de ajustar este
modelo se usan para diagnosticar posibles problemas en el ajuste y los supuestos. Como
se puede observar en el resumen de gráficos de diagnostico que se presentan en la
Figura 133 se puede ver que el Q-Q-plot muestra que la distribución de los residuos es
aproximadamente normal, pero los diagramas de dispersión de Residuos condicionales
de Pearson versus PPacum muestran una racha de valores residuos negativos después
del los 300 mm. Esta misma racha se observa en el diagrama de dispersión de Residuos
condicionales de Pearson versus los Valores ajustados, en este caso por encima de los
110 g/m2 de productividad primaria.
199
Modelos Lineales Mixtos en InfoStat
Figura 131: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada
para los datos del archivo Productividad primaria.IDB2.
Figura 132: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios
desplegada para los datos del archivo Productividad primaria.IDB2.
200
Modelos Lineales Mixtos en InfoStat
Figura 133: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo
Productividad primaria.IDB2 con la variable PPacum como regresora y pastura como factor fijo.
Esto sugiere la necesidad de incluir un término cuadrático para la variable regresora
PPacum. Para esto, en el menú Datos, sub-menú Transformaciones se eligió a PPacum
como variable, y luego de aceptar se pidió una transformación de potencia (en este caso
de orden 2) y esto generó una nueva variable en la base de datos llamada POT_PPacum.
Se agrego esta variable como covariable en el selector de variables de Modelos lineales
generales y mixtos y posteriormente, se la declaró en la solapa Efectos fijos del modelo
junto a las otras variables que ya estaban ingresadas como se indicó en la Figura 142. La
solapa de Efectos aleatorios, se la deja como en la Figura 132. Al aceptar y solicitar
nuevamente el diagnóstico de los residuos, obtendremos los gráficos que se presentan
en la Figura 134.
201
Modelos Lineales Mixtos en InfoStat
Figura 134: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo
Productividad primaria.IDB2 con la variable PPacum y POT_PPacum como regresoras y pastura
como factor fijo.
Analizando el diagrama de dispersión de residuos condicionales de Pearson versus los
Valores ajustados, se observa una clara tendencia de los residuos a aumentar su varianza
a medida que aumenta el valor medio. Esto sugiere la necesidad de modelar esta falta de
homogeneidad de varianza con una función que relaciones las varianzas de los residuos
con la media. Para declarar esta función, realizamos nuevamente el análisis (recordemos
que Ctrl + r repite el último comando) y en la solapa Heteroscedasticidad declaramos
VarPower como se muestra en la Figura 135.
202
Modelos Lineales Mixtos en InfoStat
Figura 135: Ventana del módulo Modelos lineales generales con la solapa Heteroscedasticidad
desplegada para los datos del archivo Productividad primaria.IDB2 y la selección de la función
VarPower.
Luego se repitió este análisis para otras dos funciones de varianzas, VarExp y
VarConstPower. A continuación se presentan los resultados de los estadísticos de ajuste
para estos tres modelos:
VarExp
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0 R2_1
104 1002.64 1020.87 -494.32 9.89 0.52 0.52
AIC y BIC menores implica mejor
VarPower
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0 R2_1
104 1001.07 1019.31 -493.54 2.16 0.53 0.53
AIC y BIC menores implica mejor
203
Modelos Lineales Mixtos en InfoStat
VarConstPower
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0 R2_1
104 1001.85 1022.69 -492.92 0.62 0.52 0.52
AIC y BIC menores implica mejor
No podemos comparar estos modelos usando un cociente de verosimilitud (LRT) ya que
no forman un conjunto anidado de hipótesis (excepto VarPower y VarConstPower). En
estos casos sólo los criterios AIC y BIC son útiles. El modelo VarPower resulta ser el
mejor para declarar las varianzas heterogéneas. Luego de ajustar este modelo, los
residuos no presentan ninguna tendencia (Figura 136).
Figura 136: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo
Productividad primaria.IDB2 con la variable PPacum y POT_PPacum como regresoras, pastura como
factor fijo y una función VarPower para las varianzas heterogéneas.
Para probar las hipótesis de igualdad de tendencias lineales y cuadráticas se incluyeron
en el modelo las interacciones entre tipo de pastura y las dos variables regresoras
204
Modelos Lineales Mixtos en InfoStat
(Figura 137). El efecto aleatorio de potrero fue declarado en la solapa Efectos aleatorios
(Figura 138) y la heteroscedasticidad fue especificada como en la Figura 135.
Figura 137: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada
para los datos del archivo Productividad primaria.IDB2 y la especificación del modelo con interacción.
205
Modelos Lineales Mixtos en InfoStat
Figura 138: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios
desplegada para los datos del archivo Productividad primaria.IDB2 y la selección del efecto de potrero
como aleatorio.
Con estas especificaciones se logró la siguiente salida.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.002_Productividad.primaria_REML<lme(Productividad.primaria~1+Pastura+PPacum+POT_PPacum+Pastura:PPacum+
Pastura:POT_PPacum
,random=list(Potreros=pdIdent(~1))
,weights=varComb(varPower(form=~fitted(.)))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data02
,keep.data=FALSE)
Resultados para el modelo: modelo.002_Productividad.primaria_REML
Variable dependiente: Productividad.primaria
Medidas de ajuste del modelo
206
Modelos Lineales Mixtos en InfoStat
N
AIC
BIC
logLik Sigma R2_0 R2_1
104 1004.89 1028.15 -493.45 2.46 0.65 0.65
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Pastura
PPacum
POT_PPacum
Pastura:PPacum
Pastura:POT_PPacum
numDF denDF F-value p-value
1
91
0.32 0.5703
1
7
12.62 0.0093
1
91 167.15 <0.0001
1
91
55.66 <0.0001
1
91
4.19 0.0435
1
91
0.01 0.9179
Pruebas de hipótesis secuenciales
(Intercept)
Pastura
PPacum
POT_PPacum
Pastura:PPacum
Pastura:POT_PPacum
numDF denDF F-value p-value
1
91 152.56 <0.0001
1
7
34.31 0.0006
1
91 184.34 <0.0001
1
91
62.10 <0.0001
1
91
21.04 <0.0001
1
91
0.01 0.9179
Efectos fijos
Value
Std.Error DF t-value p-value
(Intercept)
-9.44
2.74 91
-3.45 0.0009
PasturaSemi-naturales
16.27
4.58 7
3.55 0.0093
PPacum
0.82
0.08 91
9.90 <0.0001
POT_PPacum
-1.1E-03
2.2E-04 91
-4.93 <0.0001
PasturaSemi-naturales:PPac..
-0.23
0.11 91
-2.05 0.0435
PasturaSemi-naturales:POT_.. 2.9E-05
2.8E-04 91
0.10 0.9179
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Potreros
Desvíos estándares y correlaciones
(const)
(const) 1.3E-03
Estructura de varianzas
Modelo de varianzas: varPower
Formula: ~ fitted(.)
Parámetros de la función de varianza
Parámetro Estim
power
0.60
207
Modelos Lineales Mixtos en InfoStat
Como se puede observar en la salida anterior, existe interacción pastura con PPacum, lo
que indica que el comportamiento lineal es diferente entre las pasturas. Por otra parte,
no existe un comportamiento diferente entre las pasturas para la componente cuadrática
de la regresión, por lo ésta es similar en las dos pasturas. Por este motivo se corrió
nuevamente el modelo eliminando de la parte fija el efecto de la interacción
Pastura*POT_PPacum, y la salida resultante se presenta a continuación.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.003_Productividad.primaria_REML<lme(Productividad.primaria~1+Pastura+PPacum+POT_PPacum+Pastura:PPacum
,random=list(Potreros=pdIdent(~1))
,weights=varComb(varPower(form=~fitted(.)))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data03
,keep.data=FALSE)
Resultados para el modelo: modelo.003_Productividad.primaria_REML
Variable dependiente: Productividad.primaria
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0 R2_1
104 988.37 1009.14 -486.19 2.46 0.65 0.65
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Pastura
PPacum
POT_PPacum
Pastura:PPacum
numDF denDF F-value p-value
1
92
0.35 0.5579
1
7
17.01 0.0044
1
92 171.84 <0.0001
1
92
57.67 <0.0001
1
92
21.17 <0.0001
Pruebas de hipótesis secuenciales
(Intercept)
Pastura
PPacum
POT_PPacum
Pastura:PPacum
numDF denDF F-value p-value
1
92 154.21 <0.0001
1
7
33.77 0.0007
1
92 186.37 <0.0001
1
92
63.32 <0.0001
1
92
21.17 <0.0001
208
Modelos Lineales Mixtos en InfoStat
Efectos fijos
Value
(Intercept)
-9.34
PasturaSemi-naturales
16.00
PPacum
0.82
POT_PPacum
-1.0E-03
PasturaSemi-naturales:PPac..
-0.21
Std.Error DF t-value p-value
2.47 92
-3.78 0.0003
3.88 7
4.12 0.0044
0.06 92
13.60 <0.0001
1.4E-04 92
-7.59 <0.0001
0.05 92
-4.60 <0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Potreros
Desvíos estándares y correlaciones
(const)
(const) 2.2E-03
Estructura de varianzas
Modelo de varianzas: varPower
Formula: ~ fitted(.)
Parámetros de la función de varianza
Parámetro Estim
power
0.60
Medias ajustadas y errores estándares para Pastura
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Pastura
Medias E.E.
Sembradas
70.01 4.58 A
Semi-naturales 56.17 3.52
B
Medias con una letra común no son significativamente diferentes(p<= 0.05)
Debido a la presencia de la regresión polinomica, es más adecuado reportar las sumas
de cuadrado secuenciales (tipo I). Podemos decir que existe un efecto de pastura
(p=0.0007) siendo las pasturas sembradas las que más productividad primaria promedio
presentan (70 contra 56.17). La productividad primaria responden a la precipitación
acumulada, PPacum (p<0.0001) con una tendencia cuadrática, POT_PPacum
(p<0.0001). La tendencia lineal es diferente entre las pasturas ya que la interacción
Pastura*PPacum fue significativa (p<0.0001). El diagrama de dispersíon entre
Productividad primaria y Precipitaciones acumuladas con un suvizado polinomico de
orden 2 muestra estas tendencias (Figura 139).
209
Modelos Lineales Mixtos en InfoStat
200
Sembradas
180
Semi-naturales
160
Productividad primaria
140
120
100
80
60
40
20
0
0
50
100
150
200
250
300
350
400
450
500
550
600
Precipitaciones acumuladas
Figura 139: Diagrama de dispersión mostrando la relación entre productividad primaria y
precipitación acumulada para cada una de las pasturas. Archivo productividad primaria.IDB2.
Debido a la interacción existente, no es posible interpretar las medias ajustadas. Para
comparar ambas pasturas en distintos niveles de precipitación se puede usar el menú de
Exploración de Modelo, solapa de Combinaciones Lineales. Para determinar los
coeficientes, consideremos el siguiente ejemplo. Para probar si hay diferencias entre
pasturas con precipitación acumulada de 100 mm la hipótesis nula puede escribirse
como:
H 0 : β 0 + 100 β1 + 10000 β 2 =
β 0 + α + 100β1 + 10000β 2 + 100αβ1
Esta hipótesis es equivalente a H 0 : α + 100αβ1 =
0 , que es una combinación lineal de
los parámetros del modelo. Los coeficientes para valores de precipitación de 100 mm,
300 mm y 500 mm se muestran en la ventana correspondiente en la Figura 140.
210
Modelos Lineales Mixtos en InfoStat
Figura 140: Ventana Exploración de modelos estimados con la solapa Combinaciones lineales
desplegada. Archivo productividad primaria.IDB2.
Pruebas de hipótesis para combinaciones lineales
Comb. lineal Estimación E.E. gl F
p-valor
Comb.1
-5.48 4.25 1 1.66 0.2008
Comb.2
-48.44 12.45 1 15.14 0.0002
Comb.3
-91.40 21.59 1 17.92 0.0001
Total
sd
sd
Los resultados indican que no hay diferencias significativas entre pasturas cuando la
precipitación es de 100 mm (p=0.2008), mientras que cuando la precipitación es de 300
mm o de 500 mm la pastura sembrada tiene mayor productividad primaria (p=0.0002 y
p=0.0001 respectivamente).
211
Modelos Lineales Mixtos en InfoStat
Bloques incompletos y diseños relacionados
Diseños Alfa látices
Los datos de este ejemplo provienen de un ensayo de 18 variedades de cebada realizado
en Escocia (Patterson et ál., 1989). Debido a la cantidad de tratamientos fue imposible
reunir bloques con 18 unidades experimentales homogéneas, por los que estos eran
incompletos. Una repetición completa de este experimento consiste de tres bloques
incompletos con cuatro unidades experimentales cada y dos bloques incompletos con
tres unidades experimentales cada uno, y se contó con un total de cuatro repeticiones
(Figura 141).
1
1
1
1
2
2
2
2
3
3
3
4
4
4
4
5
5
5
11
3
8
10
13
17
16
5
14
18
4
6
1
7
12
9
2
15
1
1
1
1
2
2
2
3
3
3
4
4
4
4
5
5
5
5
15
4
11
17
5
12
10
9
1
13
2
14
7
8
16
6
3
18
1
1
1
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
12
15
3
4
16
7
8
4
12
13
18
8
5
9
10
17
14
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
10
2
16
9
17
7
3
8
4
12
13
15
6
5
14
11
1
18
I
II
III
IV
Figura 141: Diagrama del diseño de experimento para el ensayo de 18 variedades de cebada conducido
como un alfa látice. Los número romanos a la derecha indican las repeticiones, los número arabicos
en la parte superior de la celda indican los bloques incompletos (de tamaños 4 y 3) y en la parte
inferior las variedades.
Comenzaremos analizando este experimento considerando solamente las repeticiones
como un gran bloque (completo). Ya que hay cuatro repeticiones se puede estimar un
término de error para realizar las comparaciones de variedades. Los datos se encuntran
en el archivo Alfa látice.IDB2.
En la ventana de selección de variables de Modelos generales y mixtos declaramos
Rendimiento como variable, Variedad, Bloque incompleto y Repeticion como criterios
de clasificación. Luego de aceptar, en la solapa de Efectos fijos se declara Variedad
(Figura 142), y en la solapa Efectos aleatorios se declara Repeticion (Figura 143).
212
Modelos Lineales Mixtos en InfoStat
Como todas las variedades están en cada repetición, esta forma de declarar el modelo
corrige los sesgos por repeticiones, aunque ignora el efecto (y por ende los sesgos)
debidos a los bloques incompletos.
Figura 142: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos identificando a
las variedades para los datos del archivo Alfa látice.IDB2.
213
Modelos Lineales Mixtos en InfoStat
Figura 143: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios
identificando a las repeticiones para los datos del archivo Alfa látice.IDB2.
La siguiente salida presenta los resultados para este modelo.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.017_Rendimiento_REML<-lme(Rendimiento~1+Variedad
,random=list(Repeticion=pdIdent(~1))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data17
,keep.data=FALSE)
Resultados para el modelo: modelo.017_Rendimiento_REML
Variable dependiente: Rendimiento
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma
R2_0
R2_1
72 65.2834 105.0631 -12.6417 0.2237 0.3714 0.7015
AIC y BIC menores implica mejor
214
Modelos Lineales Mixtos en InfoStat
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Variedad
numDF denDF F-value p-value
1
51 1977.3627 <0.0001
17
51
3.7389 0.0001
Efectos fijos
Value
Std.Error DF t-value p-value
(Intercept) 5.3250
0.1579 51 33.7330 <0.0001
Variedad10 -0.6750
0.1582 51 -4.2673 0.0001
Variedad11 -0.2000
0.1582 51 -1.2644 0.2118
Variedad12 -0.4750
0.1582 51 -3.0029 0.0041
Variedad13 -0.3250
0.1582 51 -2.0546 0.0451
Variedad14
0.0000
0.1582 51 0.0000 >0.9999
Variedad15 -0.0500
0.1582 51 -0.3161 0.7532
Variedad16 -0.2250
0.1582 51 -1.4224 0.1610
Variedad17
0.1750
0.1582 51 1.1063 0.2738
Variedad18 -0.4750
0.1582 51 -3.0029 0.0041
Variedad2
-0.4250
0.1582 51 -2.6868 0.0097
Variedad3
-0.0750
0.1582 51 -0.4741 0.6374
Variedad4
-0.0500
0.1582 51 -0.3161 0.7532
Variedad5
-0.3750
0.1582 51 -2.3707 0.0216
Variedad6
-0.3250
0.1582 51 -2.0546 0.0451
Variedad7
-0.2000
0.1582 51 -1.2644 0.2118
Variedad8
-0.4000
0.1582 51 -2.5288 0.0146
Variedad9
-0.1250
0.1582 51 -0.7902 0.4330
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Repeticion
Desvíos estándares y correlaciones
(const)
0.2228
(const)
Medias ajustadas y errores estándares para Variedad
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Variedad
17
14
1
15
4
3
9
11
7
16
6
13
5
8
2
18
12
10
Medias
5.5000
5.3250
5.3250
5.2750
5.2750
5.2500
5.2000
5.1250
5.1250
5.1000
5.0000
5.0000
4.9500
4.9250
4.9000
4.8500
4.8500
4.6500
E.E.
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
0.1579
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
E
E
E
E
E
E
E
E
E
F
F
F
F
F
F
F
F
F
F
G
G
G
G
G
G
Medias con una letra común no son significativamente diferentes(p<= 0.05)
Como se puede observar la comparación de medias se realiza usando un único error
estándar (el error estándar de los efectos estimados de tratamiento, 0.1582, representa el
215
Modelos Lineales Mixtos en InfoStat
error estándar entre cada tratamiento y el tratamiento de referencia). Ahora realizaremos
un nuevo análisis incorporando el efecto de los Bloques incompletos. Para esto dejamos
la solapa de Efectos fijos como en la Figura 142 (solo Variedad) y en la solapa Efectos
aleatorios declaramos a Repeticion y Bloque incompleto como se muestra en la Figura
144.
Figura 144: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios
identificando los efectos de repetición y bloque incompleto dentro de repetición para los datos del
archivo Alfa látice.IDB2.
A continuación se presenta la salida correspondiente a este modelo.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.018_Rendimiento_REML<-lme(Rendimiento~1+Variedad
,random=list(Repeticion=pdIdent(~1)
,Bloque.incompleto=pdIdent(~1))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
216
Modelos Lineales Mixtos en InfoStat
,data=R.data18
,keep.data=FALSE)
Resultados para el modelo: modelo.018_Rendimiento_REML
Variable dependiente: Rendimiento
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma
R2_0
R2_1
R2_2
72 52.3497 94.1184 -5.1749 0.1532 0.3431 0.6595 0.8961
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Variedad
numDF denDF F-value p-value
1
35 2154.5072 <0.0001
17
35
6.5359 <0.0001
Efectos fijos
Value
Std.Error DF t-value p-value
(Intercept) 5.3617
0.1381 35 38.8237 <0.0001
Variedad10 -0.7408
0.1217 35 -6.0875 <0.0001
Variedad11 -0.1617
0.1196 35 -1.3518 0.1851
Variedad12 -0.4320
0.1217 35 -3.5499 0.0011
Variedad13 -0.3867
0.1196 35 -3.2327 0.0027
Variedad14 -0.1252
0.1209 35 -1.0362 0.3072
Variedad15 -0.0681
0.1254 35 -0.5434 0.5903
Variedad16 -0.2194
0.1254 35 -1.7500 0.0889
Variedad17
0.1129
0.1201 35 0.9399 0.3537
Variedad18 -0.5234
0.1203 35 -4.3502 0.0001
Variedad2
-0.4471
0.1251 35 -3.5731 0.0011
Variedad3
-0.0913
0.1244 35 -0.7338 0.4680
Variedad4
-0.1055
0.1251 35 -0.8439 0.4045
Variedad5
-0.4646
0.1243 35 -3.7381 0.0007
Variedad6
-0.3397
0.1201 35 -2.8289 0.0077
Variedad7
-0.1896
0.1210 35 -1.5668 0.1261
Variedad8
-0.5895
0.1238 35 -4.7632 <0.0001
Variedad9
-0.2701
0.1204 35 -2.2438 0.0313
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Repeticion
Desvíos estándares y correlaciones
(const)
(const)
0.2011
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Bloque.incompleto Dentro Repeticion
Desvíos estándares y correlaciones
(const)
(const)
0.1757
217
Modelos Lineales Mixtos en InfoStat
Medias ajustadas y errores estándares para Variedad
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Variedad
17
1
15
3
4
14
11
7
16
9
6
13
12
2
5
18
8
10
Medias
5.4746
5.3617
5.2936
5.2704
5.2562
5.2365
5.2000
5.1722
5.1423
5.0916
5.0220
4.9750
4.9297
4.9146
4.8971
4.8383
4.7722
4.6210
E.E.
0.1372
0.1381
0.1381
0.1377
0.1381
0.1377
0.1377
0.1377
0.1381
0.1381
0.1372
0.1377
0.1381
0.1381
0.1377
0.1381
0.1372
0.1381
A
A
A
A
A
A
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
E
E
E
E
E
E
F
F
F
F
F
F
G
G
G
G
G
G
G
H
H
H
H
H
H
I
I
I
I
I
I
J
J
J
Medias con una letra común no son significativamente diferentes(p<= 0.05)
En la salida anterior se puede apreciar que los errores estándar de las diferencias (igual
al error estándar de los efectos de variedad) siguen siendo similares para cada variedad
aunque no iguales, ya que a pesar de que todas las variedades tienen el mismo número
de repeticiones, n=4, los bloques incompletos son de distinto tamaño (tres o cuatro
unidades experimentales). Sin embargo, estos errores estándar son más pequeños que en
el modelo anterior, debido a que ahora se ha descontado la varianza de los bloques
dentro de cada repetición. A su vez, las medias de este último análisis están corregidas
por el efecto de bloque (medias ajustadas) por lo que este análisis es mejor ya que las
medias estimadas son insesgadas (condicionalmente a los bloques observados). Se
puede notar que el ranking de medias ha cambiado, en el análisis con solo efectos de
repeticiones (como si fuera un DBCA) las tres medias ordenadas en forma decreciente
fueron las de variedad 17, 14 y 1, mientras que en el análisis considerando también
bloques incompletos (DBI) fueron la 17, 1 y 15.
El error estándar de la diferencia de dos medias en el primer análisis fue de 0.158 y el
del segundo fue de 0.122 en promedio (para calcular el promedio de los errores estándar
de las diferencias, el procedimiento usual es elevar al cuadrado cada error estándar,
promediar estos valores y luego tomar la raíz cuadrada de este promedio). La eficiencia
de este modelo con respecto al anterior se puede calcular como:
218
Modelos Lineales Mixtos en InfoStat
2
2
σ DifDBCA
 0.158 
= =
Eficiencia
 =
 1.68
2
σ DifDBI
 0.122 
Es decir, el modelo que considera los bloques incompletos dentro de las repeticiones es
un 68% más eficiente que el modelo que considera solo las repeticiones como en un
DBCA.
A continuación se presenta la síntesis de las medidas de ajuste de los dos modelos,
donde los criterios AIC y BIC sugieren que el BIC es el mejor modelo.
Modelo incluyendo bloques incompletos
N
AIC
BIC
logLik Sigma
R2_0
R2_1
R2_2
72 52.3497 94.1184 -5.1749 0.1532 0.3431 0.6595 0.8961
AIC y BIC menores implica mejor
Modelo sin incluir bloques incompletos
N
AIC
BIC
logLik Sigma
R2_0
R2_1
72 65.2834 105.0631 -12.6417 0.2237 0.3714 0.7015
AIC y BIC menores implica mejor
219
Modelos Lineales Mixtos en InfoStat
Diseño fila-columna latinizado
Los datos de este ejemplo provienen de un ensayo para evaluar 30 variedades de
algodón. Cada una de las variedades se repitió 5 veces (William 1986). En la Figura 145
se presenta el esquema del diseño. Como puede observarse, cada una de las variedades
esta solo una vez en cada columna (columnas latinizadas). A su vez, se han formado
grupos de seis filas cada uno, y cada uno de estos grupos contiene las 30 variedades
(representan una repetición completa). Estas son las dos restricciones a la aleatorización
que se deben considerar en este diseño. A su vez, las filas dentro de cada una de las
repeticiones representan bloques incompletos. Los datos se encuentran en el archivo
Latice fila columna.IBB2.
Para realizar el análisis, en la ventana de selección de variables de Modelos lineales
generales y mixtos seleccionamos Rendimiento como variable, Variedad, Repeticion,
Fila y Columna como criterios de clasificación. Luego, en la solapa Efectos fijos sólo
declaramos Variedad (Figura 146) y en la solapa Efectos aleatorios declaramos el resto
de los efectos como en la Figura 147 .
220
Modelos Lineales Mixtos en InfoStat
Repetición Fila Columna 1 Columna 2 Columna 3 Columna 4 Columna 5
I
II
III
IV
V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
21
10
11
16
30
4
2
27
6
13
8
28
9
18
7
26
12
19
1
15
29
23
20
22
5
24
25
17
14
3
20
3
24
7
2
8
17
18
21
9
19
1
29
14
27
25
30
4
26
16
12
5
10
13
6
23
15
11
28
22
25
29
26
22
27
18
14
24
10
20
3
11
15
5
23
17
16
13
2
21
19
28
30
6
4
1
7
9
8
12
14
28
5
19
9
23
15
29
12
26
30
4
1
22
20
6
24
21
7
3
11
25
17
8
16
10
13
18
27
2
1
13
15
17
6
12
23
25
7
16
5
22
8
10
11
3
28
2
18
27
14
9
4
24
29
19
30
21
26
20
Figura 145: Diagrama del diseño de experimento para el ensayo de 30 variedades de algodón
conducidos como un diseño fila columna latinizado con cinco repeticiones. Todas las variedades están
una vez en cada columna y cada repetición, y las filas representan bloques incompletos.
221
Modelos Lineales Mixtos en InfoStat
Figura 146: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos
del archivo Látice fila columna.IDB2.
222
Modelos Lineales Mixtos en InfoStat
Figura 147: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los
datos del archivo Látice fila columna.IDB2.
A continuación se presenta la salida correspondiente a estas especificaciones.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.006_Rendimiento_REML<-lme(Rendimiento~1+Variedad
,random=list(.U.=pdBlocked(list(pdIdent(~Repeticion-1)
,pdIdent(~Columna-1)))
,Repeticion=pdIdent(~Fila-1))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data06
,keep.data=FALSE)
Resultados para el modelo: modelo.006_Rendimiento_REML
223
Modelos Lineales Mixtos en InfoStat
Variable dependiente: Rendimiento
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0 R2_1 R2_2
150 1673.82 1768.59 -802.91 140.59 0.32 0.63 0.70
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Variedad
numDF denDF F-value p-value
1
116 1285.12 <0.0001
29
116
3.25 <0.0001
Pruebas de hipótesis secuenciales
(Intercept)
Variedad
numDF denDF F-value p-value
1
116 1285.12 <0.0001
29
116
3.25 <0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdBlocked
Formula: ~Repeticion + Columna - 1
Desvíos estándares y correlaciones
Repeticion1
Repeticion2
Repeticion3
Repeticion4
Repeticion5
Columna1
Columna2
Columna3
Columna4
Columna5
D.S.
58.01
58.01
58.01
58.01
58.01
111.22
111.22
111.22
111.22
111.22
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Fila - 1|Repeticion
Desvíos estándares y correlaciones
1
10
11
12
13
14
15
16
17
18
19
D.S.
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
224
Modelos Lineales Mixtos en InfoStat
2
20
21
22
23
24
25
26
27
28
29
3
30
4
5
6
7
8
9
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
50.57
Medias ajustadas y errores estándares para Variedad
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Variedad
27
13
15
6
25
8
10
28
26
29
30
20
5
18
19
7
23
9
22
11
14
24
4
2
3
16
17
1
12
21
Medias
2276.39
2268.83
2224.86
2219.33
2217.33
2210.25
2200.76
2163.75
2161.84
2161.63
2125.28
2114.41
2103.10
2094.48
2090.57
2079.11
2071.82
2044.57
2042.96
2029.67
2026.78
1993.92
1992.30
1977.78
1947.92
1944.82
1944.00
1929.15
1916.32
1802.28
E.E.
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
86.43
A
A
A
A
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
E
E
E
E
E
E
E
E
E
E
E
E
E
E
E
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
G
G
G
G
G
G
G
G
G
G
G
G
G
G
G
G
G
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
H
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
I
J
J
J
J
J
J
J
Medias con una letra común no son significativamente diferentes(p<= 0.05)
225
Modelos Lineales Mixtos en InfoStat
Un análisis de los residuos de este modelo muestra que no hay evidencias que sugieran
violaciones a los supuestos de homoscedasticidad ni de distribución normal (Figura
148), por lo que podemos recomendar variedades en función de su rendimiento de
acuerdo a la prueba LSD de Fisher calculada en el análisis. Las variedades 27, 15, 13, 6,
25, 8, 10, 28, 26, 29, 30, 20, 5 y 18 son las de mayor rendimiento que no difieren
estadísticamente entre sí.
Figura 148: Grafico de dispersión de residuos estandarizados versus predichos y gráfico Q-Q-plot con
los residuos del modelo estimado para los datos del archivo Látice fila columna.IDB2.
226
Modelos Lineales Mixtos en InfoStat
Diseño en látice cuadrado equilibrado
En el ensayo de este ejemplo se probaron 25 variedades de trigo con seis repeticiones.
Dentro de cada cuadrado (repetición) se desea controlar los efectos de fila y de columna
(bloques incompletos en ambos casos). Fue realizado en la Slate Hall Farm,
Cambridgeshire, UK, en 1976 (Gleason, 1997). El esquema del experimento se presenta
a continuación (Figura 149). Los datos se encuentran en el archivo Látice
cuadrado.IDB2. Para analizar estos datos, en el selector de variables de Modelos
lineales generales y mixtos ingresamos Rendimiento con variable, Repeticion, Fila,
Columna y Variedad en criterios de clasificación (Figura 150). Luego de aceptar, en la
solapa Efectos fijos seleccionamos Variedad (Figura 151) y en la solapa de Efectos
aleatorios debemos incluir a la Repetición y luego indicar en el modelo que dentro de
cada repetición tenemos un efecto de filas y de columnas (Figura 152).
1
6
21
11
16
3
1
5
2
4
2
7
22
12
17
18
16
20
17
19
4
9
24
14
19
8
6
10
7
9
3
8
23
13
18
13
11
15
12
14
5
10
25
15
9
23
21
25
22
24
19
8
11
22
5
16
12
4
25
8
23
12
20
1
9
24
20
7
2
11
2
16
24
10
13
10
1
18
14
22
6
25
3
14
17
13
9
21
17
5
15
4
7
18
21
2
23
15
6
19
18
5
6
24
12
10
12
19
21
3
25
7
13
1
19
4
6
13
20
22
9
16
22
15
3
17
24
1
8
15
11
23
4
17
10
11
18
25
2
9
2
14
20
8
21
23
5
7
14
16
Figura 149: Diagrama del diseño de experimento para el ensayo de 25 variedades de trigo conducido
como un látice cuadrado equilibrado. Los cuadros en negrilla representan cada una de las seis
repeticiones dentro de las cuales se desea controlar los efectos de fila y de columna.
227
Modelos Lineales Mixtos en InfoStat
Figura 150: Ventana de selección de variables para Modelos lineales generales y mixtos con los datos
del archivo Látice cuadrado.IDB2.
228
Modelos Lineales Mixtos en InfoStat
Figura 151: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos
del archivo Látice cuadrado.IDB2.
229
Modelos Lineales Mixtos en InfoStat
Figura 152: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los
datos del archivo Látice cuadrado.IDB2.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.000_Rendimiento_REML<-lme(Rendimiento~1+Variedad
,random=list(Repeticion=pdIdent(~1)
,Repeticion=pdIdent(~Fila-1)
,Repeticion=pdIdent(~Columna-1))
,method="REML"
,control=lmeControl(msMaxIter=200)
,na.action=na.omit
,data=R.data00
,keep.data=FALSE)
Resultados para el modelo: modelo.000_Rendimiento_REML
Variable dependiente: Rendimiento
Medidas de ajuste del modelo
230
Modelos Lineales Mixtos en InfoStat
N
AIC
BIC
logLik Sigma R2_0 R2_1 R2_2 R2_3
150 1703.31 1785.33 -822.65 89.79 0.27 0.38 0.67 0.92
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Variedad
numDF denDF F-value p-value
1
120 1216.28 <0.0001
24
120
8.84 <0.0001
Pruebas de hipótesis secuenciales
(Intercept)
Variedad
numDF denDF F-value p-value
1
120 1216.28 <0.0001
24
120
8.84 <0.0001
Parámetros de los efectos aleatorios
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~1|Repeticion
Desvíos estándares relativos al residual y correlaciones
(const)
(const)
0.73
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Fila - 1|Repeticion
Desvíos estándares relativos al residual y correlaciones
1
2
3
4
5
D.S.
1.39
1.39
1.39
1.39
1.39
Modelo de covarianzas de los efectos aleatorios: pdIdent
Formula: ~Columna - 1|Repeticion
Desvíos estándares relativos al residual y correlaciones
1
2
3
4
5
D.S.
1.36
1.36
1.36
1.36
1.36
Medias ajustadas y errores estándares para Variedad
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
231
Modelos Lineales Mixtos en InfoStat
Variedad
Var19
Var22
Var20
Var25
Var13
Var18
Var02
Var24
Var05
Var06
Var17
Var15
Var21
Var12
Var08
Var04
Var03
Var07
Var16
Var23
Var11
Var14
Var09
Var01
Var10
Medias
1669.55
1644.38
1639.95
1630.63
1619.04
1592.18
1549.01
1546.47
1533.27
1527.41
1498.17
1498.01
1493.44
1483.79
1457.37
1451.86
1420.93
1400.73
1346.15
1329.11
1327.25
1326.65
1298.86
1283.59
1193.22
E.E.
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
60.20
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
E
E
E
E
E
E
E
E
E
E
F
F
F
F
F
F
F
F
F
G
G
G
G
G
G
G
G
H
H
H
H
H
I
I
I
I
I
J
J
J
J
J
J
J
K
K
K
K
K
K
K
L
L
L
Medias con una letra común no son significativamente diferentes(p<= 0.05)
Como se vio en el ejemplo de Correlación Espacial (pág. 138) una forma alternativa de
modelar este tipo de ensayos es usar la posición en el espacio de las parcelas (de igual
tamaño y en arreglos rectangulares como hemos visto en todo estos diseños en látices)
como covariables para ajustar una función de correlación espacial. El archivo de datos
Látice cuadrado.IDB2 contiene dos variables, Latitud y Longitud, que pueden ser
usadas con este fin. Para evaluara este modelo alternativo, se declaran las variables
como en la Figura 153. Luego, en la solapa Efectos aleatorios no se declara nada, y en
la solapa Correlaciones se ingresan las variables como en la Figura 154.
232
Modelos Lineales Mixtos en InfoStat
Figura 153: Ventana de selección de variables para Modelos lineales generales y mixtos con la
inclusión de covariables de posición Latitud y Longitud para los datos del archivo Látice
cuadrado.IDB2.
233
Modelos Lineales Mixtos en InfoStat
Figura 154: Ventana de Modelos lineales generales y mixtos con la solapa Correlación desplegada con
la inclusión de covariables de posición Latitud y Longitud para los datos del archivo Látice
cuadrado.IDB2.
Modelos lineales generales y mixtos
Especificación del modelo en R
modelo.002_Rendimiento_REML<-gls(Rendimiento~1+Variedad
,correlation=corExp(form=~as.numeric(as.character(Longitud))+as.numeri
c(as.character(Latitud))
,metric="euclidean"
,nugget=FALSE)
,method="REML"
,na.action=na.omit
,data=R.data02)
Resultados para el modelo: modelo.002_Rendimiento_REML
Variable dependiente: Rendimiento
234
Modelos Lineales Mixtos en InfoStat
Medidas de ajuste del modelo
N
AIC
BIC
logLik Sigma R2_0
150 1692.55 1768.92 -819.28 212.96 0.27
AIC y BIC menores implica mejor
Pruebas de hipótesis marginales (SC tipo III)
(Intercept)
Variedad
numDF F-value p-value
1 399.80 <0.0001
24
7.70 <0.0001
Pruebas de hipótesis secuenciales
(Intercept)
Variedad
numDF F-value p-value
1 393.70 <0.0001
24
7.70 <0.0001
Estructura de correlación
Modelo de correlación: Exponential spatial correlation
Formula: ~ as.numeric(as.character(Longitud)) +
as.numeric(as.character(Latitud))
Metrica: euclidean
Parámetros del modelo
Parámetro Estim
range
2.45
Medias ajustadas y errores estándares para Variedad
LSD Fisher (Alfa=0.05)
Procedimiento de corrección de p-valores: No
Variedad
Var19
Var20
Var13
Var22
Var06
Var24
Var25
Var18
Var17
Var02
Var21
Var05
Var08
Var12
Var15
Var03
Var04
Var07
Var16
Var14
Medias
1664.57
1659.01
1626.37
1589.59
1552.97
1550.00
1544.63
1537.52
1535.60
1531.18
1510.73
1477.87
1473.21
1456.69
1422.74
1407.62
1399.11
1389.06
1332.43
1327.22
E.E.
86.82
87.25
87.32
87.21
86.99
87.19
87.50
87.20
87.60
86.48
87.08
86.64
87.17
87.40
87.02
86.78
86.90
87.46
86.72
87.19
A
A
A
A
A
A
A
A
A
A
B
B
B
B
B
B
B
B
B
C
C
C
C
C
C
C
C
C
C
C
D
D
D
D
D
D
D
D
D
D
D
E
E
E
E
E
E
E
E
E
E
F
F
F
F
F
F
F
F
G
G
G
G
G
G
G
H
H
H
H
H
H
I
I
235
Modelos Lineales Mixtos en InfoStat
Var11
Var23
Var09
Var01
Var10
1326.39
1306.36
1289.71
1231.80
1201.09
87.04
87.02
86.66
86.54
87.28
G
H
H
H
I
I
I
I
I
Medias con una letra común no son significativamente diferentes(p<= 0.05)
Para comparar esto modelos podemos usar los criterios AIC y BIC (debido a que en este
caso un modelo no es un caso particular del otro no podemos usar el cociente de
verosimilitud).
DBI
Correlación Espacial
AIC
1703.31
1692.55
BIC
1785.33
1768.92
A partir de estos resultados podemos inferir que el modelo de correlación espacial ajusta
mejor. Sin embargo, si calculamos el promedio de los errores estándar para las
diferencias de medias de ambos modelos podemos ver que el modelo de correlación
espacial da un valor de 69.118 mientras que el modelo que considera la estructura de
diseño da un valor de 62.019. Así, si el objetivo es comparar medias de variedades,
considerar la estructura de diseño es más adecuado.
236
Modelos Lineales Mixtos en InfoStat
Referencias
Benjamini Y., Hochberg Y.1995. Controlling the false discovery rate: a practical and
powerful approach to multiple testing. J. R. Stat. Soc. Ser. B, 57:289-300.
Benjamini Y., Yekutieli, D. 2001. The control of the false discovery rate in multiple
hypothesis testing under dependency. The Annals of Statistics, 29(4):11651188.
Besag J.E. 1974. Spatial interaction and the statistical analysis of lattice systems. J. R.
Stat. Soc. Ser. B 36: 192-225.
Besag J.E. 1977. Errors-in-variables estimation for Gaussian lattice schemes. J. R. Stat.
Soc. Ser. B 39: 73-78.
Cáceres L., Macchiavelli R, Rojas Y. (2011). A Professional Development Model:
including coaching and problem-based learning. Abstracts, INTED2011
(International
Technology,
Education
and
Development
Conference),
Valencia, Spain.
Casanoves F., Macchiavelli R., Balzarini, M. 2005. Error variation in multienvironment
peanut trials: Within-trial spatial correlation and between-trial heterogeneity.
Crop Science, 45: 1927-1933.
Casanoves F., Macchiavelli R., Balzarini M. 2007. Models for multi-environment yield
trials with fixed and random block effects and homogeneous and
heterogeneous residual variances. Journal of Agriculture of the University of
Puerto Rico, 91(3-4): 117-131.
Cullis B.R., Gogel B.J., Verbyla A.P., Thompson R. 1998. Spatial analysis of multienvironment early generation trials. Biometrics 54: 1-18.
Di Rienzo J.A., Guzman A.W., Casanoves F. (2002). A Multiple Comparisons Method
based On the Distribution of the Root Node Distance of a Binary Tree
Obtained by Average Linkage of the Matrix of Euclidean Distances between
Treatment Means. JABES 7(2), 129-142.
Di Rienzo J. 2007.Curso de Diseño de Experimentos 2007. Maestría en Estadística
Aplicada – UNC. http://vaca.agro.uncor.edu/~estad/cursosposgrado.htm
237
Modelos Lineales Mixtos en InfoStat
Gilmour A.R., Thompson R, Cullis B.R., Verbyla A.P. 1997. Accounting for natural
and extraneous variation in the analysis of field experiments. J. Agric. Biol.
Env. Stat. 2: 269:273.
Gleson A.C. 1997. Spatial Analysis. In R.A. Kempton, P.N. Fox (eds) Statistical
Methods for Plant Variety Evaluation. Chapman & Hall, London.
Hsu J.C. 1996. Multiple Comparisons: Theory and Methods. First edition. Chapman &
Hall, London.
Littell R., Milliken G., Stroup W., Wolfinger R., Schabenberger O. 2006. SAS for
Mixed Models. Second Ed., SAS Institute, Cary, NC.
Littell R., Pendergast J., Natarajan R. 2002. Modelling Covariance Structure in the
Analysis of Repeated Measures Data. Statistics in Medicine 19:1793-1819.
Martínez N. 2006. Determinación de la tasa de degradación de hojarasca de guadua
(Guadua angustifolia) e higuerón (Ficus glabrata) con y sin presencia de
macroinvertebrados acuáticos en una quebrada del Valle del Cauca, Colombia.
Disertación, Departamento de Biología, Universidad del Valle, Colombia.
Mead R. 1971. Models for interplant competition in irregularly spaced population. In:
Statistical Ecology, Patil G.P., Pielou E.C. and Waters W.E. (Eds.).
Pensilvania State University Press, State College, PA, pp: 13-22.
Milliken G.A., Johnson D.E. 1992. Analysis of Messy Data, Vol. 1. Chapman and Hall:
Londres.
Moser E.B., Macchiavelli R. 2002. Model selection techniques for repeated measures
covariance structures. Proceedings of the XIV Conference on Applied
Statistics in Agriculture 14: 17-31.
Navarro C., Cavers S., Pappinen A., Tigerstedt P., Lowe A., Merila J. 2005. Contrasting
quantitative traits and neutral genetic markers for genetic resource assessment
of Mesoamerican Cedrela odorata. Silvae Genetica. 54: 281–292.
Ospina S. 2010. Linking plant strategies and ecosystem function: an assessment of the
contribution of biodiversity to Neotropical grassland productivity. Ph.D. Tesis.
School of the Environment, Natural Resources and Geography, Bangor
University, Gwynedd, United Kingdom, and Program Tropical Agricultural
Research and Higher Education Center (CATIE). Bangor, Reino Unido. 163 p.
238
Modelos Lineales Mixtos en InfoStat
Ospina S., Rusch G.M., Pezo D., Casanoves F., Sinclair F.L. 2012. More stable
productivity of semi natural grasslands than sown pastures in a seasonally dry
climate. Sent to PLoS ONE.
Papadakis J.S. 1937. Méthode statistique pour des experiences sur champ. Institut
d’Amélioration des Plantes a Thessaloniki.
Patterson H.D.,Thompson R., Hunter E.R., Williams E.R. 1989. Analysis of nonorthogonal data using REML. Scottish Agricultural Statistical Services
(unpublished notes from an internal course).
Pinheiro J.C., Bates D.M. 2004. Mixed-Effects Models in S and S-PLUS. Springer,
New York.
Pierson R.A., Ginther O.J. 1987. Follicular population dynamics during the estrus cycle
of the mare. Animal Reproduction Science 14: 219–231.
Ripley B.D. 1981. Spatial Statistics. Wiley, New York.
Williams E.R. 1986. Row and column designs with contigous replicates. Australian
Journal of Statistics 28 :149-154.
Zimmerman D.L., Harville D.A. 1991. A random field approach to the analysis of field
plot experiments and other spatial experiments. Biometrics 47: 223-239.
239
Modelos Mixtos en InfoStat
Índice de cuadros
Cuadro 1. Componentes de varianza estimados para los datos del archivo Compvar.IDB2 ......................................... 38
Cuadro 2. Características y medidas de ajuste de los modelos evaluados para los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 115
Cuadro 3. Criterios de bondad de ajuste para los modelos ajustados con efectos de bloque fijo en los datos del archivo
ECRmani.IDB2 .......................................................................................................................................................... 154
Cuadro 4. Criterios de bondad de ajuste para los modelos ajustados sin efectos de bloque fijo en los datos del archivo
ECRmani.IDB2 .......................................................................................................................................................... 154
Índice de figuras
Figura 1: Solapas con las opciones para especificación de un modelo lineal general y mixto. .......................................2
Figura 2: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Atriplex.IDB2. ............................3
Figura 3: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Bloque.IDB2.......................6
Figura 4: Ventana desplegada con la solapa Comparaciones para los datos del archivo Bloque.IDB2. .........................8
Figura 5: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se incluyen como efectos
aleatorios anidados. ...................................................................................................................................................... 10
Figura 6: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B, C y D se incluyen como efectos
aleatorios anidados (forma explícita). ........................................................................................................................... 10
Figura 7: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de
clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos aleatorios
cruzados. ....................................................................................................................................................................... 11
Figura 8: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de
clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos aleatorios
cruzados con interacción............................................................................................................................................... 11
Figura 9: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso D y C se incluyen como efectos
aleatorios cruzados con interacción y B esta anidado en C. .......................................................................................... 12
Figura 10: Ventana desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro
factores de clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso B y C se incluyen como efectos
aleatorios cruzados, ambos anidados dentro del factor fijo A. ...................................................................................... 12
Figura 11: desplegada con la solapa efectos aleatorios para un ejemplo hipotético en el que hay cuatro factores de
clasificación: A, B, C, y D (A fijo; B, C y D aleatorios). En este caso C y D se incluyen como efectos aleatorios
cruzados, ambos anidados en el efecto aleatorio B. ...................................................................................................... 12
240
Modelos Mixtos en InfoStat
Figura 12: Ventana de diálogo para importar datos desde las librerías de R. ............................................................... 14
Figura 13: Encabezamiento de la tabla de datos del archivo Ovary. ............................................................................. 14
Figura 14: Relación entre el número de folículos (follicles) y el tiempo (Time). ......................................................... 15
Figura 15: Ventana desplegada con la solapa Efectos fijos para los datos del archivo Ovary. .....................................16
Figura 16: Ventana desplegada con la solapa Efectos aleatorios para los datos del archivo Ovary. .............................17
Figura 17: Ventana desplegada con la solapa Correlación para los datos del archivo Ovary. ......................................18
Figura 18: Funciones ajustadas para el número poblacional de folículos (línea sólida negra) y para cada yegua
originada por el efecto aleatorio sobre la constante (archivo Ovary). ........................................................................... 22
Figura 19: Valores suavizados (polinómico de tercer grado) para el número de folículos (lineas sólidas) para cada
yegua (Archivo Ovary). ................................................................................................................................................ 22
Figura 20: Especificación de la parte fija del modelo (3) ............................................................................................. 23
Figura 21: Especificación de la parte aleatoria del modelo (3). .................................................................................... 23
Figura 22: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos
aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos aleatorios: pdSymm. .24
Figura 23: Especificación de la parte aleatoria del modelo (3) pero permitiendo que éstos varien en varianza y estén
correlacionados. ............................................................................................................................................................ 24
Figura 24: Valores predichos para el número de folículos para cada yegua generados por la incluisión de efectos
aleatorios sobre los parámetros del modelo de regresión. Matriz de covarianzas de los efectos aleatorios: pdSymm. .25
Figura 25: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Ovary. .........................26
Figura 26: Ventana comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada (archivo
Atriplex.IDB2).............................................................................................................................................................. 29
Figura 27: Ventana comparación de modelos generales y mixtos con la solapa Combinaciones lineales desplegada
(archivo Atriplex.IDB2). .............................................................................................................................................. 30
Figura 28: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) excluyendo la
modelación de la autocorrelación serial. ....................................................................................................................... 31
Figura 29: Función de autocorrelación de los residuos del modelo presentado en la Ecuación (2) incluyendo la
modelación de la autocorrelación serial. ....................................................................................................................... 32
Figura 30: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo
Compvar.IDB2. ............................................................................................................................................................ 35
Figura 31: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la
especificación del Modelo 1. ........................................................................................................................................ 36
Figura 32: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo
1 con los datos del archivo Compvar.IDB2. ................................................................................................................. 39
Figura 33: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 para los datos del archivo
Compvar.IDB2. ............................................................................................................................................................ 39
241
Modelos Mixtos en InfoStat
Figura 34: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Compvar.IDB2 para la
especificación de varianzas heterogéneas para poblaciones. ........................................................................................ 40
Figura 35: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 1 con varianzas residuales
heterogéneas para poblaciones y los datos del archivo Compvar.IDB2........................................................................ 45
Figura 36: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Compvar.IDB2 para la
especificación del Modelo 2. ........................................................................................................................................ 46
Figura 37: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Compvar.IDB2 para la
especificación del Modelo 2. ........................................................................................................................................ 46
Figura 38: Ventana con la solapa Comparaciones desplegada para los datos del archivo Compvar.IDB2 para la
especificación del Modelo 2. ........................................................................................................................................ 47
Figura 39: Ventana Análisis-exploración de modelos estimados con la solapa Diagnóstico desplegada para el Modelo
2 con los datos del archivo Compvar.IDB2. ................................................................................................................. 51
Figura 40: Gráficos de diagnóstico obtenidos para la variable largo y el Modelo 2 para los datos del archivo
Compvar.IDB2 ............................................................................................................................................................. 52
Figura 41: Gráficos de diagnóstico obtenidos para la variable largo y el modelo 2 para los datos del archivo
Compvar.IDB2 una vez declaradas las varianzas residuales diferentes para cada población. ......................................55
Figura 42: Ventana Modelos lineales generales y mixtos con la solapa Efectos aleatorios desplegada para los datos
del archivo Producciones.IDB2 con los efectos aleatorios Linea y Operario cruzados y su interacción. .....................57
Figura 43: Esquema del diseño en parcelas divididas para el ejemplo de los datos en el archivo Trigo.IDB2 (gris
oscuro=parcelas bajo riego, gris claro=parcelas en secano).......................................................................................... 62
Figura 44: Encabezamiento de la tabla de datos del archivo Trigo.IDB2. .................................................................... 63
Figura 45: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo
Trigo.IDB2. .................................................................................................................................................................. 63
Figura 46: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Trigo.IDB2..............................64
Figura 47: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Trigo.IDB2 con bloque y
agua como criterios de estratificación........................................................................................................................... 65
Figura 48: Ventana Comparación de modelos generales y mixtos con la solapa Diagnóstico desplegada para los datos
del archivo Trigo.IDB2................................................................................................................................................. 67
Figura 49: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Trigo.IDB2. .........................68
Figura 50: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Trigo.IDB2 con
selección de función varIdent con variedad como criterio de agrupamiento. ............................................................... 69
Figura 51: Ventana con la solapa Comparaciones desplegada para los datos del archivo Trigo.IDB2 y selección de la
subsolapa Medias.......................................................................................................................................................... 70
Figura 52: Encabezamiento de la tabla de datos del archivo Cobertura de gotas.IDB2. ............................................... 72
Figura 53: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo
Cobertura de gotas.IDB2. ............................................................................................................................................. 73
Figura 54: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura de gotas.IDB2.........73
242
Modelos Mixtos en InfoStat
Figura 55: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Cobertura de gotas.IDB2
con Parcela como criterio de estratificación. ................................................................................................................ 74
Figura 56: Diagrama de cajas para los residuos estandarizados de Pearson para los niveles del factor Cara. Archivo
Cobertura de gotas.IDB2. ............................................................................................................................................. 75
Figura 57: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura de gotas.IDB2
con Cara como criterio de agrupamiento. ..................................................................................................................... 76
Figura 58: Diagramas de puntos para estudiar la interacción entre Coad y Altura (a) y entre Cara y Altura (b). .........79
Figura 59: Esquema del diseño en parcelas subdivididas para el ejemplo de los datos en el archivo Calidad del
almidón.IDB2. .............................................................................................................................................................. 80
Figura 60: Encabezamiento de la tabla de datos del archivo Calidad del Almidón.IDB2. ............................................ 81
Figura 61: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo Calidad
del Almidón.IDB2. ....................................................................................................................................................... 81
Figura 62: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Calidad del Almidón.IDB2. ....82
Figura 63: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2.
...................................................................................................................................................................................... 83
Figura 64: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo Calidad del Almidón.IDB2
que contempla otra forma de especificar la parte aleatoria. .......................................................................................... 85
Figura 65: Relación entre cobertura y tiempo para cinco tratamientos del archivo Cobertura forrajes.IDB2. .............89
Figura 66: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del ejemplo
Cobertura forrajes.IDB2. .............................................................................................................................................. 91
Figura 67: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Cobertura forrajes.IDB2. ........92
Figura 68: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de efectos aleatorios de Bloque. .................................................................................................................... 93
Figura 69: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de Errores independientes (Modelo 1). ......................................................................................................... 94
Figura 70: Ventana con la solapa Efectos Aleatorios desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de efectos aleatorios de Bloque y Parcela dentro de bloques. ....................................................................... 95
Figura 71: Ventana con la solapa Heteroscedasticidad desplegada para los datos del archivo Cobertura forrajes.IDB2
con selección de función varIdent con tiempo como criterio de agrupamiento. ........................................................... 96
Figura 72: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de Simetría compuesta para datos agrupados por parcela. ........................................................................... 97
Figura 73: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de modelo Autorregresivo de orden 1 para datos agrupados por Bloque y Parcela y orden de las
observaciones indicado por la variable Tiempo. ........................................................................................................... 99
Figura 74: Ventana con la solapa Correlación desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de modelo Sin estructura para datos agrupados por parcela y orden de las observaciones indicado por la
variable Tiempo (Modelo 11). .................................................................................................................................... 101
243
Modelos Mixtos en InfoStat
Figura 75: Ventana del Calculador de probabilidades y cuantiles de InfoStat. ........................................................... 105
Figura 76: Ventana con la solapa Comparaciones desplegada para los datos del archivo Cobertura forrajes.IDB2 y
selección de la subsolapa Contrastes. ......................................................................................................................... 106
Figura 77: Ventana de selector de variables con los datos del archivo CapacidadRespiratoria.IDB2. .......................109
Figura 78: Ventana con la solapa Efectos fijos desplegada con los datos del archivo CapacidadRespiratoria.IDB2. 110
Figura 79: Ventana con la solapa Correlación desplegada, opción Simetría compuesta, con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 111
Figura 80: Ventana con la solapa Correlación desplegada, opción Autorregresivo de orden 1, con los datos del
archivo CapacidadRespiratoria.IDB2. ........................................................................................................................ 112
Figura
81:
Ventana
con
la
solapa
Heteroscedasticidad
desplegada
con
los
datos
del
archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 113
Figura
82:
Ventana
con
la
solapa
Efectos
aleatorios
desplegada
con
los
datos
del
archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 114
Figura 83: Ventana con la solapa Correlación desplegada, opción Sin estructura, con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 115
Figura 84: Ventana de selector de variables para los datos del archivo MedCapRes.IDB2. .......................................119
Figura 85: Ventana de selector de variables con solapa Particiones activada para los datos del archivo
MedCapRes.IDB2....................................................................................................................................................... 120
Figura 86: Gráfico de puntos para estudiar la interacción entre tratamientos y hora con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 121
Figura 87: Ventana con la solapa Comparaciones, subsolapa Contrastes con los datos del archivo
CapacidadRespiratoria.IDB2. ..................................................................................................................................... 122
Figura 88: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro
tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. ................................................................................. 125
Figura 89: Especificación del modelo de regresión lineal con ordenadas al origen y pendientes diferentes para el
logaritmo de la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen
del material vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. ..............................126
Figura 90: Gráfico de puntos para el logaritmo del peso seco remanente en función del tiempo, para los cuatro
tratamientos (Especie-Bolsa). Archivo Descomposición.IDB2. ................................................................................. 127
Figura 91: Gráfico de residuos estudentizados (Pearson) vs. Tiempo, para un modelo de regresión de la materia seca
residual en función del tiempo para cuatro tratamientos (Especia-Bolsa) con diferentes ordenadas y pendientes.
Archivo Descomposición.IDB2. ................................................................................................................................. 128
Figura 92: Especificación del modelo de regresión lineal con ordenadas y pendientes diferentes para el logaritmo de
la materia seca remanente en función del tiempo para cuatro tratamientos dados por la especie de origen del material
vegetal y el tramado de la bolsa que lo almacena. Archivo Descomposición.IDB2. .................................................. 128
Figura 93: Ajustes del modelo de regresión polinómica de orden 2 con ordenadas y pendientes diferentes para el
logaritmo de la materia seca remanente en función del tiempo y el tiempo^2 (centrados) para cuatro tratamientos
244
Modelos Mixtos en InfoStat
dados por la especie de origen del material vegetal y el tramado de la bolsa que lo almacena. Archivo
Descomposición.IDB2. ............................................................................................................................................... 129
Figura 94: Residuos estudentizados (Pearson) vs. Tiempo para el modelo de regresión polinómica de orden 2 con
ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposición.IDB2. ............................................................................................................ 130
Figura 95: Especificación de la parte heteroscedástica del modelo de regresión polinómica de orden 2 con ordenadas
y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposición.IDB2. ............................................................................................................ 130
Figura 96: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas
y pendientes diferentes por tratamiento para el logaritmo de la materia seca remanente en función del tiempo y el
tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la
bolsa que lo almacena. Archivo Descomposición.IDB2. ............................................................................................ 131
Figura 97: Especificación de la parte aleatoria del modelo heteroscedástico de regresión polinómica de orden 2 con
ordenadas y pendientes diferentes para el logaritmo de la materia seca remanente en función del tiempo y el tiempo^2
(centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la bolsa que
lo almacena. Archivo Descomposición.IDB2. ............................................................................................................ 132
Figura 98: Residuos estudentizados (Pearson) vs Tiempo para el modelo heteroscedástico de regresión con ordenadas
y pendientes diferentes por tratamiento y el agregado de un efecto aleatorio sobre la constante que es particular para
cada combinación de tiempo y tratamiento, para el logaritmo de la materia seca remanente en función del tiempo y el
tiempo^2 (centrados) para cuatro tratamientos dados por la especie de origen del material vegetal y el tramado de la
bolsa que lo almacena. Archivo Descomposición.IDB2. ............................................................................................ 132
Figura 99: Intérprete de R. Tiene 4 paneles. Script: contiene el o los programas R que se quieren ejecutar. Output: la
salida de la ejecución de un script o de la visualización de un objeto, Objetos: la lista de los objetos residente en la
memoria de R. Finalmente un panel inferior muestra los mensajes y reporte de errores que envía R a la consola.....133
Figura 100: Curvas de tasas de descomposición según especie y tramado de la bolsa de almacenamiento................137
Figura 101: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo
BF. .............................................................................................................................................................................. 142
Figura 102: Ventana con la solapa Efectos fijos desplegada para los datos del archivo ECRmaní.IDB2 y el Modelo
BA. ............................................................................................................................................................................. 142
Figura 103: Ventana con la solapa Efectos aleatorios desplegada para los datos del archivo ECRmaní.IDB2 y el
Modelo BA. ................................................................................................................................................................ 143
Figura 104: Ventana con la solapa Heteroscedasticidad usando local como criterio de agrupamiento para los datos del
archivo ECRmaní.IDB2 y los Modelos BFH y BAH. ................................................................................................ 144
Figura 105: Ventana con la solapa Correlación usando las variables la y lon como coordenadas en X e Y
respectivamente y local como criterio de agrupamiento para los datos del archivo ECRmaní.IDB2 y los Modelos Exp
y BFExp. ..................................................................................................................................................................... 145
Figura 106: Diagrama de puntos para estudiar la interacción entre localidades y genotipos para la variable
Rendimiento. .............................................................................................................................................................. 159
245
Modelos Mixtos en InfoStat
Figura 107: Esquema de un experimento conducido bajo un diseño strip-plot repetido en bloques completos al azar,
con la aleatorización para un bloque particular de los factores cantidad de nitrógeno y cantidad de riego. Datos del
archivo StripPlot.IDB2. .............................................................................................................................................. 162
Figura 108: Diagramas de puntos de las medias de rendimiento para cada combinación de Riego y Nitrógeno. Datos
archivo StripPlot.IDB2. .............................................................................................................................................. 163
Figura 109: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo
StripPlot.IDB2. ........................................................................................................................................................... 164
Figura 110: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los datos del
archivo StripPlot.IDB2. .............................................................................................................................................. 165
Figura 111: Ventana con la solapa Efectos aleatorios desplegada para evaluar un modelo mixto con los factores
Nitrógeno y Riego cruzados para los datos del archivo StripPlot.IDB2. .................................................................... 166
Figura 112: Ventana se selector de variable para Modelos lineales generales y mixtos los datos del archivo
Lombrices.IDB2. ........................................................................................................................................................ 170
Figura 113: Ventana con la solapa Efectos fijos desplegada para evaluar un modelo mixto con los datos del archivo
Lombrices.IDB2. ........................................................................................................................................................ 171
Figura 114: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación espacial
exponencial en los datos del archivo Lombrices.IDB2. .............................................................................................. 172
Figura 115: Ventana con la solapa Correlación desplegada para evaluar un modelo mixto con correlación
autorregresiva de orden 1 en los datos del archivo Lombrices.IDB2. ......................................................................... 174
Figura 116: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Lombrices.IDB2. .............176
Figura 117: Ventana con la solapa Heteroscedasticidad desplegada para evaluar un modelo mixto con en los datos del
archivo Lombrices.IDB2. ........................................................................................................................................... 177
Figura 118: Diagramas de puntos para estudiar la interacción entre tratamientos y profundidad y su efecto sobre la
biomasa. Datos archivo Lombrices.IDB2. .................................................................................................................. 179
Figura 119: Ventana con la solapa Comparaciones y la subsolapa Contrastes desplegada para evaluar un modelo
mixto con los datos del archivo Lombrices.IDB2. ...................................................................................................... 180
Figura 120: Ventana con la solapa Efectos fijos desplegada para los datos del archivo Testigos_apareados.IDB2. ..183
Figura 121: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y
selección de Correlación espacial exponencial. .......................................................................................................... 185
Figura 122: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y
selección de Correlación espacial Gaussiana. ............................................................................................................. 186
Figura 123: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y
selección de Correlación espacial lineal. .................................................................................................................... 187
Figura 124: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y
selección de Correlación espacial “rational quadratic”. .............................................................................................. 188
Figura 125: Ventana con la solapa Correlación desplegada para los datos del archivo Testigos_apareados.IDB2 y
selección de Correlación espacial esférica. ................................................................................................................. 189
246
Modelos Mixtos en InfoStat
Figura 126: Ventana de selección de variables para Modelos lineales generales y mixtos con datos del archivo
Testigos_apareados.IDB2. .......................................................................................................................................... 192
Figura 127: Relación entre la Ganancia en aprendizaje y la Calificacion previa al entrenamiento suavizada para cada
uno de los maestros. Archivo Ganancia en aprendizaje.IDB2. ................................................................................... 194
Figura 128: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del
archivo Ganancia en aprendizaje.IDB2. ..................................................................................................................... 196
Figura 129: Ventana de selección Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos
del archivo Ganancia en aprendizaje.IDB2................................................................................................................. 197
Figura 130: Ventana de selección de variables del módulo Modelos lineales generales para los datos del archivo
Productividad primaria.IDB2...................................................................................................................................... 199
Figura 131: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del
archivo Productividad primaria.IDB2. ........................................................................................................................ 200
Figura 132: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los
datos del archivo Productividad primaria.IDB2.......................................................................................................... 200
Figura 133: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2
con la variable PPacum como regresora y pastura como factor fijo. .......................................................................... 201
Figura 134: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2
con la variable PPacum y POT_PPacum como regresoras y pastura como factor fijo................................................ 202
Figura 135: Ventana del módulo Modelos lineales generales con la solapa Heteroscedasticidad desplegada para los
datos del archivo Productividad primaria.IDB2 y la selección de la función VarPower............................................. 203
Figura 136: Herramientas gráficas para diagnóstico obtenidas para los datos del archivo Productividad primaria.IDB2
con la variable PPacum y POT_PPacum como regresoras, pastura como factor fijo y una función VarPower para las
varianzas heterogéneas. .............................................................................................................................................. 204
Figura 137: Ventana del módulo Modelos lineales generales con la solapa Efectos fijos desplegada para los datos del
archivo Productividad primaria.IDB2 y la especificación del modelo con interacción............................................... 205
Figura 138: Ventana del módulo Modelos lineales generales con la solapa Efectos aleatorios desplegada para los
datos del archivo Productividad primaria.IDB2 y la selección del efecto de potrero como aleatorio. ........................206
Figura 139: Diagrama de dispersión mostrando la relación entre productividad primaria y precipitación acumulada
para cada una de las pasturas. Archivo productividad primaria.IDB2. ....................................................................... 210
Figura 140: Ventana Exploración de modelos estimados con la solapa Combinaciones lineales desplegada. Archivo
productividad primaria.IDB2. ..................................................................................................................................... 211
Figura 141: Diagrama del diseño de experimento para el ensayo de 18 variedades de cebada conducido como un alfa
látice. Los número romanos a la derecha indican las repeticiones, los número arabicos en la parte superior de la celda
indican los bloques incompletos (de tamaños 4 y 3) y en la parte inferior las variedades. ......................................... 212
Figura 142: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos identificando a las variedades
para los datos del archivo Alfa látice.IDB2. ............................................................................................................... 213
Figura 143: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando a las
repeticiones para los datos del archivo Alfa látice.IDB2. ........................................................................................... 214
247
Modelos Mixtos en InfoStat
Figura 144: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios identificando los efectos
de repetición y bloque incompleto dentro de repetición para los datos del archivo Alfa látice.IDB2. ........................216
Figura 145: Diagrama del diseño de experimento para el ensayo de 30 variedades de algodón conducidos como un
diseño fila columna latinizado con cinco repeticiones. Todas las variedades están una vez en cada columna y cada
repetición, y las filas representan bloques incompletos. ............................................................................................. 221
Figura 146: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo
Látice fila columna.IDB2. .......................................................................................................................................... 222
Figura 147: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del
archivo Látice fila columna.IDB2............................................................................................................................... 223
Figura 148: Grafico de dispersión de residuos estandarizados versus predichos y gráfico Q-Q-plot con los residuos
del modelo estimado para los datos del archivo Látice fila columna.IDB2. ............................................................... 226
Figura 149: Diagrama del diseño de experimento para el ensayo de 25 variedades de trigo conducido como un látice
cuadrado equilibrado. Los cuadros en negrilla representan cada una de las seis repeticiones dentro de las cuales se
desea controlar los efectos de fila y de columna. ........................................................................................................ 227
Figura 150: Ventana de selección de variables para Modelos lineales generales y mixtos con los datos del archivo
Látice cuadrado.IDB2. ................................................................................................................................................ 228
Figura 151: Ventana de Modelos lineales generales y mixtos con la solapa Efectos fijos para los datos del archivo
Látice cuadrado.IDB2. ................................................................................................................................................ 229
Figura 152: Ventana de Modelos lineales generales y mixtos con la solapa Efectos aleatorios para los datos del
archivo Látice cuadrado.IDB2. ................................................................................................................................... 230
Figura 153: Ventana de selección de variables para Modelos lineales generales y mixtos con la inclusión de
covariables de posición Latitud y Longitud para los datos del archivo Látice cuadrado.IDB2...................................233
Figura 154: Ventana de Modelos lineales generales y mixtos con la solapa Correlación desplegada con la inclusión de
covariables de posición Latitud y Longitud para los datos del archivo Látice cuadrado.IDB2...................................234
248
View publication stats
Descargar