Agro 6998 – Conferencia 2 Introducción a los modelos

Anuncio
Agro 6998 – Conferencia 2
Introducción a los modelos estadísticos mixtos
Los modelos estadísticos permiten modelar la respuesta de un estudio
experimental u observacional en función de factores (tratamientos, grupos, etc.) y/o
covariables (regresoras). Cada uno de estos efectos puede considerarse tanto como
una constante fija (desconocida) o una variable aleatoria. Cada modelo estadístico que
contiene una media general, µ, es un modelo mixto por definición, ya que también
contiene un término de error aleatorio, y por tanto contiene ambos tipos de efectos (la
media general es fija y el error es aleatorio). Sin embargo, en la práctica, el nombre
modelo mixto se reserva usualmente para cualquier modelo que contiene efectos fijos
distintos a µ y efectos aleatorios diferentes a los errores aleatorios.
En general, un efecto es considerado como fijo si los niveles del factor
asociado han sido arbitrariamente determinados por el investigador mientras que se
trata como aleatorio si los niveles en el estudio pueden ser considerados como una
muestra aleatoria de una población de niveles para el factor, es decir existe una
distribución de probabilidad asociada. Para decidir cuándo un conjunto de efectos va a
ser tratado como fijo o aleatorio es importante analizar el contexto de los datos, es
decir el ambiente desde el cual ellos provienen, la manera en la cual se obtuvieron y
principalmente el espacio de inferencia. Si los niveles del factor en consideración no
pueden considerarse como una muestra aleatoria de una población de niveles para
ese factor, los efectos deberían considerarse fijos y la inferencia restringirse a los
niveles del factor considerados en el estudio. Por el contrario, si se desea inferir para
una población de efectos de un determinado factor, los efectos actualmente
considerados en el estudio deberían tratarse como variables aleatorias.
Situación 1: Modelos de efectos fijos.
Consideremos un pequeño experimento diseñado para comparar a tratamientos
(entiéndase existe un factor tratamiento de interés con a niveles) que incluye n
unidades experimentales o repeticiones para cada tratamiento arregladas de acuerdo
a un diseño completamente aleatorizado (cada tratamiento se asigna aleatoriamente a
n unidades experimentales). Si yij representa la respuesta observada en la unidad j del
tratamiento i, yij puede considerarse como una observación aleatoria de una población
1
de observaciones bajo el tratamiento i, que podemos suponer tiene una distribución
normal con media µi y varianza σ2. Luego, un posible modelo para yij podría ser:
E(yij)= µi ,
donde E(.) representa el operador esperanza µi y es la respuesta esperada para una
observación bajo el tratamiento i. En este modelo, llamado modelo de medias, cada µi
es considerada como una constante. Dichas constantes (valores fijos) representan, en
algún sentido, las magnitudes que se desean estimar y comparar. Por ejemplo, puede
ser de interés estimar µi y µj, o µi-µj. Las constantes a estimar µi´s, con i=1,…,a,
corresponden explícitamente a los a tratamientos incluidos en el experimento. Existen
a tratamientos que son de interés y que por tanto han sido arbitrariamente
seleccionados por el investigador para el experimento. El efecto del tratamiento i se
define como τi=µi-µ , donde µ es la media general de la variable respuesta, por lo que
el modelo puede ser re-escrito como:
E(yij)= µ + τi,
que se conoce como modelo de efectos fijos. Los τi representan los efectos de
tratamiento y son obviamente constantes. Si eij representa el valor de la desviación o
diferencia entre yij y su valor esperado, término llamado error en yij, es posible modelar
los datos observados como la suma de su valor esperado y un error aleatorio,
yij = µi + eij o equivalentemente yij = µ + τi + eij .
Conforme a las propiedades distribucionales de yij, y a la definición de eij, los términos
de error son variables aleatorias con media cero,
E(eij)=E[yij -E(yij)]=0
a los cuales usualmente se les atribuye la siguiente estructura de varianzas y
covarianzas:
1. Cada eij tiene la misma varianza, σ2.
2. Los eij son independientes e idénticamente distribuidos, con covarianza entre
cualquier par de ellos igual a cero.
Es esta distribución de probabilidades asociada con los términos de error la que
provee los medios para hacer inferencias sobre las funciones de los µi que son de
2
interés y, si se desea, sobre σ2. Cabe destacar entonces que la manera en que se
obtienen los datos afecta la inferencia que se puede extraer desde ellos. En este
ejemplo se ha descripto el proceso de muestreo pertinente a un modelo de efectos
fijos. Los datos se consideraron como un conjunto posible de datos para estos a
tratamientos, conjunto que podría ser obtenido si se repite el experimento. Cada
repetición del experimento proporciona un muestra diferente de n unidades
experimentales para cada una de los a tratamientos. Los errores “realizados” en el
experimento conforman una muestra aleatoria de una población de términos de error
con media cero, varianza σ2 y covarianzas cero. Los datos en este estudio proveen
estimaciones de las medias de tratamiento y de diferencias entre ellas, la distribución
de los términos de error provee las varianzas para estas estimaciones. Por ejemplo, la
media muestral de las observaciones bajo el tratamiento i, yi , es un estimador de µi,
con varianza σ2/n, y la diferencias de medias muestrales, yi − y j , un estimador de µi-µj
con varianza 2σ2/n. En realidad, σ2 es desconocida y debe ser estimada. Debido a que
los términos de error tienen todos la misma varianza, cada una de las varianzas
muestrales es un estimador de σ2 con n-1 grados de libertad, por lo que el promedio
de las varianzas muestrales es un estimador de σ2 con a(n-1) grados de libertad. Éste
es el estimador usualmente preferido para estimar σ2 en las fórmulas de errores
estándar de las medias de tratamiento o de sus combinaciones lineales a los fines de
la inferencia, cuando los datos son balanceados.
Situación 2. Modelo con efectos aleatorios
Supongamos que existe un gran número de niveles para el factor tratamiento de
interés y por tanto una población de efectos. Supongamos también que a niveles se
seleccionaron aleatoriamente para ser incluidos en el experimento y que cada nivel del
factor
tratamiento
se
asignó
aleatoriamente
a
n
unidades
experimentales
(equivalentemente, que existen n observaciones aleatorias para cada uno de los a
niveles del factor de interés). La selección aleatoria de niveles de tratamiento se
realiza con el propósito de tratarlos como una representación de la población de
efectos hacia la cual se pretende inferir. Si yij representa la respuesta observada en la
unidad j del tratamiento i, un posible modelo para los datos es,
E(yij)= µ + ai,
3
donde µ es la media general de la variable respuesta y ai es el efecto del nivel i del
factor de interés, ai=µi-µ. A pesar de que la expresión anterior es la misma que la
correspondiente al modelo de efectos fijos, los supuestos subyacentes son diferentes
debido a que los niveles en estudio del factor tratamiento representan una muestra
aleatoria desde la población de niveles. La cantidad ai es la realización de una variable
aleatoria “efecto de tratamiento”. Dado que las cantidades ai son variables aleatorias
es necesario caracterizar su distribución de probabilidades. Comúnmente las
cantidades ai se consideran independiente e idénticamente distribuidas, con
esperanza cero y varianza σ a2 para todo i. No obstante, otros supuestos podrían
adecuarse mejor a los datos, por ejemplo covarianza entre pares de efectos.
Debido a que ai es una variable aleatoria, el modelo debe interpretarse como el
valor esperado de yij cuando, la variable aleatoria a, “efecto de tratamiento”, asume el
valor ai. Es decir E(yij)= µ + ai representa una esperanza condicional, la esperanza de
la respuesta dado el nivel del factor de tratamiento observado. Una notación
alternativa para el modelo de efectos aleatorios podría ser,
E(yij | a = ai) = µ + ai , o simplemente E(yij | ai) = µ + ai.
Tomando esperanza respecto a la variable ai, se tiene que E(yij ) = µ . Si definimos los
términos de error como la diferencia entre la cantidad observada y la esperada,
eij = yij - E(yij | ai) = yij - (µ + ai )
Se puede observar nuevamente que eij es una variable aleatoria. Debido a que las
observaciones para cada tratamiento han sido obtenidas de la misma manera que en
la situación 1, las propiedades distribucionales de los términos de error, eij, son
similares. Comúnmente se adiciona el supuesto de que las variables aleatorias eij y ai
se
distribuyen
independientemente,
de
manera
tal
que
las
observaciones
marginalmente se distribuyen con esperanza µ y varianza Var(yij) = σ a2 + σ 2 . Es decir
que, bajo este supuesto, la varianza de las respuestas es una suma de varianzas, una
para cada efecto aleatorio. Generalmente interesa conocer la representación de cada
una de ellas (componente de varianza) en la variabilidad total observada.
Tipos de Modelos Mixtos
Bajo el marco general de los modelos mixtos se pueden considerar distintos tipos de
modelos. Es importante recordar que en general los modelos mixtos se presentan
4
como aquéllos que permiten modelar conjuntos de datos en los que las observaciones
no son independientes.
El tipo más simple de modelo mixto es el modelo de efectos aleatorios presentado en
el ejemplo anterior. En ese modelo, para algunos efectos se asume que existe una
distribución asociada que da origen a una fuente de variación distinta a la variación
residual. Tales efectos se denominan efectos aleatorios. Los modelos de efectos
aleatorios han sido ampliamente usados en agronomía, principalmente en aplicaciones
relacionadas a mejoramiento genético animal y vegetal para estimar heredabilidades y
predecir ganancia genética en programas de mejoramiento (Thompson, 1977). Se
usan también en ensayos comparativos de rendimiento para estimar componentes de
varianzas asociadas a la comparación de efectos de tratamiento conducidos a través
de varias localidades y años, asumiendo que la interacción tratamiento×ambiente es
aleatoria y que los efectos de tratamiento están contenidos dentro de la interacción
aleatoria (Casanoves, 2004). Sin embargo, en otras circunstancias, los efectos que se
permite varíen aleatoriamente están asociados a covariables en lugar de factores de
clasificación. Por ejemplo, en un modelo de regresión Y sobre tiempo, se podría
pensar que la pendiente de la regresión varía aleatoriamente entre los sujetos que
aportan información para el ajuste de la regresión. Por último, en algunas
circunstancias la teoría de los modelos mixtos se usa para modelar directamente el
patrón de correlación o covarianza residual. Los modelos mixtos también pueden, en
la práctica, definirse con combinaciones de efectos aleatorios, efectos de coeficientes
aleatorios y patrones de covarianza. La selección de uno u otro tipo de modelo
depende del objetivo del análisis.
5
Descargar