Agro 6998 – Conferencia 2 Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos, grupos, etc.) y/o covariables (regresoras). Cada uno de estos efectos puede considerarse tanto como una constante fija (desconocida) o una variable aleatoria. Cada modelo estadístico que contiene una media general, µ, es un modelo mixto por definición, ya que también contiene un término de error aleatorio, y por tanto contiene ambos tipos de efectos (la media general es fija y el error es aleatorio). Sin embargo, en la práctica, el nombre modelo mixto se reserva usualmente para cualquier modelo que contiene efectos fijos distintos a µ y efectos aleatorios diferentes a los errores aleatorios. En general, un efecto es considerado como fijo si los niveles del factor asociado han sido arbitrariamente determinados por el investigador mientras que se trata como aleatorio si los niveles en el estudio pueden ser considerados como una muestra aleatoria de una población de niveles para el factor, es decir existe una distribución de probabilidad asociada. Para decidir cuándo un conjunto de efectos va a ser tratado como fijo o aleatorio es importante analizar el contexto de los datos, es decir el ambiente desde el cual ellos provienen, la manera en la cual se obtuvieron y principalmente el espacio de inferencia. Si los niveles del factor en consideración no pueden considerarse como una muestra aleatoria de una población de niveles para ese factor, los efectos deberían considerarse fijos y la inferencia restringirse a los niveles del factor considerados en el estudio. Por el contrario, si se desea inferir para una población de efectos de un determinado factor, los efectos actualmente considerados en el estudio deberían tratarse como variables aleatorias. Situación 1: Modelos de efectos fijos. Consideremos un pequeño experimento diseñado para comparar a tratamientos (entiéndase existe un factor tratamiento de interés con a niveles) que incluye n unidades experimentales o repeticiones para cada tratamiento arregladas de acuerdo a un diseño completamente aleatorizado (cada tratamiento se asigna aleatoriamente a n unidades experimentales). Si yij representa la respuesta observada en la unidad j del tratamiento i, yij puede considerarse como una observación aleatoria de una población 1 de observaciones bajo el tratamiento i, que podemos suponer tiene una distribución normal con media µi y varianza σ2. Luego, un posible modelo para yij podría ser: E(yij)= µi , donde E(.) representa el operador esperanza µi y es la respuesta esperada para una observación bajo el tratamiento i. En este modelo, llamado modelo de medias, cada µi es considerada como una constante. Dichas constantes (valores fijos) representan, en algún sentido, las magnitudes que se desean estimar y comparar. Por ejemplo, puede ser de interés estimar µi y µj, o µi-µj. Las constantes a estimar µi´s, con i=1,…,a, corresponden explícitamente a los a tratamientos incluidos en el experimento. Existen a tratamientos que son de interés y que por tanto han sido arbitrariamente seleccionados por el investigador para el experimento. El efecto del tratamiento i se define como τi=µi-µ , donde µ es la media general de la variable respuesta, por lo que el modelo puede ser re-escrito como: E(yij)= µ + τi, que se conoce como modelo de efectos fijos. Los τi representan los efectos de tratamiento y son obviamente constantes. Si eij representa el valor de la desviación o diferencia entre yij y su valor esperado, término llamado error en yij, es posible modelar los datos observados como la suma de su valor esperado y un error aleatorio, yij = µi + eij o equivalentemente yij = µ + τi + eij . Conforme a las propiedades distribucionales de yij, y a la definición de eij, los términos de error son variables aleatorias con media cero, E(eij)=E[yij -E(yij)]=0 a los cuales usualmente se les atribuye la siguiente estructura de varianzas y covarianzas: 1. Cada eij tiene la misma varianza, σ2. 2. Los eij son independientes e idénticamente distribuidos, con covarianza entre cualquier par de ellos igual a cero. Es esta distribución de probabilidades asociada con los términos de error la que provee los medios para hacer inferencias sobre las funciones de los µi que son de 2 interés y, si se desea, sobre σ2. Cabe destacar entonces que la manera en que se obtienen los datos afecta la inferencia que se puede extraer desde ellos. En este ejemplo se ha descripto el proceso de muestreo pertinente a un modelo de efectos fijos. Los datos se consideraron como un conjunto posible de datos para estos a tratamientos, conjunto que podría ser obtenido si se repite el experimento. Cada repetición del experimento proporciona un muestra diferente de n unidades experimentales para cada una de los a tratamientos. Los errores “realizados” en el experimento conforman una muestra aleatoria de una población de términos de error con media cero, varianza σ2 y covarianzas cero. Los datos en este estudio proveen estimaciones de las medias de tratamiento y de diferencias entre ellas, la distribución de los términos de error provee las varianzas para estas estimaciones. Por ejemplo, la media muestral de las observaciones bajo el tratamiento i, yi , es un estimador de µi, con varianza σ2/n, y la diferencias de medias muestrales, yi − y j , un estimador de µi-µj con varianza 2σ2/n. En realidad, σ2 es desconocida y debe ser estimada. Debido a que los términos de error tienen todos la misma varianza, cada una de las varianzas muestrales es un estimador de σ2 con n-1 grados de libertad, por lo que el promedio de las varianzas muestrales es un estimador de σ2 con a(n-1) grados de libertad. Éste es el estimador usualmente preferido para estimar σ2 en las fórmulas de errores estándar de las medias de tratamiento o de sus combinaciones lineales a los fines de la inferencia, cuando los datos son balanceados. Situación 2. Modelo con efectos aleatorios Supongamos que existe un gran número de niveles para el factor tratamiento de interés y por tanto una población de efectos. Supongamos también que a niveles se seleccionaron aleatoriamente para ser incluidos en el experimento y que cada nivel del factor tratamiento se asignó aleatoriamente a n unidades experimentales (equivalentemente, que existen n observaciones aleatorias para cada uno de los a niveles del factor de interés). La selección aleatoria de niveles de tratamiento se realiza con el propósito de tratarlos como una representación de la población de efectos hacia la cual se pretende inferir. Si yij representa la respuesta observada en la unidad j del tratamiento i, un posible modelo para los datos es, E(yij)= µ + ai, 3 donde µ es la media general de la variable respuesta y ai es el efecto del nivel i del factor de interés, ai=µi-µ. A pesar de que la expresión anterior es la misma que la correspondiente al modelo de efectos fijos, los supuestos subyacentes son diferentes debido a que los niveles en estudio del factor tratamiento representan una muestra aleatoria desde la población de niveles. La cantidad ai es la realización de una variable aleatoria “efecto de tratamiento”. Dado que las cantidades ai son variables aleatorias es necesario caracterizar su distribución de probabilidades. Comúnmente las cantidades ai se consideran independiente e idénticamente distribuidas, con esperanza cero y varianza σ a2 para todo i. No obstante, otros supuestos podrían adecuarse mejor a los datos, por ejemplo covarianza entre pares de efectos. Debido a que ai es una variable aleatoria, el modelo debe interpretarse como el valor esperado de yij cuando, la variable aleatoria a, “efecto de tratamiento”, asume el valor ai. Es decir E(yij)= µ + ai representa una esperanza condicional, la esperanza de la respuesta dado el nivel del factor de tratamiento observado. Una notación alternativa para el modelo de efectos aleatorios podría ser, E(yij | a = ai) = µ + ai , o simplemente E(yij | ai) = µ + ai. Tomando esperanza respecto a la variable ai, se tiene que E(yij ) = µ . Si definimos los términos de error como la diferencia entre la cantidad observada y la esperada, eij = yij - E(yij | ai) = yij - (µ + ai ) Se puede observar nuevamente que eij es una variable aleatoria. Debido a que las observaciones para cada tratamiento han sido obtenidas de la misma manera que en la situación 1, las propiedades distribucionales de los términos de error, eij, son similares. Comúnmente se adiciona el supuesto de que las variables aleatorias eij y ai se distribuyen independientemente, de manera tal que las observaciones marginalmente se distribuyen con esperanza µ y varianza Var(yij) = σ a2 + σ 2 . Es decir que, bajo este supuesto, la varianza de las respuestas es una suma de varianzas, una para cada efecto aleatorio. Generalmente interesa conocer la representación de cada una de ellas (componente de varianza) en la variabilidad total observada. Tipos de Modelos Mixtos Bajo el marco general de los modelos mixtos se pueden considerar distintos tipos de modelos. Es importante recordar que en general los modelos mixtos se presentan 4 como aquéllos que permiten modelar conjuntos de datos en los que las observaciones no son independientes. El tipo más simple de modelo mixto es el modelo de efectos aleatorios presentado en el ejemplo anterior. En ese modelo, para algunos efectos se asume que existe una distribución asociada que da origen a una fuente de variación distinta a la variación residual. Tales efectos se denominan efectos aleatorios. Los modelos de efectos aleatorios han sido ampliamente usados en agronomía, principalmente en aplicaciones relacionadas a mejoramiento genético animal y vegetal para estimar heredabilidades y predecir ganancia genética en programas de mejoramiento (Thompson, 1977). Se usan también en ensayos comparativos de rendimiento para estimar componentes de varianzas asociadas a la comparación de efectos de tratamiento conducidos a través de varias localidades y años, asumiendo que la interacción tratamiento×ambiente es aleatoria y que los efectos de tratamiento están contenidos dentro de la interacción aleatoria (Casanoves, 2004). Sin embargo, en otras circunstancias, los efectos que se permite varíen aleatoriamente están asociados a covariables en lugar de factores de clasificación. Por ejemplo, en un modelo de regresión Y sobre tiempo, se podría pensar que la pendiente de la regresión varía aleatoriamente entre los sujetos que aportan información para el ajuste de la regresión. Por último, en algunas circunstancias la teoría de los modelos mixtos se usa para modelar directamente el patrón de correlación o covarianza residual. Los modelos mixtos también pueden, en la práctica, definirse con combinaciones de efectos aleatorios, efectos de coeficientes aleatorios y patrones de covarianza. La selección de uno u otro tipo de modelo depende del objetivo del análisis. 5