Modelo Lineal Generalizado GAMMA Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: La distribución gamma es de tipo exponencial: 1 Supongamos que se dispone de r subpoblaciones independientes, cada una con distribución gamma con una dispersión común, pero medias posiblemente distintas. De la subpoblación iésima se extraen observaciones i.i.d. . La logverosimilitud de las medias es entonces: Un modelo lineal generalizado gamma queda determinado por el predictor lineal Sobre la función de enlace: Dado que en la distribución gamma , el enlace canónico es la función recíproca: Otro enlace habitual considerado en el ajuste de modelos gamma es ¿Por qué? Antes de dar una respuesta, haremos algunas consideraciones sobre las diferencias entre transformar la respuesta y transformar la media. Supongamos que un estimador de un parámetro tiene una varianza dependiente del mismo, por ejemplo: ¿Qué transformación monótona “estabiliza” la varianza, esto es, hace que la varianza del estimador transformado sea constante? Una aproximación la proporciona el método delta: De modo que podríamos elegir Así, por ejemplo, si la respuesta es Poisson: Si disponemos de una binomial: 2 Si, como es el modelo presente, la respuesta tiene distribución gamma: Dependiendo del problema, la correspondiente transformación h de la respuesta o del estimador, puede ser útil para conseguir IC’s para el parámetro transformado, cuya inversión producirá un IC para el parámetro de interés, generalmente más razonable que el obtenido haciendo uso de la normalidad asintótica del estimador no transformado. En un modelo lineal normal (MLG normal con enlace identidad) se supone que la varianza de la respuesta es constante, independiente de la media, lo que sugiere el uso del criterio de mínimos cuadrados. Si esta relación media-varianza no fuera constante, pero fuera conocida, es posible usar mínimos cuadrados con pesos, y si no es conocida es posible el uso de transformaciones que “estabilicen” la varianza, usando en muchas ocasiones la transformación raíz cuadrada o , habitualmente después de usar el método de Box-Cox para determinar la transformación adecuada que normalice la respuesta. La transformación de la respuesta puede facilitar el ajuste de un modelo lineal mediante mínimos cuadrados, pero generalmente a costa de su interpretabilidad debido al cambio de escala en la respuesta. Por otro lado, si asumimos unos errores normales asociados a una respuesta, perderán la normalidad cuando están asociados a la respuesta transformada. Estos problemas quedan soslayados si en lugar de transformar la respuesta se transforma la media, esto es, se cambia la función de enlace en un MLG, pero la respuesta permanece con la misma distribución asociada. Cuando la respuesta es poisson entonces . Si bien la distribución de poisson es discreta, en el ajuste del MLG solo se usan los momentos de orden 1 y 2 de la distribución, por lo que el ajuste del modelo sería el mismo aunque la respuesta pudiera ser continua ¿quasiverosimilitud? Si podemos suponer que la desviación estándar de la respuesta crece linealmente con la media, entonces el coeficiente de variación debería ser constante, de forma que la varianza sería proporcional al cuadrado de la media: Si, en esta situación, se deseara ajustar un modelo lineal normal, procedería usar la transformación , de modo que la respuesta sería lognormal. Si la respuesta fuera gamma, entonces la varianza es proporcional al cuadrado de la media y procede un MLG gamma, tal vez con enlace log, esto es, con la transformación log aplicada a la media, ¡no a la respuesta! Y transformar la media no afecta a la distribución de los errores. El enlace canónico del modelo gamma, la función recíproca de la media, no garantiza una estimación positiva de la media, lo que sería inadecuado en ocasiones. Un enlace log implica que las variables explicativas tienen un efecto multiplicativo sobre la respuesta media: , . En ocasiones puede ser útil tener en cuenta que si en un modelo gamma la dispersión es pequeña, esto es, si el parámetro de forma es grande, entonces la respuesta es aproximadamente normal, como consecuencia de la reproductividad de la distribución gamma respecto del parámetro de forma y la aplicación del TCL. 3 Estimación de parámetros: El “score” de la media es Es inmediato comprobar que el EMV de la respuesta media en el modelo completo es el vector de medias muestrales observadas en cada subpoblación: Bajo el modelo nulo: Si en la logverosimilitud de las medias “enchufamos” el predictor lineal del modelo, la aplicación del algoritmo IRWLS permite el cálculo de los EMV de los parámetros beta del modelo (no así de la dispersión), así como la estimación de su covarianza asintótica, que en el caso de este modelo gamma, con el enlace log, se reduce a lo siguiente: La expresión de la covarianza es idéntica a la que se obtendría en un modelo lineal normal, que podría ser ajustado como alternativa al modelo gamma, utilizando un enlace identidad y respuesta Y lognormal (esto es, log(Y) normal) transformación que “estabiliza” la varianza cuando el coeficiente de variación es constante. Esta última posibilidad alteraría la escala de la respuesta original, lo que podría complicar la interpretación del modelo. La Deviance: La función Deviance “escalada” del modelo gamma es, fijado el parámetro dispersión, como sigue: Si representamos por al EMV de la media en un modelo M, y consideramos fijada la dispersión, se verifica que, bajo M: siendo p el número de parámetros libres beta del MLG. La deviance no resulta útil para valorar el ajuste de un modelo, dada su dependencia del parámetro dispersión. Si consideramos la deviance “no escalada” o deviance “residual”, podemos definir un estimador de la dispersión, de la siguiente forma: Deviance residual (o “no escalada”) 4 Estimador de la dispersión basado en la deviance: EMV de la dispersión Por otro lado, es especialmente sencilla la obtención del EMV de la dispersión en un MLG gamma. El EMV de las medias se obtiene, como ya hemos visto, independientemente de la dispersión, por consiguiente, es posible alcanzar el EMV de la dispersión maximizando la verosimilitud perfil en el EMV de la media: En la última igualdad, el primer término no depende de la dispersión. El EMV de la dispersión es solución de la ecuación: El último término se anula si no hay datos agrupados (r=n). El error estándar, , puede ser calculado fácilmente, si tenemos en cuenta que: 5 Estimador de la dispersión basado en chi-cuadrado: Si tenemos en cuenta que Algunos autores recomiendan el uso de este último estimador de la dispersión (o del parámetro de forma) basado en el chi-cuadrado, dada la mayor sensibilidad de los otros dos a valores inusualmente pequeños de la respuesta, así como a algunos otros problemas de consistencia detectados. La estimación y obtención de un IC para la respuesta media en valores fijados de las variables explicativas, se resuelve de acuerdo a la regla general seguida en los MLG: por aplicación de la inversa de la función de enlace a los extremos de un IC para el correspondiente predictor lineal, el cual puede obtenerse mediante el método de Wald, teniendo en cuenta la normalidad asintótica del predictor lineal; esta última es consecuencia de la normalidad asintótica de los EMV de los betas. 6