1 Modelo Lineal Generalizado GAMMA Distribución gamma: Otra

Anuncio
Modelo Lineal Generalizado GAMMA
Distribución gamma:
Otra parametrización mediante el parámetro de forma y la media:
La distribución gamma es de tipo exponencial:
1
Supongamos que se dispone de r subpoblaciones independientes, cada una con distribución
gamma con una dispersión común, pero medias posiblemente distintas. De la subpoblación iésima se extraen observaciones i.i.d.
.
La logverosimilitud de las medias es entonces:
Un modelo lineal generalizado gamma queda determinado por el predictor lineal
Sobre la función de enlace:
Dado que en la distribución gamma
, el enlace canónico es la función recíproca:
Otro enlace habitual considerado en el ajuste de modelos gamma es
¿Por qué?
Antes de dar una respuesta, haremos algunas consideraciones sobre las diferencias entre
transformar la respuesta y transformar la media.
Supongamos que un estimador de un parámetro tiene una varianza dependiente del mismo,
por ejemplo:
¿Qué transformación monótona “estabiliza” la varianza, esto es, hace que la varianza del
estimador transformado sea constante? Una aproximación la proporciona el método delta:
De modo que podríamos elegir
Así, por ejemplo, si la respuesta es Poisson:
Si disponemos de una binomial:
2
Si, como es el modelo presente, la respuesta tiene distribución gamma:
Dependiendo del problema, la correspondiente transformación h de la respuesta o del
estimador, puede ser útil para conseguir IC’s para el parámetro transformado, cuya inversión
producirá un IC para el parámetro de interés, generalmente más razonable que el obtenido
haciendo uso de la normalidad asintótica del estimador no transformado.
En un modelo lineal normal (MLG normal con enlace identidad) se supone que la varianza de la
respuesta es constante, independiente de la media, lo que sugiere el uso del criterio de
mínimos cuadrados. Si esta relación media-varianza no fuera constante, pero fuera conocida,
es posible usar mínimos cuadrados con pesos, y si no es conocida es posible el uso de
transformaciones que “estabilicen” la varianza, usando en muchas ocasiones la transformación
raíz cuadrada
o
, habitualmente después de usar el método de Box-Cox para
determinar la transformación adecuada que normalice la respuesta.
La transformación de la respuesta puede facilitar el ajuste de un modelo lineal mediante
mínimos cuadrados, pero generalmente a costa de su interpretabilidad debido al cambio de
escala en la respuesta. Por otro lado, si asumimos unos errores normales asociados a una
respuesta, perderán la normalidad cuando están asociados a la respuesta transformada.
Estos problemas quedan soslayados si en lugar de transformar la respuesta se transforma la
media, esto es, se cambia la función de enlace en un MLG, pero la respuesta permanece con la
misma distribución asociada.
Cuando la respuesta es poisson entonces
. Si bien la distribución de
poisson es discreta, en el ajuste del MLG solo se usan los momentos de orden 1 y 2 de la
distribución, por lo que el ajuste del modelo sería el mismo aunque la respuesta pudiera ser
continua ¿quasiverosimilitud?
Si podemos suponer que la desviación estándar de la respuesta crece linealmente con la
media, entonces el coeficiente de variación
debería ser constante, de forma que
la varianza sería proporcional al cuadrado de la media:
Si, en esta situación, se deseara ajustar un modelo lineal normal, procedería usar la
transformación
, de modo que la respuesta sería lognormal.
Si la respuesta fuera gamma, entonces la varianza es proporcional al cuadrado de la media y
procede un MLG gamma, tal vez con enlace log, esto es, con la transformación log aplicada a
la media, ¡no a la respuesta! Y transformar la media no afecta a la distribución de los errores.
El enlace canónico del modelo gamma, la función recíproca de la media, no garantiza una
estimación positiva de la media, lo que sería inadecuado en ocasiones.
Un enlace log implica que las variables explicativas tienen un efecto multiplicativo sobre la
respuesta media:
,
.
En ocasiones puede ser útil tener en cuenta que si en un modelo gamma la dispersión es
pequeña, esto es, si el parámetro de forma
es grande, entonces la respuesta es
aproximadamente normal, como consecuencia de la reproductividad de la distribución gamma
respecto del parámetro de forma y la aplicación del TCL.
3
Estimación de parámetros:
El “score” de la media es
Es inmediato comprobar que el EMV de la respuesta media en el modelo completo es el vector
de medias muestrales observadas en cada subpoblación:
Bajo el modelo nulo:
Si en la logverosimilitud de las medias “enchufamos” el predictor lineal del modelo, la
aplicación del algoritmo IRWLS permite el cálculo de los EMV de los parámetros beta del
modelo (no así de la dispersión), así como la estimación de su covarianza asintótica, que en el
caso de este modelo gamma, con el enlace log, se reduce a lo siguiente:
La expresión de la covarianza es idéntica a la que se obtendría en un modelo lineal normal,
que podría ser ajustado como alternativa al modelo gamma, utilizando un enlace identidad y
respuesta Y lognormal (esto es, log(Y) normal) transformación que “estabiliza” la varianza
cuando el coeficiente de variación es constante. Esta última posibilidad alteraría la escala de la
respuesta original, lo que podría complicar la interpretación del modelo.
La Deviance:
La función Deviance “escalada” del modelo gamma es, fijado el parámetro dispersión, como
sigue:
Si representamos por
al EMV de la media en un modelo M, y consideramos fijada la
dispersión, se verifica que, bajo M:
siendo p el número de parámetros libres beta del MLG.
La deviance no resulta útil para valorar el ajuste de un modelo, dada su dependencia del
parámetro dispersión.
Si consideramos la deviance “no escalada” o deviance “residual”, podemos definir un
estimador de la dispersión, de la siguiente forma:
Deviance residual (o “no escalada”)
4
Estimador de la dispersión basado en la deviance:
EMV de la dispersión
Por otro lado, es especialmente sencilla la obtención del EMV de la dispersión en un MLG
gamma. El EMV de las medias se obtiene, como ya hemos visto, independientemente de la
dispersión, por consiguiente, es posible alcanzar el EMV de la dispersión maximizando la
verosimilitud perfil en el EMV de la media:
En la última igualdad, el primer término no depende de la dispersión.
El EMV de la dispersión es solución de la ecuación:
El último término se anula si no hay datos agrupados (r=n).
El error estándar,
, puede ser calculado fácilmente, si tenemos en cuenta que:
5
Estimador de la dispersión basado en chi-cuadrado:
Si tenemos en cuenta que
Algunos autores recomiendan el uso de este último estimador de la dispersión (o del
parámetro de forma) basado en el chi-cuadrado, dada la mayor sensibilidad de los otros dos a
valores inusualmente pequeños de la respuesta, así como a algunos otros problemas de
consistencia detectados.
La estimación y obtención de un IC para la respuesta media en valores fijados de las variables
explicativas, se resuelve de acuerdo a la regla general seguida en los MLG: por aplicación de la
inversa de la función de enlace a los extremos de un IC para el correspondiente predictor
lineal, el cual puede obtenerse mediante el método de Wald, teniendo en cuenta la normalidad
asintótica del predictor lineal; esta última es consecuencia de la normalidad asintótica de los
EMV de los betas.
6
Descargar