logistica cuadrática

Anuncio
ANEXO:
LA REGRESIÓN LOGÍSTICA CUADRÁTICA
La regresión logística cuadrática, usada con frecuencia en ecología, tiene fórmula:
pi  1 /[1  e (  B0  B1x  B2 x ) ]
2
Donde x es la variable predictora, generalmente es una variable física ó ambiental,
llamada comúnmente gradiente, y pi es la probabilidad de encontrar la especie en cuestión
( y se le conoce como probabilidad de ocurrencia).
La fórmula lleva una estructura cuadrática, toda vez que con esa estructura se simula
una distribución de la ocurrencia de la especie en forma de campana simétrica a lo largo
del gradiente. (con la regresión logística ordinaria se simularía una distribución en forma de S ó de S invertida,
lo cual no es una distribución realista para la mayoría de las especies).
Algunos parámetros de esta regresión son:
Óptimo: Valor del gradiente donde la probabilidad de ocurrencia es máxima.
Tolerancia: Es una medida de amplitud de la ocurrencia, es el rango de valores del
gradiente donde la especie puede subsistir.
Probabilidad máxima: Es la probabilidad máxima de ocurrencia ( es la probabilidad de
ocurrencia en el óptimo).
Éstos tres parámetros pueden ser obtenidos a partir de los valores de b0, b1 y b2 ; en
esta macro puedes obtenerlos.
El procedimiento para manejar la regresión cuadrática es Statistica puede seguir los
pasos que se ilustran con el siguiente ejemplo:
Ejemplo:
Las medidas halladas en este archivo conciernen a la ausencia ( 0 ) ó presencia ( 1 )
de la especie Fagus Sylvatica en varios sitios en Francia y las temperaturas máximas
anuales en esos sitios. Realizaremos un análisis de regresión logística cuadrática para
esos datos.
Una vez que tienes vaciados los datos del gradiente y de la presencia de la especie:
Obtén los valores de los cuadrados del gradiente (radiación solar), para ello haz clic en
data → batch transformation fórmulas y verás el siguiente cuadro, escribe o que se
visualiza:
que significa que se creará una tercer variable (columna) que sea el cuadrado de la
segunda variable (temperatura), renombra esa variable como temperatura máxima anual
2
Haga clic en Statistics luego elija Advanced Linear/Nonlinear Models →
Generalized Linear/Nonlinear Models → advanced, → Binomial en Distribución y
Logit en Link functions, → OK →Variables, escoja :
presione Ok → estimates, verá:
cuadro A
( considere que b0, b1 y b2 son de signo contrario a los parámetros que aparecen en la columna de Estimate)
lo que significa que nuestro modelo viene a ser:
pi  1 /[1  e ( 5.04447 1.75399 x 0.12554 x ) ]
2
Dado que los valores de p (están en la última del cuadro A ) para intercept, temp.. máxima
anual y temperatura máxima anual 2 son todos menores que 0.05 concluimos que esas
variables son significativas para explicar la ocurrencia de la especie. No pierda de vista que x
es el gradiente ( temperatura), y que pi es la probabilidad de ocurrencia de la especie, no confundir pi con la p del
cuadro A.
Vaya ahora a graphs → 2D graphs → custom function plots, haga las
especificaciones que se muestran a a continuación:
y presione OK, verá la siguiente gráfica:
donde la temperatura ( x ) se plotea con la probabilidad de ocurrencia de la
especie ( y ). Por otro lado, podemos auxiliarnos en la macro que se habilita
aquí para hallar los valores del óptimo, tolerancia y prob. máxima:
( considere que b0, b1 y b2 son de signo contrario a los parámetros que obtuvimos en el cuadro A )
El valor del óptimo (6.98) parece ser efectivamente el valor central en x de la
campana de la gráfica anterior, recuerde que el óptimo es el valor del gradiente (x)
donde la probabilidad de ocurrencia es máxima. Significa que en los sitios donde la
temp. anual máxima es de 6.98 OC entonces se tiene la mayor posibilidad de encontrar
esa especie. Esa especie parece tener su nicho en climas muy fríos. La probabilidad
máxima (0.74) parece, en efecto, coincidir con la altura de la campana, esa probabilidad
0.74=74% es la de hallar la especie a los 6.98 oC. La tolerancia (1.99) no es claramente
identificable en la gráfica, pero viene a ser la amplitud de un intervalo en el gradiente x
alrededor del óptimo. Significa que la especie halla su subsistencia en el intervalo
(6.98 - 1.99/2 , 6.98 +1.99/2 ) = (6.98 – 0.995 , 6.98 +0.995 ) = ( 5.985 , 7.975
) , esto es, entre 6 y 8 OC de Temp.. máx. anual.
Ejercicio
Realizar un análisis de regresión logística cuadrática con el archivo de oxalis acetosella
Descargar