ANEXO: LA REGRESIÓN LOGÍSTICA CUADRÁTICA La regresión logística cuadrática, usada con frecuencia en ecología, tiene fórmula: pi 1 /[1 e ( B0 B1x B2 x ) ] 2 Donde x es la variable predictora, generalmente es una variable física ó ambiental, llamada comúnmente gradiente, y pi es la probabilidad de encontrar la especie en cuestión ( y se le conoce como probabilidad de ocurrencia). La fórmula lleva una estructura cuadrática, toda vez que con esa estructura se simula una distribución de la ocurrencia de la especie en forma de campana simétrica a lo largo del gradiente. (con la regresión logística ordinaria se simularía una distribución en forma de S ó de S invertida, lo cual no es una distribución realista para la mayoría de las especies). Algunos parámetros de esta regresión son: Óptimo: Valor del gradiente donde la probabilidad de ocurrencia es máxima. Tolerancia: Es una medida de amplitud de la ocurrencia, es el rango de valores del gradiente donde la especie puede subsistir. Probabilidad máxima: Es la probabilidad máxima de ocurrencia ( es la probabilidad de ocurrencia en el óptimo). Éstos tres parámetros pueden ser obtenidos a partir de los valores de b0, b1 y b2 ; en esta macro puedes obtenerlos. El procedimiento para manejar la regresión cuadrática es Statistica puede seguir los pasos que se ilustran con el siguiente ejemplo: Ejemplo: Las medidas halladas en este archivo conciernen a la ausencia ( 0 ) ó presencia ( 1 ) de la especie Fagus Sylvatica en varios sitios en Francia y las temperaturas máximas anuales en esos sitios. Realizaremos un análisis de regresión logística cuadrática para esos datos. Una vez que tienes vaciados los datos del gradiente y de la presencia de la especie: Obtén los valores de los cuadrados del gradiente (radiación solar), para ello haz clic en data → batch transformation fórmulas y verás el siguiente cuadro, escribe o que se visualiza: que significa que se creará una tercer variable (columna) que sea el cuadrado de la segunda variable (temperatura), renombra esa variable como temperatura máxima anual 2 Haga clic en Statistics luego elija Advanced Linear/Nonlinear Models → Generalized Linear/Nonlinear Models → advanced, → Binomial en Distribución y Logit en Link functions, → OK →Variables, escoja : presione Ok → estimates, verá: cuadro A ( considere que b0, b1 y b2 son de signo contrario a los parámetros que aparecen en la columna de Estimate) lo que significa que nuestro modelo viene a ser: pi 1 /[1 e ( 5.04447 1.75399 x 0.12554 x ) ] 2 Dado que los valores de p (están en la última del cuadro A ) para intercept, temp.. máxima anual y temperatura máxima anual 2 son todos menores que 0.05 concluimos que esas variables son significativas para explicar la ocurrencia de la especie. No pierda de vista que x es el gradiente ( temperatura), y que pi es la probabilidad de ocurrencia de la especie, no confundir pi con la p del cuadro A. Vaya ahora a graphs → 2D graphs → custom function plots, haga las especificaciones que se muestran a a continuación: y presione OK, verá la siguiente gráfica: donde la temperatura ( x ) se plotea con la probabilidad de ocurrencia de la especie ( y ). Por otro lado, podemos auxiliarnos en la macro que se habilita aquí para hallar los valores del óptimo, tolerancia y prob. máxima: ( considere que b0, b1 y b2 son de signo contrario a los parámetros que obtuvimos en el cuadro A ) El valor del óptimo (6.98) parece ser efectivamente el valor central en x de la campana de la gráfica anterior, recuerde que el óptimo es el valor del gradiente (x) donde la probabilidad de ocurrencia es máxima. Significa que en los sitios donde la temp. anual máxima es de 6.98 OC entonces se tiene la mayor posibilidad de encontrar esa especie. Esa especie parece tener su nicho en climas muy fríos. La probabilidad máxima (0.74) parece, en efecto, coincidir con la altura de la campana, esa probabilidad 0.74=74% es la de hallar la especie a los 6.98 oC. La tolerancia (1.99) no es claramente identificable en la gráfica, pero viene a ser la amplitud de un intervalo en el gradiente x alrededor del óptimo. Significa que la especie halla su subsistencia en el intervalo (6.98 - 1.99/2 , 6.98 +1.99/2 ) = (6.98 – 0.995 , 6.98 +0.995 ) = ( 5.985 , 7.975 ) , esto es, entre 6 y 8 OC de Temp.. máx. anual. Ejercicio Realizar un análisis de regresión logística cuadrática con el archivo de oxalis acetosella