Estadística. FBA I 2011-2012 Extensiones del modelo de regresión EXTENSIONES DEL MODELO DE REGRESIÓN 1. Regresión exponencial 2. Regresión polinómica 3. Regresión con variables cualitativas M. Carmen Carollo, Beatriz Pateiro Página 1 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión 1. Regresión exponencial Al tratar de explicar (o predecir) la variable Y a través de una covariable X puede ocurrir que la relación no sea lineal. La regresión exponencial se utiliza cuando podemos asumir que la relación entre ambas variables es del tipo: Y β 0 e β1 X + ε = En este caso el ajuste se puede reducir a una simple regresión lineal ya que si la relación (X,Y) es exponencial , entonces (X , Ln(Y)) es lineal: ln(Y ) =β 0 + β1 X + ε Podemos entonces ajustar un modelo lineal tomando X como covariable y ln(Y) como variable respuesta. Ejemplo: Estamos interesados en establecer la relación que existe entre la reacción a un estímulo (variable dependiente) y el tiempo de exposición a ese estímulo (variable independiente o covariable). Para ello disponemos de 14 observaciones. M. Carmen Carollo, Beatriz Pateiro Página 2 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Si construimos el diagrama de dispersión, vemos que puede ajustarse por una curva (función exponencial) M. Carmen Carollo, Beatriz Pateiro Página 3 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Si ajustásemos los datos mediante una regresión lineal tendríamos: ˆ = 3, 70 − 0, 75tiempo estím Aunque el grado de ajuste es bueno , el tiempo explica el 78,1% de la variabilidad de la respuesta al estímulo, el ajuste puede mejorarse utilizando un ajuste exponencial. Dijimos que este ajuste es equivalente a ajustar por una regresión lineal los pares: ( ln(Y) , X) M. Carmen Carollo, Beatriz Pateiro Página 4 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión ln(estimulo = ) 1, 68 − 0,33tiempo Entonces el modelo ajustado es: estímulo = 5,38e −0,33tiempo R con = 2 0,93 > 0, 781 Este proceso puede hacerse directamente con el SPSS de la siguiente forma: M. Carmen Carollo, Beatriz Pateiro Página 5 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Analizar / Regresión / Estimación Curvilínea... Dependiente : estímulo Independientes : tiempo Modelo : Exponencial El SPSS nos devuelve la siguiente tabla: M. Carmen Carollo, Beatriz Pateiro Página 6 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Resumen del modelo y estimaciones de los parámetros Variable dependiente:respuesta al estímulo Estimaciones de los parámetros Resumen del modelo Ecuación R cuadrado F gl1 gl2 Sig. Constante b1 Lineal ,781 42,859 1 12 ,000 3,696 -,375 Exponencial ,930 158,997 1 12 ,000 5,384 -,333 La variable independiente es el tiempo. El modelo ajustado es: estímulo = 5,38e −0,33tiempo M. Carmen Carollo, Beatriz Pateiro Página 7 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión 2. Regresión polinómica En muchas situaciones, la relación entre dos variables continuas X e Y no se puede expresar a través de una recta sino que es necesario utilizar otro tipo de funciones, como por ejemplo polinomios de mayor orden (archivo datos_NL.sav) Con la regresión polinómica e trata de predecir la variable Y a través de un polinomio en X. Y = β 0 + β1 X + β 2 X 2 + ... + β p X p + ε Casos particulares: P=1 Recta de regresión P=2 Regresión cuadrática P=3 Regresión cúbica El ajuste se hace de la misma forma que en el caso de una recta, es decir, utilizando el método de mínimos cuadrados. En este caso, se minimiza la distancia a la gráfica que rige el modelo. M. Carmen Carollo, Beatriz Pateiro Página 8 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Ejemplo: Estamos interesados en establecer la relación que existe entre la variable Ycub y la variable Xcub del archivo de datos datos_NL.sav. Dibujamos primero el diagrama de dispersión y vamos haciendo ajustes. Vemos que el ajuste cúbico mejora mucho a los ajustes lineal ó cuadrático. M. Carmen Carollo, Beatriz Pateiro Página 9 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Decidimos entonces realizar un ajuste cúbico, es decir, ajustamos un modelo de la forma: Y =β 0 + β1 X + β 2 X 2 + β3 X 3 Las estimaciones de los parámetros del modelo se pueden obtener, de la misma forma que se hace para una recta, en: Analizar / Regresión / Estimación curvilínea / Cúbica Para nuestro caso obtenemos la siguiente tabla: Resumen del modelo y estimaciones de los parámetros Variable dependiente:Ycub Resumen del modelo R Ecuació cuadrad n o F gl1 Estimaciones de los parámetros gl2 Sig. Constante b1 Lineal ,172 41,154 1 198 ,000 1,206 -,670 Cúbico ,693 147,373 3 196 ,000 -,049 -1,922 b2 b3 3,080 1,996 La variable independiente esXcub. El modelo ajustado es pues: M. Carmen Carollo, Beatriz Pateiro Yˆ = −0, 05 − 2 X + 3 X 2 + 2 X 3 Página 10 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión 3. Regresión con variables cualitativas Puede ocurrir que en la variable respuesta (Y) , además de las covariables (variables contínuas), influyan variables de tipo cualitativo como por ejemplo el sexo, realizar o no ejercicio físico, etc. Estas variables (atributos o factores) deberían tenerse en cuenta a la hora de encontrar el modelo de regresión. Ejemplo: Supongamos que queremos predecir la tensión arterial teniendo en cuenta la edad y el sexo. Tenemos dos variables explicativas, X= edad (covariable) y el sexo (factor) que en este caso tiene dos modalidades hombre y mujer. En este caso, para ajustar un modelo de regresión, debemos introducir una nueva variable (variable artificial): Z = 0 si es hom bre (categoría de referencia ) 1 si es mujer El modelo a ajustar es ahora: Modelo : Y =β 0 + β1 X + β 2 Z + ε El coeficiente β mide el efecto incremental en la tensión cuando la edad aumenta en 1 año y el sexo es el mismo. 1 El coeficiente β 2 mide el efecto incremental que produce ser mujer con respecto a ser hombre cuando la edad es la misma. M. Carmen Carollo, Beatriz Pateiro Página 11 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión Procediendo como es usual en la regresión tenemos: Variables introducidas/eliminadas Modelo 1 Variables Variables introducidas eliminadas a sexo, edad . Método Introducir a. Todas las variables solicitadas introducidas. Resumen del modelo Model o R 1 ,803a R cuadrado corregida R cuadrado ,645 Error típ. de la estimación ,635 11,167 a. Variables predictoras: (Constante), sexo, edad Coeficientes a Coeficientes no estandarizados B Modelo 1 (Constante) Error típ. 102,962 4,485 edad ,982 ,090 sexo ,980 2,695 M. Carmen Carollo, Beatriz Pateiro Coeficientes tipificados Beta t Sig. 22,957 ,000 ,802 10,922 ,000 ,027 ,364 ,717 Página 12 Estadística. FBA I 2011-2012 Extensiones del modelo de regresión El modelo ajustado sería entonces: Tensión = 102,96 + 0,982edad + 0,98sexo Observemos que el sexo no influye de manera significativa. ¿Cómo se interpretarían los parámetros? El coeficiente asociado a la edad nos indica que la tensión (en media) aumenta 0,982 cuando la edad aumenta en un año siendo el sexo el mismo. Si el coeficiente del sexo fuese significativo nos indicaría que la tensión (en media) aumenta 0,98 para las mujeres con respecto a los hombres ( para una misma edad). M. Carmen Carollo, Beatriz Pateiro Página 13