EXTENSIONES DEL MODELO DE REGRESIÓN

Anuncio
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
EXTENSIONES DEL MODELO DE REGRESIÓN
1. Regresión exponencial
2. Regresión polinómica
3. Regresión con variables cualitativas
M. Carmen Carollo, Beatriz Pateiro
Página 1
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
1. Regresión exponencial
Al tratar de explicar (o predecir) la variable Y a través de una covariable X puede ocurrir que la relación no
sea lineal. La regresión exponencial se utiliza cuando podemos asumir que la relación entre ambas
variables es del tipo:
Y β 0 e β1 X + ε
=
En este caso el ajuste se puede reducir a una simple regresión lineal ya que si la relación (X,Y) es
exponencial , entonces (X , Ln(Y)) es lineal:
ln(Y ) =β 0 + β1 X + ε
Podemos entonces ajustar un modelo lineal tomando X como covariable y ln(Y) como variable respuesta.
Ejemplo: Estamos interesados en establecer la relación que existe entre la reacción a un estímulo (variable
dependiente) y el tiempo de exposición a ese estímulo (variable independiente o covariable). Para ello
disponemos de 14 observaciones.
M. Carmen Carollo, Beatriz Pateiro
Página 2
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Si construimos el diagrama de dispersión, vemos que puede ajustarse por una curva (función exponencial)
M. Carmen Carollo, Beatriz Pateiro
Página 3
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Si ajustásemos los datos mediante una regresión lineal tendríamos:
ˆ = 3, 70 − 0, 75tiempo
estím
Aunque el grado de ajuste es bueno , el tiempo explica el 78,1% de la variabilidad de la respuesta al
estímulo, el ajuste puede mejorarse utilizando un ajuste exponencial. Dijimos que este ajuste es
equivalente a ajustar por una regresión lineal los pares:
( ln(Y) , X)
M. Carmen Carollo, Beatriz Pateiro
Página 4
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
ln(estimulo
=
) 1, 68 − 0,33tiempo
Entonces el modelo ajustado es:
estímulo = 5,38e −0,33tiempo
R
con =
2
0,93 > 0, 781
Este proceso puede hacerse directamente con el SPSS de la siguiente forma:
M. Carmen Carollo, Beatriz Pateiro
Página 5
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Analizar / Regresión / Estimación Curvilínea...
Dependiente : estímulo Independientes : tiempo
Modelo : Exponencial
El SPSS nos devuelve la siguiente tabla:
M. Carmen Carollo, Beatriz Pateiro
Página 6
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Resumen del modelo y estimaciones de los parámetros
Variable dependiente:respuesta al estímulo
Estimaciones de los
parámetros
Resumen del modelo
Ecuación
R cuadrado
F
gl1
gl2
Sig.
Constante
b1
Lineal
,781
42,859
1
12
,000
3,696
-,375
Exponencial
,930 158,997
1
12
,000
5,384
-,333
La variable independiente es el tiempo.
El modelo ajustado es:
estímulo = 5,38e −0,33tiempo
M. Carmen Carollo, Beatriz Pateiro
Página 7
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
2. Regresión polinómica
En muchas situaciones, la relación entre dos variables continuas X e Y no se puede expresar a través de una recta sino que
es necesario utilizar otro tipo de funciones, como por ejemplo polinomios de mayor orden (archivo datos_NL.sav)
Con la regresión polinómica e trata de predecir la variable Y a través de un polinomio en X.
Y = β 0 + β1 X + β 2 X 2 + ... + β p X p + ε
Casos particulares:
P=1
Recta de regresión
P=2
Regresión cuadrática
P=3
Regresión cúbica
El ajuste se hace de la misma forma que en el caso de una recta, es decir, utilizando el método de mínimos cuadrados. En
este caso, se minimiza la distancia a la gráfica que rige el modelo.
M. Carmen Carollo, Beatriz Pateiro
Página 8
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Ejemplo: Estamos interesados en establecer la relación que existe entre la variable Ycub y la variable Xcub del archivo de
datos datos_NL.sav.
Dibujamos primero el diagrama de dispersión y vamos haciendo ajustes. Vemos que el ajuste cúbico mejora mucho a los
ajustes lineal ó cuadrático.
M. Carmen Carollo, Beatriz Pateiro
Página 9
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Decidimos entonces realizar un ajuste cúbico, es decir, ajustamos un modelo de la forma:
Y =β 0 + β1 X + β 2 X 2 + β3 X 3
Las estimaciones de los parámetros del modelo se pueden obtener, de la misma forma que
se hace para una recta, en:
Analizar / Regresión / Estimación curvilínea / Cúbica
Para nuestro caso obtenemos la siguiente tabla:
Resumen del modelo y estimaciones de los parámetros
Variable dependiente:Ycub
Resumen del modelo
R
Ecuació cuadrad
n
o
F
gl1
Estimaciones de los parámetros
gl2
Sig.
Constante
b1
Lineal
,172
41,154
1
198
,000
1,206
-,670
Cúbico
,693 147,373
3
196
,000
-,049
-1,922
b2
b3
3,080 1,996
La variable independiente esXcub.
El modelo ajustado es pues:
M. Carmen Carollo, Beatriz Pateiro
Yˆ =
−0, 05 − 2 X + 3 X 2 + 2 X 3
Página 10
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
3. Regresión con variables cualitativas
Puede ocurrir que en la variable respuesta (Y) , además de las covariables (variables contínuas), influyan variables de tipo
cualitativo como por ejemplo el sexo, realizar o no ejercicio físico, etc. Estas variables (atributos o factores) deberían
tenerse en cuenta a la hora de encontrar el modelo de regresión.
Ejemplo: Supongamos que queremos predecir la tensión arterial teniendo en cuenta la edad y el sexo. Tenemos dos
variables explicativas, X= edad (covariable) y el sexo (factor) que en este caso tiene dos modalidades hombre y mujer.
En este caso, para ajustar un modelo de regresión, debemos introducir una nueva variable (variable artificial):
Z = 0 si es hom bre (categoría de referencia )

1 si es mujer

El modelo a ajustar es ahora:
Modelo : Y =β 0 + β1 X + β 2 Z + ε
El coeficiente β mide el efecto incremental en la tensión cuando la edad aumenta en 1 año y el sexo es el mismo.
1
El coeficiente β 2 mide el efecto incremental que produce ser mujer con respecto a ser hombre cuando la edad es la
misma.
M. Carmen Carollo, Beatriz Pateiro
Página 11
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
Procediendo como es usual en la regresión tenemos:
Variables introducidas/eliminadas
Modelo
1
Variables
Variables
introducidas
eliminadas
a
sexo, edad
.
Método
Introducir
a. Todas las variables solicitadas introducidas.
Resumen del modelo
Model
o
R
1
,803a
R cuadrado
corregida
R cuadrado
,645
Error típ. de
la estimación
,635
11,167
a. Variables predictoras: (Constante), sexo, edad
Coeficientes
a
Coeficientes no estandarizados
B
Modelo
1
(Constante)
Error típ.
102,962
4,485
edad
,982
,090
sexo
,980
2,695
M. Carmen Carollo, Beatriz Pateiro
Coeficientes
tipificados
Beta
t
Sig.
22,957
,000
,802
10,922
,000
,027
,364
,717
Página 12
Estadística. FBA I 2011-2012
Extensiones del modelo de regresión
El modelo ajustado sería entonces:
Tensión =
102,96 + 0,982edad + 0,98sexo
Observemos que el sexo no influye de manera significativa.
¿Cómo se interpretarían los parámetros?
El coeficiente asociado a la edad nos indica que la tensión (en media) aumenta 0,982 cuando la edad aumenta en un año
siendo el sexo el mismo. Si el coeficiente del sexo fuese significativo nos indicaría que la tensión (en media) aumenta 0,98
para las mujeres con respecto a los hombres ( para una misma edad).
M. Carmen Carollo, Beatriz Pateiro
Página 13
Descargar