Bioestadı́stica: Práctica 3 Introducción a la regresión lineal Objetivos En esta práctica utilizaremos el el paquete estadı́stico SPSS para estudiar la regresión lineal entre dos variables. Veremos también una introducción a la regresión lineal múltiple. Índice 1. Regresión lineal simple. Ajuste de una recta. Coeficiente de correlación. 2. Introducción a la regresión lineal múltiple. Cómo hacer Correlaciones Bivariadas: Analizar/Correlaciones/Bivariadas. El resultado es una tabla en el que se analizan las correlaciones de las variables dos a dos. Podemos seleccionar coeficientes de correlación Pearson y correlaciones significativas. Desde el recuadro Opciones también podemos seleccionar (entre otros) las medias y desviaciones tı́picas de las variables. Regresión Lineal: Analizar/Regresión/Lineal. . . y seleccionamos la variable dependiente y la variable independiente (o las variables dependientes). Este análisis, entre otras cosas, nos muestra: R Múltiple (coeficiente de correlación de Pearson) y R cuadrado (coeficiente de determinación) Tabla de Análisis de la Varianza (ANOVA). Lleva a cabo un contraste de hipótesis en la que contrasta si existe o no dependencia lineal. Una tabla con los coeficientes de la recta de regresión (β1 y β0 ). También al realizar el análisis podemos marcar: Desde el recuadro Guardar. . . podemos almacenar algunas transformaciones de las variables relativas a la regresión lineal (valores pronosticados, intervalos de pronósticos y los residuos). Desde el recuadro Gráficos. . . podemos sacar algunos gráficos (histograma d elos residuos, diagramas de dispersión, gráficos de residuos tipificados, etc.). Gráfico de dispersión: Gráficos/Cuadro de diálogos antiguos/ Dispersión/Puntos. Marcando la opción Dispersión Simple nos permite representar la nube de puntos de dos variables estadı́sticas. Editando el gráfico podemos seleccionar la recta de regresión (u otro tipo de regresión). Predicción: Si se desea hacer estimaciones de la variable dependiente para ciertos valores de la independiente se han de añadir estos valores a la tabla de datos y repetir el análisis de regresión, marcando en la opción Guardar. . . los resultados que se quieren obtener (valores pronosticados y/o intervalos). 1 Ejercicios 1. En un estudio, por medio de detectores radioactivos, de la capacidad corporal para absorber hierro y plomo, participaron diez sujetos. A cada uno se le da una dosis oral idéntica de hierro (sulfato ferroso) y de plomo (cloruro de plomo-203). Después de doce dı́as se mide la cantidad de cada componente retenida en el sistema corporal y, a partir de éstas, se determinan los porcentajes absorbidos por el cuerpo. Los datos obtenidos fueron: Hierro ( %) 17 22 35 43 80 85 91 92 96 Plomo ( %) 8 17 18 25 58 59 41 30 43 100 58 a) Dibuja la nube de puntos. Basándose en ella, ¿se puede esperar que el coeficiente de correlación de Pearson esté próximo a 1, -1 ó 0?. Dibuja la recta de regresión sobre el diagrama de dispersión. b) Halla e interpreta R2 (conocido como coeficiente de determinación). c) Comprueba la idoneidad del modelo de regresión lineal. Si éste es apropiado, estima la recta de regresión. ¿Cuál son sus coeficientes d ) ¿Cuál serı́a la predicción del porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe el 15 % del plomo ingerido. 2. Se realiza un estudio de fotoperiodo en aves acuáticas. Se pretende establecer una ecuación mediante la cual pueda predecirse el tiempo de reproducción, Y , en base al conocimiento del fotoperiodo (número de horas de luz por dı́a) bajo el que se inició la reproducción, X. Se obtuvieron datos del comportamiento de 11 Aythya (patos buceadores). Los resultados fueron los siguientes: Y X 110 54 12.8 13.9 98 14.1 50 14.7 67 15.0 58 52 50 43 15 28 15.1 16.0 16.5 16.6 17.2 17.9 a) Representa los datos gráficamente. ¿Observas dependencia lineal? ¿Cuánto esperarı́as que valiera el coeficiente de correlación lineal (de Pearson)? b) Halla la recta de regresión correspondiente. c) Calcula una predicción del tiempo de reproducción para un fotoperiodo de 14.5 horas. ¿Tendrı́a sentido realizar en este caso una predicción para un fotoperiodo de 24 horas?. 2