Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Estadística Descriptiva II: Relación entre variables Iniciación a la Investigación Ciencias de la Salud Jesús Montanero Fernández MUI Ciencias de la Salud, UEx 25 de octubre de 2010 Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos ¿De qué trata? Descripción conjunto concreto de datos (sin generalizar) Clasificación Tablas de frecuencia Representación Gráficos Resumen Valores típicos Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Tipos de variables ¿? Según SPSS Cualitativas (factores) Nominales: Grupo sanguíneo Ordinales: Grado enfermedad Cuantitativas o de escala : Temperatura, estatura, glucemia, no hijos... Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Problemas estadísticos: relación Tipos de relaciones Cualitativa (factor) ↔ Cuantitativa (Comparación de grupos o tratamientos) Cuantitativa ↔ Cuantitativa (Regresión) Cualitativa (factor) ↔ Cuanlitativa (Tablas de contingencia) Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Relación entre dos variables cuantitativas Peso-altura X =peso(kg) Y =altura(cm) 80 174 45 152 Jesús Montanero Fernández 63 160 94 183 24 102 75 183 56 148 Estadística Descriptiva II: Relación entre variables ... ... Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Gráfico Diagrama de dispersión Y 6 200− 190− q 180− qq 170− 160− q qq q 150− 140− q q q 130− 120− 110− q 100− | | q | | | | | | | | 10 20 30 40 50 60 70 80 90 100 Jesús Montanero Fernández - X Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Otro ejemplo 5,200 5,100 Anchura cabeza 5,000 4,900 4,800 4,700 4,600 4,500 7,800 8,100 8,400 8,700 9,000 Longitud cabeza Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Estudiamos inicialmente relaciones lineales Concentración de calcio (mg/100ml) 11,00 10,00 9,00 8,00 7,00 6,00 5,00 0,00 1,00 2,00 3,00 4,00 5,00 Concentración de hormona paratiroidea (mug/ml) Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Valores típicos Dos tipos De las variables por separados. Referentes a la relación entre las variables Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Variables por separado x, sx , y, Jesús Montanero Fernández sy , ỹ, . . . Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Referentes a la relación entre las variables: Covarianza → r Pn (xi − x)(yi − y) sxy = i=1 n−1 − sx · sy ≤ sxy ≤ + sx · sy . Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Interpretación gráfica −630,71 ≤ sxy ≤ +630,71 sxy = 577,86 200 Altura 175 150 125 100 20 40 60 80 100 Peso Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos 5,200 5,100 Anchura cabeza 5,000 4,900 4,800 4,700 4,600 4,500 7,800 8,100 8,400 8,700 9,000 Longitud cabeza Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Interpretación gráfica covarianza Y q Y 6 q q qq q q 6 q q Y q 6 q q q - X Jesús Montanero Fernández q q qq q q - X q q - X Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Covarianza próxima a cero 8,00 7,00 6,00 y 5,00 4,00 3,00 2,00 1,00 2,00 4,00 6,00 8,00 x Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Covarianza negativa Concentración de calcio (mg/100ml) 11,00 10,00 9,00 8,00 7,00 6,00 5,00 0,00 1,00 2,00 3,00 4,00 5,00 Concentración de hormona paratiroidea (mug/ml) Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Coeficiente de correlación lineal r Medida adimensional del grado de correlación − sx · sy ≤ sxy ≤ + sx · sy . r= sxy sx · sy −1 ≤ r ≤ 1 Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r = 0,91 Y 6 200− 190− q 180− qq 170− 160− q qq q 150− 140− q q q 130− 120− 110− q 100− | | q | | | | | | | | 10 20 30 40 50 60 70 80 90 100 Jesús Montanero Fernández - X Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r = 0,625 5,200 anch 5,000 4,800 4,600 7,800 8,100 8,400 8,700 9,000 longt Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r = −0,97 Concentración de calcio (mg/100ml) 11,00 10,00 9,00 8,00 7,00 6,00 5,00 0,00 1,00 2,00 3,00 4,00 5,00 Concentración de hormona paratiroidea (mug/ml) Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Recta de regresión lineal y = a + b · x y = 89,11 + 1,10x Predicciones: x = 62kg → ŷ = 89,11 + 1,10 · 60 = 155,11cm 200 Altura 175 150 125 100 20 40 60 80 100 Peso Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Regresión múltiple ¿Pueden introducirse más variables explicativas en la ecuación? y = a + b1 x1 + b2 x2 + b3 x3 Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Varianza residual Mide el error cometido por la recta de regresión Pn 1 2 s2y←x = n−2 i=1 [yi − (a + bxi )] = 1335,32/10 xi 80 45 63 94 24 75 56 52 61 34 21 78 yi 174 152 160 183 102 183 148 152 166 140 98 160 (a + bxi ) 176.80 138.44 158.17 192.15 115.42 171.32 150.50 146.11 155.98 126.38 112.12 174.61 Jesús Montanero Fernández [yi − (a + bxi )]2 7.86 183.94 3.36 83.70 180.05 136.37 6.23 34.69 100.48 185.51 199.66 213.47 1335.32 Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Coeficiciente de determinación r2 s2y←x 2 = 1 − rxy s2y 2 1 − rxy indica la proporción de la variabilidad total de Y no explicada por la regresión. 2 rxy expresa lo contrario. Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r2 = 0,82 200 Altura 175 150 125 100 20 40 60 80 100 Peso Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r2 ' 0 8,00 7,00 6,00 y 5,00 4,00 3,00 2,00 1,00 2,00 4,00 6,00 8,00 x Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos r2 = 0,39 5,200 5,100 Anchura cabeza 5,000 4,900 4,800 4,700 4,600 4,500 7,800 8,100 8,400 8,700 9,000 Longitud cabeza Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Regresión no lineal Edad días-Peso embrión: Transformar variables 3.000 Peso Embrión 2.000 1.000 0 10 12 14 16 Edad embrión Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Relación entre variables cualitativas nivel contaminación - salud árboles Cloroplastos (3 × 3) Alto Medio Bajo Alto 3 4 13 5 10 5 SO2 Medio Bajo 7 11 2 Total 15 25 20 Jesús Montanero Fernández Total 20 20 20 60 Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Vacunación-hepatitis Vacunación (2 × 2) Sí Hepatitis No Total Sí 11 538 549 Jesús Montanero Fernández No 70 464 534 Total 81 1002 1083 Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Gráfico Barras agrupadas Gráfico de barras Nivel de cloroplastos Cloroplastos alto Cloroplastos medio Cloroplatos bajo 12,5 Recuento 10,0 7,5 5,0 2,5 0,0 SO2 alto SO2 medio SO2 bajo Nivel de SO2 Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Medidas del grado de dependencia Observados vs Esperados independencia: distancia χ2 X (Oij − Eij )2 χ2exp = Eij i,j 0 ≤ χ2exp ≤ +∞ Coeficiente de contingencia de Pearson C s χ2exp C= χ2exp + n s q−1 0≤C≤ , q = min{no filas, no colunas} q Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Ejemplo: cloropastos Tabla 3 × 3. Por lo tanto, r 0≤C≤ 2 = 0,816 3 En este caso concreto, C = 0,444 Grado de asociación medio Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Independencia C = 0 Cloroplastos SO2 (3 × 3) Alto Medio Bajo Total Alto Medio Bajo 5 8.3 6.7 5 8.3 6.7 5 8.3 6.7 15 25 20 Jesús Montanero Fernández Total 20 20 20 60 Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Máxima dependencia C = 0, 816 Los valores observados deberían ser éstos: Cloroplastos SO2 (3 × 3) Alto Medio Bajo Total Alto Medio Bajo 0 0 20 0 20 0 20 0 0 20 20 20 Jesús Montanero Fernández Total 20 20 20 60 Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Cualitativa → cuantitativa Puntuación de ansiedad de Hamilton 20,00 18,00 16,00 5 14,00 12,00 10,00 8,00 Viven solos Viven con otras personas Grupo ¿Influye el estilo de vida en la ansiedad? Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos ¿Influye la acidosis en la glucemia? Nivel de glucemia en el cordón umbilical 100,000 90,000 80,000 70,000 60,000 50,000 40,000 Control Acidosis Respiratoria Acidosis Metabólica Acidosis Mixta Tipo de acidosis Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Contrastes de hipótesis H 0 : µ1 = µ2 = µ3 = µ4 Parámetros poblacionales µ denota la media poblacional de una variable cuantitativa Parámetros muestrales Nosotros sólo contamos con los valores típicos (x,s, etc) de una muestra de cada población. Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables Regresión-correlación Tablas de contingencia Comparación de grupos o tratamientos Inferencia Estadística En general, ¿cómo generalizar conclusiones a partir de una muestra? Jesús Montanero Fernández Estadística Descriptiva II: Relación entre variables