SESIÓN 14 Estadística Inferencial para Psicología COEFICIENTE DE CORRELACIÓN DE R de PEARSON Y Rho de SPEARMAN TEMARIO 1.Logro de la sesión 2.R de Pearson 3.Rho de Spearman 4.Ejercicios 5.Conclusión LOGRO DE LA SESIÓN Al finalizar la sesión de aprendizaje el estudiante aplica los conceptos de r de Pearson con la finalidad de aplicarlo en el campo de la psicología y la investigación. Coeficiente de correlación de r de Pearson El coeficiente de correlación r de Pearson se aplica cuando se supone que hay una relación lineal entre dos variables X e Y cuyas mediciones de las variables son al menos en escala de intervalos. Suponiendo además que siguen una distribución normal. CORRELACIÓN: Cuantificación lineal de la relación entre dos variables. CUANTIFICACIÓN: porque convierte la relación en un número, mientras más fuerte sea la relación, mayor será el valor absoluto de la correlación. LINEAL: porque asume que la relación forma una línea recta. ENTRE DOS VARIABLES: porque describe qué tanto cambia una variable X dado un cambio en segunda variable Y. Un índice de correlación (r) es un número entre -1 y 1 que describe la relación entre dos variables. r de Pearson DIRECCIÓN DE LA RELACIÓN CORRELACIÓN NEGATIVA NO CORRELACIÓN CORRELACIÓN POSITIVA Cuando una variable sube la otra baja Cuando un cambio en una de las variables no afecta a la otra Cuando una variable sube, la otra también sube y viceversa Cero Número positivo + Número negativo - r de Pearson MAGNITUD (TAMAÑO) DE LA RELACIÓN • Refleja la magnitud de la asociación, independientemente de las variables de que se trate y de su métrica 0.30 es más fuerte que 0.20, pero menos que 0.40 0.30 es de la misma magnitud que -0.30 Máxima posible: 1 o -1 Mientras más se aleja el índice del cero, más fuerte es la relación Correlación fuerte Correlación moderada Correlación débil r ≥ 0.80 0.50 < r < 0.80 r ≤ 0.50 r de Pearson CORRELACIÓN La correlación no indica por qué un cambio en una de las variables da lugar a cambios en la otra. Es decir, la correlación no implica causalidad. Una correlación alta entre dos variables no significa que una cause a la otra. Las pruebas de estadística Inferencial están basadas en la correlación lineal. r de Pearson EJEMPLOS DE CORRELACIÓN: Variable X (independiente) Variable Y (Dependiente) Correlación Altura Peso Positiva Velocidad Núm. de minutos en llegar Negativa Número de adultos que vive en la casa Número de niños que viven en la casa Autoconcepto académico Logro escolar Positiva Empatía en la práctica clínica Efectividad de la terapia Positiva Número de caries en los niños Vocabulario de los escolares Vacunas aplicadas de H1N1 Prevalencia de H1N1 Negativa Ingreso total Porcentaje del ingreso gastado en alimentos positiva Evaluación en curso de manejo Infracciones de tránsito Negativa Habilidad para remar Tiempo requerido para atravesar un lago Negativa No correlación Ambas debidas a la edad del niño r de Pearson DISPERSIGRAMAS: • Constituyen un medio visual de entender los patrones de los datos numéricos bivariados. Cada punto corresponde a una observación bivariada. • Muestran la dirección y la fuerza de la relación. También evidencian las observaciones extremas o sospechosas. • Se construyen sólo para datos cuantitativos. r de Pearson DISPERSIGRAMAS: r de Pearson PROPIEDADES DE LA CORRELACIÓN LINEAL: • El valor de r no depende de las unidades de medición de ambas variables. • El valor de r es simétrico: no depende de cuál de las dos variables se rotula X e Y • r = ± 1 ocurre sólo cuando todos los puntos en el dispergrama caen exactamente en una línea recta. • “r" mide solamente la relación lineal entre dos variables. Coeficiente de Correlación r de Pearson Coeficiente de Correlación El coeficiente de correlación de Pearson(r), pensado para variables cuantitativas, es un índice que mide el grado de covariación entre distintas variables relacionadas linealmente. Esto significa que puede haber variables fuertemente relacionadas, pero no de forma lineal. 𝒓= 𝒏 σ 𝑿𝒀 − σ 𝑿 σ 𝒀 2 𝒏 σ 𝑿2 −(σ𝑿ሻ . 𝒏 σ 𝒀2 −(σ𝒀ሻ Rango de valores r r = -1 Correlación inversa perfecta r= 1 Correlación directa perfecta 2 Relación inversa Intensa -1 Variables incorreladas 0 Si –1< r ≤ -0.8 Relación Inversa Intensa o fuerte Si –0.8 < r ≤ -0.5 Relación Inversa moderada Si –0.5 < r < 0 Relación Inversa débil Si 0 < r < 0.5 Relación Directa débil Si 0.5 ≤ r < 0.8 Relación Directa moderada Si 0.8 ≤ r < 1 Relación Directa intensa o fuerte Relación directa Intensa +1 Coeficiente de Correlación r de Pearson 330 280 230 180 130 80 30 140 r=0,1 150 160 170 180 190 200 130 120 110 100 90 80 70 60 50 40 30 140 100 100 90 90 80 80 70 70 60 60 50 50 r=0,8 40 30 140 150 160 170 180 190 r=0,4 150 160 170 180 200 200 r=0,99 40 30 140 190 150 160 170 180 190 200 Coeficiente de Correlación r de Pearson 90 80 80 70 60 50 40 30 60 20 10 20 70 50 40 30 r=-0,5 0 140 150 160 170 180 190 200 0 140 80 80 70 70 60 60 50 50 40 40 30 30 20 20 10 0 140 r=-0,95 150 r=-0,7 10 10 160 170 180 190 200 150 160 170 180 190 200 160 170 180 190 200 r=-0,999 0 140 150 Coeficiente de Determinación (r2) El coeficiente de determinación es la proporción o porcentaje de variación total en Y respecto a su media, que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien 𝟎 ≤ 𝑹𝟐 ≤ 𝟏 Descomposición de la variabilidad de Y: ത 2 (𝑌 − 𝑌ሻ = ത 2 (𝑌 − 𝑌ሻ + 2 (𝑌 − 𝑌ሻ SCT = SCR + SCE Variación total (Y) = Variación Explicada + Variación no explicada SCT=SCR+SCE − 𝑌ሻ ത 2 σ ( 𝑌 𝑆𝐶𝑅 2 𝑅 = = 2 ത σ(𝑌 − 𝑌ሻ 𝑆𝐶𝑇 El resultado del 𝑅 2 oscila entre 0 y 1. Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado estará el modelo y, por tanto, menos fiable será. Coeficiente de Determinación (r2) Ejemplo: Si se tiene los siguiente resultados = 2.56665 + 2.7565X Y R2 = 0.8998 → r = 0.9485 Interpretación El ajuste del modelo es bueno, ya que el valor de 𝑅 2 = 0.8998 es cercano a 1, en concreto, el 89,98% de la variabilidad de la variable Y es explicado por la variable X, mediante el modelo de regresión ajustado. Podemos concluir que el modelo lineal es adecuado para describir la relación que existe entre estas variables (X e Y). El coeficiente de correlación de r = 0.9485, es decir existe una relación directa intensa entre la variable X y la variable Y, es decir, a mayor X, mayor Y. En una regresión lineal simple el coeficiente de determinación coincide con la correlación de Pearson elevada al cuadrado. 𝑹𝟐 = 𝒓𝟐 EJERCICIO EXPLICATIVO 1 La Propina que se le otorga a un mozo en un restaurante depende de muchos factores, por ejemplo la cordialidad del personal, Tipo de ambiente, Satisfacción por el servicio, etc. En el siguiente cuadro se tiene la cantidad de propina (s/.) que los clientes de un restaurant dan a los mozos en función al tiempo en que se demora en servir una orden(minutos). Propina(S/) Tiempo de Atención (minutos) 1 3 3 2 3 2 2 4 6 1 1 4 2 3 3 2 Halle e interprete el coeficiente de Correlación y coeficiente de determinación 4 2 CORRELACIÓN DE RANGO DE SPERMAN COEFICIENTE DE CORRELACIÓN DE RANGO DE SPERMAN: Para probar la hipótesis nula H0 : 𝜌 = 0 se supone además la distribución normal. Una medida no paramétrica de la asociación entre dos variables X e Y es el coeficiente de correlación de rangos de Sperman rs (C. Spearman en 1904). Para n pares de datos observados 𝑥𝑖 , 𝑦𝑖 de (X,Y) el coeficiente de correlación de rango de Sperman rs está dado por: 2 6. di rs = 1 – ∑ n(n 2 – 1) Donde 𝑑𝑖 es la diferencia entre los rangos asignados a 𝑥𝑖 e 𝑦𝑖 EJERCICIO EXPLICATIVO 1 Dos profesores, uno de matemáticas y otro de lenguaje, indicaron las notas que le corresponden a cada uno de los ocho alumnos de su grupo en su aprovechamiento escolar. ALUMNOS NOTAS EN MATEMÁTICAS NOTAS EN LENGUAJE Ana 06 10 Carlos 08 05 Bartolomé 09 07 Horacio 10 14 Estela 11 17 Flavia 15 20 Donato 17 12 Gisela 20 15 a) Calcule el coeficiente de correlación por rangos de Spearman b) Pruebe la hipótesis nula contra la alternativa, con un nivel de significancia de 5% EJERCICIO PROPUESTO 2 Se evaluó el coeficiente intelectual de 10 personas, así como el número de horas que veían la televisión a la semana, y se ordenaron (de menor a mayor) de acuerdo con los valores que obtuvieron en cada variable : SOLUCIÓN: Persona 1 2 3 4 5 6 7 8 9 10 Coef. Intelec. (CI) 86 97 99 100 100 103 106 110 113 113 Horas Tv/sem (Tv) 0 20 28 50 28 28 7 17 7 12 a) b) Calcule el coeficiente de correlación por rangos de Spearman Pruebe la hipótesis nula contra la alternativa H1, con un nivel de significancia de 5% EJERCICIO PROPUESTO 3 La tabla a continuación muestra las puntuaciones en la variable X (Inteligencia) e Y (Rendimiento Académico) X 105 116 103 124 137 126 112 129 118 105 Y 4 8 2 7 9 9 3 10 7 6 Calcular: a) El coeficiente de correlación de Pearson e interpretar b) El coeficiente de determinación e interpretar EJERCICIO PROPUESTO 4 Los datos que se dan en la siguiente son los costos y las ventas mensuales, en miles de soles para 14 farmacias: FARMACIAS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 COSTOS 10 09 13 12 11 19 20 14 21 17 18 15 16 22 VENTAS 18 14 19 13 15 32 31 17 28 21 22 19 20 23 Calcular: a) El coeficiente de correlación de Pearson e interpretar b) El coeficiente de determinación e interpretar EJERCICIO PROPUESTO 5 Se desea conocer el grado de correlación entre el tipo de anemia que padecen los niños y el nivel educativo alcanzado por la madre : Calcular: a) El coeficiente de correlación por rango 𝑟𝑠 e interpretar b) ¿Diría usted que el coeficiente es significativo al nivel de significancia del 5%? e interpretar EJERCICIO PROPUESTO 6 En una competencia de habilidades musicales dos jueces calificaron a 10 candidatos. Las calificaciones se muestran en la tabla que sigue : Candidato 1 2 3 4 5 6 7 8 9 10 JUEZ 1 8 9 6 2 1 4 5 7 3 10 JUEZ 2 7 10 8 5 3 2 4 6 1 9 Calcular: a) El coeficiente de correlación por rango de Spearman (𝑟𝑠 ሻ e interpretar b) ¿Diría usted que el coeficiente es significativo al nivel de significancia del 5%? e interpretar Y ahora nos toca interactuar en CANVAS. Usaremos el chat y foro para estar en comunicación permanente, también tendrás que completar algunas actividades programadas.