Subido por Ivan Ramos

S14.s1 - Material (R de Pearson y de Spearman)

Anuncio
SESIÓN 14
Estadística Inferencial para Psicología
COEFICIENTE DE CORRELACIÓN DE
R de PEARSON Y Rho de SPEARMAN
TEMARIO
1.Logro de la sesión
2.R de Pearson
3.Rho de Spearman
4.Ejercicios
5.Conclusión
LOGRO DE LA SESIÓN
Al finalizar la sesión de
aprendizaje el estudiante aplica
los conceptos de r de Pearson
con la finalidad de aplicarlo en
el campo de la psicología y la
investigación.
Coeficiente de correlación de r de Pearson
El coeficiente de correlación r de Pearson se aplica cuando se supone que hay una relación lineal entre dos
variables X e Y cuyas mediciones de las variables son al menos en escala de intervalos. Suponiendo además
que siguen una distribución normal.
 CORRELACIÓN:
Cuantificación lineal de la relación entre dos variables.
 CUANTIFICACIÓN: porque convierte la relación en un número, mientras más fuerte sea la relación, mayor
será el valor absoluto de la correlación.
 LINEAL: porque asume que la relación forma una línea recta.
 ENTRE DOS VARIABLES: porque describe qué tanto cambia una variable X dado un cambio en segunda
variable Y.
Un índice de correlación (r) es un número entre -1 y 1 que describe la relación entre dos variables.
r de Pearson
DIRECCIÓN DE LA RELACIÓN
CORRELACIÓN NEGATIVA
NO CORRELACIÓN
CORRELACIÓN POSITIVA
Cuando una variable sube
la otra baja
Cuando un cambio en una
de las variables no afecta
a la otra
Cuando una variable sube, la otra
también sube y viceversa
Cero
Número positivo
+
Número negativo
-
r de Pearson
MAGNITUD (TAMAÑO) DE LA RELACIÓN
• Refleja la magnitud de la asociación, independientemente de las variables de que
se trate y de su métrica
 0.30 es más fuerte que 0.20, pero menos que 0.40
 0.30 es de la misma magnitud que -0.30
 Máxima posible: 1 o -1
Mientras más se aleja el índice del cero, más fuerte es la relación
Correlación fuerte
Correlación moderada
Correlación débil
r ≥ 0.80
0.50 < r < 0.80
r ≤ 0.50
r de Pearson
CORRELACIÓN
La correlación no indica por qué un cambio
en una de las variables da lugar a cambios
en la otra. Es decir, la correlación no
implica causalidad. Una correlación alta
entre dos variables no significa que una
cause a la otra.
Las pruebas de estadística Inferencial
están basadas en la correlación lineal.
r de Pearson
EJEMPLOS DE CORRELACIÓN:
Variable X (independiente)
Variable Y (Dependiente)
Correlación
Altura
Peso
Positiva
Velocidad
Núm. de minutos en llegar
Negativa
Número de adultos que vive en la casa
Número de niños que viven en la casa
Autoconcepto académico
Logro escolar
Positiva
Empatía en la práctica clínica
Efectividad de la terapia
Positiva
Número de caries en los niños
Vocabulario de los escolares
Vacunas aplicadas de H1N1
Prevalencia de H1N1
Negativa
Ingreso total
Porcentaje del ingreso gastado en alimentos
positiva
Evaluación en curso de manejo
Infracciones de tránsito
Negativa
Habilidad para remar
Tiempo requerido para atravesar un lago
Negativa
No correlación
Ambas debidas a la edad del niño
r de Pearson
DISPERSIGRAMAS:
• Constituyen un medio visual de entender los patrones de los datos
numéricos bivariados. Cada punto corresponde a una observación
bivariada.
• Muestran la dirección y la fuerza de la relación. También evidencian
las observaciones extremas o sospechosas.
• Se construyen sólo para datos cuantitativos.
r de Pearson
DISPERSIGRAMAS:
r de Pearson
PROPIEDADES DE LA CORRELACIÓN LINEAL:
• El valor de r no depende de las unidades de medición de ambas
variables.
• El valor de r es simétrico: no depende de cuál de las dos variables
se rotula X e Y
• r = ± 1 ocurre sólo cuando todos los puntos en el dispergrama caen
exactamente en una línea recta.
• “r" mide solamente la relación lineal entre dos variables.
Coeficiente de Correlación r de Pearson
Coeficiente de Correlación
El coeficiente de correlación de Pearson(r), pensado para variables cuantitativas, es un índice
que mide el grado de covariación entre distintas variables relacionadas linealmente. Esto
significa que puede haber variables fuertemente relacionadas, pero no de forma lineal.
𝒓=
𝒏 σ 𝑿𝒀 − σ 𝑿 σ 𝒀
2
𝒏 σ 𝑿2 −(σ𝑿ሻ . 𝒏 σ 𝒀2 −(σ𝒀ሻ
Rango de valores r
r = -1
Correlación inversa perfecta
r= 1
Correlación directa perfecta
2
Relación
inversa
Intensa
-1
Variables
incorreladas
0
Si –1< r ≤ -0.8  Relación Inversa Intensa o fuerte
Si –0.8 < r ≤ -0.5  Relación Inversa moderada
Si –0.5 < r < 0  Relación Inversa débil
Si 0 < r < 0.5  Relación Directa débil
Si 0.5 ≤ r < 0.8  Relación Directa moderada
Si 0.8 ≤ r < 1  Relación Directa intensa o fuerte
Relación
directa
Intensa
+1
Coeficiente de Correlación r de Pearson
330
280
230
180
130
80
30
140
r=0,1
150
160
170
180
190
200
130
120
110
100
90
80
70
60
50
40
30
140
100
100
90
90
80
80
70
70
60
60
50
50
r=0,8
40
30
140
150
160
170
180
190
r=0,4
150
160
170
180
200
200
r=0,99
40
30
140
190
150
160
170
180
190
200
Coeficiente de Correlación r de Pearson
90
80
80
70
60
50
40
30
60
20
10
20
70
50
40
30
r=-0,5
0
140
150
160
170
180
190
200
0
140
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
0
140
r=-0,95
150
r=-0,7
10
10
160
170
180
190
200
150
160
170
180
190
200
160
170
180
190
200
r=-0,999
0
140
150
Coeficiente de Determinación (r2)
El coeficiente de determinación es la proporción o porcentaje de variación total en Y
respecto a su media, que es explicada por el modelo de regresión. Es usual expresar
esta medida en tanto por ciento, multiplicándola por cien
𝟎 ≤ 𝑹𝟐 ≤ 𝟏
Descomposición de la variabilidad de Y:
ത 2
෍(𝑌 − 𝑌ሻ
=
ത 2
෍(𝑌෠ − 𝑌ሻ
+
෠ 2
෍(𝑌 − 𝑌ሻ
SCT
=
SCR
+
SCE
Variación
total (Y)
=
Variación
Explicada
+
Variación no
explicada
SCT=SCR+SCE
෠ − 𝑌ሻ
ത 2
σ
(
𝑌
𝑆𝐶𝑅
2
𝑅 =
=
2
ത
σ(𝑌 − 𝑌ሻ
𝑆𝐶𝑇
El resultado del 𝑅 2 oscila entre 0
y 1. Cuanto más cerca de 1 se
sitúe su valor, mayor será el
ajuste del modelo a la variable
que estamos intentando explicar.
De forma inversa, cuanto más
cerca de cero, menos ajustado
estará el modelo y, por tanto,
menos fiable será.
Coeficiente de Determinación (r2)
Ejemplo: Si se tiene los siguiente resultados
෡ = 2.56665 + 2.7565X
Y
R2 = 0.8998
→ r = 0.9485
Interpretación
 El ajuste del modelo es bueno, ya que el valor de 𝑅 2 = 0.8998 es cercano a 1, en concreto, el
89,98% de la variabilidad de la variable Y es explicado por la variable X, mediante el
modelo de regresión ajustado. Podemos concluir que el modelo lineal es adecuado para
describir la relación que existe entre estas variables (X e Y).
 El coeficiente de correlación de r = 0.9485, es decir existe una relación directa intensa
entre la variable X y la variable Y, es decir, a mayor X, mayor Y.
En una regresión lineal simple el coeficiente de determinación coincide con la correlación de Pearson elevada
al cuadrado.
𝑹𝟐 = 𝒓𝟐
EJERCICIO EXPLICATIVO 1
La Propina que se le otorga a un mozo en un restaurante depende de muchos factores, por
ejemplo la cordialidad del personal, Tipo de ambiente, Satisfacción por el servicio, etc.
En el siguiente cuadro se tiene la cantidad de propina (s/.) que los clientes de un restaurant
dan a los mozos en función al tiempo en que se demora en servir una orden(minutos).
Propina(S/)
Tiempo de Atención (minutos)
1
3
3
2
3
2
2
4
6
1
1
4
2
3
3
2
Halle e interprete el coeficiente de Correlación y coeficiente de determinación
4
2
CORRELACIÓN DE RANGO DE SPERMAN
COEFICIENTE DE CORRELACIÓN DE RANGO DE SPERMAN:
Para probar la hipótesis nula H0 : 𝜌 = 0 se supone además la distribución normal.
Una medida no paramétrica de la asociación entre dos variables X e Y es el coeficiente de correlación de
rangos de Sperman rs (C. Spearman en 1904). Para n pares de datos observados 𝑥𝑖 , 𝑦𝑖 de (X,Y) el coeficiente
de correlación de rango de Sperman rs está dado por:
2
6.
di
rs = 1 –
∑
n(n 2 – 1)
Donde 𝑑𝑖 es la diferencia entre los rangos asignados a 𝑥𝑖 e 𝑦𝑖
EJERCICIO EXPLICATIVO 1
Dos profesores, uno de matemáticas y otro de lenguaje, indicaron las notas que le corresponden a
cada uno de los ocho alumnos de su grupo en su aprovechamiento escolar.
ALUMNOS
NOTAS EN MATEMÁTICAS
NOTAS EN LENGUAJE
Ana
06
10
Carlos
08
05
Bartolomé
09
07
Horacio
10
14
Estela
11
17
Flavia
15
20
Donato
17
12
Gisela
20
15
a) Calcule el coeficiente de correlación por rangos de Spearman
b) Pruebe la hipótesis nula contra la alternativa, con un nivel de significancia de 5%
EJERCICIO PROPUESTO 2
Se evaluó el coeficiente intelectual de 10 personas, así como el número de horas que veían la televisión a la
semana, y se ordenaron (de menor a mayor) de acuerdo con los valores que obtuvieron en cada variable :
SOLUCIÓN:
Persona
1
2
3
4
5
6
7
8
9
10
Coef. Intelec.
(CI)
86
97
99
100
100
103
106
110
113
113
Horas Tv/sem
(Tv)
0
20
28
50
28
28
7
17
7
12
a)
b)
Calcule el coeficiente de correlación por rangos de Spearman
Pruebe la hipótesis nula contra la alternativa H1, con un nivel de significancia de 5%
EJERCICIO PROPUESTO 3
La tabla a continuación muestra las puntuaciones en la variable X (Inteligencia) e Y (Rendimiento
Académico)
X
105
116
103
124
137
126
112
129
118
105
Y
4
8
2
7
9
9
3
10
7
6
Calcular:
a) El coeficiente de correlación de Pearson e interpretar
b) El coeficiente de determinación e interpretar
EJERCICIO PROPUESTO 4
Los datos que se dan en la siguiente son los costos y las ventas mensuales, en miles de soles para
14 farmacias:
FARMACIAS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
COSTOS
10
09
13
12
11
19
20
14
21
17
18
15
16
22
VENTAS
18
14
19
13
15
32
31
17
28
21
22
19
20
23
Calcular:
a) El coeficiente de correlación de Pearson e interpretar
b) El coeficiente de determinación e interpretar
EJERCICIO PROPUESTO 5
Se desea conocer el grado de correlación entre el tipo de anemia que padecen los niños y el nivel
educativo alcanzado por la madre :
Calcular:
a) El coeficiente de correlación por rango 𝑟𝑠 e interpretar
b) ¿Diría usted que el coeficiente es significativo al nivel de significancia del 5%? e interpretar
EJERCICIO PROPUESTO 6
En una competencia de habilidades musicales dos jueces calificaron a 10 candidatos. Las
calificaciones se muestran en la tabla que sigue :
Candidato
1
2
3
4
5
6
7
8
9
10
JUEZ 1
8
9
6
2
1
4
5
7
3
10
JUEZ 2
7
10
8
5
3
2
4
6
1
9
Calcular:
a) El coeficiente de correlación por rango de Spearman (𝑟𝑠 ሻ e interpretar
b) ¿Diría usted que el coeficiente es significativo al nivel de significancia del 5%? e interpretar
Y ahora nos toca interactuar en CANVAS.
Usaremos el
chat y foro para estar en
comunicación permanente, también tendrás que
completar algunas actividades programadas.
Descargar