Matemáticas Pitágoras 4.º ESO / Opción B / Resumen Unidad 14 14 Estadística bidimensional 1. Variables estadísticas bidimensionales Las variables estadísticas bidimensionales son las que se obtienen al observar simultáneamente dos características de un mismo elemento o individuo de una población. Se representan mediante el par (X, Y) y toman pares de valores (x1, y1), (x2, y2), …, (xn, yn). Una tabla de doble entrada o de contingencia es aquella donde se muestran las frecuencias absolutas de una variable estadística bidimensional. Es la extensión a dos dimensiones de la tabla de frecuencias. 2. Dependencia aleatoria y funcional Un diagrama de dispersión o nube de puntos es un gráfico que muestra los pares de valores de una variable estadística bidimensional en el plano. Se utiliza para expresar la relación entre dos variables. La relación entre dos variables unidimensionales se puede observar en un diagrama de dispersión, y puede ser: • De dependencia funcional, si sus valores se ajustan a una función. • De dependencia aleatoria o de correlación, si sus valores no se ajustan a una función, pero guardan cierta relación. La correlación puede ser: – Positiva o directa, si al aumentar una variable, aumenta la otra. – Negativa o inversa, si al aumentar una variable, la otra disminuye. – Nula, si no se observa ninguna dependencia entre las variables. Y Y O X Y O Correlación positiva X O Correlación negativa X Correlación nula 3. Covarianza Las dos variables unidimensionales que componen una variable estadística bidimensional se llaman variables marginales. Para analizar una variable bidimensional es necesario estudiar sus dos distribuciones marginales, caracterizadas por su media y su desviación típica. Se usa la siguiente notación: ⎪⎧ X, (x , sX ) Variable bidimensional (X, Y) → Distribuciones marginales: ⎪⎨ ⎪⎪Y , ( y , s ) Y ⎩ — — El punto (x , y ) se llama centro de gravedad o de masas de (X, Y). La covarianza de la variable bidimensional (X, Y) viene dada por: sXY = ∑(x − x )(y − y ) = x y + ... + x y i i 1 1 n n n n 1 −x y = ∑x y −x y i i n Matemáticas Pitágoras 4.º ESO / Opción B / Resumen Unidad 14 4. Coeficiente de correlación lineal El coeficiente de correlación lineal o de Pearson se define como r = Se demuestra que su valor está entre −1 y 1. sXY sX sY Se puede ver que existe una relación entre el diagrama de dispersión y el coeficiente de correlación lineal. Y Y O X Y Y O X O X Y O X 0<r<1 O X r = −1 −1 < r < 0 r=0 r=1 Correlación negativa perfecta. Los puntos están alineados. Correlación negativa, más fuerte cuanto más cerca de −1. Correlación nula. No existe dependencia entre las variables. Correlación positiva, más fuerte cuanto más cerca de 1. Correlación positiva perfecta. Los puntos están alineados. Dependencia funcional. Dependencia aleatoria. Independencia aleatoria. Dependencia aleatoria. Dependencia funcional. 5. Recta de regresión — — La recta de regresión de Y sobre X pasa por el centro de gravedad o de masas (x , y ), y viene dada por la siguiente expresión: s y − y = m( x − x ), donde m = XY2 sX Sustituyendo en esta ecuación nuevos valores de x se pueden obtener, con cierta aproximación, valores esperados para y, llamados estimaciones o predicciones. La fiabilidad de estas estimaciones será mayor cuanto más próximo esté el coeficiente de correlación a 1 o −1, y cuando el nuevo valor x no esté alejado de los valores de X. 2