mat4eso op a. resumen estadistica bidimensional

Anuncio
Matemáticas Pitágoras 4.º ESO / Opción B / Resumen Unidad 14
14
Estadística bidimensional
1. Variables estadísticas bidimensionales
Las variables estadísticas bidimensionales son las que se obtienen al observar simultáneamente dos características de un mismo elemento o individuo de una población. Se representan mediante el par (X, Y) y
toman pares de valores (x1, y1), (x2, y2), …, (xn, yn).
Una tabla de doble entrada o de contingencia es aquella donde se muestran las frecuencias absolutas de
una variable estadística bidimensional. Es la extensión a dos dimensiones de la tabla de frecuencias.
2. Dependencia aleatoria y funcional
Un diagrama de dispersión o nube de puntos es un gráfico que muestra los pares de valores de una variable estadística bidimensional en el plano. Se utiliza para expresar la relación entre dos variables.
La relación entre dos variables unidimensionales se puede observar en un diagrama de dispersión, y puede ser:
• De dependencia funcional, si sus valores se ajustan a una función.
• De dependencia aleatoria o de correlación, si sus valores no se ajustan a una función, pero guardan cierta relación. La correlación puede ser:
– Positiva o directa, si al aumentar una variable, aumenta la otra.
– Negativa o inversa, si al aumentar una variable, la otra disminuye.
– Nula, si no se observa ninguna dependencia entre las variables.
Y
Y
O
X
Y
O
Correlación positiva
X
O
Correlación negativa
X
Correlación nula
3. Covarianza
Las dos variables unidimensionales que componen una variable estadística bidimensional se llaman variables marginales.
Para analizar una variable bidimensional es necesario estudiar sus dos distribuciones marginales, caracterizadas por su media y su desviación típica. Se usa la siguiente notación:
⎪⎧ X, (x , sX )
Variable bidimensional (X, Y) → Distribuciones marginales: ⎪⎨
⎪⎪Y , ( y , s )
Y
⎩
— —
El punto (x , y ) se llama centro de gravedad o de masas de (X, Y).
La covarianza de la variable bidimensional (X, Y) viene dada por:
sXY =
∑(x − x )(y − y ) = x y + ... + x y
i
i
1 1
n
n n
n
1
−x y =
∑x y −x y
i i
n
Matemáticas Pitágoras 4.º ESO / Opción B / Resumen Unidad 14
4. Coeficiente de correlación lineal
El coeficiente de correlación lineal o de Pearson se define como r =
Se demuestra que su valor está entre −1 y 1.
sXY
sX sY
Se puede ver que existe una relación entre el diagrama de dispersión y el coeficiente de correlación lineal.
Y
Y
O
X
Y
Y
O
X
O
X
Y
O
X
0<r<1
O
X
r = −1
−1 < r < 0
r=0
r=1
Correlación negativa
perfecta. Los puntos
están alineados.
Correlación negativa,
más fuerte cuanto
más cerca de −1.
Correlación nula. No
existe dependencia
entre las variables.
Correlación positiva,
más fuerte cuanto
más cerca de 1.
Correlación positiva
perfecta. Los puntos
están alineados.
Dependencia
funcional.
Dependencia
aleatoria.
Independencia
aleatoria.
Dependencia
aleatoria.
Dependencia
funcional.
5. Recta de regresión
— —
La recta de regresión de Y sobre X pasa por el centro de gravedad o de masas (x , y ), y viene dada por la
siguiente expresión:
s
y − y = m( x − x ), donde m = XY2
sX
Sustituyendo en esta ecuación nuevos valores de x se pueden obtener, con cierta aproximación, valores esperados para y, llamados estimaciones o predicciones.
La fiabilidad de estas estimaciones será mayor cuanto más próximo esté el coeficiente de correlación a 1
o −1, y cuando el nuevo valor x no esté alejado de los valores de X.
2
Descargar