ESTADÍSTICA BIDIMENSIONAL MAT4 Una distribución estadística bivariante (bidimensional) es en la que para cada individuo de la población se estudian dos variables Estas variables se llaman variables marginales. MEDIA ARITMÉTICA donde xi e yi son los valores de las variables, ni es la frecuencia (el número de veces que se repite xi o yi), y N el número de medidas. VARIANZA , ) Es la medida de la dispersión de una variable estadística: COVARIANZA Mide el grado de correlación entre las 2 variables estadísticas. Se halla calculando la media aritmética de las desviaciones respecto de la media de cada una de las variables marginales (x,y) o bien COEFICIENTE DE CORRELACIÓN LINEAL O DE PEARSON En una distribución estadística bidimensional, los valores de estas variables pueden tener una fuerte relación entre sí, una relación baja, o ninguna relación. Se mide con el coeficiente de correlación de Pearson, que se calcula a partir de las varianzas y de la covarianza: positiva covarianza cero negativa no hay correlación correlación inversa r correlación entre las 2 correlación directa variables El valor del cuadrado del coeficiente de correlación de Pearson (r2) indica el grado de explicación de una variable respecto de la otra; por ejemplo, si en una distribución bivariante, el r2 de una variable y sobre una variable x es 0,95, significa que al calcular y a partir de x hay un 5% de variabilidad. RECTA DE REGRESIÓN Es la línea que más se ajusta a la nube de puntos de una distribución. ecuación de la recta pendiente de la recta recta de regresión y sobre x recta de regresión x sobre y Las rectas de regresión y sobre x y x sobre y se cortan en el punto ; es decir, el punto que corresponde a las medias aritméticas de las variables marginales x e y. ¡ATENCIÓN! La pendiente de una NO es la inversa de la pendiente de la otra. Dpto. de Matemáticas – colegio NUESTRA SEÑORA DEL PILAR - Madrid ESTADÍSTICA BIDIMENSIONAL MAT4 1. EJERCICIO Y X 2 5 6 7 9 10 TOTAL 3 4 5 6 7 8 10 TOTALES 4 0 0 0 0 0 4 0 7 0 0 0 0 7 0 11 0 0 0 0 11 0 0 5 5 0 0 10 0 0 3 2 0 0 5 0 0 0 0 1 0 1 0 0 0 0 0 2 2 4 18 8 7 1 2 40 Las calificaciones obtenidas por 40 alumnos de 4º de la ESO en Matemáticas y Física figuran en la siguiente tabla estadística bidimensional. En ella, la variable X es la nota de Matemáticas, e Y, la de Física. Calcula el coeficiente de correlación lineal de Pearson, y analiza el grado de dependencia entre las notas de ambas asignaturas. 2. EJERCICIO Una empresa dedicada a la elaboración y venta de ropa para jóvenes ha realizado los gastos en publicidad y ha obtenido las ventas que figuran en la siguiente tabla. Los datos vienen expresados en miles de euros y se refieren a los últimos 10 años. 7.5 8 8.5 10 10.5 12 13 14 15 18 200 205 230 240 250 270 280 300 310 325 Si denominamos X a la variable gastos en publicidad, e Y a beneficios de ventas, calcula: a) El coeficiente de correlación lineal. Analiza la dependencia de ambas variables b) La recta de regresión de Y sobre X c) La empresa decide invertir el próximo año 25000 euros en publicidad. Si se mantiene la misma tendencia de los años anteriores, ¿cuál es el volumen esperado de ventas? d) Si la empresa desea lograr 500000 euros de ventas, ¿cuánto debe invertir en publicidad? Dpto. de Matemáticas – colegio NUESTRA SEÑORA DEL PILAR - Madrid ESTADÍSTICA BIDIMENSIONAL MAT4 1. EJERCICIO - SOLUCIÓN Realizamos las siguientes tablas: xi fi fixi fixi2 3 4 5 6 7 8 10 Total 4 7 11 10 5 1 2 40 12 28 55 60 35 8 20 218 36 112 275 360 245 64 200 1292 yi fi fiyi fiyi2 2 5 6 7 9 10 4 18 8 7 1 2 8 90 48 49 9 20 16 450 288 343 81 200 Total 40 224 1378 (xi,yi) fij fijxiyi (3,2) (4,5) (5,5) (6,6) (6,7) (7,6) (7,7) (8,9) (10,10) 4 7 11 5 5 3 2 1 2 24 140 275 180 210 126 98 72 200 Total 40 1325 Las medias aritméticas, las desviaciones típicas y la covarianza son: Calculamos, con estos valores, el coeficiente de correlación de Pearson: El valor del coeficiente está próximo a 1 → hay una correlación positiva muy alta entre las 2 variables, las notas de matemáticas y las de Física Dpto. de Matemáticas – colegio NUESTRA SEÑORA DEL PILAR - Madrid ESTADÍSTICA BIDIMENSIONAL MAT4 2. EJERCICIO - SOLUCIÓN Realizamos la tabla para los cálculos: totales xi xi2 yi yi2 xi yi 7,5 8 8,5 10 10,5 12 13 14 15 18 56,25 64 72,25 100 110,25 144 169 196 225 324 200 205 230 240 250 270 280 300 310 325 40000 42025 52900 57600 62500 72900 78400 90000 96100 105625 1500 1640 1955 2400 2625 3240 3640 4200 4650 5850 116,5 1460,75 2610 698050 31700 ¡ATENCIÓN! Ten en cuenta que TODAS las frecuencias, en este caso, son 1 → a) Coeficiente de correlación lineal de Pearson alto grado de dependencia b) Recta de regresión Y sobre X → c) Si x=25000 → sustituimos: euros será el valor de las ventas. d) Si y=500000 → en la misma ecuación: euros debe invertir en publicidad. Dpto. de Matemáticas – colegio NUESTRA SEÑORA DEL PILAR - Madrid