MATEMÁTICAS APLICADAS A LAS CIENCIAS

Anuncio
1º Bachillerato
BLOQUE TEMÁTICO I: ESTADÍSTICA Y PROBABILIDAD.
TEMA 2: DISTRIBUCIONES BIDIMENSIONALES.
1.- INTRODUCCIÓN.
Hasta ahora hemos estudiado una sola característica de una población (talla, peso, estado
civil,...), pero podríamos estudiar simultáneamente varias de ellas. Concretamente, en este tema,
estudiaremos a la vez dos características de una población. Ejemplos:
1.- Peso y altura de una muestra de 100 personas.
2.- Extensión en km 2 y número de habitantes en los distintos países de Europa.
3.- Número de horas que dedican los estudiantes a ver la televisión y resultados académicos.
4.- Producción y ventas de una fábrica.
5.- Edad y número de días que faltan al trabajo los trabajadores de una fábrica...
A este tipo de variable estadística se le llama bidimensional.
Frecuentemente, nos interesa estudiar la relación que existe entre dos características de una
población. Este es el objeto de la “Regresión lineal”.
2. VARIABLES ESTADÍSTICAS BIDIMENSIONALES:
Son las que resultan de la observación de un fenómeno respecto de dos modalidades. Se
representan por el par (X, Y), donde X es una variable estadística unidimensional que toma los
valores x 1 , x 2 , ... x n ; e Y es otra variable estadística unidimensional que toma los valores y 1 ,
y 2 , ... y n ; por tanto, la variable estadística bidimensional (X, Y) toma los valores:
(x 1 , y 1 ), (x 2 , y 2 ), ...( x n , y n ); o bien (x i , y i ), (1 i .n)
Si representamos estos pares en un sistema de ejes cartesianos se obtiene un conjunto de
puntos sobre el plano que se denomina diagrama de dispersión o nube de puntos.
3.-TABLAS BIDIMENSIONALES DE FRECUENCIAS:
Veamos algunos ejemplos:
Ejemplo1: Se observaron las edades de cinco niños y sus pesos respectivos, y se consiguieron
los resultados siguientes:
Edad (años)
2
4’5
Peso (Kg)
15
19
Su diagrama de dispersión es:
Tema 2: Estadística Bidimensional
6
25
7’2
33
8
34
1
1º Bachillerato
Ejemplo 2: Las calificaciones obtenidas por 40 alumnos en Matemáticas y Física son:
X= Notas Matemáticas
3 4 5 6 6 7 7 8 10
Y= Notas Física
2 5 5 6 7 6 7 9 10
Nº de alumnos
4 6 12 4 5 4 2 1 2
Esto significa que, por ejemplo, hay 4 alumnos en total que han sacado un 3 en Matemáticas y
un dos en Física.
A este tipo de tabla se le denomina tabla simple. Su diagrama de dispersión es:
Ejemplo 3: Se han clasificado 50 familias con arreglo al número de hijos (X) e hijas (Y),
obteniéndose los siguientes resultados:
x
y
0
1
2
3
4
5
0 1 2 3
2 - 4 3
3 - 9 - 6 - 6
1 4 - - 2 - - 1
6 10 15 10
4
1
2
1
4
5
3
1
4
6
1
1
10
15
13
8
3
1
50
A este tipo de tabla se le denomina tabla de doble entrada.
Estas tablas se utilizan cuando se trata de muchos datos o bien los valores se encuentran
agrupados en intervalos.
Observa que toda tabla de doble entrada se puede transformar en una tabla simple.
El diagrama de dispersión del ejemplo 3 es:
Tema 2: Estadística Bidimensional
2
1º Bachillerato
4) CÁLCULO DE PARÁMETROS ESTADÍSTICOS:
Sea una variable estadística bidimensional (X, Y). En general presentan la siguiente forma:
VARIABLE X
VARIABLE Y
FRECUENCIA ABSOLUTA
xi
yi
fi
x1
y1
f1
x2
y2
f2
x3
y3
f3
.......
.......
.......
xn
yn
fn
N = f i = nº total de datos.
Recordemos las definiciones de media y varianza para distribuciones de variable estadística
unidimensional:
Variable X
Variable Y
n
Media
x
n
 xi. . f i
y=
= i 1
y
i 1
i.
. fi
N
N
n
n
x2= Sx2==
 f i ·( xi  x)
y2=
2
i 1
2
 f i ·( yi  y)
Sy2== i 1
N
N
n
Varianza
n
x2=
-

Sx2= i 1
f i· xi
N
2
- x
y2= Sy2=
2
 f ·y
i 1
i
N
2
i
- y 2
Se llama desviación típica de una variable estadística a la raíz cuadrada positiva de la
varianza. Por ello tenemos también dos desviaciones típicas:  X y  Y .
Veamos un nuevo parámetro:
Covarianza o varianza conjunta:
Se llama covarianza de una variable estadística bidimensional (X, Y) a la media aritmética de
los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.
Se representa por  xy .
n
 xy = S xy =
n
 f i ·( xi  x)( y i  y)
i 1
N
 f i · xi y i
=
i 1
N
 x y
NOTA:
El significado de la covarianza se verá más adelante, así como su interpretación según el signo.
Ejemplo1: Se observaron las edades de cinco niños y sus pesos respectivos, y se consiguieron
los resultados siguientes:
Tema 2: Estadística Bidimensional
3
1º Bachillerato
Edad (años)
Peso (Kg)
4’5
19
2
15
7’2
33
6
25
8
34
Calcular las medias, las varianzas, las desviaciones típicas y la covarianza.
Construimos la siguiente tabla:
xi
yi
fi
x i ·fi
y i ·fi
x i 2 ·fi
y i 2 ·fi
x i · yi·fi
2
4’5
6
7’2
8
15
19
25
33
34
1
1
1
1
1
N=5
2
4’5
6
7’2
8
 x i =27’7
15
19
25
33
34
 y i =126
4
20’25
36
51’84
64
176’09
225
361
625
1089
1156
3456
30
85’5
150
237’6
272
775’1
a) Media de X:
x=
26 '5
= 5’54
5
y=
27
= 25’2
5
b) Media de Y:
c) Varianza de las X:
x 2 =
176'09
- 5’54 2 = 4’526  x =
5
= 2’1275
d) Varianza de las Y:
y 2 =
3456
- 25’2 2 = 56’16  y =
5
= 7’4939
e) Covarianza:
 XY =
775'1
- 5’54 ·25’2= 155’02-139’608=15’412
5
Ejemplo 2: Las calificaciones obtenidas por 40 alumnos en Matemáticas y Física son:
X= Notas Matemáticas
Y= Notas Física
Nº de alumnos
3 4 5 6 6 7 7 8 10
2 5 5 6 7 6 7 9 10
4 6 12 4 5 4 2 1 2
Realiza la tabla y calcula las medias, las varianzas, las desviaciones típicas y la covarianza.
xi
3
4
5
6
6
7
7
8
10
yi
2
5
5
6
7
6
7
9
10
fi
4
6
12
4
5
4
2
1
2
N=40
Tema 2: Estadística Bidimensional
xi . fi
xi2. fi
yi . fi
yi2. fi
xi.yi.fi
4
1º Bachillerato
5.- CONCEPTO GENERAL DE CORRELACIÓN :
Se llama correlación a la teoría que trata de estudiar “la relación o dependencia” que existe
entre las dos variables que intervienen en una distribución bidimensional.
1.- La correlación es lineal o curvilínea según el diagrama de puntos se condense en torno a
una línea recta o a una curva.
2.- La correlación es positiva o directa cuando a medida que crece una variable la otra también
crece.
La correlación es negativa o inversa cuando a medida que crece una variable la otra decrece.
La correlación es nula cuando no existe relación entre ambas variables; en este caso los puntos
del diagrama están esparcidos al azar, sin formar ninguna línea, y se dice que las variables están
incorreladas.
3.- La correlación es de tipo funcional si existe una función que satisface todos los valores de
la distribución.
En caso contrario será tanto más fuerte o más débil, dependiendo de la mayor o menor tendencia
de los valores de la distribución a satisfacer una determinada función.
A continuación veremos algunos diagramas de dispersión, indicando la relación que existe entre
las variables X e Y.
Tema 2: Estadística Bidimensional
5
1º Bachillerato
6.- COEFICIENTE DE CORRELACIÓN LINEAL DE PEARSON:
Una vez observado, por vía intuitiva, mediante el diagrama de dispersión que existe una
correlación lineal entre las variables, es interesante cuantificar de forma más objetiva y precisa
esa correlación. Para ello se calcula el coeficiente de correlación lineal de Pearson, que se define
mediante la siguiente expresión:
s xy
r=
sx s y
El signo de r viene dado por el signo de la covarianza, ya que las desviaciones típicas son
siempre positivas. Es decir, el signo de la covarianza decide el comportamiento de la
correlación:
· Si la covarianza es positiva, la correlación es directa.
· Si la covarianza es negativa, la correlación es inversa.
· Si la covarianza es nula, no existe correlación.
Se demuestra que el coeficiente de correlación lineal es un número real comprendido entre –1
y 1. Veamos qué tipo de dependencia existe entre las variables X e Y según el valor de r.
1.- Si r = -1, todos los valores de la variable bidimensional (X, Y) se encuentran situados sobre
una recta, luego satisfacen la ecuación de una recta. Entonces se dice que entre las variables X e
Y existe una dependencia funcional.
2.- Si –1  r  0, la correlación es negativa y será tanto más fuerte a medida que r se aproxima a
–1, y tanto más débil a medida que se aproxima a 0. Entonces se dice que entre las variables X e
Y existe una dependencia aleatoria.
3.- Si r = 0, no existe ningún tipo de relación entre las dos variables. En este caso se dice que las
variables X e Y son aleatoriamente independientes.
4.- Si 0  r  1, la correlación es positiva y será tanto más fuerte a medida que r se aproxima a 1,
y tanto más débil a medida que se aproxima a 0. Entonces se dice que entre las variables X e Y
existe una dependencia aleatoria.
5.- Si r = 1, todos los valores de la variable bidimensional (X, Y) se encuentran situados sobre
una recta, luego satisfacen la ecuación de una recta. Entonces se dice que entre las variables X e
Y existe una dependencia funcional.
Ejemplos:
Tema 2: Estadística Bidimensional
6
1º Bachillerato
7.- ESTUDIO ANALÍTICO DE LA REGRESIÓN LINEAL :
Si entre dos variables existe una fuerte correlación, el diagrama de puntos se condensa en torno
a una recta. Sea X la variable independiente e Y la variable dependiente de X, entonces el
problema consiste en encontrar la ecuación de la recta que mejor se ajuste a la nube de puntos.
Para ello existen varios métodos, pero el de los mínimos cuadrados es el más utilizado.
Aplicando este método se deduce que la recta de regresión siempre pasa por el punto ( x , y).
La ecuación de la recta de regresión de y sobre x es:
Sustituyendo en esta ecuación los valores de x podemos obtener, con cierta aproximación, los
valores esperados para la variable y, que llamamos estimaciones o previsiones.
La ecuación de la recta de regresión de x sobre y es:
Con esta ecuación estimamos valores de x conocidos los de y.
¿Qué fiabilidad podemos conceder a estos cálculos obtenidos a través de las rectas de regresión?
Será tanto mejor cuanto más se aproxime el coeficiente de correlación lineal a –1 o a 1. Por
tanto:
· Si r es muy pequeño, no tiene sentido realizar ningún tipo de estimaciones o previsiones.
· Si r es próximo a –1 o a 1, probablemente los valores reales serán próximos a nuestras
estimaciones.
· Si r = -1 o r = 1, las estimaciones realizadas coincidirán con los valores reales.
Recordar que…
La ecuación de la recta en la forma
punto-pendiente es
donde
m es la pendiente de la recta, y A(x1,y2)
es un punto por el que pasa la recta.
Tema 2: Estadística Bidimensional
7
Descargar