Esquemas de Estadística y Probabilidad

Anuncio
Esquemas de Matematicas ACCSS – 1º Bachillerato
ESTADÍSTICA

Definición. Ciencia que se ocupa de la recogida de datos, organización, análisis y predicciones que de
los datos pueden hacerse

Clases



Descriptiva. Toma de datos, organización y cálculo de parámetros que dan información de manera
global de los datos.

Inferencial. Extracción de conclusiones y determinación de la fiabilidad de dichas conclusiones.
Definiciones

Población. Conjuntos sobre el que se realiza el estudio estadístico.

Individuo u objeto. Cada elemento de la población.

Muestra. Subconjunto representativo de la población.
Variable estadística.

Cualidad o propiedad que poseen los elementos de una población y que es objeto del estudio.

Tipos

Cualitativa

Cuantitativa

Discreta. Pueden tomar un número finito de valores.

Continua. Pueden tomar cualquier valor en un intervalo dado.

Tablas estadísticas. Forma de organizar los datos.

Frecuencias

Frecuencia absoluta.

Número de veces que aparece un determinado valor de la variable.

N
n
f
i
i 1

Frecuencia relativa.
fi
N

hi 

0  hi  1
n

h
i
1
i 1

Frecuencia porcentual

pi  h1  100
n

p
i
 100
i 1

0  pi  100
i

Frecuencia acumulada absoluta Fi 
f
i
j 1
i

Frecuencia acumulada relativa H i 
h
i
j 1
Esquemas de Matematicas ACCSS – 1º Bachillerato
i

Frecuencia acumulada porcentual Pi 
p
i
j 1


Gráficos

Para variables cualitativas: Diagramas de barras, de sectores, pictogramas, cartogramas.

Para variables cuantitativas:

Diagramas de barras, polígono de frecuencias.

Histogramas para variables continuas o discretas con muchos valores.
Tablas estadísticas para variables continuas o discretas con muchos valores

Los datos se agrupan en clases.

Marca de clase.


Valor medio de cada clase.

Se utiliza para calcular la media, desviación típica, etc.
¿Cómo se construyen las clases?

Número de clases entre 5 y 10.

Generalmente clases de igual amplitud.

r= xmax – xmin si es necesario aproximar para un valor de c adecuado.

Amplitud de clase c 
r
num. clases
Esquemas de Matematicas ACCSS – 1º Bachillerato
PARÁMETROS

Centralización

Media aritmética


x
 xi f i
N

 xi hi 
 xi pi
 pi

Parámetro de centralización más utilizado

Si se suma k a cada valor xi => x nueva  k  x antigua

Si se multiplica por k cada valor de xi => x nueva  k  x antigua

Si la distribución es continua o discreta con muchos valores la media se calcula con las marcas
de clase.
Moda

Distribución discreta: xi con mayor frecuencia absoluta (puede haber varias)

Distribución es continua o discreta con muchos valores:

Primera aproximación: CLASE MODAL y Mo= marca de clase.

Mayor precisión
Mo  Li 
f Mo  f Mo 1
 f Mo  f Mo1  f Mo  f Mo1 
c
Li: límite inferior de la clase modal
c: amplitud de la clase modal

Mediana

Distribución discreta: Valor central de los datos colocados en orden.

Distribución es continua o discreta con muchos valores:

Primera aproximación: CLASE MEDIANA y Me= marca de clase

Mayor precisión
N
 FMe 1
Me  Li  2
c
f Me
FMe-1: Frecuencia acumulada de la clase anterior a la clase mediana

Percentiles

Dividen la distribución en partes

Cuartiles.

Q1 deja por debajo el 25% de los datos.

Q2 = Me deja por debajo el 50% de los datos.

Q3 deja por debajo el 75% de los datos.

Para distribuciones continuas o discretas con muchos valores

N
 FQ1 1
Q1  Li  4
c
f Q1

3N
 FQ3 1
Q3  Li  4
c
f Q3
Esquemas de Matematicas ACCSS – 1º Bachillerato

Deciles

Dividen la distribución en 10 partes

Para distribuciones continuas o discretas con muchos valores
kN
 FDk 1 1
D k  Li  10
c
f Dk

Percentiles

Dividen la distribución en 100 partes

Para distribuciones continuas o discretas con muchos valores
kN
 FPk 1 1
Pk  Li  100
c
f Pk


Dispesión

Recorrido o rango: R = xmzx - xmin

Recorrido intercuartílico: Ri = Q3 – Q1

Desviación media: Media de las desviaciones.

desviación  x  x

Desviación media: DM 
 xi  x f i
N
 ( x i  x) 2 f i   xi 2 f i  x 2

Varianza: v 

Desviación típica:   v
N
N

Es el parámetro de dispersión más utilizado

Si se suma k a cada valor xi =>  nueva   antigua

Si se multiplica por k cada valor de xi =>  nueva  k   antigua
Coeficiente de variación

Para comparar poblaciones

CV 

x


Parámetros conjuntos x y 




Cuanto más pequeño es CV más representativa es la media de la distribución.


El 95,45% de los datos están en el intervalo x  2 , x  2 
El 99,73% de los datos están en el intervalo x  3 , x  3 
El 68,27% de los datos están en el intervalo x   , x  
Puntuaciones típicas o normalizadas

Para comparar datos individuales de distintas distribuciones

Z
xx

Esquemas de Matematicas ACCSS – 1º Bachillerato
DISTRIBUCIONES BIDIMENSIONALES

Variable estadística bidimensional (X,Y): Par de valores de dos variables estadísticas
unidimensionales.

Distribución bidimensional: Tabla formada por pares (xi,yi) y su correspondiente frecuencia




Tablas simple entrada

Tablas de doble entrada
Distribuciones marginales

Distribuciones unidimensionales de X e Y.

Podemos calcular media y desviación típica marginales: x, y,  x ,  y
Diagramas

De barras (tridimensional).

Nube de puntos (bidimensional): La frecuencia correspondiente a (xi,yi) se representa con puntos.
Dependencia o correlación

Tipo

Funcional: Nube se situa en la gráfica de una función



Aleatoria: Nube de puntos se situa próxima a la gráfica de una función.

Independencia
Grado



Lineal. Caso particular de funcional. La función es una recta
Según aproximación

Fuerte: Nube se aproxima mucho a la gráfica de una función

Débil: Se aproxima poco.
Según variación

Positiva:
X  Y

Negativa: X  Y
Coeficiente de Pearson

Mide el grado de correlación lineal.

r

 xy 

 x ,  y : desviaciones típicas marginales

-1 r 1

r = 1 ó r = -1 correlación funcional
 xy
 x  y
 xi y i f i  x  y
N
 covarianza
Esquemas de Matematicas ACCSS – 1º Bachillerato


r = 0 no existe correlación

r > 0 correlación positiva

r < 0 correlación negativa

r  1 ó r  -1 fuerte

r  0 muy débil
Recta de regresión
 xy

De y sobre x: y  y 

De x sobre y: x  x 

Ambas pasan por P ( x, y )  centro de gravedad de la nube

Si r  0 el ángulo que forman las rectas tiende a 90º

Si r  1 ó r  -1 el ángulo que forman las rectas tienden a 0º

Permite hacer estimaciones
 x2
 xy
 y2
( x  x)
( y  y)

Son fiables si r  1 ó r  -1

Tienen sentido para valores de las variables próximos a los demás.
Esquemas de Matematicas ACCSS – 1º Bachillerato
PROBABILIDAD

Experimento aleatorio. A priori no se conoce el resultado.

Espacio muestral (E). Conjunto de resultados posibles.

Suceso. Cualquier subconjunto del espacio muestral.

Elemental. Formado por un único elemento del espacio muestral.

Compuesto. Formado por varios sucesos elementales.

Seguro = E.

Imposible = 

Unión ()



Comunes y no comunes

“O”
Intersección ()

Comunes

“Y”

Suceso contrario ( A ). Suceso formado por los elementos de E que no están en A.

Sucesos incompatibles: A  B = 

Sucesos compatibles: A  B  
Probabilidad

Número que se asigna a un suceso para cuantificar la ocurrencia de un número.

Probabilidad = Número al que tiende la frecuencia relativa cuando el número de pruebas tiende a
infinito.

Dos formas de asignar probabilidad

Si los sucesos elementales son equiprobables se aplica la Regla de Laplace:
P



casos favorables
casos posibles
En cualquier otro caso P = frecuencia relativa.
Propiedades

0  P(S)  1

P() = 0

P(E) = 1

Si A  B =   P(AB) = P(A) + P(B)

Si A  B    P(AB) = P(A) + P(B) – P(A  B)

P(A) = 1 – P( A )
Probabilidad condicionada.

Probabilidad de que ocurra B habiendo ocurrido A.
Esquemas de Matematicas ACCSS – 1º Bachillerato
P ( B / A) 

P(AB) = P(A)P(B/A)

Sucesos independientes


P( A  B)
P ( A)

P(B) = P(B/A)

La ocurrencia de uno de no modifica la probabilidad del otro.
Sucesos dependientes

P(B)  P(B/A)

La ocurrencia de uno de modifica la probabilidad del otro.
Probabilidad total
P(A) = P(B1)  P(A/B1) + P(B2)  P(A/B2) + …. + P(Bn)  P(A/Bn)


Condiciones

A depende de un conjunto de sucesos B1, B2, …, Bn

La unión de los sucesos Bi es E.

Los sucesos Bi son incompatibles dos a dos.
Método gráfico  mediante un árbol
Esquemas de Matematicas ACCSS – 1º Bachillerato
DISTRIBUCIÓN BINOMIAL


Distribución de frecuencias discreta. Relaciona una variable discreta con su frecuencia.

Empírica.

Parámetros
x
x h

 
x
i i
2
i
hi  x
2
Distribución de probabilidades discreta. Relaciona una variable discreta con su probabilidad.

Teórica.

Parámetros





x p

 
x
i
i
2
i
(media, esperanza matemática o valor esperado).
pi  x
2
Juegos: si  = 0 es justo, si  > 0 favorable para el jugador y si  < 0 desfavorable para el jugador.
Distribución binomial

Distribución discreta más utilizada.

Se realizan n experiencias idénticas.

Cada experiencia es independiente de las otras.

Solo dos resultados posibles: ÉXITO (probabilidad = p) y FRACASO (q).

p=1–q

Se designa por B(n,p).

Probabilidad de obtener r éxitos
n
P X  r     p r q n r
r 
Donde:


n! = n·(n-1)·(n-2)….3·2·1

0! = 1

1! = 1
Tabla de distribuciones binomiales
Ej. B(3;0,15) para calcular P(X=2) tenemos que n= 3 , p= 0,15 y r= 2 luego P(X=2)= 0,0574

Parámetros

  np

  npq
Esquemas de Matematicas ACCSS – 1º Bachillerato
DISTRIBUCIÓN NORMAL



Distribución de frecuencias continua. Relaciona una variable continua con su frecuencia.

Gráfica: Histograma

Frecuencia relativa = Área

Área total = 1

Si el número de clases tiende a infinito  el polígo de frecuencias se convierte en una línea continua.
Distribución de probabilidades continua. Relaciona una variable continua con su probabilidad.

Gráfica: Una línea continua

La probabilidad = Área

Prob. total = Área total = 1

No podemos calcular P(X=a) ya que el área sería 0.
Distribución normal o de Gauss


f(x)
1  x  
 

e 2  
2
 2

Gráfica en forma de campana.

Se designa por N(,)

El 68,26% de los datos están entre (-,+)

El 95,44% de los datos están entre (-2,+2)

El 99,73% de los datos están entre (-3,+3)
Distribución normal estándar o tipificada N(0,1)
x
(tipificación de la variable)


Z 

Utilización tabla (lo mejor es hacer un dibujo)



Probabilidad de un valor positivo

P(Z  k) ver tabla

P(Z  k) = 1 - P(Z  k)
Probabilidad de un valor negativo

P(Z  -k) = P(Z  k) = 1 - P(Z  k)

P(Z  - k) = P(Z  k)
Probabilidad entre dos positivos



P(h  Z  k) = P(Z  k) - P(Z  h)
Probabilidad entre dos negativos

P(-h  Z  -k) = P(Z  h) - P(Z  k)
Probabilidad entre un negativo y un positivo


1
P(-h  Z  k) = P(Z  k) + P(Z  h) – 1
Aproximación de la normal a la binomial


B(n,p) se aproxima por N(,) tomando:

  np

  npq
La aproximación es mejor si np>5 y nq>5.
Esquemas de Matematicas ACCSS – 1º Bachillerato


Corrección de Yates

P(X = k) = P(k-0,5  X’  k+0,5)

P(X  k) = P(X’  k+0,5)

P(X < k) = P(X’  k-0,5)

P(X  k) = P(X’ k-0,5)

P(X > k) = P(X’ k+0,5)
Ajuste de datos a una normal

Se calculan x y  de los datos

Se calculan las probabilidades de cada clase de la tabla

Se comparan las pi calculadas con las hi empíricas, si son similares los datos siguen una distribución
continua.
Descargar