Distribuciones t, Ji y F

Anuncio
Estadísticas y distribuciones de
muestreo
DIANA DEL PILAR COBOS DEL ANGEL
27/11/2011
Estadísticas
2
Una estadística es cualquier función de las observaciones en una
muestra aleatoria que no depende de parámetros desconocidos.
Por ejemplo, si X1, X2,…,Xn es una muestra aleatoria de tamaño
n, entonces la media de la muestra X, la varianza de la muestra S2
y la desviación estándar S son estadísticas.
n
X
 Xi
i 1
n
n
S2 
(X
i 1
i
 X )2
n 1
El proceso de extraer conclusiones en torno a poblaciones con
base en datos de muestras utiliza estadísticas en forma
considerable.
Diana Cobos del Angel
27/11/2011
1
Distribuciones muestrales
3

Supóngase que se toma una muestra aleatoria de tamaño n,
X1, X2, …, Xn de una población con distribución Normal,
N(m,s2).

Cada observación es una v.a. con distribución N(m,s2)

Entonces la media X es una v. a. con distribución
N(m,s2/n)
Diana Cobos del Angel
27/11/2011
Teorema de Límite Central
4
Si X es la media de una muestra aleatoria de tamaño n que se toma
de una población con media m y varianza s2, entonces, el
estadístico
Z
X m
s/ n
Se aproxima a una distribución Normal estándar cuando n tiende a
infinito.
Observación: esta aproximación será mejor para n ≥ 30 sin
importar la forma de la población. Si n < 30 la aproximación es
buena sólo si la población no difiere mucho de una distribución
Normal.
Diana Cobos del Angel
27/11/2011
2
Distribución Ji cuadrada c2
5
Sean Z1, Z2, …, Zn variables aleatorias con distribución normal
estándar, es decir N(0,1). Entonces
n
Y   Zi2  Z12  Z 22  ...  Z n2  c n2
i 1
Tiene la función de densidad Ji cuadrada con n grados de libertad
Diana Cobos del Angel
27/11/2011
Distribución Ji cuadrada c2
6
Diana Cobos del Angel
27/11/2011
3
Características de Ji cuadrada c2
7







Asimétrica y asintótica al eje x por la derecha;
Su dominio va de 0 a +
Área bajo la curva desde 0 a + =1
Tiene parámetro  = n (g.l.)
Al aumentar n se aproxima a la normal
Representa distribución muestral de varianza.
Entre las aplicaciones:




Determinación intervalos confianza para varianzas
Pruebas de hipótesis para una varianza
El ajuste de datos a una distribución dada conocida
Las pruebas de independencia.
Diana Cobos del Angel
27/11/2011
Gráficas de Ji cuadrada c2
8
Diana Cobos del Angel
27/11/2011
4
Distribución Ji cuadrada c2
9
Diana Cobos del Angel
27/11/2011
Probabilidad c2 Excel
10
 =DISTR.CHI(x;)
 Devuelve la probabilidad de una variable aleatoria
continua siguiendo una distribución Ji cuadrada de
una sola cola con  gl.
 P(X>c2)
Diana Cobos del Angel
27/11/2011
5
Probabilidad c2
11
Diana Cobos del Angel
27/11/2011
Probabilidad c2 Inversa Excel
12
 =PRUEBA.CHI.INV(P,)
 Devuelve el valor de c2 para una probabilidad dada, de
una distribución Ji-cuadrada de una sola cola con  g.l.
Diana Cobos del Angel
27/11/2011
6
Ejercicios Ji cuadrada c2
13
a)
Calcular la probabilidad de obtener un valor mayor de
23.7 en una distribución c2 con  = 14 g.l., es decir
P( c142  23.7)
b)
Calcular el valor de c2 después del cual se encuentre el 5
% del área en una distribución Ji-cuadrado con 4 g.l., es
decir
P( c42  c 2 )  0.05
Diana Cobos del Angel
27/11/2011
Distribución “t” de Student
14
 Desarrollada con base en distribuciones de frecuencia
empíricas por el estadístico William Gosset, cuyo
seudónimo era “Student”.
 Gosset trabajó en la Cervecería Guiness de Dublín y
tenía dificultades al usar la distribución Normal en
muestras pequeñas

“The probable error of a mean” Biometrika 1908
 Fisher fue quien encontró mas aplicaciones para ésta.
Diana Cobos del Angel
27/11/2011
7
Distribución “t” de Student
15
 La distribución muestral de la media de una muestra
aleatoria X se ajusta muy bien a la distribución Normal si se
conoce s. Si n es grande, esto no presenta ningún problema,
aún cuando s sea desconocida, por lo que en este caso es
razonable sustituirla por s.
 Sin embargo, en el caso de usar valores de n < 30, o sea en el
caso de pequeñas muestras, esto no funciona tan bien, y la
distribución que mejor se ajusta es la t de Student.
Diana Cobos del Angel
27/11/2011
Distribución “t” de Student
16
 Sean Z es una v.a. Normal estándar y V es una v.a. Ji
con k grados de libertad. Si Z y V son independientes,
entonces la v.a.
Z
T
V /k
tiene una distribución t con n grados de libertad, cuya
función de densidad es:
Diana Cobos del Angel
27/11/2011
8
Distribución “t” de Student
17
 Definiendo el estadístico t:
t=
x -m
s/ n
 Se puede probar que siendo `x la media de una
muestra de tamaño n tomada de una población Normal
con media m y varianza s2, el estadístico t es el valor de
una variable aleatoria con distribución "t" de Student y
parámetro  (grados de libertad) = n-1.
Diana Cobos del Angel
27/11/2011
Distribución “t” de Student
18
Diana Cobos del Angel
27/11/2011
9
Distribución “t” de Student
19
Diana Cobos del Angel
27/11/2011
Características de la distribución “t”
20
 Tiene media igual 0, es asintótica al eje x y su dominio





va de -  a +;
El área bajo la curva desde - a + es igual a 1
m  0, s2 depende parámetro  (grados libertad)
Varianza > 1, pero se aproxima a 1 cuando n  
Al aumentar n, la distribución “t se aproxima a la
Normal; n > 30 ó más, excelente aproximación
Entre las aplicaciones:
 Estimación de intervalos de confianza para medias a
partir de muestras pequeñas
 Pruebas de hipótesis basadas en muestras < 30
Diana Cobos del Angel
27/11/2011
10
Distribución “t” de Student
21
Diana Cobos del Angel
27/11/2011
Distribución “t” de Student
22
Las tablas brindan sólo los puntos porcentuales de la cola
superior
Diana Cobos del Angel
27/11/2011
11
Probabilidad “t” en Excel
23
 =DISTR.T(x,,colas)
 Devuelve el área a la derecha de x (a)
 x= valor de t (solo positivo)
 = grados de libertad
 Colas = 1 o 2 colas
 colas=
1, P( X>t )
 colas = 2, P(|X| > t); P(X > t o X < -t).
Diana Cobos del Angel
27/11/2011
Probabilidad “t” Inversa en Excel
24
 =DISTR.T.INV(a,)
 Devuelve el valor de t de dos colas, después del
cual se encuentra el a x 100% del área de la curva.
 P(|X| > t) = P(X < -t o X > t).
 Para una cola, remplazar a por 2 a.
Diana Cobos del Angel
27/11/2011
12
Ejercicio distribución “t” de Student
25
a)
Calcular la probabilidad de obtener un valor mayor
que 2,26 en una distribución t con 9 gdl
b)
Calcular la probabilidad de obtener un valor mayor
que 2,26 o menor que -2,26 en una distribución t con
9 gdl
c)
Calcular el valor de t después del cual se encuentre el
5% del área de la curva con 9 gdl
d)
Calcular el valor de t para a= 0,05 con 9 gdl y dos
colas
Diana Cobos del Angel
27/11/2011
Distribución "F” de Fisher
26
Sean W y Y v.a. con distribución Ji cuadrada, independientes con
n1 y n2 grados de libertad respectivamente. Entonces el cociente
F
W / n1
Y / n2
Sigue la distribución F con n1= u g.l. en el numerador y n2 = v g.l.
en el denominador y su función de densidad es:
Diana Cobos del Angel
27/11/2011
13
Distribución "F” de Fisher
27
 También llamada "F” de Fisher - Schnedecor
 Representa la distribución muestral de la razón de
dos varianzas. Es decir que se obtiene de la razón
de dos distribuciones Ji-cuadradas.
 Definimos el estadístico F como:
s12
F= 2
s2
 El cual es el valor de una variable aleatoria que
tiene distribución F con parámetros n1 y n2
Diana Cobos del Angel
27/11/2011
Propiedades de distribución F
28
 Asimétrica, y asintótica al eje x por el lado derecho
 Su dominio va de 0 a +
 Área bajo curva desde 0 a + =1
 Tiene parámetros n1 y n2
 Entre sus aplicaciones:
 Pruebas de hipótesis entre 2 varianzas
 Análisis de varianza
 Análisis de covarianza.
Diana Cobos del Angel
27/11/2011
14
Gráfica de la distribución F
29
Diana Cobos del Angel
27/11/2011
Propiedades de Distribución F
30
n
E(F )  2
n2  2
2n22 (n1  n2  2)
V (F ) 
n1 (n2  2)2 (n2  4)
Diana Cobos del Angel
27/11/2011
15
Gráfica de la distribución F
31
Diana Cobos del Angel
27/11/2011
Probabilidad F Excel
32
 =DISTR.F(x,1, 2)
 Devuelve el área a la derecha de un valor en una
distribución F con 1 y 2 g.l.
 P( F>x )
Diana Cobos del Angel
27/11/2011
16
Probabilidad F Inversa Excel
33
 =DISTR.F.INV(a, 1, 2)
 Devuelve el valor crítico de F(a) para una
distribución F con 1, 2 g.l.
Diana Cobos del Angel
27/11/2011
Ejercicios sobre la distribución F
34
a) Determine la probabilidad de tener un valor de
F mayor que 9.28 en una distribución F con
1=3 y 2=3 g.l.
b) Halle la el valor crítico de F(0.05) para 1=3 y
2=15 g.l.
Diana Cobos del Angel
27/11/2011
17
Descargar