Subido por roberto inostroza

tablas y formulas estadisticas

Anuncio
Tablas y Fórmulas Estadísticas
TABLAS Y FORMULAS
ESTADISTICAS
Carlo Magno Araya
Profesor de Estadística
Sede de Occidente
Universidad de Costa Rica
1
Tablas y Fórmulas Estadísticas
MEDIDAS DE POSICION
Datos sin agrupar
Datos agrupados
Promedio aritmético de muestras
k
n
∑ xi fi
∑ xi
x=
x =
i =1
∑ fi
n
i =1
Promedio ponderado
n
Mediana
∑ x i wi
x=
i=1
k
i =1
n
∑ wi
n

 - F i-1 
2
*c
M e = Li + 
f


i


i =1
Mediana para n impar
M e = X  n +1 


 2 
Moda
 d1 
*c
M o = Li + 
 d 1+ d 2 
d 1 = f i − f i −1
d 2 = f i − f i +1
Mediana para n par
Percentiles
X  n + X  n
Me =

 +1
2 
 
 2
2
 m.n

- F i-1 

100
*c
P m = Li + 
fi




Percentiles
Pm = X 
m

 100 ( n + 1) 


Media geométrico
n
x g = x 1 . x 2 .... x n
Media armónica
xa =
n
n
∑
i=1
1
xi
2
Tablas y Fórmulas Estadísticas
MEDIDAS DE VARIABILIDAD
Datos sin agrupar
Datos agrupados
Variancia de una muestra
1 k
1 n
2
2
∑ ( xi − x ) 2 . f i
s
=
sx2 =
x
−
x
∑( i
)
x
n
−
1
i
=1
n − 1 i =1
2

n  
x
n
∑  
1  2  i =1 i  
2
sx =
∑ xi −
n − 1 i =1
n 




2

k
 
 ∑ xi f i  
k
 i=1
 
1 
sx2 =
. ∑ x2 f 
n - 1 i=1 i i
n




Variancia de la población
1 N
2
σ x2 = ∑ ( xi − µ )
N i =1
2

N  
N
 ∑ xi  

 
1
σ x2 = .  ∑ xi2 - i=1

N i=1
N 




Coeficiente de variación de una
población
CV x =
σx
* 100
µ
σ 2x =
2
1 k
∑ xi − µ . f i
N i =1
(
)
2

k
 
 ∑ xi f i  
k
 i=1
 
1
σ 2x = .  ∑ xi2 f i 
N i=1
N




Coeficiente de variación de
una muestra
sx
CV x = * 100
x
Desviación media
k
n
∑ | xi - x|. f i
∑ | xi - x|
D. M.=
i=1
D. M.=
n
i=1
k
∑ fi
i=1
Medida de variabilidad para muestras
pareadas
s2d =
1  n 2
. ∑ di
n -1 i=1 
di = X 1i - X 2i
Variancia para variables
dicotómicas
σ 2 = PQ
$$
s 2 = pq
3
Tablas y Fórmulas Estadísticas
INDICE DE PRECIOS
Relativo simple de precios
p
I = n ⋅ 100
p0
Agregado simple de precios
k
∑ pn
i =1
k
I=
⋅ 100
∑ p0
i =1
Promedio de los relativos simples de precios
k  p 
∑ n 
i =1 p 0 
I =
⋅ 100
k
Laspeyres
I PL =
Laspeyres
I QL =
Índices de precios ponderados
Paasche
∑ pn q o
⋅ 100
∑ po q o
I PP =
∑ pn q n
⋅ 100
∑ po q n
Índices de cantidades ponderados
Paasche
∑ po q n
⋅ 100
∑ po q o
I QP =
∑ pn q n
⋅ 100
∑ pn q o
Indice de precio de Fischer
 ∑ pn q0   ∑ pn qn 

 ⋅ 100
I PF = 
 ∑ p0 q0   ∑ p0qn 
4
Tablas y Fórmulas Estadísticas
MUESTREO ALEATORIO SIMPLE
Población finita
Población infinita
Variancia del promedio
N - n s 2x
.
N -1 n
N - n σ 2x
2
=
.
σx
N -1 n
s2x =
s2x =
σ 2x =
s2x
n
σ 2x
n
Variancia de una proporción
s 2p$ =
$$
N - n pq
.
N -1 n
s2p$ =
$$
pq
n
PQ
N - n PQ
.
σ 2p$ =
n
N -1 n
Tamaño de muestra para la estimación
De un promedio y una proporción poblacional
σ 2p$ =
n1
n=
n
1+ 1
N
n1
n=
n
1+ 1
N
 Zα / 2 σ 

donde n1 = 
d 
2
 Z α / 2 PQ 

donde n1 = 

d


Z σ
n =  α/2 
 d 
2
2
 Z α / 2 PQ 

n = 

d


2
Intervalos de confianza para el promedio cuando
la variancia de la población es conocida
σx
N -n σx
*
Li = x ± Zα /2*
N -1
n
n
Intervalos de confianza para el promedio cuando la variancia
de la población es desconocida y n≤
≤30
N - n sx
sx
*
Li = x ± t α / 2(n-1)gl *
Li = x ± t α / 2(n-1)gl *
N -1
n
n
Li = x ± Z α / 2 *
Intervalos de confianza para una proporción si np>5 y nq>5
$$
N -n
pq
$$
pq
*
Li = p$ ± Z α / 2 *
$ ± Zα / 2*
=
p
L
i
N -1
n
n
5
Tablas y Fórmulas Estadísticas
ESTADISTICO PARA PRUEBA DE HIPOTESIS
Promedios
Para un promedio: variancia conocida
Proporciones
Para una proporción
x-µ
Zc =
Zc =
σ
p$ - P
PQ
n
n
Para un promedio: variancia
desconocida
x-µ
tc =
Diferencia de proporciones
p$ 1 − p$ 2
p$ 1 q$1 p$ 2 q$ 2
+
n1
n2
Zc =
s
n
Diferencia de dos promedios: variancia Otra alternativa de cálculo:
x1 x 2
conocida
−
x1 - x 2
Zc =
σ 12
n1
+
Zc =
σ 22
n2
n1
 1
1
p(1 − p) − 
 n1 n 2 
p=
Diferencia de dos promedios: variancia desconocida
x1 - x 2
*k
k=
tc =
donde
( n1 - 1) S 12 + ( n2 - 1) S 22
Estadístico de prueba de independencia y de homogeneidad Ji-Cuadrada
2
r
(Oij - E ij )2
c
χ =∑ ∑
i=1 j=1
E ij =
E ij
Ni N j
N
n2
x1 + x 2
n1 + n2
n1 n2 ( n1 + n2 - 2)
n1 + n 2
Estadístico de prueba para muestras
pareadas
tc =
d
Sd / n
6
Tablas y Fórmulas Estadísticas
ANALISIS DE REGRESION LINEAL SIMPLE
Constante de regresión
Coeficiente regresión lineal
n
n
a = y − bx
b=
i=1
i=1
Intervalos de confianza para el
promedio de y dado un x0
(
n
n
i=1
i=1
i=1
n
Intervalos de confianza para una
observación de y dado un x0
x0 - x
1
+
Li = y$ ± t α / 2(n-2)gl * S e
n
SC x
Error estándar de estimación
n
i=1
2


n ∑ xi2 -  ∑ xi
 i=1 
i=1
n
)
2
(
x0 - x
1
1+ +
n
SC x
Li = y$ ± tα / 2(n-2)gl * S e
Suma de cuadrados de x
2
∑ yi - a ∑ y i - b ∑ xi yi
Se =
n
n ∑ xi yi - ∑ xi ∑ yi
n
SC x = ∑ xi2 -
 n 
 ∑ xi 
 i=1 
2
n
i=1
n-2
Inferencia sobre la constante y coeficiente de regresión
Intervalos de confianza
Estadístico de prueba de hipótesis
a
1 x2
tc =
a ± t ( n− 2 ) gl S e
+
1 x2
n SCx
+
Se
n SC x
Se
b ± t ( n−2 ) gl
tc =
SC x
b
Se /
SC x
ANALISIS DE CORRELACION LINEAL SIMPLE
Coeficiente de correlación lineal
n
n
n
i=1
i=1
i=1
n ∑ xi yi - ∑ xi ∑ y i
r=
2
 n
n  
n ∑ xi2 -  ∑ x i 
 i=1  
 i=1

2
 n
 n  
*  n ∑ y i2 -  ∑ yi 
 i=1  
 i=1

Estadístico para prueba de hipótesis sobre Coeficiente de correlación parcial
r12 − r13 r23
el coeficiente de correlación
tc =
r−ρ
2
1− r
n−2
r12.3 =
(1 − r )(1 − r )
2
13
2
23
)
2
7
Tablas y Fórmulas Estadísticas
MUESTREO ALEATORIO ESTRATIFICADO
Afijación de la muestra
proporcional
Afijación de la muestra
óptima o Neyman




Nhσh 

=
n
⋅
nh
 L

 ∑ Nhσ h
 h=1

Nh
nh = n ⋅
L
∑ Nh
h=1
Promedio aritmético estratificado
y st =
Proporción estratificada
L
1 L
∑ N h yh = ∑ Wh xh
N h=1
h =1
N
Wh = h
N
Variancia del promedio estratificada
p$ st =
Variancia de la proporción estratificada
l
l
Var ( y st ) = ∑ Wh2 ⋅Var ( yh )
y =1
Tamaño de la muestra para
proporciones
Tamaño de la muestra para la
estimación de la media de la población
1 Wh2 sh2 1
V = ∑
− ∑ Wh sh2
n
wh
N
( )
Var ( p$ st ) = ∑ Wh2 ⋅Var p$ h
y =1
Wh2 sh2
∑
wh
n=
1 W 2 s2
V+ ∑ h h
N
wh
L
1 L
∑ N h p$ h = ∑ Wh p$ h
N h=1
h =1
Proporcional:
n=
∑ Wh ph qh
n0
n0 =
donde
n
V
1+ 0
N
Optimo supuesto:
n0
n=
1+
n0
1
∑ Wh ph qh
NV
(∑ W
=
h
ph qh
V
)
2
8
Tablas y Fórmulas Estadísticas
MUESTREO POR CONGLOMERADOS
Estimación del promedio
Estimación de una proporción
A
A
∑ yi
y =
∑ ai
i=1
A
i =1
A
p$ =
∑ mi
∑ mi
i=1
i =1
MODELOS DE CRECIMIENTO
Modelo aritmético
Modelo geométrico
N t = N 0 (1 + rt )
N t = N 0 (1+ r )
t
1 N - N0
r= ⋅ t
t
N0
N 
r= t
 No
1/ t
-1
Modelo exponencial
N t = N 0 e rt

1 
r = ln  N t 
t  N0 
DISTRIBUCIONES DE PROBABILIDADES
Distribución binomial
 n
f ( x ) =   p x q n − x x=0, 1,..., n
 x
Distribución de Poisson
x −λ
f ( x) =
Distribución hipergeométrica
 D  N − D 
 

x  n − x 

f ( x) =
N
 
n
x=0, 1, 2,..., min(n,D)
f
λe
x!
x=0, 1,...
Distribución geométrica
( x ) = q x −1 p x=1, 2,...
TEOREMA DE BAYES
P( A) P( D / A)
P( A D ) =
P( A) P( D / A) + P( B) P( D / A)
TECNICAS DE CONTEO
Combinaciones
Permutaciones
n Pr =
n!
(n − x)!
nCr =
n!
r!(n − x)!
9
Tablas y Fórmulas Estadísticas 10
ANALISIS DE VARIANCIA A UNA VIA: DISEÑO
COMPLETAMENTE ALEATORIZADO
Media total
Suma de cuadrados total
r
r
c
SCT = ∑ ∑ ( xij − x ) 2
∑ ∑ xij
x=
c
i =1 j =1
i =1 j =1
n
Suma de cuadrados de los tratamientos
c
SCTR = ∑ rj ( x j − x )
j =1
2
Suma del cuadrado de error
r
c
SCE = ∑ ∑ ( xij − x j ) 2
i =1 j =1
Prueba para diferencias entre pares de medias
Diseños balanceados
Diseños no balanceados
Criterio de Tukey
Diferencia mínima significativa
T = qα , c , n − c
CME
R
DMS J , K =
1 1
 + (CME ) Fα , c −1,n − c
 rj rk 
Diferencia mínima significativa
DMS =
2( CME ) Fα ,1,n − c
r
ANALISIS DE VARIANCIA A DOS VÍAS: DISEÑO
ALEATORIZADO EN BLOQUES
Suma de cuadrados de bloques
r
SCBL = ∑ ci ( xi − x ) 2
i =1
Suma de cuadrados del error
SCE = SCT − SCTR − SCBL
Tablas y Fórmulas Estadísticas 11
PRUEBAS NO PARAMETRICAS
Prueba U de Mann-Whitney
n1 ( n1 + 1)
− ∑ R1
2
U1 = n1n2 +
Media y desviación estándar de la
distribución muestral para la prueba
U de Mann-Whitney
µu =
n2 ( n2 + 1)
− ∑ R2
2
U 2 = n1n2 +
n1n2 ( n1 + n2 + 1)
σu =
Valor Z para normalizar la prueba U de
Mann-Whitney
Z=
n1n2
2
12
Prueba de independencia ChiCuadrada
U i − µu
2
χ obs
σu
rc
( Oi − E i ) 2
i =1
Ei
=∑
Coeficiente de correlación de Spearman Desviación normal para la prueba de
rangos de Spearman
rs = 1 −
6∑ di2
(
Z = rs n − 1
)
n n2 − 1
Prueba de Kruskal-Wallis
12  Ri2 
K=
∑
 − 3( n + 1)
n( n + 1)  ni 
Valor crítico para la prueba de Kruskal-Wallis
Ck =
 n( n + 1) 
χα , k −1 

12


2
1 1
 + 
 ni n j 
Descargar