Tablas y Fórmulas Estadísticas TABLAS Y FORMULAS ESTADISTICAS Carlo Magno Araya Profesor de Estadística Sede de Occidente Universidad de Costa Rica 1 Tablas y Fórmulas Estadísticas MEDIDAS DE POSICION Datos sin agrupar Datos agrupados Promedio aritmético de muestras k n ∑ xi fi ∑ xi x= x = i =1 ∑ fi n i =1 Promedio ponderado n Mediana ∑ x i wi x= i=1 k i =1 n ∑ wi n - F i-1 2 *c M e = Li + f i i =1 Mediana para n impar M e = X n +1 2 Moda d1 *c M o = Li + d 1+ d 2 d 1 = f i − f i −1 d 2 = f i − f i +1 Mediana para n par Percentiles X n + X n Me = +1 2 2 2 m.n - F i-1 100 *c P m = Li + fi Percentiles Pm = X m 100 ( n + 1) Media geométrico n x g = x 1 . x 2 .... x n Media armónica xa = n n ∑ i=1 1 xi 2 Tablas y Fórmulas Estadísticas MEDIDAS DE VARIABILIDAD Datos sin agrupar Datos agrupados Variancia de una muestra 1 k 1 n 2 2 ∑ ( xi − x ) 2 . f i s = sx2 = x − x ∑( i ) x n − 1 i =1 n − 1 i =1 2 n x n ∑ 1 2 i =1 i 2 sx = ∑ xi − n − 1 i =1 n 2 k ∑ xi f i k i=1 1 sx2 = . ∑ x2 f n - 1 i=1 i i n Variancia de la población 1 N 2 σ x2 = ∑ ( xi − µ ) N i =1 2 N N ∑ xi 1 σ x2 = . ∑ xi2 - i=1 N i=1 N Coeficiente de variación de una población CV x = σx * 100 µ σ 2x = 2 1 k ∑ xi − µ . f i N i =1 ( ) 2 k ∑ xi f i k i=1 1 σ 2x = . ∑ xi2 f i N i=1 N Coeficiente de variación de una muestra sx CV x = * 100 x Desviación media k n ∑ | xi - x|. f i ∑ | xi - x| D. M.= i=1 D. M.= n i=1 k ∑ fi i=1 Medida de variabilidad para muestras pareadas s2d = 1 n 2 . ∑ di n -1 i=1 di = X 1i - X 2i Variancia para variables dicotómicas σ 2 = PQ $$ s 2 = pq 3 Tablas y Fórmulas Estadísticas INDICE DE PRECIOS Relativo simple de precios p I = n ⋅ 100 p0 Agregado simple de precios k ∑ pn i =1 k I= ⋅ 100 ∑ p0 i =1 Promedio de los relativos simples de precios k p ∑ n i =1 p 0 I = ⋅ 100 k Laspeyres I PL = Laspeyres I QL = Índices de precios ponderados Paasche ∑ pn q o ⋅ 100 ∑ po q o I PP = ∑ pn q n ⋅ 100 ∑ po q n Índices de cantidades ponderados Paasche ∑ po q n ⋅ 100 ∑ po q o I QP = ∑ pn q n ⋅ 100 ∑ pn q o Indice de precio de Fischer ∑ pn q0 ∑ pn qn ⋅ 100 I PF = ∑ p0 q0 ∑ p0qn 4 Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO SIMPLE Población finita Población infinita Variancia del promedio N - n s 2x . N -1 n N - n σ 2x 2 = . σx N -1 n s2x = s2x = σ 2x = s2x n σ 2x n Variancia de una proporción s 2p$ = $$ N - n pq . N -1 n s2p$ = $$ pq n PQ N - n PQ . σ 2p$ = n N -1 n Tamaño de muestra para la estimación De un promedio y una proporción poblacional σ 2p$ = n1 n= n 1+ 1 N n1 n= n 1+ 1 N Zα / 2 σ donde n1 = d 2 Z α / 2 PQ donde n1 = d Z σ n = α/2 d 2 2 Z α / 2 PQ n = d 2 Intervalos de confianza para el promedio cuando la variancia de la población es conocida σx N -n σx * Li = x ± Zα /2* N -1 n n Intervalos de confianza para el promedio cuando la variancia de la población es desconocida y n≤ ≤30 N - n sx sx * Li = x ± t α / 2(n-1)gl * Li = x ± t α / 2(n-1)gl * N -1 n n Li = x ± Z α / 2 * Intervalos de confianza para una proporción si np>5 y nq>5 $$ N -n pq $$ pq * Li = p$ ± Z α / 2 * $ ± Zα / 2* = p L i N -1 n n 5 Tablas y Fórmulas Estadísticas ESTADISTICO PARA PRUEBA DE HIPOTESIS Promedios Para un promedio: variancia conocida Proporciones Para una proporción x-µ Zc = Zc = σ p$ - P PQ n n Para un promedio: variancia desconocida x-µ tc = Diferencia de proporciones p$ 1 − p$ 2 p$ 1 q$1 p$ 2 q$ 2 + n1 n2 Zc = s n Diferencia de dos promedios: variancia Otra alternativa de cálculo: x1 x 2 conocida − x1 - x 2 Zc = σ 12 n1 + Zc = σ 22 n2 n1 1 1 p(1 − p) − n1 n 2 p= Diferencia de dos promedios: variancia desconocida x1 - x 2 *k k= tc = donde ( n1 - 1) S 12 + ( n2 - 1) S 22 Estadístico de prueba de independencia y de homogeneidad Ji-Cuadrada 2 r (Oij - E ij )2 c χ =∑ ∑ i=1 j=1 E ij = E ij Ni N j N n2 x1 + x 2 n1 + n2 n1 n2 ( n1 + n2 - 2) n1 + n 2 Estadístico de prueba para muestras pareadas tc = d Sd / n 6 Tablas y Fórmulas Estadísticas ANALISIS DE REGRESION LINEAL SIMPLE Constante de regresión Coeficiente regresión lineal n n a = y − bx b= i=1 i=1 Intervalos de confianza para el promedio de y dado un x0 ( n n i=1 i=1 i=1 n Intervalos de confianza para una observación de y dado un x0 x0 - x 1 + Li = y$ ± t α / 2(n-2)gl * S e n SC x Error estándar de estimación n i=1 2 n ∑ xi2 - ∑ xi i=1 i=1 n ) 2 ( x0 - x 1 1+ + n SC x Li = y$ ± tα / 2(n-2)gl * S e Suma de cuadrados de x 2 ∑ yi - a ∑ y i - b ∑ xi yi Se = n n ∑ xi yi - ∑ xi ∑ yi n SC x = ∑ xi2 - n ∑ xi i=1 2 n i=1 n-2 Inferencia sobre la constante y coeficiente de regresión Intervalos de confianza Estadístico de prueba de hipótesis a 1 x2 tc = a ± t ( n− 2 ) gl S e + 1 x2 n SCx + Se n SC x Se b ± t ( n−2 ) gl tc = SC x b Se / SC x ANALISIS DE CORRELACION LINEAL SIMPLE Coeficiente de correlación lineal n n n i=1 i=1 i=1 n ∑ xi yi - ∑ xi ∑ y i r= 2 n n n ∑ xi2 - ∑ x i i=1 i=1 2 n n * n ∑ y i2 - ∑ yi i=1 i=1 Estadístico para prueba de hipótesis sobre Coeficiente de correlación parcial r12 − r13 r23 el coeficiente de correlación tc = r−ρ 2 1− r n−2 r12.3 = (1 − r )(1 − r ) 2 13 2 23 ) 2 7 Tablas y Fórmulas Estadísticas MUESTREO ALEATORIO ESTRATIFICADO Afijación de la muestra proporcional Afijación de la muestra óptima o Neyman Nhσh = n ⋅ nh L ∑ Nhσ h h=1 Nh nh = n ⋅ L ∑ Nh h=1 Promedio aritmético estratificado y st = Proporción estratificada L 1 L ∑ N h yh = ∑ Wh xh N h=1 h =1 N Wh = h N Variancia del promedio estratificada p$ st = Variancia de la proporción estratificada l l Var ( y st ) = ∑ Wh2 ⋅Var ( yh ) y =1 Tamaño de la muestra para proporciones Tamaño de la muestra para la estimación de la media de la población 1 Wh2 sh2 1 V = ∑ − ∑ Wh sh2 n wh N ( ) Var ( p$ st ) = ∑ Wh2 ⋅Var p$ h y =1 Wh2 sh2 ∑ wh n= 1 W 2 s2 V+ ∑ h h N wh L 1 L ∑ N h p$ h = ∑ Wh p$ h N h=1 h =1 Proporcional: n= ∑ Wh ph qh n0 n0 = donde n V 1+ 0 N Optimo supuesto: n0 n= 1+ n0 1 ∑ Wh ph qh NV (∑ W = h ph qh V ) 2 8 Tablas y Fórmulas Estadísticas MUESTREO POR CONGLOMERADOS Estimación del promedio Estimación de una proporción A A ∑ yi y = ∑ ai i=1 A i =1 A p$ = ∑ mi ∑ mi i=1 i =1 MODELOS DE CRECIMIENTO Modelo aritmético Modelo geométrico N t = N 0 (1 + rt ) N t = N 0 (1+ r ) t 1 N - N0 r= ⋅ t t N0 N r= t No 1/ t -1 Modelo exponencial N t = N 0 e rt 1 r = ln N t t N0 DISTRIBUCIONES DE PROBABILIDADES Distribución binomial n f ( x ) = p x q n − x x=0, 1,..., n x Distribución de Poisson x −λ f ( x) = Distribución hipergeométrica D N − D x n − x f ( x) = N n x=0, 1, 2,..., min(n,D) f λe x! x=0, 1,... Distribución geométrica ( x ) = q x −1 p x=1, 2,... TEOREMA DE BAYES P( A) P( D / A) P( A D ) = P( A) P( D / A) + P( B) P( D / A) TECNICAS DE CONTEO Combinaciones Permutaciones n Pr = n! (n − x)! nCr = n! r!(n − x)! 9 Tablas y Fórmulas Estadísticas 10 ANALISIS DE VARIANCIA A UNA VIA: DISEÑO COMPLETAMENTE ALEATORIZADO Media total Suma de cuadrados total r r c SCT = ∑ ∑ ( xij − x ) 2 ∑ ∑ xij x= c i =1 j =1 i =1 j =1 n Suma de cuadrados de los tratamientos c SCTR = ∑ rj ( x j − x ) j =1 2 Suma del cuadrado de error r c SCE = ∑ ∑ ( xij − x j ) 2 i =1 j =1 Prueba para diferencias entre pares de medias Diseños balanceados Diseños no balanceados Criterio de Tukey Diferencia mínima significativa T = qα , c , n − c CME R DMS J , K = 1 1 + (CME ) Fα , c −1,n − c rj rk Diferencia mínima significativa DMS = 2( CME ) Fα ,1,n − c r ANALISIS DE VARIANCIA A DOS VÍAS: DISEÑO ALEATORIZADO EN BLOQUES Suma de cuadrados de bloques r SCBL = ∑ ci ( xi − x ) 2 i =1 Suma de cuadrados del error SCE = SCT − SCTR − SCBL Tablas y Fórmulas Estadísticas 11 PRUEBAS NO PARAMETRICAS Prueba U de Mann-Whitney n1 ( n1 + 1) − ∑ R1 2 U1 = n1n2 + Media y desviación estándar de la distribución muestral para la prueba U de Mann-Whitney µu = n2 ( n2 + 1) − ∑ R2 2 U 2 = n1n2 + n1n2 ( n1 + n2 + 1) σu = Valor Z para normalizar la prueba U de Mann-Whitney Z= n1n2 2 12 Prueba de independencia ChiCuadrada U i − µu 2 χ obs σu rc ( Oi − E i ) 2 i =1 Ei =∑ Coeficiente de correlación de Spearman Desviación normal para la prueba de rangos de Spearman rs = 1 − 6∑ di2 ( Z = rs n − 1 ) n n2 − 1 Prueba de Kruskal-Wallis 12 Ri2 K= ∑ − 3( n + 1) n( n + 1) ni Valor crítico para la prueba de Kruskal-Wallis Ck = n( n + 1) χα , k −1 12 2 1 1 + ni n j