Resumen de Pruebas de Hipótesis Procedimiento para realizar cualquier prueba de Hipótesis Tipos de pruebas de hipótesis: 1. Párametricas 2. Comparación Múltiple 3. Análisis de Varianza (ANOVA) 4. De Ajuste a distribuciones de probabilidad (bondad de ajuste) 5. De Homogeneidad de los datos (dependencia entre características) Pasos para realizar la prueba (contraste): Antes de examinar los datos muestrales: 1. Identificar el parámetro o parámetros de interés. 2. Establecer la Hipótesis Nula. 3. Especificar una Hipótesis Alternativa adecuada. 4. Seleccionar un Nivel de Significación α. Usando los datos muestrales: 5. Establecer un estadígrafo de prueba adecuado. 6. Establecer una región de rechazo. 7. Calcular todas las cantidades muestrales necesarias para el estadígrafo. 8. Dar la conclusión Estadística y Práctica. Pruebas Paramétricas: Parámetro Casos conocida) 0 0 (con Bilateral (de 2colas) Caso 1 Ho: 0 H1: 0 Región C: Z Z1 2 conocida) 0 0 2 p 2 02 pˆ pˆ 0 pˆ pˆ 0 T T 2 12 ( sin ; n1 2 2 02 2 Unilateral (de 1 cola) Caso 2 Unilateral (de 1 cola) Caso 3 Ho: 0 H1: 0 Región C: Ho: 0 H1: 0 Región C: ; n1 Z Z1 2 ; n 1 0 0 2 02 Z Z1 T T ; n1 2 2; n1 Z Z1 0 0 0 0 T T ; n1 2 02 pˆ pˆ 0 pˆ pˆ 0 Z Z1 x 0 Sx donde S x es: ó es: n S n T 2 pˆ pˆ 0 pˆ pˆ 0 2 0 2 02 2 12 ; n1 x 0 Sx 2 Sx donde donde S n es: 2 2 0 0 Z Estadígrafo 2 (n 1) S 2 0 2 n = tamaño de muestra Z Z1 Z pˆ pˆ 0 S pˆ donde S pˆ es: pˆ 0 (1 pˆ 0 ) n y n 30 Todas las magnitudes 0 , pˆ 0 ,02 se extraen de la afirmación (Hipótesis) que se quiere contrastar, y las demás ( x , S , n, k ) se extraen de la muestra dada o de los datos de la población ( 2 , ) . Pruebas de Comparaciónes Múltiples (con conocida) 1 , 2 ( sin conocida) 1 2 ,2 2 H1: 1 2 Región C: 1 2 1 2 Z Z1 1 2 1 2 1 Ho: 1 2 1 2 1 2 Parámetros Casos Bilateral (de 2colas) Caso 1 Unilateral (de 1 cola) Caso 2 Unilateral (de 1 cola) Caso 3 Ho: 1 2 1 , 2 T T 2 1 1 2 Z Z1 T T ; n1 Ho: 1 2 1 2 1 2 donde S x es: ó es: Estadígrafo n S n y n 30 T x1 x2 Sx donde Sx 1 2 22 F F ;V 1,V 2 1 2 22 n = tamaño x x2 Z 1 Sx 2 2 1 2 22 1 2 T T ; n1 Z Z1 F F ;VM ,Vm 2 1 2 1 2 2 2 12 22 H1: 1 2 Región C: H1: 1 2 Región C: (n>29) 2 ; n1 2 es: (n1 1) S12 (n2 1) S 22 n1n2 (n1 n2 2) n1 n2 p1 , p 2 F F ;V 2,V 1 S M2 S m2 donde M es: F la muestra de mayor varianza p1 p2 p1 p2 Z Z1 p1 p2 p1 p2 Z Z1 p1 p2 p1 p2 Z Z1 Z pˆ 1 pˆ 2 S pˆ donde S pˆ es: 1 1 p(1 p) n1 n2 y p x1 x2 n1 n2 ANOVA Modelo general de ANOVA: medias Muestra 1 y11 , y12 ,..., y1n y1 Muestra 2 y 21 , y 22 ,..., y 2n y2 Muestra k y k1 , y k2 ,..., y kn yk y Hipótesis: H 0 : 1 2 ... k H1 : i j , para i j Las medias son iguales o difieren Ó H 0 : 1 2 ... k 0 H1 : i 0, 2 para un i El factor afecta o no afecta por igual las muestras F F ;k 1; N k Región crítica: F Estadígrafo: SCR /( k 1) SCE /( N k ) Donde k cantidad de muestras Tamaño de la muestra i ni k N ni Total de datos observados i 1 n Ti yij Suma de los datos de la muestra i j 1 k T Ti Suma de todos los datos de las muestras i 1 C T2 N Constante k n SCT yij2 C Suma de cuadrados totales k T 2 SCR i C i 1 ni Suma de cuadrados de los residuos SCE SCT SCR Sumas de los cuadrados de los errores i 1 j 1 Tabla ANOVA: Fuente de variación G.L S.C. C.M. Residuos k-1 SCR MSCR =SCR/(k-1) Error N-k SCE MSCE =SCE/(N-k) Totales N-1 SCT F MSCR / MSCE Pruebas No paramétricas Ho: Oi Ei Ha: Oi Ei Región C: Estadígrafo Contraste de Bondad de ajuste Oi Ei Oi Ei Prueba de homogeneidad Oij Eij ( A y B son Independientes) 2 2; k r 1 2 2; ( m1)( n1) Donde: k = número de clases r=0 Donde: m = número de filas n = número de columnas k 2 Oij Eij ( A y B son Dependientes) Oi Ei 2 i 1 k 2 Ei i 1 j 1 ij Eij 2 Eij 2 Clases Oi Pi Ei=n*Pi Oi-Ei Intervalo 1 O1 P1 E1 Intervalo 2 O2 P2 E2 Intervalo 3 . . . Intervalo k O3 . . . Ok P3 . . . Pk E3 . . . Ek (Oi-Ei)2 (Oi-Ei)2/Ei (chi-cuadrado) 2 2 Segunda porción de Primera porción de . . . . . . n es la suma de las Oi, o total de datos observados. P1 = p(Intervalo 1) = pasos lógicos = valor de probabilidad 1 P2 = p(Intervalo 2) = pasos lógicos = valor de probabilidad 2 … Pk = p(Intervalo k) = pasos lógicos = valor de probabilidad k 2 O se usa tabla de contingencia para calcular 2 se usa tabla de frecuencias para calcular 2 Tabla de frecuencias para cálculo de n (O1 E1)2 (O2 E 2)2 (Ok Ek )2 ... E1 E2 Ek k-ésima porción de 2 Tabla de Contingencia para cálculo de a1 a2 . . . am totales 2 b1 b2 b3 … bn totales O11 (E11) O21 (E21) . . . Om1 (Em1) Tb1 O12 (E12) O22 (E22) . . . Om2 (Em2) Tb2 O13 (E13) O23 (E23) . . . Om3 (Em3) Tb3 … O1n (E1n) O2n (E2n) . . . Omn (Emn) Tn Ta1 … . . . … Ta2 Tm T (O11 E11) 2 (O12 E12) 2 (O1n E1n) 2 ... E11 E12 E1n (O 21 E 21) 2 (O 22 E 22) 2 (O 2n E 2n) 2 ... E 21 E 22 E 2n (Om1 Em1) 2 (Om 2 Em2) 2 (Omn Emn) 2 ... ... Em1 Em2 Emn 2 En estos casos, se puede calcular los valores esperados como Ei = Tm*Tn/T, por ejemplo: E13 = Ta1*Tb3/T