Prueba H de Kruskal-Wallis para comparar las distribuciones de probabilidad de k poblaciones: diseño completamente aleatorizado H0: las distribuciones de probabilidad de las k poblaciones son idénticas. H1: Al menos dos de las k distribuciones de probabilidad de población difieren en su ubicación. k T2 12 Estadística de prueba: H i 3(n 1) n(n 1) i 1 ni donde: ni = Número de mediciones en la muestra i Ti = Suma de rangos para la muestra i, donde el rango de cada medición se calcula según su magnitud relativa dentro de la totalidad de datos de las k muestras. n = Tamaño total de las muestras= n1 +n2 + …..+nk Región de rechazo: H 2 con (k 1) grados de libertad Supuestos: 1. Las k muestras son aleatorias e independientes 2. Hay 5 o más mediciones en cada muestra. 3. Las observaciones se pueden ordenar. [Nota: No es preciso hacer supuestos en los que toca a la forma de las distribuciones de probabilidad de las poblaciones] Ejemplo 1: La efectividad de la capacitación sobre evaluación del desempeño en un entorno organizacional se estudió en Personnel Psychology (agosto de 1984). Se seleccionaron aleatoriamente gerentes de nivel medio y se asignaron a una de tres condiciones de capacitación:1) ninguna capacitación, 2)capacitación asistida por computadora o 3) capacitación asistida por computadora más un taller de modelado del comportamiento.. Después de la capacitación formal, los gerentes contestaron un examen de opción múltiple de 25 preguntas sobre conocimientos gerenciales, registrándose el número de respuestas correctas para cada uno. Los datos de la tabla se adaptaron de la información resumida contenida en el articulo.¿Hay pruebas suficientes de que las distribuciones de frecuencia relativa de las calificaciones difieren en su ubicación para los tres tipos de capacitación sobre evaluación del desempeño?. Pruebe con α = .01 Sin capacitación 16 18 11 14 23 Capacitación asistida Por computadora 19 22 13 15 20 18 21 Capacitación por computadora, mas taller 12 19 18 22 16 25 Rangos del 1 al 18 Sin capacitación Rank Capacitación asistida Por computadora Rank Capacitación por computadora, mas taller Rank 16 18 11 14 23 6.5 9 1 4 17 19 22 13 15 20 18 21 11.5 15.5 3 5 13 9 14 71 12 19 18 22 16 25 2 11.5 9 15.5 6.5 18 T1= 37.5 T2 T3 62.5 Estadística de prueba: 12 (37.5) 2 (71) 2 (62.5) 2 H [ 3(19) (18)(19) 5 7 6 H 0.035[1652.4328] 57 H 0.98 Utilizando las tablas de distribución ji cuadrada, para .201 y 2 grados de libertad se obtiene el valor crítico : 9.21034 H0 No se Rechaza 9.21 0.98 MINITAB La forma de acomodar los datos es la siguiente: En una columna ( variable Response) se colocan todos los datos de las k muestras. En una segunda columna(Factor) se coloca el número de muestra a que pertenece cada dato La instrucción es la siguiente: Stat – Nonparametrics_ Kruskal-Wallis Al aparecer el siguiente recuadro asignamos como sigue y damos OK Los resultados que arroja son los siguientes: El rango que maneja es el Rango promedio( Suma de rangos entre el tamaño de la muestra). Se marcó con amarillo los resultados obtenidos de la prueba, observe que el valor p es mayor que el nivel de significancia, por lo tanto H0 no se Rechaza. Kruskal-Wallis Test: Resp versus comp Kruskal-Wallis Test on Resp comp 1 2 3 Overall H = 0.98 H = 0.99 N 5 7 6 18 Median 16.00 19.00 18.50 DF = 2 DF = 2 Ave Rank 7.5 10.1 10.4 9.5 P = 0.613 P = 0.610 Z -0.99 0.41 0.52 (adjusted for ties) Ejemplo 2. Con la elevación de los costos de perforación de los pozos petroleros hasta niveles sin precedentes, la tarea de medir el rendimiento de perforación se ha vuelto esencial para el éxito de una compañía petrolera. Un método para reducir los costos de perforación consiste en aumentar la velocidad de perforación. Investigadores de la Cities Service Co. inventaron una broca de perforación, llamada PD-1, que creen podrá penetrar roca a una velocidades mayor que cualquier otra broca del mercado. Se decidió comparar la velocidad de la PD-1 con las dos brocas más rápidas conocidas, la IADC 1-2-6 y la IADC 5-1-7, en 15 sitios de perforación en Texas. Se asignaron cinco sitios de perforación aleatoriamente a cada broca, y se registró la velocidad de penetración (RoP) en pies por hora después de perforar 3,000 pies en cada sitio. Con base en la información que se presenta en la tabla, ¿Puede Cities Service Co. suponer que las distribuciones de probabilidad de la velocidad de perforación difiere para al menos dos de las tres brocas?. Pruebe con un nivel de significancia α = 0.05 PD-1 IADC 1-2-6 IADC 5-1-7 35.2 25.8 14.7 30.1 29.7 28.9 37.6 26.6 23.3 34.3 30.1 16.2 31.5 28.8 20.1 Solución: Asignando rangos: PD-1 Rank IADC 1-2-6 Rank IADC 5-1-7 Rank 35.2 14 25.8 5 14.7 1 30.1 10.5 29.7 9 28.9 8 37.6 15 26.6 6 23.3 4 34.3 13 30.1 10.5 16.2 2 31.5 12 28.8 7 20.1 3 64.5 37.5 18 Estadística de prueba: 12 (64.5) 2 (37.5) 2 (18) 2 H [ 3(16) (15)(16) 5 5 5 H 0.05[832.05 281.25 64.8] 48 H 10.905 .201 y 2 grados de libertad =10.5966 , por lo que H0 apenas se rechaza lo que significa que las distribuciones de probabilidad si difieren. Esto es, los datos indican que la nueva broca es mejor. MINITAB. Utilizando el mismo procedimiento anterior, se obtienen los siguientes resultados : Kruskal-Wallis Test: Resp versus factor Kruskal-Wallis Test on Resp factor 1 2 3 Overall H = 10.91 H = 10.92 N 5 5 5 15 Median 34.30 28.80 20.10 DF = 2 DF = 2 Ave Rank 12.9 7.5 3.6 8.0 P = 0.004 P = 0.004 Z 3.00 -0.31 -2.69 (adjusted for ties)