PRUEBA DE KRUSKAL-WALLIS(*)

Anuncio
Prueba H de Kruskal-Wallis para comparar las distribuciones de probabilidad de k
poblaciones: diseño completamente aleatorizado
H0: las distribuciones de probabilidad de las k poblaciones
son idénticas.
H1: Al menos dos de las k distribuciones de probabilidad de población difieren en su
ubicación.
k T2
12
Estadística de prueba: H 
 i  3(n  1)
n(n  1) i 1 ni
donde:
ni = Número de mediciones en la muestra i
Ti = Suma de rangos para la muestra i, donde el rango de cada medición se calcula según
su magnitud relativa dentro de la totalidad de datos de las k muestras.
n = Tamaño total de las muestras= n1 +n2 + …..+nk
Región de rechazo: H 
 2 con (k  1) grados de libertad
Supuestos: 1. Las k muestras son aleatorias e independientes
2. Hay 5 o más mediciones en cada muestra.
3. Las observaciones se pueden ordenar.
[Nota: No es preciso hacer supuestos en los que toca a la forma de las distribuciones de
probabilidad de las poblaciones]
Ejemplo 1:
La efectividad de la capacitación sobre evaluación del desempeño en un entorno
organizacional se estudió en Personnel Psychology (agosto de 1984). Se seleccionaron
aleatoriamente gerentes de nivel medio y se asignaron a una de tres condiciones de
capacitación:1) ninguna capacitación, 2)capacitación asistida por computadora o 3)
capacitación asistida por computadora más un taller de modelado del comportamiento..
Después de la capacitación formal, los gerentes contestaron un examen de opción múltiple
de 25 preguntas sobre conocimientos gerenciales, registrándose el número de respuestas
correctas para cada uno. Los datos de la tabla se adaptaron de la información resumida
contenida en el articulo.¿Hay pruebas suficientes de que las distribuciones de frecuencia
relativa de las calificaciones difieren en su ubicación para los tres tipos de capacitación
sobre evaluación del desempeño?. Pruebe con α = .01
Sin capacitación
16
18
11
14
23
Capacitación asistida
Por computadora
19
22
13
15
20
18
21
Capacitación por
computadora, mas taller
12
19
18
22
16
25
Rangos del 1 al 18
Sin capacitación
Rank
Capacitación asistida
Por computadora
Rank
Capacitación por
computadora, mas taller
Rank
16
18
11
14
23
6.5
9
1
4
17
19
22
13
15
20
18
21
11.5
15.5
3
5
13
9
14
71
12
19
18
22
16
25
2
11.5
9
15.5
6.5
18
T1= 37.5
T2
T3 62.5
Estadística de prueba:
12
(37.5) 2 (71) 2 (62.5) 2
H
[


 3(19)
(18)(19)
5
7
6
H  0.035[1652.4328]  57
H  0.98
Utilizando las tablas de distribución ji cuadrada, para  .201 y 2 grados de libertad
se obtiene el valor crítico : 9.21034
H0 No se Rechaza
9.21
0.98
MINITAB
La forma de acomodar los datos es la siguiente: En una columna ( variable Response) se
colocan todos los datos de las k muestras. En una segunda columna(Factor) se coloca el
número de muestra a que pertenece cada dato
La instrucción es la siguiente:
Stat – Nonparametrics_ Kruskal-Wallis
Al aparecer el siguiente recuadro asignamos como sigue y damos OK
Los resultados que arroja son los siguientes:
El rango que maneja es el Rango promedio( Suma de rangos entre el tamaño de la muestra).
Se marcó con amarillo los resultados obtenidos de la prueba, observe que el valor p es
mayor que el nivel de significancia, por lo tanto H0 no se Rechaza.
Kruskal-Wallis Test: Resp versus comp
Kruskal-Wallis Test on Resp
comp
1
2
3
Overall
H = 0.98
H = 0.99
N
5
7
6
18
Median
16.00
19.00
18.50
DF = 2
DF = 2
Ave Rank
7.5
10.1
10.4
9.5
P = 0.613
P = 0.610
Z
-0.99
0.41
0.52
(adjusted for ties)
Ejemplo 2.
Con la elevación de los costos de perforación de los pozos petroleros hasta niveles sin
precedentes, la tarea de medir el rendimiento de perforación se ha vuelto esencial para el
éxito de una compañía petrolera. Un método para reducir los costos de perforación consiste
en aumentar la velocidad de perforación. Investigadores de la Cities Service Co. inventaron
una broca de perforación, llamada PD-1, que creen podrá penetrar roca a una velocidades
mayor que cualquier otra broca del mercado. Se decidió comparar la velocidad de la PD-1
con las dos brocas más rápidas conocidas, la IADC 1-2-6 y la IADC 5-1-7, en 15 sitios de
perforación en Texas. Se asignaron cinco sitios de perforación aleatoriamente a cada broca,
y se registró la velocidad de penetración (RoP) en pies por hora después de perforar 3,000
pies en cada sitio. Con base en la información que se presenta en la tabla, ¿Puede Cities
Service Co. suponer que las distribuciones de probabilidad de la velocidad de perforación
difiere para al menos dos de las tres brocas?. Pruebe con un nivel de significancia α = 0.05
PD-1 IADC 1-2-6 IADC 5-1-7
35.2
25.8
14.7
30.1
29.7
28.9
37.6
26.6
23.3
34.3
30.1
16.2
31.5
28.8
20.1
Solución:
Asignando rangos:
PD-1 Rank IADC 1-2-6 Rank IADC 5-1-7 Rank
35.2
14
25.8
5
14.7
1
30.1 10.5
29.7
9
28.9
8
37.6
15
26.6
6
23.3
4
34.3
13
30.1
10.5
16.2
2
31.5
12
28.8
7
20.1
3
64.5
37.5
18
Estadística de prueba:
12
(64.5) 2 (37.5) 2 (18) 2
H
[


 3(16)
(15)(16)
5
5
5
H  0.05[832.05  281.25  64.8]  48
H  10.905
 .201 y 2 grados de libertad =10.5966 , por lo que H0 apenas se rechaza
lo que significa que las distribuciones de probabilidad si difieren. Esto es, los datos indican
que la nueva broca es mejor.
MINITAB.
Utilizando el mismo procedimiento anterior, se obtienen los siguientes resultados
:
Kruskal-Wallis Test: Resp versus factor
Kruskal-Wallis Test on Resp
factor
1
2
3
Overall
H = 10.91
H = 10.92
N
5
5
5
15
Median
34.30
28.80
20.10
DF = 2
DF = 2
Ave Rank
12.9
7.5
3.6
8.0
P = 0.004
P = 0.004
Z
3.00
-0.31
-2.69
(adjusted for ties)
Descargar