Podemos utilizar el procedimiento ANOVA de una vía para

Anuncio
Podemos utilizar el procedimiento ANOVA de una vía para contrastar la hipótesis de
que las medias de dos o más grupos no son diferentes significativamente.
El ANOVA de una vía también ofrece:
 Estadísticos a nivel de grupo para la variable dependiente.
 Un contraste de igualdad de varianzas
 Un gráfico de medias de grupo.
 Contrastes de rango, comparaciones de pares múltiple, y contrastes, para
describir la naturaleza de la diferencia entre los grupos.
Un primer paso importante en el análisis de la varianza es establecer la validez de los
supuestos. Un supuesto del ANOVA es que las varianzas de los grupos sean
equivalentes. Este ejemplo ilustra cómo contrastar este supuesto.
Un Director de Ventas quiere determinar el número óptimo de días de entrenamiento de
producto necesarios para los nuevos empleados. El tiene puntuaciones para tres grupos:
empleados con uno, dos y tres días de entrenamiento. Los datos se recogen en el fichero
ventas.sav.
Antes de ejecutar el análisis de la varianza, representamos gráficamente las medias y los
errores típicos.
Para crear un gráfico de barras, elegimos:
Gráficos
Barras de error…
Definir




Seleccionamos Puntuación en el exámen de ventas como variable de análisis.
Seleccionamos Grupo de entrenamiento de ventas como variable de categoría.
Seleccionamos Error típico de la media de la lista de lo representan las barras.
Pulsamos en Aceptar.
Media +- 2 ET Puntuación en el exámen de ventas
85,00
80,00
75,00
70,00
65,00
60,00
55,00
1
2
3
Grupo de entrenamiento de ventas
Las puntuaciones medias crecen claramente a medida que crecen los días de
entrenamiento, pero la variación en dichas puntuaciones decrecen. El ANOVA asume
igualdad de varianzas entre grupos; dicho supuesto no se puede mantener para estos
datos.
Para contrastar el supuesto de igualdad de varianzas, elegimos:
Analizar
Comparar medias
ANOVA de un factor…



Seleccionamos Puntuaciones del exámen de ventas como variable dependiente.
Seleccionamos Grupo de entrenamiento de ventas como la variable factor.
Entramos en Opciones…

Seleccionamos Estadísticos Descriptivos y Prueba de Homogeneidad de
Varianzas.
Continuar.
Aceptar.


Descriptivos
nivel
N
1
2
3
Total
20
20
20
60
Media
63,5798
73,5677
79,2792
72,1422
Desviación
típica
13,50858
10,60901
4,40754
12,00312
Error típico
3,02061
2,37225
,98556
1,54960
Intervalo de confianza para
la media al 95%
Límite
Límite inferior
superior
57,2576
69,9020
68,6025
78,5328
77,2165
81,3420
69,0415
75,2430
Mínimo
32,68
47,56
71,77
32,68
Máximo
86,66
89,65
89,69
89,69
La desviación típica y el error típico confirman que a medida que crece el número de
días de entrenamiento, la variación en las puntuaciones decrece.
Prueba de homogeneidad de varianzas
nivel
Estadístico
de Levene
4,637
gl1
gl2
2
57
Sig.
,014
El estadístico de Levene rechaza la hipótesis nula de la varianza de los grupos son
iguales. El ANOVA es robusto a esta violación cuando los grupos son de igual o
parecido tamaño; sin embargo, podemos elegir la transformación de los datos o la
ejecución de un contraste no paramétrico que no requiere del cumplimiento de este
supuesto.
En respuesta a los requerimientos de los clientes, una compañía de electrónica esta
desarrollando un nuevo aparato reproductor de Vds.. Usando un prototipo, el equipo de
marketing ha recogido datos de un grupo de análisis. El ANOVA se utiliza para
descubrir si los consumidores de distintas edades puntúan el diseño de forma diferente.
Este ejemplo utiliza el fichero reproductordvd.sav.
Para empezar el análisis, elegimos:
Analizar
Comparar medias
ANOVA de un factor…



Seleccionamos valoración global como variable dependiente.
Seleccionamos Grupo de edad como variable factor.
Entramos en Opciones…
El gráfico de medias es una forma útil de visulizar las diferencias de grupos.


Seleccionamos Gráfico de las medias.
Continuar.

Aceptar.
ANOVA
dvdpuntos
Inter-grupos
Intra-grupos
Total
Suma de
cuadrados
733,274
1976,417
2709,691
gl
5
62
67
Media
cuadrática
146,655
31,878
F
4,601
Sig.
,001
El nivel de significación de la prueba F en la tabla ANOVA es 0.001. Por tanto,
debemos rechazar la hipótesis de que las puntuaciones medias son iguales para los
distintos grupos de edad. Ahora que sabemos que los grupos de edad difieren de alguna
forma, necesitamos saber más acerca de la estructura de dichas diferencias.
38
Media de dvdpuntos
36
34
32
30
28
18-24
25-31
32-38
39-45
46-52
53-59
Grupo de edad
El gráfico de las medias ayuda a ver esta estructura. Los participantes con edades entre
32 y 45 años puntuaron el reproductor de DVD más alto que los otros. Si analizamos
más detalladamente, entonces el equipo puede utilizar contraste de rangos,
comparaciones de pares, o característica de contraste en un ANOVA de un factor.
CONTRASTES ENTRE MEDIAS
En general, los estadísticos F establecen que hay o no hay diferencias entre las medias
de grupo, y los gráficos de las medias sugieren donde puede estar dicha diferencia. En
este punto se muestra, podemos utilizar el procedimiento ANOVA de un factor para
especificar cómo las medias difieren y contrastar dichas especificaciones.
Viendo los datos del reproductor de DVD, los investigadores de Mercado se preguntan:
 ¿Son realmente diferentes los dos grupos que hay entre las edades de 32 y 45
años?
 ¿Podemos considerar estadísticamente equivalentes los entrevistados con edades
inferiores a 32 años y los de más de 45 años?
Volvemos a ejecutar el ANOVA de un factor, pero ahora entramos en Contrastes…
El primer contraste compara solamente los grupos 3 y 4 ([32-38] y [39-45]); el resto son
eliminados asignándoles ponderaciones 0.





Ponemos 0 como coeficiente para el grupo 1, pulsamos en añadir.
Añadimos otro coeficiente 0 para el grupo 2.
Luego, añadimos coeficientes a los grupos 3 y 4, de manera que sumen 0. Por
tanto, ponemos un -1 para el grupo 3 y un 1 para el grupo 4.
Ponemos un 0 como coeficientes para los grupos 5 y 6.
Pasamos al siguiente contraste.
El segundo contraste compara los grupos 1 y 2 con los grupos 5 y 6. Los grupos 3 y 4 se
eliminan.



Ponemos 0,5 como coeficiente para los grupos 1 y 2.
Luego ponemos coeificiente 0 para los grupos 3 y 4.
Para que la suma de los coeficientes de contraste sea 0, los grupos 5 y 6 tienen
que tener como coeficiente -0,5.


Continuar.
Aceptar.
Pruebas para los contrastes
dvdpuntos
Asumiendo igualdad
de varianzas
No asumiendo
igualdad de varianzas
Contraste
1
2
1
2
Valor del
contraste
-2,20
2,61
-2,20
Error típico
2,525
1,633
2,678
t
-,871
1,596
-,821
62
62
17,209
Sig. (bilateral)
,387
,116
,423
2,61
1,594
1,635
42,280
,110
gl
Nótese que los resultados se muestran en dos panels: el primero assume que las
varianzas de los grupos son iguales, y el segundo asumen que son distintas. En este
caso, las varianzas de los grupos se asume que son iguales, por lo que nos centramos en
el primer panel.


Los niveles de significación para los contrastes del primer contraste son ambos
mayores que 0.1. Esto indica que el grupo de edad 39-45 no es
significativamente más favorable hacia el reproductor DVD que el grupo de 3238.
De igual forma, los valores de significación para los contrastes del segundo
contraste son mayores que 0.1. Los entrevistados con edades inferiores a 32 y
superiores a 45 tienen puntuaciones estadísticamente equivalentes.
TODAS LAS POSIBLES COMPARACIONES ENTRE MEDIAS.
Los contrastes son un método eficiente y potente para la comparación exacta de los
grupos que queremos comparar, utilizando cualquier ponderación que necesitemos. Sin
embargo, hay veces cuando no tenemos, o no necesitamos, tales especificaciones. El
procedimiento de ANOVA de un factor permite comparar cada media de grupo frente a
cada una de las restantes, un método conocido como comparaciones múltiples de pares.
Un Director de ventas ha analizado los datos de entrenamiento utilizando el ANOVA de
un factor. Mientras que las diferencias de los grupos fueron detectadas, no hay hipótesis
a priori acerca de cómo los tres grupos difieren. Así, ha decidido simplemente comparar
cada grupo con cada uno de los restantes.
Este ejemplo utiliza el fichero ventas.sav.
Retomamos el primero de los ejemplos para llevar a cabo el ANOVA de un factor, pero
ahora además entramos en Post Hoc…
Las pruebas Post Hoc se dividen en dos grupos:





El primer grupo asume igualdad de varianzas.
El segundo conjunto no asume que las varianzas sean iguales. Puesto que el test
de Levene ha establecido que las varianzas entre grupos de entrenamiento son
significativamente diferentes, elegimos de esta lista.
Seleccionamos T2 de Tamhane.
Continuar.
Aceptar.
Comparaciones múltiples
Variable dependiente: nivel
Tamhane
(I) GRUPO
1
2
3
(J) GRUPO
2
3
1
3
1
2
Diferencia de
medias (I-J)
-9,98789*
-15,69947*
9,98789*
-5,71158
15,69947*
5,71158
Error típico
3,84079
3,17733
3,84079
2,56883
3,17733
2,56883
Sig.
,040
,000
,040
,102
,000
,102
Intervalo de confianza al
95%
Límite
Límite inferior
superior
-19,6053
-,3705
-23,8792
-7,5198
,3705
19,6053
-12,2771
,8539
7,5198
23,8792
-,8539
12,2771
*. La diferencia entre las medias es significativa al nivel .05.
El grupo con un día de entrenamiento significativamente menor puntuación que el resto
de grupos.
Los entrenados 2 y 3 días no difieren significativamente en promedio. A pesar de esta
igualdad, el Director de ventas puede aún considerar el beneficio añadido del tercer día
de entrenamiento, dado el mayor descenso en la variabilidad.
Descargar