PROGRAMA UNIVERSITARIO PARA FORMACION DE ADMINISTRADORES E INGENIEROS INDUSTRIALES FUNDAMETAL – UNEG Guayana Universidad Nacional Experimental de Guayana PROYECTO DE CARRERA: INGENIERÍA INDUSTRIAL ASIGNATURA: ESTADÍSTICAS II UNIDAD IV: ANÁLISIS DE VARIANZA TECNICA ANOVA – CUADRO RESUMEN INTRODUCCIÓN Para determinar si hay una diferencia significativa entre las medias muestrales de dos grupos de datos, se recomienda utilizar el contraste de hipótesis mediante la prueba t, pero si son más de dos grupos, la recomendación apropiada será utilizar la técnica ANOVA y descartar la primera. El análisis de varianza o ANOVA es una técnica estadística usada para contrastar la hipótesis en la que se busca probar la igualdad de tres o más medias poblacionales, por medio del análisis de las varianzas muestrales. ANOVA se utiliza en aquellas situaciones en las que hay tres grupos o más, que tienen valores medios distintos en relación a un parámetro o característica bajo estudio, al aplicar sobre cada grupo un procedimiento o tratamiento diferente. FUNDAMENTOS DEL ANOVA El análisis de la varianza o ANOVA, es una técnica estadística utilizada para determinar si la diferencia entre las medias muestrales de tres o más grupos es más grande de lo que se esperaría si solo se tomara en cuenta el azar en caso de que la hipótesis nula (Ho : µ1 = µ2 = ... = µk) fuese verdadera. Bajo el supuesto que las poblaciones son normales, de igual varianza σ2, y que las muestras son independientes, se estima el valor común de σ2 por dos métodos diferentes. El estadístico de prueba F, es el cociente o proporción de dichos estimados, y tendrá una distribución muestral llamada F de Fisher, de parámetros: α, ν1, ν2. Autor: HERNAN RIVAS Técnica ANOVA y Cuadro Resumen (PRUFAI).doc (25/06/2010) Página 1 PROGRAMA UNIVERSITARIO PARA FORMACION DE ADMINISTRADORES E INGENIEROS INDUSTRIALES Universidad Nacional Experimental de Guayana FUNDAMETAL – UNEG Guayana De este modo, un valor de F significativamente grande constituirá una evidencia en contra que las medias poblacionales sean iguales. F se calcula mediante la fórmula siguiente: F= Variación _ entre _ muestras Variación _ dentro _ de _ las _ muestras En donde los dos métodos para estimar el valor de σ2 son los siguientes: 1. La variación entre muestras (o variación debida al tratamiento) se basa en la variación entre las medias muestrales de los grupos y se conoce como Cuadrados Medios entre Tratamientos (CMTR). Su cálculo se realiza mediante la siguiente expresión: ∑n CMTR = i ( ⋅ xi − x k −1 ) 2 En donde al numerador se le llama Suma de Cuadrado entre Tratamientos (SCTR) y al denominador representa los grados de libertad ν1 para distribución F: ν1 = k-1, x = media de todos los valores muestrales, k = número de grupos, ni = tamaño del grupo i, xi = media de los valores del grupo i, 2. La variación dentro de las muestras (o variación debida al error) se basa en las varianzas muestrales y se conoce como Cuadrados Medios debido al Error (CME); ésta puede calcularse de la siguiente forma: ∑ (ni − 1) ⋅ si2 CME = ∑ (ni − 1) ∑∑ (x − x ) = 2 ij ∑n i −k Donde, al numerador se le conoce como Suma de Cuadrados debido al Error (SCE) y el denominador corresponde con los grados de libertad ν2 de la distribución F, (ν2 es igual al número total de observaciones menos el número de grupos). Autor: HERNAN RIVAS Técnica ANOVA y Cuadro Resumen (PRUFAI).doc (25/06/2010) Página 2 PROGRAMA UNIVERSITARIO PARA FORMACION DE ADMINISTRADORES E INGENIEROS INDUSTRIALES Universidad Nacional Experimental de Guayana FUNDAMETAL – UNEG Guayana s i2 = varianza muestral del grupo i. xij = valor de la observación j-ésima del grupo i. Nota: Cuando los grupos a comparar tienen todos el mismo tamaño n, el cálculo del estadístico F se resume a la siguiente fórmula: ( n ⋅ ∑ xi − x n⋅s F = 2 = k −1 1 s prom ⋅ ∑ si2 k 2 x ) 2 PASOS PARA TRABAJAR CON LA TECNICA ANOVA La prueba F de ANOVA supone que las observaciones en cada una de la K poblaciones corresponden a muestras aleatorias simples, independientes, normalmente distribuidas y con varianzas iguales ( σ 12 = σ 22 = L = σ k2 ). Para trabajar con esta técnica debe seguir los siguientes pasos: 1. Enuncie Ho, por ejemplo: Ho: µ1 = µ 2 = L = µ 3 2. Especifique el nivel de significancia, por ejemplo: α = 0,05 3. Calcule el estadístico Fp como la razón: F = CMTR / CME 4. Halle el valor crítico Fc por medio de la tabla de la distribución F para los valores de α, ν1 y ν2 correspondientes. 5. Enuncie la conclusión: rechazar Ho si Fp > Fc; mantenga Ho en otro caso. ANOVA DE UN FACTOR (1F) – CUADRO RESUMEN PARA LOS DIFERENTES DISEÑOS El factor o tratamiento, es la propiedad o característica que permite distinguir entre sí a las distintas poblaciones. Se tienen varios diseños bajo este modelo de análisis, los cuales se presentan a continuación. Autor: HERNAN RIVAS Técnica ANOVA y Cuadro Resumen (PRUFAI).doc (25/06/2010) Página 3 PROGRAMA UNIVERSITARIO PARA FORMACION DE ADMINISTRADORES E INGENIEROS INDUSTRIALES Universidad Nacional Experimental de Guayana FUNDAMETAL – UNEG Guayana ANOVA 1F: CUADRO RESUMEN PARA LOS DIFERENTES DISEÑOS 1) DISEÑO COMPLETAMENTE ALEATORIZADO Fuente de variación Intermuestral (Tratamiento) Intramuestral (Error) Total SCTR = ∑ ni (xi − x ) g. l. Suma de Cuadrados Cuadrados Medios ν1 = k-1 SCTR CMTR=SCTR / ν1 ν2 = ∑ni-k SCE CME=SCE / ν2 n-1 SCT 2 SCT = ∑∑ (xij − x ) 2 ; ; Estadístico de prueba (F) F=CMTR/CME SCE = SCT − SCTR 2) DISEÑO DE BLOQUE ALEATORIZADO Fuente de variación Intermuestral (Tratamiento) Intermuestral (Bloque) Intramuestral (Error) Total g. l. Suma de Cuadrados Cuadrados Medios νt = t-1 SCTR CMTR=SCTR / νt νb = b-1 SCBL CMBL=SCBL / νb F1=CMTR/CME νe = νt x νb SCE CME=SCE / νe F2=CMBL/CME SCT SCBL = ∑ bi (x j − x ) ; SCTR = ∑ t j (xi − x ) ; 2 2 Estadístico de prueba (F) SCT = ∑∑ (xij − x ) ; 2 SCE = SCT − SCRT − SCBL 3) DISEÑO DE CUADRADO LATINO Fuente de variación Intermuestral (Tratamiento) Intermuestral (Fila) Intermuestral (Columna) Intramuestral (Error) Total g. l. Suma de Cuadrados Cuadrados Medios νt = r-1 SCTR CMTR=SCTR / νt νf = r-1 SCFL CMFL=SCFL / νf F1=CMTR/CME νc = r-1 SCCL CMCL=SCCL / νc F2=CMFL/CME νe = (r-1)(r-2) SCE CME=SCE / νe F3=CMCL/CME SCT SCTR = (1 / r ) ⋅ ∑ (Suma _ de _ tratamientos ) − C 2 , 2 SCFL = (1 / r ) ⋅ ∑ (Suma _ de _ filas ) − C 2 ; 2 SCT = ∑∑ xij2 − C 2 ; Autor: HERNAN RIVAS Estadístico de prueba (F) donde C = (1 / r ) ⋅ ∑∑ xij SCCL = (1 / r ) ⋅ ∑ (Suma _ de _ columnas ) − C 2 ; 2 SCE = SCT − SCTR − SCFL − SCCL Técnica ANOVA y Cuadro Resumen (PRUFAI).doc (25/06/2010) Página 4