ANOVA FLOW CHART PHASE DESCRIPTION 1) Scorecard, KPI Management. 2) Project charter: - Scope - Objective - Taskforce - Deadline - Expected benefits - Communication CONTROL IMPROVE ANALYZE MEASUREMENT DEFINE KPI Management Problem Identification Problem evaluation Six Sigma Project definition Process Map MSA CTQ Cause&effect matrix ("Critical to") CTP Action Plan (R&R NC) PFMEA Action Plan (RPN>100) 5.- Determine statistical relation between process and product parameters. Hypothesis tests: ANOVA, Regression analysis, Chi Sq, T-student. (*CTP filter) CTQ=f(CTP) Hypothesis testing 6.- Identify impact degree and interactions of process parameters CTPs, and identify VITAL FEW variables and the optimum operating settings. (*CTP filter). Note: mathematic model is defined. Design of Experiments (DOE) SPC (Control Charts) Poka Yoke End 1.- Process Map. To identify all known process (X's) and product (Y's) variables. 2.- C&E Matrix. To identify most important X's and Y's variables: CTP and CTQ in a first level, using Pareto principle. (*CTP filter). 3.-PFMEA for CTP. Risk assesment to identify CTP more critical regarding RPN. (*CTP filter). 4.-MSA for CTQ. To be confident on measuring method for most important Quality characteristics and to be confident on data collected. Standardize 7.- To implement, verify, validate and standardize control intem (SPC or Poka Yoke) for each vital variable identified. - Final validation CONCEPTOS ANOVA ANOVA vs. PRUEBA DE HIPOTESIS (2-MUESTRAS) Comparemos el conjunto de datos tomados en métodos diferentes para producir artefactos, en que varía un Factor A Prueba Hipótesis: Old Method 13.6 14.9 15.2 13.2 19.5 13.2 15.8 New Method 15.3 17.6 15.6 16.2 21.7 15.1 17.2 ¿Hay una diferencia en el promedio para cada método? ¿Y si comparamos varios métodos? Method 1 16.3 15.2 14.9 19.2 20.1 13.2 15.8 Method 2 17.2 17.3 16.0 20.5 22.6 14.3 17.6 Method 3 19.4 17.9 18.1 22.8 24.7 17.3 19.7 Method 4 20.5 18.8 21.3 25.0 26.4 18.5 23.2 Q: ¿Hay algunas diferencias estadísticas importantes en los promedios para los métodos? Q: Si es así, ¿cuáles son las diferencias con otros? ANOVA DE 1 FACTOR • El Análisis de varianza de Un Factor (ANOVA) es un método estadístico para comparar las medias de más de dos niveles cuando un factor único es variado • En otras palabras, una ANOVA evalúa si cualquiera de las medias son diferentes. ANOVA no nos dice cuáles son diferentes. • Complementaremos ANOVA con los procedimientos de comparación múltiples. FUENTES DE VARIABILIDAD ANOVA busca tres orígenes de variabilidad: 1. Variabilidad total entre todas las observaciones. 2. Variación entre medias de subgrupos. 3. Variación Individual. FUENTES DE VARIABILIDAD ANOVA busca tres orígenes de variabilidad: 1. Variabilidad total entre todas las observaciones 2. Variación entre medias de subgrupos 3. Variación Individual yj = Media de Grupo 70 y = Gran Media del experimento 65 60 yi,j = Medición individual 55 1 2 3 Factor 4 i = representa un punto de dato dentro del grupo jth j = representa el grupo jth HIPÓTESIS NULA Y ALTERNA Para determinar si podemos aceptar o rechazar la hipótesis nula debemos calcular el valor P. Si Valor P < 0.05 se rechaza la hipótesis nula • Para determinar si cualquiera de las diferencias entre las medias es estadísticamente significativa, compare el valor p con el nivel de significancia para evaluar la hipótesis nula. • La hipótesis nula indica que las medias de población son todas iguales. Por lo general, un nivel de significancia (denotado como α o alfa) de 0.05 funciona adecuadamente. • Un nivel de significancia de 0.05 indica un riesgo de 5% de concluir que existe una diferencia cuando no hay una diferencia real. Si Valor P< 0.05 se rechaza la hipótesis nula Ejemplo de Aplicación • Un ingeniero estaba intentando desarrollar una alfombra más durable . • La mayoría de las quejas de cliente se concentraron en una característica de desgaste de alfombra llamada aglomeración. • La aglomeración es cuando una alfombra pierde su grosor y se vuelve comprimida por el desgaste. • Este conjunto de datos contiene los datos tomados 30 días después de que las cuatro alfombras diferentes fueron instaladas. ¿UNA ALFOMBRA ES MÁS DURABLE QUE OTRA? • ¿Cómo podríamos determinar cuál, si alguna de las cuatro alfombras es más durable? • Cada muestra fue instalada y medido su desgaste 30 días después • Los valores más altos para la durabilidad son mejores ALFOMBRA 1 ALFOMBRA 2 ALFOMBRA 3 ALFOMBRA 4 18.95 12.62 11.94 14.42 10.06 7.19 7.03 14.66 10.92 13.28 14.52 12.51 9.3 21.2 16.11 21.41 Gráfica de caja de DURABILIDAD 22.5 20.0 20.0 17.5 17.5 DURABILIDAD DURABILIDAD Gráfica de valores individuales de DURABILIDAD vs. ALFOMBRA 22.5 15.0 12.5 15.0 12.5 10.0 10.0 7.5 7.5 5.0 5.0 1 2 3 ALFOMBRA 4 1 2 3 4 ALFOMBRA NO SE RECHAZA LA HIPOTESIS NULA • Ninguna de las alfombras tienen una durabilidad significativamente diferente. EJEMPLO ANOVA – PRODUCTIVIDAD POR PLAN DE INCENTIVOS. • En este estudio, se evaluaron los niveles de productividad en 5 planes de incentivos diferentes. • La hipótesis nula es que no hay una diferencia estadísticamente significativa entre la productividad media de los 5 planes. PLAN A 1106 1203 1064 1119 1087 1106 1101 1049 PLAN B 1214 1186 1165 1177 1146 1099 1161 1153 PLAN C 1010 1069 1047 1120 1084 1062 1051 1029 PLAN D 1054 1101 1029 1066 1082 1067 1109 1083 PLAN E 1210 1193 1169 1223 1161 1200 1189 1197 • ¿Queremos determinar si hay una diferencia detectable en el nivel de la productividad entre los planes diferentes? Gráfica de caja de PRODUCCION 1250 1250 1200 1200 PRODUCCION PRODUCCION Gráfica de valores individuales de PRODUCCION vs. PLAN 1150 1100 1050 1150 1100 1050 1000 1000 A B C PLAN D E A B C PLAN • ¿El plan de incentivos parece importar? • ¿Si fuera el director, qué haría? D E • Se rechaza la hipótesis nula • Prueba de Tukey QUIZ - REPASO 1) ANOVA es un tipo de prueba de hipótesis para variables X , Y donde ambas son continuas. (a) Cierto (b) Falso 2) ANOVA es equivalente a T-student 1 muestra (a) Cierto 3) (b) Falso El estadístico de prueba P-value significa: (a) Los datos de la prueba de hipótesis son normales. (b) No tiene relación con las pruebas de hipótesis. (c) Probabilidad de cometer un error tipo I 4) Con el ANOVA podemos evaluar la relación Y = f(X) para 1 factor X categórico. (a) Cierto (b) Falso 5) En un ANOVA 95% CL, Si el P-value es ≥ 0.05 Aceptamos la Hipótesis nula H0 (a) Cierto (b) Falso