Diseños Factoriales Diseño de experimentos – p. 1/25 Introducción El término “experimento factorial” o “arreglo factorial” se refiere a la constitución de los tratamientos que se quieren comparar. Diseño de tratamientos es la selección de los factores a estudiar, sus niveles y la combinación de ellos. El diseño de tratamientos es independiente del diseño experimental que indica la manera en que los tratamientos se aleatorizan a las diferentes u.e. y las formas de controlar la variabilidad natural de las mismas. Así, el diseño experimental puede ser completamente al azar, bloques al azar, bloques al azar generalizados, cuadro latino, etc. y para cada uno de estos diseños se puede tener arreglo factorial de los tratamientos, si estos se forman por la combinación de niveles de varios factores. A ambos tipos de diseños, el de tratamientos y el experimental, les corresponde un modelo matemático. Diseño de experimentos – p. 2/25 Introducción Así, por ejemplo, si el diseño experimental es bloques al azar, el modelos es: yij = µ + τi + βj + ǫij respuesta = media general + efecto de tratamiento + efecto de bloque + error Si se trata de un diseño factorial, los tratamientos se forman combinando los niveles de los factores en estudio, de manera que el efecto del tratamiento τi se considera a su vez compuesto de los efectos de los factores y sus interacciones. Por ejemplo, si son dos factores en estudio se tiene: τi = τkl = αk + γl + ξkl tratamiento = factor A + factor B + interacción AB Diseño de experimentos – p. 3/25 Introducción Haciendo una equivalencia entre los valores de i y los de k y l suponiendo que el factor A tiene K niveles y el factor B L: l i k 1 1 1 2 1 2 3 3 1 .. .. .. t K L Y el modelo resultante es: yklj = µ + αk + γl + ξkl + βj + ǫklj Es poco usual tener diseños experimentales muy complicados en los experimentos factoriales, ya que se dificulta el análisis y la interpretación. Diseño de experimentos – p. 4/25 Introducción La necesidad de estudiar conjuntamente varios factores obedece a la posibilidad de que el efecto de un factor cambie según los niveles de otros factores, esto es, que los factores interactúen, o exista interacción. También se utilizan los arreglos factoriales cuando se quiere optimizar la respuesta o variable dependiente, esto es, se quiere encontrar la combinación de niveles de los factores que producen un valor óptimo de la variable dependiente. (superficie de respuesta) Si se investiga un factor por separado, el resultado puede ser diferente al estudio conjunto y es mucho más difícil describir el comportamiento general del proceso o encontrar el óptimo. Diseño de experimentos – p. 5/25 Introducción Las ventajas de los experimentos factoriales son: 1. Economía en el material experimental al obtener información sobre varios factores sin aumentar el tamaño del experimento. Todas las u.e.se utilizan para la evaluación de los efectos. 2. Se amplía la base de la inferencia en relación a un factor, ya que se estudia en las diferentes condiciones representadas por los niveles de otros factores. Se amplía el rango de validez del experimento. 3. Permite el estudio de la interacción, esto es, estudiar el grado y forma en la cual se modifica el efecto de un factor por los niveles de los otros factores. Una desventaja de los experimentos factoriales es que requiere un gran número de u.e., sobre todo cuando se prueban muchos factores o muchos niveles de algunos factores, es decir, se tiene un número grande de tratamientos. (factoriales fraccionales) Diseño de experimentos – p. 6/25 Interacción Suponga un diseño con dos factores: A con a niveles y B con b niveles, en diseño completamente al azar. (Factorial a × b completo, balanceado, efectos fijos) Sea yijk la respuesta para la k-ésima u.e. del nivel i de A y j de B. yijk = µ + τi + βj + γij + ǫijk i = 1, . . . , a j = 1, . . . , b k = 1, . . . , n Las hipótesis que se prueban son: H01 : γij = 0 ∀ i, j H02 : τi + γ̄i. = 0 ∀ i H03 : βj + γ̄.j = 0 ∀ j Diseño de experimentos – p. 7/25 Interacción Ejemplo de un factorial 2 × 2 sin y con interacción. Diseño de experimentos – p. 8/25 Interacción Conocer la interacción es más útil que conocer los efectos principales. Una interacción significativa frecuentemente oscurece la significancia de los efectos principales. Cuando hay interacción significativa, se deberán examinar los niveles de un factor, digamos A, con los niveles del o de los otros factores fijos, para tener conclusiones acerca del efecto principal A. Dos factores: A con a niveles y B con b niveles. Se dice que se tiene un factorial a × b, con diseño completamente al azar (bloques, etc.). Se tienen ab tratamientos. Diseño de experimentos – p. 9/25 Tabla de ANOVA F.V. g.l. SS CM F A a−1 SSA SSA /(a − 1) B b−1 SSB SSB /(b − 1) AB (a − 1)(b − 1) SSAB SSAB /(b − 1) CMA CME CMB CME CMAB CME error ab(n − 1) SSE SSE /ab(n − 1) total abn − 1 SST SST = a X b X n X i=1 j=1 k=1 2 yijk E(CM ) 2 σ 2 + rbθa σ 2 + raθb2 2 σ 2 + rθab σ2 2 y... − abn a SSA = 2 y... 1 X 2 y − bn i=1 i.. abn b SSB = 2 y... 1 X 2 y.j. − an j=1 abn a SSAB SSE = b 2 1 XX 2 y... yij. − − SSA − SSb n i=1 j=1 abn = SST − SSAB − SSA − SSB Diseño de experimentos – p. 10/25 Ejemplo Un ingeniero está diseñando una batería para usarse en un aparato que estará sujeto a variaciones extremas de temperatura. Tiene tres opciones para el material de la placa para la batería, y como sabe que la temperatura afecta la vida de la batería decide probar tres temperaturas: 15◦ F, 70◦ F, 125◦ F . Se prueban 4 baterías en cada combinación de material y temperatura y las 36 pruebas (3 × 3 × 4) se corren en orden aleatorio (completamente al azar). Los datos son vida (en horas) de las baterías. Diseño de experimentos – p. 11/25 Ejemplo tipo de material 1 2 3 Temperatura(◦ F ) 15 70 125 130 155 34 40 20 70 74 180 80 75 82 58 150 188 136 122 25 70 159 126 106 115 58 45 138 110 174 120 96 104 168 160 150 139 82 60 El ingeniero quiere contestar las siguientes preguntas: 1. Qué efectos producen el material y la temperatura en la vida de la batería? 2. Existe un material que produzca uniformemente más larga vida a la batería sin importar la temperatura? diseño completamente al azar, experimento balanceado, completo, factores fijos. ej_fact3x3.jmp Diseño de experimentos – p. 12/25 Una observación por celda Suponga un experimento con dos factores A con a niveles y B con b niveles y una sola repetición en cada celda (tratamiento). El modelo con interacción es: yij = µ + τi + βj + (τ β)ij + ǫij i = 1, . . . , a j = 1, . . . , b F.V. A B AB Error Total g.l. a−1 b−1 (a − 1)(b − 1) 0 ab − 1 E(CM ) σ 2 + bθa2 σ 2 + aθb2 2 σ 2 + θab σ2 σ 2 no se puede estimar, por lo tanto no hay prueba para los efectos principales a menos que no haya interacción, y entonces el modelo es yij = µ + τi + βj + ǫij Este es el caso de bloques al azar. Diseño de experimentos – p. 13/25 El Diseño Factorial General. Balanceado El diseño factorial de dos factores se puede generalizar a tener p factores: A con a niveles B con b niveles .............. En general, habrá abc · · · n observaciones si hay n repeticiones del experimento completo. Debe haber por lo menos 2 repeticiones (n ≥ 2) para poder calcular σ̂ 2 si todas las posibles interacciones están incluidas en el modelo. Diseño de experimentos – p. 14/25 Tres factores El modelo para un factorial de tres factores en diseño completamente al azar: yijkl = µ+τi +βj +γk +(τ β)ij +(τ γ)ik +(βγ)jk +(τ βγ)ijk +ǫijkl i = 1, . . . , a; j = 1, . . . , b; k = 1, . . . , c; l = 1, . . . , n Ejemplo: Se desea obtener más uniformidad en el llenado de botellas de refresco. La máquina de llenado teóricamente llena cada botella a la altura correcta, pero en la práctica hay variación, y la embotelladora desea entender mejor las fuentes de esta variabilidad para eventualmente reducirla. El ingenio de procesos puede controlar tres factores durante el proceso de llenado: El % de carbonato (A), la presión del llenado (B) y las botellas llenadas por minuto (velocidad de la línea) (C). Diseño de experimentos – p. 15/25 Sigue ejemplo tres factores 10% A= 12% 14% ( 25psi B= 30psi ( 200bpm C= 250bpm Decide correr dos repeticiones de un diseño factorial en estos tres factores, con las 24 corridas realizadas en orden aleatorio. La variable de respuesta es la desviación de la altura objetivo. Diseño de experimentos – p. 16/25 Sigue ejemplo tres factores % carbonato (A) 10 12 14 Presión (B) 25psi 30psi Velocidad (C) Velocidad (C) 200 250 200 250 -3 -1 -1 1 -1 0 0 1 0 2 2 6 1 1 3 5 5 7 7 10 4 6 9 11 fact3x2x2.jmp Diseño de experimentos – p. 17/25 Factoriales desbalanceados Hay situaciones en que el número de observaciones (repeticiones) en cada tratamiento es diferente. Esto ocurre por varias razones. Por ejemplo, el experimentador pudo haber diseñado un experimento balanceado inicialmente, pero debido a problemas durante la ejecución del experimento que no se previeron, se perdieron algunas observaciones lo que provocó terminar con un diseño desbalanceado. Por otro lado, algunos diseños desbalanceados se diseñan así, por ejemplo, algunos tratamientos pueden ser más caros o con más dificultad para aplicarse, por lo que se toman menos observaciones en ellos. Diseño de experimentos – p. 18/25 Factoriales desbalanceados Alternativamente, algunos tratamientos pueden ser de gran interés para el investigador porque pueden representar condiciones nuevas o inexploradas, por lo que toma más observaciones en ellos. La ortogonalidad entre efectos principales e interacciones ya no funciona en los diseños desbalanceados. Esto significa que no se aplican las técnicas del ANOVA usual. Diseño de experimentos – p. 19/25 Factoriales desbalanceados Caso del modelo con dos factores con interacción: yijk = µ + τi + βj + γij + ǫijk i = 1, . . . , a; j = 1, . . . , b; k = 1, . . . , nij Se definen otros tipos de sumas de cuadrados. El primero involucra ajustar modelos de una manera secuencial: 1. Ajustar yijk = µ + ǫijk y obtener SSE1 2. Ajustar yijk = µ + τi + ǫijk y obtener SSE2 3. Ajustar yijk = µ + τi + βj + ǫijk y obtener SSE3 4. Ajustar yijk = µ + τi + βj + γij + ǫijk y obtener SSE4 Diseño de experimentos – p. 20/25 Factoriales desbalanceados Sea R(τ |µ) = SSE1 − SSE2 R(τ |µ) es la reducción debida a τ ajustada por µ. Es la cantidad en la que se reduce la suma de cuadrados del error del modelo en el paso 1 al incluir en el modelo el término τi . Mientras más grande sea R(τ |µ) más importante es tener a τi en el modelo. Es decir, R(τ |µ) es una medida del efecto del factor A. R(β|µ, τ ) = SSE2 − SSE3 es la reducción debida a β ajustada por µ y τ . Es una medida del efecto del factor B dado que ya se tiene a µ y a τi en el modelo. R(γ|µ, τ, β) = SSE3 − SSE4 es la reducción debida a γ ajustada por µ, τ y β. Diseño de experimentos – p. 21/25 Tabla de Análisis de Varianza tipo I F.V. A B AB Error Total g.l. a−1 b−1 (a − 1)(b − 1) n.. − ab n.. − 1 donde, n.. = Pa i=1 Pb j=1 SS R(τ |µ) R(β|µ, τ ) R(γ|µ, τ, β) SSE4 SSE1 CM SSA /glA SSB /glB SSAB /glAB SSE /glE F CMA /CME CMB /CME CMAB /CME nij Diseño de experimentos – p. 22/25 Tabla de Análisis de Varianza tipo II F.V. A B AB Error Total g.l. a−1 b−1 (a − 1)(b − 1) n.. − ab n.. − 1 SS R(τ |µ, β) R(β|µ, τ ) R(γ|µ, τ, β) SSE4 SSE1 CM SSA /glA SSB /glB SSAB /glAB SSE /glE F CMA /CME CMB /CME CMAB /CME Diseño de experimentos – p. 23/25 Análisis tipo III, Regresión 1. Se generan a − 1 variables dummy (0,1) para los a niveles del factor A. Se generan b − 1 variables dummy para los b niveles del factor B. 2. La interacción A × B se representa por los productos de sus variables dummy correspondientes. 3. Se ajusta el modelo con todas las variables dummy y se obtiene SSE. 4. Se ajusta el modelo con todas las variables dummy excepto aquellas que corresponden a los efectos principales o interacciones que están siendo probadas. La diferencia entre esta SSE y la del modelo completo es la SS correspondiente a este efecto. Diseño de experimentos – p. 24/25 Ejemplo factorial 2x3 desbalanceado Suponga un experimento factorial 2 × 3 en un diseño completamente al azar. T1 T2 B1 19 20 21 25 27 B2 24 26 21 24 24 B3 22 25 25 31 32 33 ej9_1_messy.jmp Diseño de experimentos – p. 25/25