capitulo 6 diseños factoriales 2

Anuncio
CAPITULO 6 DISEÑOS FACTORIALES 2K
6.1 Generalidades
Los diseños factoriales 2K son una clase especial de los diseños factoriales en los que
se tienen k factores de interés a dos niveles cada uno. Son especialmente útiles en las
etapas iniciales de la investigación para determinar, de un gran número de factores
candidatos, cuales son los que realmente influyen sobre la variable respuesta.
Se llaman diseños factoriales 2k porque se quiere investigar la forma como influyen k
factores sobre una variable respuesta y en cada factor se consideran dos niveles
solamente. La réplica completa de un diseño de este tipo requiere 2 x 2 x… x 2 = 2k
observaciones y recibe el nombre de diseño factorial 2k.
El diseño 2k son muy útiles en las primeras etapas del trabajo experimental, cuando se
investiguen muchos factores pero, probablemente todos ellos no influyen realmente
sobre la variable respuesta. Esto diseño proporciona el número más pequeño de
corridas para estudiar simultáneamente k factores en un diseño factorial completo.
Dado que sólo existen dos niveles para cada factor, es necesario suponer que la
respuesta es aproximadamente lineal sobre el rango de los niveles seleccionados para
el factor. Así, este tipo de diseño experimental es la forma más económica de estudiar
el efecto combinado de k factores.
Los niveles de cada factor pueden ser cualitativos o cuantitativos y se denotan como
Alto y Bajo o mas (+) y menos (-).
A continuación se enumeran algunas de las razones por las cuales se estudian los
diseños factoriales 2k por separado:
•
Es la forma más económica y barata de estudiar el efecto de k factores de interés
sobre una variable respuesta.
•
Existen procedimientos especiales que simplifican los cálculos matemáticos en los
diseños 2k
•
Los diseños 2k se pueden fraccionar. Esta característica permite correr solo una
fracción (la mitad, la cuarta parte, etc) del diseño completo y responder algunas
inquietudes del fenómeno que se estudia.
•
Constituyen la base de otros diseños más complejos que se verán más adelante
en el curso.
•
El modelo de regresión lineal para un diseño 2k es muy fácil de obtener a partir del
ANOVA. Esto se verá detalladamente más adelante.
6.1.1 Definiciones y diseño 22
Es el tipo más sencillo de diseño experimental 2k. En este diseño se tienen dos
factores A y B, cada uno con dos niveles. Lo usual es considerar estos niveles como
los niveles bajo y alto del factor. El diseño 22 se suele representar por un cuadrado
como el que se ilustra en la Figura 6.1
b
ab
Alto (+)
Bajo (-)
(1)
Bajo (-)
a
Alto (+)
Figura 6.1 Representación geométrica del diseño 22
A esta representación se le conoce como representación geométrica del diseño 22. Es
esta representación, cada vértice del cuadrado corresponde a una combinación
diferente de tratamientos (niveles) en el diseño factorial.
En la Figura 6.1 se aprecia una notación especial para etiquetar las combinaciones de
tratamiento en el diseño 22. Esta notación de letras minúsculas se utiliza, en general,
para todos los diseños 2k y se conoce como notación de Yates. Si una letra está
presente, el factor correspondiente se corre con el nivel alto en dicha combinación de
tratamiento; si está ausente, el factor se corre con su nivel bajo. Por ejemplo, la
combinación de tratamiento a indica que el factor A está en el nivel alto, y el factor B
en el nivel bajo. La combinación de tratamiento donde ambos factores tienen el nivel
bajo está representado por (1). Esta notación se emplea en todas las series de
diseños 2k. Por ejemplo, la combinación de tratamiento en un diseño 24 con A y C en el
nivel alto, y B y D en el nivel bajo, se denota por ac.
Los efectos de interés en el diseño 22 son los efectos principales A y B, y la interacción
entre los dos factores AB. Si suponemos que las letras (1), a, b y ab representan los
totales de todas las n observaciones tomadas en los puntos de diseño, es sencillo
estimar los efectos de estos factores. Para estimar el efecto principal de A, se
promedian las observaciones del lado derecho del cuadrado de la Figura 6.1, donde A
tiene el nivel alto, y se resta de éste el promedio de las observaciones que están en el
lado izquierdo del cuadrado, donde A tiene el nivel bajo, o
A = y A+ − y A− =
a + ab b + (1) 1
−
=
[a + ab − b − (1)]
2n
2n
2n
(6-1)
De igual forma, el efecto principal de B se obtiene al promediar las observaciones de la
parte superior del cuadrado, donde B tiene el nivel alto, y se resta de éste el promedio
de las observaciones que están en la parte inferior del cuadrado, donde B tiene el nivel
bajo:
B = y B+ − y B− =
b + ab a + (1) 1
−
=
[b + ab − a − (1)]
2n
2n
2n
(6-2)
Finalmente, la interacción AB se estima tomando la diferencia en los promedios de la
diagonal de la Figura 6.1, o
AB =
ab + (1) a + b) 1
=
−
[ab + (1) − a − b]
2n
2n
2n
(6-3)
Debido a que la cantidad dentro de corchetes cuadrados en las ecuaciones (6-1), (6-2)
y (6-3) aparece con frecuencia en los diseños 22, resulta conveniente hacer las
siguientes definiciones:
Contraste A = [a + ab − b − (1)]
(6-4)
ContrasteB = [b + ab − a − (1)]
(6-5)
Contraste AB = [ab + (1) − a − b]
(6-6)
La manera practica de calcular los contrastes de cualquier efecto (principal o de
interacción) es a partir de la tabla de signos. Esta tabla, para el diseño 22 se muestra a
continuación:
A
B
AB
Notación de Yates
-
-
+
(1)
+
-
-
a
-
+
+
b
+
+
-
ab
Tabla 6.1 Tabla de signos para el diseño 22 y notación de Yates
Observe que la tabla de signos (Tabla 6.1)
que la interacción AB se obtiene
multiplicando la columna con los signos de A por la columna con los signos de B y, el
resultado son los signos del contraste AB [ver ecuación (6-6)].
Para generar un
contraste a partir de esta tabla, se multiplican los signos de la columna apropiada de la
Tabla 6.1 por las combinaciones de tratamientos que aparecen en la columna de
notación de Yates, y luego se suma. Por ejemplo, contrasteAB = [(1)] + [-a] + [-b] = ab +
(1) – a – b. Los contrastes se emplean en el cálculo de las estimaciones de los efectos
y en las sumas de cuadrados de A, B y la interacción AB. Las fórmulas para las sumas
de cuadrados son
SC A
2
2
[
a + ab − b − (1)]
[
Contraste A ]
=
=
(6-7)
[b + ab − a − (1)]2 = [ContrasteB ]2
(6-8)
SC B =
4n
SC AB =
4n
4n
4n
[ab + (1) − a − b]2 = [ContrasteAB ]2
4n
4n
(6-9)
Para los diseños 22, tal vez no se ve muy útil la tabla de signos. Sin embargo, en la
medida que aumenta la cantidad de factores en el diseño 2k, la utilidad de la tabla de
signos se hace más evidente.
El Análisis de Varianza para el diseño 22 se completa con la suma de cuadrados
totales:
2
2
n
SCT = ∑∑∑ yijk2 −
i =1 j =1 k =1
y•2••
4n
Y la suma de cuadrados de los errores que se obtiene por diferencia:
(6-10)
SCE = SCT − SC AB − SC A − SCB
(6-11)
El ANOVA completo para el diseño 22 se muestra en la
Tabla 6.2 a continuación:
Fuente de
Variación
Factor A
Factor B
Interacción
AB
Grados
de
Suma de Cuadrados
libertad
Media de
F0
cuadrados
Valor P
SC A =
[a + ab − b − (1)]2 = [Contraste A ]2
1
MC A =
SC A
1
F0 =
MC A
MC E
Probabilidad
SC B =
[b + ab − a − (1)]2 = [ContrasteB ]2
1
MC B =
SC B
1
F0 =
MC B
MC E
Probabilidad
SC AB =
[ab + (1) − a − b]2 = [Contraste AB ]2
1
MC AB =
SC AB
1
F0 =
MC AB
MC E
Probabilidad
MC E =
4n
4n
4n
4n
4n
4n
Error
SCE = SCT − SC AB − SC A − SCB
4(n-1)
Total
y•2••
SCT = ∑∑∑ y −
4n
i =1 j =1 k =1
4n-1
2
2
SC E
4(n − 1)
n
2
ijk
Tabla 6.2 Tabla ANOVA para un diseño factorial 22
6.1.2 Diseño 23
En los diseños factoriales 23 se tienen tres factores de interés A, B y C a dos niveles
cada uno. Las ocho corridas o tratamientos del diseño 23 se pueden representar
geométricamente como un cubo similar al que se muestra en la figura siguiente:
bc
abc
c
Alto +
ac
Factor C
b
ab
Alto +
Factor B
Bajo −
Bajo −
a
(1)
−
Bajo
Factor A
+
Alto
Figura 6.2 Representación geométrica del diseño 23
Cada arista del cubo corresponde a una corrida o combinación de tratamientos
diferente. En la Figura 6.2 también se puede apreciar la notación de Yates para los
diseños 23, en esta notación las ocho corridas se representan por (1), a, b, ab, c, ac,
bc y abc.
Al igual que el los diseños 22, el efecto principal A puede estimarse promediando las
cuatro combinaciones de tratamiento de la cara derecha del cubo, donde el nivel A es
alto, y después restando de esta cantidad el promedio de las cuatro combinaciones de
tratamientos que están en la cara izquierda del cubo, donde A tiene el nivel bajo. Al
hacer esto se tiene:
A = y A+ − y A−
a + ab + ac + abc (1) + b + c + bc
−
4n
4n
1
[a + ab + ac + abc − (1) − b − c − bc]
=
4n
=
(6-12)
De manera similar, el efecto de B se puede determinar como la diferencia en
promedios entre las cuatro combinaciones de tratamientos de la cara posterior del
cubo (Figura 6.2) y las cuatro combinaciones de la cara anterior. Con esto se tiene que
B = y B+ − y B− =
1
[b + ab + bc + abc − (1) − a − c − ac]
4n
(6-13)
El efecto de C es la diferencia en la respuesta promedio entre las cuatro
combinaciones de tratamientos de la cara superior del cubo (Figura 6.2) y las cuatro
de la cara inferior, esto es,
C = y C+ − y C− =
1
[c + ac + bc + abc − (1) − a − b − ab]
4n
(6-14)
Los efectos de interacción también se pueden obtener con facilidad. La interacción
entre A y B se puede obtener como la diferencia entre los promedios de los efectos de
A en los dos niveles de B. Es decir:
Efecto de A promedio
B alto (+)
EfectoAPara B + =
B bajo (-)
EfectoAPara B − =
[(abc − bc ) + (ab − b )]
2n
{(ac − c ) + [a − (1)]}
2n
Luego la interacción entre A y B es:
AB =
EfectoAPara B + − EfectoAPara B − [abc − bc + ab − b − ac + c − a + (1)]
=
2
4n
(6-15)
De manera analoga se pueden obtener la interacción AC y BC
AC =
EfectoAPara C + − EfectoAPara C − [(1) − a + b − ab + c − ac + bc − abc ]
=
2
4n
(6-16)
BC =
EfectoBPara C + − EfectoBPara C − [(1) + a − b − ab − c − ac + bc + abc ]
=
2
4n
(6-17)
En la Figura 6.3 se ilustra gráficamente los terminos involucrados en el cálculo de los
efectos principales y de interacción en un diseño factorial 23.
bc
c
ac
−b
+
abc
ac
+
b
ab
ab
−
a
(1)
a
(1)
abc
+
c
ac
−b
ab
a
(1)
bc
bc
abc
c
Efectos principales A, B y C
bc
bc
bc
abc
abc
c
+
(1)
−
ac
b
c
ac
+
−
b
ab
a
+
abc
ac
−
b
ab
(1)
a
(1)
+
c
ab
a
Interacciones de dos factores: AB, AC y BC
bc
c
ac
b
(1)
abc
Corridas −
Corridas +
ab
a
Interacción
de tres factores
Figura 6.3 Calculo de los efectos principales y de interacción en un diseño 23
La Figura 6.3 muestra los vértices del cubo (tratamientos) que deben ir positivos y/o
negativos para el cálculo de cada efecto. Estos signos concuerdan con los obtenidos
anteriormente en las ecuaciones de la (6-12) a la (6-17) y los que se verán más
adelante en la tabla de signos que se verá más adelante (Tabla 6.4).
Finalmente, la interacción ABC se obtiene como:
ABC=
[abc-bc -ac+c-ab+b+a-(1)]
4n
(6-18)
A pesar de que para los diseños factoriales 22 y 23 se puede representar
geométricamente en un cuadrado y un cubo respectivamente, el cálculo de los
contrastes y de los efectos se puede obtener más fácilmente a partir de la tabla de
signos mostrada a continuación:
Tratamiento
1
2
3
4
5
6
7
8
Yates
(1)
a
b
ab
c
ac
bc
abc
A
+
+
+
+
B C AB AC BC ABC
- - +
+
+
- - +
+
+ - +
+
+ - +
- + +
+
+
- + +
+
+ + +
+
+ + +
-
Tabla 6.3 Tabla de signos para el diseño 23 y notación de Yates
En la tabla de signos (Tabla 6.4) se puede obtener con facilidad los signos para los
contrastes de interacción, multiplicando las columnas adecuadas de los efectos
principales. Así, por ejemplo, la columna con los signos de interacción AC se puede
obtener multiplicando la columna de A con la columna C renglón a renglón. Y el
contraste AC, resulta simplemente de multiplicar la columna de Yates en la Tabla 6.4
por la columna de signos AC:
Contraste AC = [(1) − a + b − ab + c − ac + bc − abc ]
(6-19)
La suma de cuadrados y efectos para la construcción del ANOVA se pueden obtener a
partir de las formulas:
Efecto =
SC =
Contraste
4n
(Contraste)2
8n
(6-20)
(6-21)
6.1.3 Diseño 2k
Después de tratar los diseños 22 y 23 con cierto detalle, nos proponemos a explicar el
caso general de los diseños 2k. En estos diseños, tenemos k factores de interés. La
tabla de signos (para k ≤ 6) se muestra a continuación:
Tratamiento Yates
1
(1)
2
a
3
b
4
ab
5
c
6
ac
7
bc
8
abc
9
d
10
ad
11
bd
12
abd
13
cd
14
acd
15
bcd
16
abcd
17
e
18
ae
19
be
20
abe
21
ce
22
ace
23
bce
24
abce
25
de
26
ade
27
bde
28
abde
29
cde
30
acde
31
bcde
32
abcde
A
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
B
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
C
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
D
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
E
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
F
-
Tratamiento
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
Yates
f
af
bf
abf
cf
acf
bcf
abcf
df
adf
bdf
abdf
cdf
acdf
bcdf
abcdf
ef
aef
bef
abef
cef
acef
bcef
abcef
def
adef
bdef
abdef
cdef
acdef
bcdef
abcdef
A
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
B
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
C
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
D
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
E
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Tabla 6.4 Tabla de signos para el diseño 2k k≤ 6 y notación de Yates
En la tabla de signos (Tabla 6.4 ) muestra un patrón de construcción bien definido: la
columna del primer factor, A inicia alternando los signos más (+) y menos (-) iniciando
con el signo menos; la segunda columna alterna dos signos menos con dos signos
más, iniciando con dos signos menos; la tercera columna (la de C) alterna 4 signos
menos con 4 signos más iniciando con 4 signos menos, y así sucesivamente.
En general, el procedimiento para hallar un contraste es el mismo que se empleo para
los diseños 22 y 23. Por ejemplo, si se tienen 4 factores de interés en un diseño 24 se
toman las 6 primeras columnas de la Tabla 6.4 para obtener la siguiente tabla:
F
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
Tratamiento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Yates
(1)
a
b
ab
c
ac
bc
abc
d
ad
bd
abd
cd
acd
bcd
abcd
A
+
+
+
+
+
+
+
+
B
+
+
+
+
+
+
+
+
C
+
+
+
+
+
+
+
+
D AB
+
+
+
+
+ +
+
+
+ +
+ +
+
+
+ +
Tabla 6.5 Tabla de signos para el diseño 24
Si se desea el contraste AB, simplemente se multiplican los signos de la columna A
por los signos de la B renglón a renglón y posteriormente el resultado de esta columna
se multiplica por la columna de Yates. El resultado final es el siguiente:
Contraste AB = [(1) − a − b + ab + c − ac − bc + abc
(6-22)
+ d − ad − bd + abd + cd − acd − bcd + abcd ]
De la misma forma se pueden obtener los demás contrastes para el cálculo de efectos
[Ecuación (6-23)] y la suma de cuadrados [Ecuación (6-24)]
para el Análisis de
Varianza.
Efecto =
SC =
Contraste
n 2 k −1
(Contraste )2
n2 k
(6-23)
(6-24)
6.1.4 Modelo de Superficie de Respuesta para un diseño 2k
Un aspecto interesante de los diseños factoriales 2k es que si se codifican las variables
al intervalo [-1,1] entonces, se puede obtener el modelo de regresión correspondiente
con relativa facilidad. Consideremos por ejemplo el diseño 22. En este diseño se tienen
dos efectos principales, A y B
y la interacción AB. El modelo de regresión
correspondiste es:
y = β 0 + β1 x1 + β 2 x2 + β12 x1 x2
(6-25)
Donde x1 representa el factor A, x2 representa el factor B, y el producto entre x1 y x2
representa la interacción entre A y B. Los parámetros del modelo de regresión, β 1, β 2,
β 12 se pueden demostrar que son iguales a la mitad de las estimaciones de los efectos
correspondientes, mientras que β 0 es igual a la gran media. En general, se tiene que:
Cualquier Parámetro en el modelo de Regresión =
Efecto en ANOVA
2
(6-26)
Y
β 0 = gran promedio = promedio de todas las observaciones
(6-27)
Se debe recordar que los valores de las variables en el modelo de regresión están
codificadas al intervalo [-1, 1]. Esto quiere decir que si se quiere expresar el modelo en
las unidades en las que realmente se mide la variable se debe hacer la transformación
correspondiste. Esta transformación se ilustra en la figura siguiente:
Factor en escala
normalizada
+1
Bajo
Factor en
Alto
escala real
-1
Figura 6.4 Transformación usada para encontrar el modelo de regresión en un diseño 2k
Esto nos lleva a la ecuación de transformación:
xcod . =
2 x real − Bajo − Alto
Alto − Bajo
(6-28)
La cual se puede utilizar para obtener el modelo de regresión en las unidades
originales en las que se miden los factores de interés. Esto transforma la ecuación
(6-25) en el modelo:
 2 x A − ABajo − AAlto
y = β 0 + β1 

AAlto − ABajo

 2 x A − ABajo − AAlto
+ β12 

AAlto − ABajo


 2 x − BBajo − B Alto
 + β2  B

 B −B
Alto
Bajo


 2 x B − BBajo − B Alto

 B − B
Alto
Bajo


+






(6-29)
Sin embargo, siempre se prefiere trabajar el modelo con las variables codificadas (en
el intervalo [-1,1])
Si los factores son cuantitativos, el modelo de regresión, se puede utilizar, con toda
confianza, para predecir el valor de la variable respuesta para cualquier punto entre -1
y 1 (si el factor o variable está codificado) o desde el valor bajo al alto si la variable o
factor no está codificado. Es decir, el modelo de regresión se puede utilizar para
interpolar cualquier valor intermedio de la variable respuesta sin problemas pero no se
debe utilizar para extrapolar.
6.1.5 Proyección de diseños factoriales 2k
Cualquier diseño 2k se contrae o se proyecta sobre cualquier otro diseño 2k con
menos variables si se omiten uno o más de los factores originales. En ocasiones, esto
puede proporcionar un conocimiento adicional de los demás factores.
Si algún factor en un diseño factorial 2k no es significativo y todas sus interacciones
son despreciables, entonces puede descartarse del experimento convirtiendo el diseño
en un diseño 2K−1. En este caso se dice que el diseño 2k se ha proyectado en un
diseño 2k−1 con el doble de réplicas denominadas réplicas ocultas.
En general, si se tiene una sola réplica en un diseño 2K y si h (h<k) factores son
insignificantes y pueden descartarse, entonces los datos originales corresponden a un
diseño factorial completo con dos niveles en los h−k factores restantes con 2h réplicas
La figura siguiente ilustra la proyección de un diseño 24 en uno 23
−
Factor insignificante D
+
Figura 6.5 Proyección de un diseño 24 a un diseño 23
6.1.6 El algoritmo de Yates
Este procedimiento fue propuesto por Yates para obtener, de una manera sencilla, la
tabla de ANOVA para un diseño factorial 2k. Este procedimiento es una alternativa a la
tabla de signos propuesta anteriormente. Para utilizar el algoritmo de Yates, primero
se construye una tabla con las combinaciones de tratamientos y los correspondientes
totales de tratamiento, en un orden estándar. Por orden estándar se entiende que
cada factor se introduce uno a la vez combinándolo con todos los niveles de los
factores que están por encima de él. Es así como el orden estándar de un diseño 22 es
(1), a, b, ab, mientras que para un diseño 23 es (1), a, b, ab, c, ac, bc, abc, y para un
diseño 24 es (1), a, b, ab, c, ac, bc, abc, d, ad, bd, abd, cd, acd, bcd, abad. Aquí se
presenta el procedimiento siguiente de cuatro pasos:
1. Se etiqueta la columna adyacente (1). Las entradas en la mitad superior de esta
columna se calculan sumando las respuestas en pares adyacentes de la columna
anterior. Las entradas de la parte inferior de esta columna se calcula cambiando el
signo de la primera entrada de cada par de las respuestas originales y luego
sumando los pares adyacentes.
2. Se etiqueta la columna adyacente (2). La columna (2) se construye con las
entradas de la columna (1), siguiendo el mismo procedimiento utilizado para
generar la columna (1). El proceso continúa hasta que se han construido k
columnas. La columna (k) contiene los contrastes designados en los renglones.
3. Se calcula la suma de cuadrados para los efectos elevando al cuadrado cada
entrada de la columna k y dividiéndolo entre n2k.
4. Se calcula las estimaciones de los efectos dividiendo cada entrada de la columna k
entre n2k-1.
6.1.7 Diseño 2k sin réplica
A medida que crece el número de factores de un experimento factorial, el número de
efectos que pueden estimarse también aumenta. Por ejemplo, un experimento 24 tiene
cuatro efectos principales, 6 interacciones entre dos factores, 4 interacciones entre
tres factores y una interacción entre cuatro factores, mientras que un experimento 26
tiene 6 efectos principales, 15 interacciones entre dos factores, 20 interacciones entre
tres factores, 15 interacciones entre cuatro factores, 6 interacciones entre cinco
factores y una intersección entre 6 factores.
En muchas situaciones se aplica el principio de dispersión de los efectos; esto es,
usualmente el sistema está dominado por los efectos principales y las interacciones de
orden inferior. En general, las interacciones entre tres factores y las de orden superior
son
despreciables.
Por
consiguiente,
cuando
el
número
de
factores
es
moderadamente grande (por ejemplo, k ≥ 4 o 5), una práctica común es correr sólo
una réplica del diseño 2k y luego combinar las interacciones de orden superior como
una estimación del error. En ocasiones, una única réplica de un diseño 2k se conoce
como diseño factorial 2k sin réplica.
Cuando se analizan datos que provienen de diseños factoriales sin réplica, en
ocasiones se presentan interacciones reales de orden superior. En estos casos resulta
inapropiado utilizar la media de cuadrados del error obtenida al combinar las
interacciones de orden superior. Para resolver este problema puede emplearse un
método de análisis más sencillo. Para ello se construye una gráfica de las
estimaciones de los efectos sobre una escala de probabilidad normal. Los efectos que
son despreciables tienen una distribución normal, con media cero y varianza σ2, y
tienden a caer a lo largo de una línea recta sobre esta gráfica, mientras que los efectos
significativos tienen medias distintas de cero y no se alinean a los largo de la línea
recta.
6.2 Adición de puntos centrales en un diseño 2k
Un aspecto muy importante en el empleo de diseños factoriales de dos niveles es la
hipótesis de linealidad en los efectos de los factores. Claro está que la linealidad
perfecta es innecesaria, y el sistema 2k trabaja muy bien aun cuando la suposición de
linealidad es sólo aproximada. Sin embargo, existe un método para replicar ciertos
puntos en el diseño 2k factorial que proporciona protección contra la curvatura y
permite una estimación independiente del error que ha de obtenerse. El método
consiste en añadir puntos centrales al diseño 2k. Éstos coinciden de nC réplicas de
las corridas en el punto xi = 0 (i= 1, 2,…, k). Una razón importante para añadir réplicas
de las corridas en el centro del diseño es que los puntos centrales no tienen impacto
en las estimaciones usuales de los efectos en un diseño 2k. Se supone que los k
factores son cuantitativos.
ab
b
Alto (+)
Corrida
Central
Medio
Bajo (-)
(1)
Bajo (-)
Medio
a
Alto (+)
Figura 6.6 Representación geométrica del diseño 22 con corridas centrales o puntos centrales
Para ilustrar este enfoque, considérese un diseño 22 con una observación en cada uno
de los puntos factoriales (-, -), (+, -), (-, +) y (+, +), y nC observaciones en los puntos
centrales (0, 0). La Figura 6.6 ilustra esta situación. Sean y F y y C los promedios de
las cuatro corridas en los cuatro puntos factoriales y el promedio de las nC corridas en
el punto central, respectivamente. Si la diferencia y F - y C es pequeña, entonces los
puntos centrales se encuentran sobre el plano que pasa por todos los puntos
factoriales, o cerca de él, y no hay curvatura. Por otra parte, si
y F - y C es grande,
entonces la curvatura está presente. Una suma de cuadrados de un grado de libertad
para la curvatura está dada por:
SS Curvatura
n n (y − y C )
= F C F
nF + nC
2
(6-30)
donde, en general, nF es el número de puntos en el diseño factorial. Esta cantidad
puede ser comparada con el error cuadrático medio para probar la curvatura. De
manera más específica, cuando se añaden puntos al centro del diseño 2k, entonces el
modelo que se considera es
k
k
Y = β 0 + ∑ β j x j + ∑∑ β ij xi x j + ∑ β jj x 2 + ε
j =1
i< j i< j
(6-31)
j =1
donde las βjj son efectos cuadráticos puros. La prueba de curvatura consiste, en
realidad, de la prueba de las hipótesis
k
H 0 : ∑ β jj = 0
j =1
k
(6-32)
H 1 : ∑ β jj ≠ 0
j =1
Por otra parte, si los puntos factoriales en el diseño no están replicados, entonces
pueden emplearse los nC puntos centrales para construir una estimación del error con
nC -1 grados de libertad.
6.3 Formación de bloques y confusión en diseños 2k
A menudo es imposible correr todas las observaciones en un diseño factorial 2k bajo
condiciones homogéneas. La técnica de diseño apropiada para esta situación general
es la formación de bloques. Sin embargo, en muchas situaciones, el tamaño del
bloque es más pequeño que el número de corridas en la réplica completa. En estos
casos, la confusión es un procedimiento útil para correr el diseño 2k en bloques 2p,
donde el número de corridas en un bloque es menor que el número de combinaciones
de tratamientos en una réplica completa. La técnica provoca que ciertos efectos de
interacción sean indistinguibles de los bloques, o que sean confundidos con
bloques. A continuación se ilustra la confusión en el diseño factorial 2k en bloques 2p,
con p < k.
Considérese un diseño 22. Supóngase que cada una de las 22 = 4 combinaciones de
tratamientos requiere cuatro horas de análisis de laboratorio. Por tanto, se requieren
dos días para efectuar el experimento. Si los días se consideran como bloques,
entonces deben asignarse dos de las cuatro combinaciones de tratamientos a cada
día.
Tratamiento
(1)
a
b
ab
A
+
+
B AB
- +
- + + +
Contraste AB = [(1) − a − b + ab ]
b
ab
Corridas Bloque 1
(1)
ab
a
b
Bloque 1
Bloque 2
Corridas Bloque 2
(1)
a
Figura 6.7 Formación de bloques en un diseño 22
Este diseño se muestra en la Figura 6.7. Nótese que el bloque 1 contiene las
combinaciones de tratamientos (1) y ab, y que el bloque 2 contiene a a y b. Los
contrastes para estimar los efectos principales de los factores A y B son
ContrasteA = ab + a – b – (1)
ContrasteB = ab + a – b – (1)
Observe que estos contrastes no se ven afectados por la formación de bloques puesto
que en cada uno de ellos existe sólo una combinación de tratamientos más y una
menos de cada uno de los bloques. Esto es, cualquier diferencia entre el bloque 1 y el
bloque 2 que aumente las lecturas en un bloque por una constante aditiva, será
cancelada. El contraste para la interacción AB es
ContrasteAB = ab + (1) – a – b
Puesto que las dos combinaciones de tratamientos con los signos más, ab y (1), están
en el bloque 1 y las dos con los signos menos, a y b, están en el bloque 2, los efectos
del bloque y la interacción AB son idénticos. Esto es, la interacción AB queda
confundida con bloques.
La razón de esto es evidente en la tabla de signos más y menos del diseño 22 que
aparece en la Figura 6.7. De ésta se observa que todas las combinaciones de
tratamientos que tienen un signo más en AB están asignadas al bloque 1, mientras
que todas las combinaciones de tratamientos que tienen un signo menos en AB están
asignadas al bloque 2.
Este esquema puede emplearse para confundir cualquier diseño 2k en dos bloques.
Como segundo ejemplo considérese un diseño 23, efectuado en dos bloques. De la
tabla de signos más y menos (Figura 6.8), se asignan las combinaciones de
tratamientos que son menos en la columna ABC al bloque 1, y las que son más en la
columna ABC al bloque 2. El diseño resultante se muestra en la Figura 6.8.
Combinación de
Tratamientos
(1)
a
b
ab
c
ac
bc
abc
I
+
+
+
+
+
+
+
+
A
+
+
+
+
Efectos Factoriales
B AB C AC BC ABC
- + - + +
- - - - +
+
+ - - +
+
+ + - - + + +
- - + +
+ - + - +
+ + + + +
+
Contraste ABC = [− (1) + a + b − ab + c − ac − bc + abc ]
bc
abc
Corridas – (Bloque 1)
c
ac
Corridas + (Bloque 2)
b
ab
(1)
(1)
ab
ac
bc
a
b
c
abc
Bloque 1
Bloque 2
a
Figura 6.8 Formación de bloques en un diseño 22
En general, lo que se busca es que el efecto de bloque se confunda con las
interacciones de orden superior. La Figura 6.8 se observa que el efecto de bloque se
confunde con el efecto de interacción ABC. El cual, por el principio de los efectos
esparcidos se puede asumir despreciable. Sin embargo, si la interacción entre los tres
factores llega a ser significativa entonces no podremos saber si realmente se debe a la
interacción a al efecto de bloque.
Existe un método más general para construir bloques. Ésta utiliza un contraste de
definición, por ejemplo,
L= α1x1 + α2x2 +… + αkxk
donde xi es el nivel del i-ésimo factor que aparece en una combinación de tratamientos
y αi es el exponente que aparece sobre el i-ésimo factor en el efecto que va a
confundirse con bloques. Para el sistema 2k, se tiene que αi = 0 o 1, y xi = 0 (nivel bajo)
o xi = 1 (nivel alto). Las combinaciones de tratamientos que producen el mismo valor
de L (mód. 2) son colocadas en el mismo bloque, Puesto que los únicos valores
posibles de L (mód. 2) son 0 y 1, esto asigna las combinaciones de tratamientos 2k
exactamente en dos bloques.
Como ejemplo, considérese el diseño 23 con ABC confundido con bloques. En este
caso, xi corresponde a A, x2 a B, x3 a C, con α1 = α2 = α3 = 1. Por tanto, el contraste de
definición que se utilizará para confundir ABC con bloques es
L = x1 + x2 + x3
Para asignar las combinaciones de tratamientos a los bloques, se sustituyen éstas en
el contraste de definición, de la manera siguiente:
(1): L = 1(0) + 1(0) + 1(0) = 0 = 0 (mód 2)
a:
L = 1(1) + 1(0) + 1(0) = 1 = 1 (mód 2)
b:
L = 1(0) + 1(1) + 1(0) = 1 = 1 (mód 2)
ab: L = 1(1) + 1(1) + 1(0) = 2 = 0 (mód 2)
c:
L = 1(0) + 1(0) + 1(1) = 1 = 1 (mód 2)
ac: L = 1(1) + 1(0) + 1(1) = 2 = 0 (mód 2)
bc: L = 1(0) + 1(1) + 1(1) = 2 = 0 (mód 2)
Es así como (1), ab, ac, y bc se corren en el bloque 1, y a, b, c y abc se corren en el
bloque 2. Este mismo diseño se muestra en la figura 12-32.
Existe un útil método corto para construir estos diseños. El bloque que contiene la
combinación de tratamientos (1) recibe el nombre de bloque principal. Cualquier
elemento [con excepción de (1)] en el bloque principal puede generarse haciendo la
multiplicación módulo 2 de los exponentes de cualquier par de elementos del bloque
principal. Por ejemplo, considérese el bloque principal del diseño 23 con ABC
confundido, el cual se muestra en la figura 12-32. Nótese que
ab · ac = a2bc = bc
ab · bc = ab2c = ac
ab · bc = abc2 = ab
Las combinaciones de tratamientos del otro bloque (o bloques) pueden generarse al
hacer la multiplicación módulo 2 de los exponentes de un elemento del bloque nuevo
por cada elemento del bloque principal. Para el diseño 23 con ABC confundido, puesto
que el bloque principal es (1), ab, ac y bc, se sabe que la combinación de tratamientos
b está en el otro bloque. Por tanto, los elementos de este segundo bloque son
b · (1)
=b
b · ab = ab2 = a
b · ac
= abc
2
b · bc = b c = c
6.4 Diseños 2k fraccionados
A medida que aumenta el número de factores en un diseño factorial 2k, el número de
corridas requeridas se aumenta con rapidez. Por ejemplo, un diseño 25 requiere 32
corridas. En este diseño, sólo cinco grados de libertad corresponden a los efectos
principales, y 10 a las interacciones entre dos factores. Dieciséis de los 31 grados de
libertad se utilizan para estimar interacciones de orden superior –esto es, interacciones
entre tres factores y de orden superior-. A menudo existe poco interés en estas
interacciones de orden superior, en particular cuando se comienza a estudiar por
primera vez un proceso o sistema. Si es posible suponer que ciertas interacciones de
orden superior son despreciables, entonces puede emplearse un diseño factorial
fraccionaria con menos corridas que el conjunto completo de corridas 2 k, para
obtener información sobre los efectos principales y las interacciones de orden inferior.
Aquí se presentan las réplicas fraccionarias del diseño 2k.
Uno de los principales usos de los diseños fraccionarios se encuentran en
experimentos de detección. Éstos son experimentos en los que se consideran muchos
factores con la finalidad de identificar aquellos (si es que los hay) que tienen efectos
grandes
Normalmente los experimentos de detección se realizan en las primeras etapas de un
proyecto, cuando es probable que muchos de los factores considerados al inicio
tengan poco o ningún efecto sobre la respuesta. Los factores identificados como
importantes son los que se investigan con más profundidad en experimentos
subsecuentes.
6.4.1 Fracción un medio de un diseño 2k
La fracción un medio del diseño 2k-1 corridas y a menudo se conoce como diseño
factorial fraccionario 2k-1. Como ejemplo considérese el diseño 23-1, la fracción un
medio del diseño 23. Este diseño tiene sólo cuatro corridas, en contraste con el diseño
completo que requiere ocho.
Combinación de
Tratamientos
a
b
c
abc
ab
ac
bc
(1)
I
+
+
+
+
+
+
+
+
A
+
−
−
+
+
+
−
−
Efectos Factoriales
B C AB AC BC ABC
− − − − +
+
+ − − + −
+
− + + − −
+
+ + + + +
+
+ − + − −
−
− + − + −
−
+ + − − +
−
− − + + +
−
3
bc
abc
c
Fracción principal, I=ABC
ac
Fracción alterna, I= −ABC
b
ab
(1)
Figura 6.9 Diseño factorial 2 fraccionado a la mitad.
a
Relación de
definición
del diseño
La Figura 6.9 presenta la tabla de signos más y menos para el diseño 23 fraccionado.
Supóngase que se escogen las cuatro combinaciones de tratamientos a, b, c y abc
como la fracción un medio. Estas combinaciones aparecen en la parte superior de la
Figura 6.9 en color azul claro. Observe que la combinación de tratamientos escogida
para esta fracción tiene signo mas para la interacción ABC, por lo tanto, el efecto ABC
se conoce como generador de la fracción. Además, debido a que el signo es el mismo
para la interacción ABC, esta interacción es indetectable usando esta fracción.
Además observe que la combinación de signos utilizada para encontrar el efecto de
cualquier factor principal se repite en una interacción doble. Para encontrar los efectos
principales se usa:
A = ½ [a – b – c + abc]
B = ½ [-a + b – c + abc]
C = ½ [-a – b + c + abc]
Los cuales se repiten en el cálculo de las interacciones dobles:
BC = ½ [a – b – c + abc]
AC = ½ [-a + b – c + abc]
AB = ½ [-a – b + c + abc]
Estos resultados se aprecian en la Figura 6.9, donde se colocan con un recuadro del
mismo color las parejas de efectos que son iguales.
Por tanto, la combinación lineal de las observaciones en la columna A de la Figura 6.9
no solo estima el efecto principal de A sino la interacción BC. O mejor dicho, esta
combinación estima la suma de los efectos A+BC. De la misma forma, la columna
correspondiente a B no solo estima este efecto sino también la interacción AC o lo que
se mejor, estima la suma B+AC. En la Tabla 6.6 se resumen las consecuencias del
fraccionamiento a la mitad de un diseño 23 completo.
Combinación
Efecto
Explicación
½ [a – b – c + abc]
A+BC
A se confunde con BC o es alias de él
½ [-a + b – c + abc]
B+AC
B se confunde con AC o es alias de él
½ [-a – b + c + abc]
C+AB
C se confunde con AB o es alias de él
Tabla 6.6 Confusión en un diseño factorial 23 fraccionado a la mitad
La consecuencia adicional de este fraccionamiento es que la interacción triple, ABC no
se puede detectar. Es decir, con un diseño 23-1 no se puede evaluar la posible
interacción ABC. Sin embargo, las interacciones de orden superior, usualmente, son
despreciables en el mundo real.
En general, la fracción a realizar se escoge de tal suerte que los efectos principales y
las interacciones de orden inferior que son de interés formen alias sólo con
interacciones de orden superior (las que probablemente son despreciables).
La estructura de alias para este diseño puede encontrarse utilizando la relación de
definición I = ABC. La multiplicación de cualquier efecto por esta relación proporciona
los alias para tal efecto. En el ejemplo, el alias de A es A=A (ABC) = A2BC = BC. Note
que se ha eliminado A2 debido a que representa una columna de signos más que no
altera el producto final. Es decir A2 = I, e I es la columna identidad.
De la misma manera se pueden encontrar los alias de B y C.
Supóngase que en lugar de escoger la mitad superior de la Figura 6.9 para fraccionar
al diseño 23, se hubiera escogido la mita inferior. Es decir la combinación de
tratamientos en los que ABC tiene signo negativo. Estas cuatro corridas se muestran
en color amarillo en la Figura 6.9. La relación de definición para este diseño es I = ABC. Los alias son A =-BC, B = -AC, y C = -AB. Por tanto, las estimaciones de A, B y
C que se obtienen de esta fracción en realidad estiman A – BC, - B – AC y C – AB. En
la práctica, usualmente no es importante la fracción un medio que se escoja pues
ambas son lleva a resultados equivalentes. La fracción con el signo más en la relación
de definición se conoce como fracción principal, y la otra como fracción alternativa.
Nótese que si se hubiera seleccionado AB como el generador del diseño factorial
fraccionario (Buscando todos los más en la columna correspondiente de la Figura 6.9),
entonces A sería alias de B, lo cual conlleva a una pérdida de información muy
importante. Como regla general, se escoge la fracción en la que se confundan las
interacciones de orden superior. Más adelante, se explica un procedimiento práctico
para escoger la fracción más adecuada, en el caso general de los diseños 2k-1
Un comentario final de los diseños factoriales fraccionados a la mitad es que
combinando las estructuras de alias de ambas fracciones se pueden obtener los
efectos principales y de interacción. Por ejemplo, el efecto A se obtiene:
A=
( A + BC ) fracción + ( A − BC ) fracción
principal
alternativa
2
Y la interacción doble BC se obtiene como:
(6-33)
BC =
( A + BC ) fracción − ( A − BC ) fracción
principal
alternativa
(6-34)
2
Una alternativa equivalente hubiera sido analizar el experimento como si se hubiera
corrido completo desde el principio. Sin embargo, al correr la segunda fracción
posteriormente, se debe tener mucho cuidado en que las condiciones bajo las cuales
se realizan los experimentos sean las mismas de cuando se corrió la primera fracción.
Si no se pudieron mantener las mismas condiciones se debe utilizar un efecto de
bloque haciendo que el efecto de bloque se confunda con la interacción triple, ABC, y
los efectos principales y de interacciones dobles se calculen sin ninguna confusión
6.4.2 Resolución en un diseño fraccionado
Al correr un diseño factorial fraccionado los efectos no pueden estimarse de manera
individual, sino que se estiman sumas o restas de efectos que son alias entre sí. La
interpretación de estas sumas o restas se hace sencilla si se supone que todos los
términos, excepto uno, son despreciables. Por lo tanto el efecto de esta suma (o
resta), se puede atribuir a un único factor. Por esta razón siempre se busca un diseño
factorial fraccionado en el cual los efectos principales importantes sean alias de otros
efectos que no son muy importantes.
El supuesto lógico en este caso consiste en asumir que los efectos principales son
más importantes que las interacciones de dos factores, y estas a su vez son más
relevantes que los de tres factores, y así sucesivamente. Este concepto se maneja
buscando un diseño factorial fraccionado que tenga la máxima resolución posible.
Se dice que un diseño factorial fraccionado tiene resolución R si las interacciones de
P factores no son alias de interacciones que tengan menos de R – P factores. Cuan
más alta sea la resolución de un diseño factorial fraccionado mejor se pueden apreciar
los efectos potencialmente importantes. A continuación se dan las definiciones de los
diseños con resolución III, IV y V.
Diseños de Resolución III. En estos diseños los efectos principales no son alias entre
sí, pero si pueden ser alias con alguna interacción doble. El diseño 23-1 pertenece a
esta clase. Lo usual es utilizar un número romano como subíndice para indicar la
resolución 2 3III−1
Diseños de Resolución IV. Son diseños en los que ningún efecto principal tiene alias
con otro efecto principal o con interacciones entre dos factores, pero estas pueden
tener alias entre sí. El diseño 24-1 con relación de definición I = ABCD (o I = - ABCD) es
de resolución IV. Este diseño se denota como 2 4IV−1
Diseños de Resolución V. En estos diseños los efectos principales y las
interacciones dobles son alias con interacciones triples o de orden superior, es decir,
los efectos principales y las interacciones dobles se pueden determinar limpiamente.
Un ejemplo de un diseño con esta resolución es el diseño 25-1 ( 2V5−1 ) con relación de
definición I = ABCDE (o I = - ABCDE).
En general la resolución de un diseño factorial fraccionado esta dado por la longitud de
la “palabra” en la relación de definición con el menor número de letras posible. Por
esta razón los diseños factoriales fraccionados 23-1, 24-1 y 25-1 tienen resolución III, IV y
V respectivamente, porque sus correspondientes generadores se componen de 3, 4 y
5 letras.
6.4.3 Construcción de fracciones 2k-1
Una manera sencilla de construir diseños factoriales fraccionados 2k-1 con la más alta
resolución posible es la siguiente:
1. Se construye la tabla de signos para un diseño factorial completo con k-1 factores
y de esta forma se tienen las primeras k-1 columnas de la fracción deseada.
2. La columna faltante (la k-ésima) se construye multiplicando entre sí las columnas
anteriores. Si se desea la fracción complementaria o alternativa se cambian los
signos de esta última columna.
El diseño que resulta es un diseño factorial fraccionado, 2k-1 con la máxima resolución
posible, R = k.
Como ejemplo veamos la construcción de un diseño factorial fraccionado 24-1 con
resolución IV y con generador I = ABCD.
1. Se parte del diseño factorial completo 24-1 = 23 dado por:
A
B
C
-
-
-
+
-
-
-
+
-
+
+
-
D
-
-
+
+
-
+
-
+
+
+
+
+
2. La columna restante (la cual corresponde a D) se obtiene al multiplicar las
columnas A, B y C
A
B
C
D= ABC
-
-
-
-
+
-
-
+
-
+
-
+
+
+
-
-
-
-
+
+
+
-
+
-
-
+
+
-
+
+
+
+
Si se desea la fracción alternativa, con generador I = - ABC, se cambia el signo de la
última columna en el segundo paso.
6.4.4
Diseños factoriales fraccionados 2k-2
Un diseño factorial 2k-2 representa la cuarta parte del diseño factorial completo. Para
generar este diseño se necesitan dos efectos generadores, los cuales se toman de las
interacciones de orden superior y que al mismo tiempo su producto sea también una
interacción de orden superior.
Estos diseños tendrán tres generadores: los dos
primeros que se escogieron y el que resulta del producto entre ellos y ninguno de ellos
se puede estimar. La estructura de alias se obtiene a partir de los dos generadores
iniciales y su producto. Por lo tanto cada efecto tiene tres alias. En general, el número
de palabras de la relación definidora indica el número de alias que tendrá cada efecto,
y multiplicando un efecto cualquiera por esta relación se determinan sus alias.
Una forma sencilla de construir un diseño factorial 2k-2 es:
1. Se escribe el diseño 2k-2 como si fuera un diseño factorial completo con k-2
factores y de esta forma se obtienen los primeros k-2 factores.
2. Los niveles que corresponden a los factores de las dos últimas columnas (factores
k-1 y k) se obtienen multiplicando columnas previas de acuerdo a los generadores
escogidos.
Veamos este procedimiento de dos pasos para construir un diseño factorial 25-2:
1. Se parte del diseño factorial completo 23 para los tres factores A, B y C
A
B
C
-
-
-
+
-
-
-
+
-
+
+
-
-
-
+
+
-
+
-
+
+
+
+
+
D
E
2. Los niveles para los factores D y E se obtienen al seleccionar de manera
adecuada los generadores. Una opción es tomar I = ABD e I = ACE, y el tercer
generador es el producto ABD × ACE = A2 BCDE = BCDE. De esta manera se
puede obtener que D = AB y E = AC.
A
B
C
D
E
-
-
-
+
-
+
-
-
-
-
-
+
-
-
+
+
+
-
+
-
-
-
+
+
-
+
-
+
-
+
-
+
+
-
-
+
+
+
+
+
La estructura de alias completo se puede obtener como se explico anteriormente. Por
ejemplo, los alias de A se obtienen multiplicando este por los tres generadores así:
A = A × (Primer generador) = A × ABD = BD
A = A × (Segundo generador) = A × ACE = CE
A = A × (Tercer generador) = A × BCDE = ABCDE
El resto de alias para los demás factores se muestra en la siguiente tabla:
A+BD+CE+ABCDE
B+AD+ABCE+CDE
C+ABCD+AE+BDE
D+AB+ACDE+BCE
E+ABDE+AC+BCD
BC+ACD+ABE+DE
BE+ADE+ABC+CD
µ+ABD+ACE+BCDE
Tabla 6.7 Estructura de alias completa para un diseño
2 5III−2
Se observa en la Tabla 6.7 que cada efecto principal tiene al menos una interacción
doble como alias que es lo que conduce a un diseño de resolución III.
De la Tabla 6.7 se puede asumir que las interacciones de orden superior son
despreciables y por lo tanto eliminarlas del modelo para obtener una estructura de
alias reducida (ver Tabla 6.8)
A + BD + CE
B + AD
C + AE
D + AB
E + AC
BC + DE
BE + CD
Tabla 6.8 Estructura de alias reducida para un diseño
2 5III−2
Cuando se alían efectos con la misma jerarquía, como en el caso de BD + CE, debe
decidirse con base en el conocimiento del proceso, a que interacción se atribuye el
efecto observado en el caso que resulte significativo. Otra manera es fijarse en qué
efectos principales resultan significativos ya que estos tienen más probabilidad de
estar activos en sus interacciones.
6.4.5 Ejercicios propuestos.
1. A continuación se muestran los resultados de un diseño factorial. Conteste los
siguientes incisos sin utilizar un software computacional, haga las operaciones que
se le piden de manera manual.
Réplica
A
B
I
II
III
Total
-
-
82
80
84
(1) = 246
+
-
78
82
79
(a) = 239
-
+
71
70
66
(b) = 207
+
+
89
88
93
(ab) = 270
a. ¿Qué nombre recibe este diseño y por qué?
b. ¿Cuántos tratamientos tiene este diseño, cuántas réplicas?
c. En total son 12 corridas experimentales las que se realizaron, señale en
qué orden debieron correrse y explique por qué.
d. Señale los efectos que se pueden estudiar a través de este diseño.
e. Obtenga los contrastes para los efectos principales de A y B, y para la
interacción.
f.
Calcule los efectos principales y el efecto de interacción.
g. Haga las gráficas de los efectos principales de A y B, e interprételas.
h. Realice la gráfica de la interacción entre los factores de A y B, e interprétela
con detalle.
i.
¿Desde su punto de vista el factor B parece tener influencias sobre Y?
Argumente.
2. Suponga un diseño factorial 23, y conteste las siguientes preguntas.Utilizando la
notación de (-, +) para los niveles de los factores, escriba todos los tratamientos
que forman este diseño.
a. Represente en forma geométrica este diseño y resalte la región de
experimentación.
b. ¿Cuáles son todos los posibles efectos que se pueden estu diar con este
diseño?
c. Para cada uno de los efectos anteriores, obtenga su contraste.
d. Señale en forma específica cómo utilizaría los contrastes para calcular los
efectos y la suma de los cuadrados.
e. ¿Cómo aplicaría los tres principios básicos del diseño de experimentos en
este caso para cada uno de los efectos anteriores?
3. A continuación se muestran los resultados obtenidos en un diseño factorial 23 no
replicado. Conteste los siguientes incisos sin utilizar un software computacional, es
decir, haga las operaciones que se le piden de forma manual.
¿Código?
A
B
C
Y
-
+
-
25
+
+
+
12
-
-
-
30
+
-
+
10
-
-
+
10
+
+
-
14
-
+
+
31
+
-
-
17
a. En la primera columna de la matriz del diseño especifique el código de cada
uno de los tratamientos, de acuerdo a la notación de Yates.
b. Calcule los efectos principales de A y B.
c. Haga la gráfica de los efectos principales de A y B, e interprételas.
d. Calcule el efecto de la interacción AB.
e. Realice la gráfica de la interacción entre los factores A y B; e interprétela
con detalle.
f.
¿Qué tendría que hacer para saber si los efectos que cálculo en los incisos
anteriores, afectan de manera significativa a la variable de respuesta?
g. Calcule la suma de cuadrados para el efecto principal de A y para la
interacción.
4. Suponga un diseño factorial 24, y conteste las siguientes preguntas.
a. Anote la matriz de diseño, es decir, haga una lista de todos los tratamientos
que forman este diseño.
b. ¿Por qué este diseño recibe tal nombre?
c. ¿Cuáles son todos los posibles efectos que se pueden estudiar con este
diseño?
d. ¿Refiriéndose al análisis, en qué consiste y cuál es el objetivo de obtener el
mejor ANOVA?
e. ¿Cómo se calculan los coeficientes de determinación R2 y R2AjS?
f.
Si después de obtener el mejor ANOVA, se obtiene que estos R2aj
coeficientes tienen un valor de alrededor 90, ¿qué significa esto?
g. Si por el contrario, tales coeficientes tienen un valor de alrededor 20, ¿qué
significa esto?
h. Obtenga el contraste para el efecto principal de D y para el efecto de
interacción CD.
i.
Señale en forma específica cómo utilizaría los contrastes para calcular los
efectos y la suma de los cuadrados.
j.
¿Puede darse el caso de que el efecto principal de A no sea significativo, y
el efecto de la interacción AB si lo sea?
5. En una empresa lechera se ha tenido problemas con la viscosidad de cierta bebida
de chocolate. Se cree que tres ingredientes que se agregan en pequeñas
cantidades son con los que se puede resolver este problema, por lo que es
necesario explorar la situación; para ello se corre un experimento 23 con dos
réplicas. En seguida se aprecian los resultados obtenidos.
Ingrediente A
Ingrediente B
Ingrediente C
Viscosidad
-1
-1
-1
13.3, 13.7
+1
-1
-1
14.7, 14.4
-1
+1
-1
14.6, 14.5
+1
+1
-1
14.3, 14.1
-1
-1
+1
16.9, 17.2
+1
-1
+1
15.5, 15.4
-1
+1
+1
17.0, 17.1
+1
+1
+1
18.9, 19.0
a. Estime todos los posibles efectos y diga cuáles son significativos.
b. Realice un análisis de varianza de estos datos y obtenga conclusiones
generales.
c. ¿Hay un tratamiento ganador para minimizar?
d. Verifique residuos, ¿qué observa de destacado?
6. Se quiere aumentar el rendimiento de un proceso, y para ello se estudian tres
factores con dos niveles cada uno. Se hacen tres repeticiones en cada tratamiento
del diseño factorial 23 resultante. La variable de respuesta que se mide es
rendimiento. Los datos son los siguientes:
Repetición
Tratamiento
1
2
3
(1)
22
31
25
a
32
43
29
b
35
34
50
ab
55
47
46
c
44
45
38
ac
40
37
36
bc
60
50
54
abc
39
41
47
a. ¿Cuáles efectos están activos?
b. Si obtuvo una interacción importante, interprétela con detalle.
c. Determine las condiciones de operación que maximizan el rendimiento.
d. ¿Cuál es la respuesta esperada en el mejor tratamiento?
e. Verifique los supuestos del modelo.
7. Se hace un experimento para mejorar el rendimiento de un proceso, controlando
cuatro factores en dos niveles cada uno. Se corre una réplica de un diseño factorial
24, con los factores tiempo (A), concentración (B), presión (C) y temperatura (D), y
los resultados son los siguientes:
A0
A1
B0
B1
B0
B1
C0
C1
C0
C1
C0
C1
C0
C1
D0
12
17
13
20
18
15
16
15
D1
10
19
13
17
25
21
24
23
a. Analice estos datos con el uso de todos los criterios existentes para
encontrar el mejor ANOVA. En las figuras considere de entrada los 15
efectos posibles.
b. ¿Cuáles efectos están activos?
c. Determine el mejor tratamiento.
d. Prediga el rendimiento esperado en el mejor tratamiento y dé un intervalo
de confianza para el rendimiento futuro.
e. Compruebe los supuestos del modelo.
f.
¿Puede este diseño colapsarse en uno 23 con dos réplicas? De ser posible,
hágalo y repita los incisos anteriores para este nuevo diseño.
8. En una empresa panificadora existen problemas con la simetría y el color del pan
integral. Los responsables del proceso sospechan que el problema se origina
desde la fase de fermentación. En ésta se combina agua, harina, cierta cantidad
de levadura más una serie de ingredientes como fosfato, sal, etc. Al final de la
fermentación se obtiene lo que se llama “esponja líquida” la cual debe cumplir una
serie de parámetros de calidad: una acidez total titulable (ATT) mayor a 6.0 y un
pH mayor a 4.8. Sin embargo, no se ha cumplido con dichas exigencias de calidad;
se han hecho algunos intentos experimentales con un factor a la vez, pero los
resultados han sido malos. En busca de una mejor estrategia experimental, se
decide utilizar un diseño factorial fraccionado 26-2 para investigar el efecto de seis
factores en las variables ATT y pH. Los primeros cinco factores se refieren a cierta
cantidad que se agrega en la fermentación: A: levadura (17,19), B: sal (2.5, 3.7), C:
fosfato (2.0, 3.6), D: sulfato (1.5, 2.2), E: cloruro (0.89, 1.20); el sexto factor es F:
temperatura inicial del agua (22, 26). Los datos obtenidos se muestran en la tabla
siguiente.
Orden de
Variables de
Matriz de diseño
corrida
9
respuesta
A
B
C
D
E
F
ATT
pH
-
-
-
-
-
-
6.2
4.86
5
+
-
-
-
+
-
5.6
4.86
6
-
+
-
-
+
+
5.8
4.85
1
+
+
-
-
-
+
5.8
4.99
14
-
-
+
-
+
+
5.7
4.94
10
+
-
+
-
-
+
6.4
4.74
13
-
+
+
-
-
-
6.4
4.83
12
+
+
+
-
+
-
6.6
4.85
11
-
-
-
+
-
+
5.3
4.81
3
+
-
-
+
+
+
6.6
4.81
15
-
+
-
+
-
+
5.2
4.98
16
+
+
-
+
-
-
5.5
4.98
8
-
-
+
+
+
-
6.9
4.84
4
+
-
+
+
-
-
7.1
4.85
2
-
+
+
+
-
+
6.7
4.96
7
+
+
+
+
+
+
6.9
4.84
a. Observe los datos con cuidado, sobre todo los correspondientes al pH,
¿qué observa de destacado? ¿A qué puede deberse eso?
b. ¿Cuál es la resolución de este diseño y qué significa ésta? Escriba la
estructura alias reducida. ¿Cómo se pueden interpretar efectos de
interacción que son alias?
c. ¿Cuáles efectos explican el comportamiento de cada una de las
respuestas? Encuentre el mejor ANOVA para cada respuesta e interprete
utilizando α = 0.05.
d. Determine las condiciones de operación que maximizan a ambas
respuestas simultáneamente. ¿Es posible dar una solución simultánea al
problema con los análisis individuales? Argumente.
e. Verifique los supuestos para cada variable de respuesta.
9. Se piensa que cuatro factores tienen influencia sobre el sabor de un refresco: tipo
de endulzante (A), proporción jarabe/agua (B), nivel de carbonatación (C) y
temperatura (D). Cada factor puede correrse en dos niveles, lo que produce un
diseño 24. En cada corrida del diseño, se dan muestras de la bebida a un grupo
de prueba formado por 20 personas. Cada una de ellas asigna un puntaje a la
bebida, que va de 1 a 10. El puntaje total es la variable de respuesta, y el objetivo
es encontrar una fórmula que maximice el puntaje total. Se corren dos réplicas de
este diseño, y los resultados se muestran a continuación. Analice los datos y
obtenga conclusiones. Utilice α = 0.05 y las prueba estadísticas.
Combinación
de
Réplica
Réplica
Combinación de
I
II
tratamientos
I
II
(1)
159
163
d
164
159
a
168
175
ad
187
189
b
158
163
bd
163
159
ab
166
168
abd
185
191
c
175
178
cd
168
174
ac
179
183
acd
197
199
bc
173
168
bcd
170
174
abc
179
182
abca
194
198
tratamientos
10. En un estudio del rendimiento en el desarrollo de un proceso, se analizan cuatro
factores, cada uno con dos niveles: tiempo (A), concentración (B), presión (C), y
temperatura (D). Se corre sólo una replica del diseño 24, y los datos resultantes
son los que aparecen en la tabla siguiente:
Orden real
Número
de corrida
de la
A B C D
Rendimiento
corrida
Niveles de los factores
(lbs)
Bajo (-)
Alto
(+)
1
5
-
-
-
-
12
A (h)
2.5
3
2
9
+
-
-
-
18
B (%)
14
18
3
8
-
+
-
-
13
C (psi) 60
80
4
13
+
+
-
-
16
D (ºC)
250
5
3
-
-
+
-
17
6
7
+
-
+
-
15
7
14
-
+
+
-
20
8
1
+
+
+
-
15
9
6
-
-
-
+
10
10
11
+
-
-
+
25
11
2
-
+
-
+
13
12
15
+
+
-
+
24
13
4
-
-
+
+
19
14
16
+
-
+
+
21
15
10
-
+
+
+
17
16
12
+
+
+
+
23
225
a. Haga una gráfica de las estimaciones de los efectos sobre una escala
de probabilidad normal. ¿Qué factores son los que aparentemente
tienen los efectos más grandes?
b. Realice un análisis de varianza utilizando la gráfica de probabilidad
normal del inciso a) como guía para formar el término del error. ¿Cuáles
son sus conclusiones?
c. Analice los residuos de este experimento. ¿El análisis de éstos indica
algún problema en potencia?
d. ¿Puede reducirse este diseño en un diseño 23 con dos réplicas? Si es
así, esboce el diseño con el promedio y el rango del rendimiento den
cada punto de un cubo. Interprete los resultados.
11. Considere el experimento descrito en el ejercicio anterior. Encuentre intervalos de
confianza del 95% sobre los efectos de los factores que parezcan importantes.
Utilice la gráfica de probabilidad normal como guía con respecto a los efectos que
pueden combinarse para proporcionar una estimación del error.
Descargar