Una gran empresa desea saber si el absentismo laboral está relacionado con el tamaño del departamento y la antigüedad. Para el estudio se dispone de una muestra aleatoria de 60 empleados, de la que se conoce el número de dı́as que no acudieron al puesto de trabajo en los últimos tres años. El tamaño del departamento se clasifica en pequeño, mediano y grande, y la antigüedad en más de 5 años y menos de 5 años. Los datos son: TAMAÑO ANTIGÜEDAD Pequeño 0 2 Más de 2 0 5 años 1 5 3 6 0 8 Media ȳ11· =2.7 (αβ)11 =-1.6 0 2 Menos de 1 7 5 años 1 4 0 0 4 3 Media ȳ21· =2.2 (αβ)21 =1.6 ȳ·j· ȳ·1· = 2.5 β̂j β̂1 = −3.9 DEL DEPARTAMENTO Mediano Grande ȳi·· α̂i 2 4 15 16 ȳ1·· = 8.2 α̂1 = 1.9 4 3 10 7 7 1 8 30 12 5 5 3 15 20 25 27 ȳ12· =7.3 ȳ13· =14.6 (αβ)12 =-0.1 (αβ)13 =1.7 5 1 10 15 ȳ2·· = 4.5 α̂2 = −1.9 3 3 8 4 2 6 12 9 0 7 3 6 1 9 7 1 ȳ22· =3.7 ȳ23· =7.5 (αβ)22 =0.1 (αβ)23 =-1.7 ȳ·2· = 5.5 ȳ·3· = 11.1 ȳ··· = 6.3 β̂2 = −0.8 β̂1 = 4.7 a) Plantear el modelo adecuado para analizar estos datos y estimar los parámetros. b) Obtener la tabla de análisis de la varianza. c) Para un nivel de significación del 5%, ¿los contrastes F para el efecto de la antigüedad y el tamaño del departamento indican que hay que rechazar las hipótesis nulas correspondientes? ¿Qué podemos decir sobre la interacción? d) Calcular un intervalo de confianza al 95% para la diferencia entre los efectos de los grupos más de 5 años y menos de 5 años de antigüedad. Solución: a) Yijk = Número de dı́as que el k-ésimo empleado del departamento con antigüedad i y tamaño j no acudió al trabajo en los 3 últimos años = µ + αi + βj + (αβ)ij + Uijk , donde Uijk P ∼ N (0, σ 2 ) son P P2 independientes, P3 i = 1, 2 = I, j = 1, 2, 3 = J, k = 1, . . . , 10 = K, 2 3 α = β = 0, (αβ) = ij i=1 i j=1 j i=1 j=1 (αβ)ij = 0 para todo i, j. b) VE(α) = JK VE(β) = IK I X i=1 J X α̂i2 = 3 · 10 · (1.92 + (−1.9)2 ) = 209.1 β̂j2 = 2 · 10 · ((−3.9)2 + (−0.8)2 + 4.72 ) = 760.4 j=1 VE(αβ) = K I X J X i=1 j=1 2 [ = 10 · ((−1.6)2 + (−0.1)2 + 1.72 + 1.62 + 0.12 + (−1.7)2 ) = 109.0 (αβ) ij TAMAÑO DEL DEPARTAMENTO Residuos eijk ANTIGÜEDAD Pequeño Mediano Grande -2.7 -0.7 -5.3 -3.3 0.4 1.4 Más de -0.7 -2.7 -3.3 -4.3 -4.6 -7.6 5 años -1.7 2.3 -0.3 -6.3 -6.6 15.4 0.3 3.3 4.7 -2.3 -9.6 -11.6 -2.7 5.3 7.7 12.7 10.4 12.4 -2.2 -0.2 1.3 -2.7 2.5 7.5 Menos de -1.2 4.8 -0.7 -0.7 0.5 -3.5 5 años -1.2 1.8 -1.7 2.3 4.5 1.5 -2.2 -2.2 -3.7 3.3 -4.5 -1.5 1.8 0.8 -2.7 5.3 -0.5 -6.5 Tabla ANOVA de 2 factores con interacción: FV Antigüedad Tamaño depto. Interacción Residual Total SC gl CM F 209.1 1 209.1 F (1) = 7.2 F1,54,0.05 = 4.02 760.4 2 380.2 F (2) = 13.1 F2,54,0.05 = 3.16 109.0 2 54.5 F (3) = 1.9 F2,54,0.05 = 3.16 1564.8 54 29.0 2643.3 59 (1) (2) Al nivel de significación α = 0.05 rechazo H0 : α1 = α2 = 0 y H0 : β1 = β2 = β3 = 0, pero no (3) puedo rechazar H0 : (αβ)ij = 0 para todo i = 1, 2, j = 1, 2, 3. Aún ası́ no es conveniente hacer desaparecer los términos de interacción (αβ)ij del modelo, pues el estadı́stico F (3) no está muy próximo a 1. c) r IC0.95 (α1 − α2 ) = = ! 2 JK r ! √ 2 8.2 − 4.5 ∓ 2.01 29.0 30 ȳ1·· − ȳ1·· ∓ t54,0.025 sR = (3.7 ∓ 2.8) = (0.9, 6.5) Por tanto, el absentismo laboral es más acusado en los departamentos de más de 5 años de antigüedad que en los de reciente creación.