Problema del examen final de enero de 2010: Se desea comparar la cantidad de nitrógeno (en kgT por año) que se vierte en las aguas costeras del Reino Unido a través de descargas de agua dulce (por ejemplo, de ríos) y a través de puntos de desagüe directos (como tuberías). Se observan las siguientes cantidades de nitrógeno: Región Mar del Mar del Norte Atlántica Norte Celta Irlandesa (Costa Este) (Canal) Ríos 28 93 17 30 42 Ruta Directo 10 77 12 11 6 a) Especifica qué modelo utilizarías para analizar estos datos. Estima sus parámetros. b) ¿Existen diferencias entre las regiones? ¿Influye la ruta sobre la cantidad de nitrógeno? Utiliza nivel de significación α=0,05. c) Compara la cantidad vertida de nitrógeno por parejas de regiones con un nivel conjunto de confianza del 95%. ¿Qué conclusiones extraes? ¿Es coherente con lo obtenido en (b)? Observación: Quizá necesites alguno de los siguientes cuantiles: t 4;0.0025 = 5,60 , t10;0.0025 = 3,58 , t 5;0.0025 = 4,77 . Solución: a) Modelo: j= μ Yij =Cantidad de nitrógeno vertida a través de ruta tipo i en la región + α i + β j + U ij , donde i=1,2=I, j=1,…,5=J, U ij ~ 2 5 i =1 j =1 ∑α i = 0 = ∑ β j N(0, σ ) independientes y 2 . Se trata de un modelo de análisis de la varianza con dos factores sin interacción. El primer factor es la ruta y αi μ representa su efecto incremental respecto a la cantidad media nitrógeno vertida globalmente. El segundo factor es la región. El tamaño muestral es n = I ⋅ J Estimación de los parámetros: = 10 . μˆ = y •• = 32,6 αˆ 1 = y1• − y •• = 42 − 32,6 = 9,4 = −αˆ 2 βˆ1 = y •1 − y •• = 19 − 32,6 = −13,6 βˆ 2 = y •2 − y•• = 85 − 32,6 = 52,4 βˆ3 = y •3 − y •• = 14,5 − 32,6 = −18,1 βˆ 4 = y •4 − y•• = 20,5 − 32,6 = −12,1 βˆ5 = y •5 − y •• = 24 − 32,6 = −8,6 Residuos: eij = y ij − ( μˆ + αˆ i + βˆ j ) Atlántica Ríos Directo Ruta 2 5 VNE = ∑∑ e 2 ij = 247,4 i =1 j =1 -0,4 0,4 Región Mar del Norte (Canal) -6,9 6,9 Mar del Norte (Costa Este) -1,4 1,4 → Varianza residual Celta Irlandesa 0,1 -0,1 8,6 -8,6 s R = VNE / 4 = 61,85 2 = estimación de σ2 de b) Tabla ANOVA: Fuente SC gl CM F I-1=1 883,6 F (1) = 14,28 J-1=4 1739,35 F ( 2 ) = 28,12 (I-1)(J-1)=4 IJ-1=9 61,85 2 VE(α) = Ruta 5∑ αˆ i2 = 883,6 i =1 5 Región VE(β) = 2∑ βˆ j2 = 6957,4 j =1 Residual Total VNE = 247,4 VT = 8088,4 Contrastes: Como F (1) = 14,28 > F1; 4;0.05 = 7,71 , rechazamos “ H 0(1) : α 1 = α 2 = 0 (la ruta no influye sobre la cantidad de nitrógeno vertida)” al nivel de significación α=0,05. Como F ( 2) = 28,12 > F4; 4;0.05 = 6,39 , rechazamos “ H 0( 2) : β 1 = K β 5 = 0 (no existen diferencias entre las regiones)” al nivel de significación α=0,05. ⎛J⎞ ⎛ 5⎞ c) El número de comparaciones entre regiones que queremos hacer es c = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ = 10 . Por 2 2 ⎝ ⎠ tanto, el nivel individual de confianza con el que calcularemos los intervalos de αT ⎝ ⎠ β j − βl es 1-α, siendo 0,05 = 0,005 . c 10 En general, para todo j , l = 1, K ,5 , tenemos que α= = ⎛ 2⎞ ⎟ = ( y • j − y •l m 44,04 ) IC 0.995 ( β j − β l ) = ⎜⎜ y • j − y •l m t ( I −1)( J −1);α / 2 ⋅ s R ⋅ ⎟ I ⎝ ⎠ Por tanto, IC 0.995 ( β 1 − β 2 ) = (-110,04 , -21,96) IC 0.995 ( β 1 − β 3 ) = (-39,54 , 48,54) ⇒ β1 = β 3 IC 0.995 ( β 1 − β 4 ) = (-45,54 , 42,54) ⇒ β1 = β 4 IC 0.995 ( β 1 − β 5 ) = (-49,04 , 39,04) ⇒ β1 = β 5 IC 0.995 ( β 2 − β 3 ) = (26,46 , 114,54) ⇒ β 2 > β3 IC 0.995 ( β 2 − β 4 ) = (20,46 , 108,54) ⇒ β2 > β4 IC 0.995 ( β 2 − β 5 ) = (16,96 , 105,04) ⇒ β 2 > β5 IC 0.995 ( β 3 − β 4 ) = (-50,04 , 38,04) ⇒ β3 = β4 IC 0.995 ( β 3 − β 5 ) = (-53,54 , 34,54) ⇒ β3 = β5 IC 0.995 ( β 4 − β 5 ) = (-47,54 , 40,54) ⇒ β4 = β5 Resumiendo, obtenemos que ⇒ β1 < β 2 β1 = β 3 = β 4 = β 5 < β 2 , es decir, la cantidad de nitrógeno que se vierte en el Mar del Norte (Costa Este) es mayor que en las restantes regiones. Y en las regiones atlántica, Mar del Norte (Canal), celta e irlandesa se pueden considerar iguales. Esto es coherente con haber rechazado H 0( 2) : β 1 = K β 5 = 0 en (b).