20-21 NHD Problemas traballo ANOVA (tema 5)

1 BIOESTATÍSTICA 2020-2021 Grao en Nutrición Humana e Dietética. Facultade de Ciencias. Lugo ================================================================================== Boletín de problemas de ANOVA PARA O TRABALLO Tema 5 ================================================================================== A.1 Se desea comparar el porcentaje de carbonato de calcio (CaCO3) en tres localizaciones L1, L2 y L3. Un examen de seis muestras en cada lugar (llevado a cabo en las mismas condiciones y de forma independiente para cada muestra) dio los siguientes resultados, para los que se acompaña un análisis estadístico preliminar. DATOS Y MEDIDAS DE RESUMEN L1 19,2 18,7 21,3 16,5 17,3 22,4 L2 12,5 14,3 8,7 11,4 9,5 16,5 L3 19,9 24,3 17,6 20,2 18,4 19,1 L1 L2 L3 media 19,23 12,15 19,92 desviación típica 2,2713 2,9379 2,3507 Davis JC (2002) Statistics and data analysis in Geology. Wiley TABLA ANOVA Variabilidad Entre localizaciones Residual Total Suma de Grados de cuadrados libertad Cuadrado medio 110,9617 Valor de F 96,5767 COMPARACIÓN POR PARES comparación L1 con L2 diferencia de medias µ1 − µ 2 límite inferior límite superior L1 con L3 µ1 − µ3 L2 con L3 µ 2 − µ3 -3,8059 2,4392 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar si se puede considerar que el contenido medio de carbonato de calcio es el mismo en los tres lugares, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test para un nivel de significación del 5%. c) Obtener los intervalos de confianza del 95% para las diferencias de medias µi − µ j (basados en el método de la mínima diferencia significativa) pendientes de calcular en la tabla de “comparación por pares”. En base a dichos intervalos decidir, si es posible, cuáles son los lugares de mayor y de menor contenido medio de carbonato de calcio. A.2. Se realizó un estudio para comparar los porcentajes de carbohidratos en 4 marcas de pan. Se realizaron 18 determinaciones: 5 en la primera marca (M1), 3 en la segunda (M2), 4 en la tercera (M3) y 6 en la cuarta (M4). A continuación se presentan los resultados obtenidos, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN Porcentaje M1 65 68 71 70 69 M2 60 65 61 M3 59 66 58 59 M4 70 69 62 71 70 66 Fuente: Infante Gil, S y Zárate de Lara, G. (2012). Métodos estadísticos, un enfoque interdisciplinario. Mundi-Prensa Q1 Q3 68,0 70,0 60,5 63,0 58,5 62,5 66,0 70,0 Marca M1 M2 M3 M4 media 68,6 62 60,5 68 desviación típica 2,3022 2,6458 3,6968 3,4059 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 2 TABLA ANOVA Variabilidad Entre marcas Residual Total Suma de cuadrados Grados de libertad Cuadrado medio 74,10 9,5857 Valor de F COMPARACIÓN POR PARES Intervalos de confianza del 95% Comparación 1 con 3 2 con 3 límite inferior 3,65 -3,57 límite superior 12,55 6,57 3 con 4 a) Para la marca M4, obtener e interpretar la medida de tendencia central y la medida de dispersión representadas en el gráfico de cajas. En base al gráfico de cajas, ¿qué tipo de asimetría se aprecia? b) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? c) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el porcentaje de carbohidratos es el mismo en cualquiera de las cuatro marcas, indicando: c.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. c.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. c.3) Cuál es el resultado del test. d) Obtener el intervalo de confianza del 95% para la diferencia de medias µ3 − µ4 basado en el método de la mínima diferencia significativa, indicando: d.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. d.2) Cuál es la expresión matemática del intervalo de confianza. d.3) Cuál es el intervalo de confianza obtenido. d.4) Interpretar los tres intervalos de confianza de la tabla de “comparación por pares”. En base a ellos, ¿se puede considerar que la marca M3 es la que tiene un menor porcentaje de carbohidratos? A.3. Se llevó a cabo un experimento en el que se determinó el valor nutritivo de un total de 20 piezas de cierto fruto comestible. Se consideraron piezas de 4 variedades diferentes del fruto para comparar sus valores nutritivos medios. Los resultados y la tabla ANOVA son los que siguen a continuación. V V1 V2 V3 V4 valor nutritivo 109 124 108 110 110 121 109 108 110 118 111 114 media 112 120 109 112 114 119 119 117 total 111,0 120,4 111,2 112,2 113,7 Fuente de variación Variedad Error exp. Total Suma de cuadrados 303,4 Grados de libertad Cuadrado medio Valor de F 470,2 a) Escribir las hipóteses nula y alternativa del problema e indicar qué supuestos sobre las muestras se asumen en el análisis estatístico asociado a la tabla ANOVA. b) Completar la tabla y examinar si se puede considerar que el valor nutritivo de las cuatro variedades es la misma. c) En el caso de que en el apartado anterior se observen diferencias significativas, calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias del valor nutritivo entre cada par de variedades, µi − µ j . En base a la información de estos intervalos, ¿existe alguna variedad que podamos afirmar que tiene un valor nutritivo superior a las demás?. ¿Por qué? A.4. En un estudio sobre polución realizado con algas, se seleccionaron aleatoriamente cinco ejemplares de cada una de las cuatro especies objetivo del estudio. En el laboratorio se determinó el nivel de cadmio presente, en μg por g. de peso seco. Los resultados y la tabla ANOVA son los que siguen a continuación. Especie: Cadmio μg/g peso seco Media desv. Típica Pelvetia Fucus vesiculous 2,04 2,01 2,17 2,07 1,97 1,95 2,25 2,14 2,06 2,11 2,006 2,148 0,04615 0,06797 Ascophyllum Laminaria 1,93 2,05 1,94 1,85 2,08 2,13 2,02 1,97 2,03 1,93 2,044 1,942 0,07403 0,06221 Muestra media 2,035 total desv. típica 0,09627 Fuente: Gardiner, W. P. y Gettinby, G. (1998). Experimental Design Techniques in Statistical Practice. Horwood Publishing __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 3 Fuente de Variación Especie Error experimental Total Suma de Grados de Cuadrado cuadrados libertad medio 0,1117 0,0644 Valor de F a) Completar la tabla e indicar: a.1) cuál es el modelo de análisis de la varianza asociado a la muestra, identificando cada uno de sus términos; a.2) qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla ANOVA. b) ¿Se puede considerar que no existen diferencias significativas entre los contenidos medios de cadmio de las cuatro especies? b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente?. b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. b.3) ¿Cuál es el resultado del test? c) Contrastar, utilizando el método de la mínima diferencia significativa, con un nivel de significación del 5%, si se puede asumir que el contenido medio de cadmio es el mismo en las especies Fucus vesiculosus y Ascophyllum. d) Calcular: d.1) los residuos correspondientes a la especie Laminaria, d.2) la estimación insesgada de la varianza del error experimental. ¿Cuál es su expresión en términos de los residuos? A.5. En una plantación de árboles frutales hay tres variedades de melocotoneros, A, B y C. Se quiere determinar si las variedades de frutal son diferentes respecto al diámetro del tronco medido a 75 cm. del suelo. Los siguientes datos son las determinaciones de dicho diámetro en once árboles de cada variedad seleccionados al azar. media Variedad A Variedad B Variedad C 29,69 29,39 29,10 28,22 27,94 27,65 28,81 27,93 28,52 28,22 27,36 30,90 29,98 29,66 28,78 29,67 29,38 28,80 29,37 29,08 29,96 29,97 29,39 27,38 29,10 27,37 27,95 29,1 28,5 27,65 28,81 27,10 26,55 total varianza 28,4391 29,5955 0,5441 0,3793 28,7055 1,0003 Fuente: Ruiz Macías, P. (2000). Métodos estadísticos para investigación agraria y biológica. Junta de Extremadura En el análisis de la varianza se obtuvieron los siguientes resultados: Variabilidad Entre variedades Residual Total Suma de Grados de Cuadrado cuadrados libertad medio 6,8858 18,2379 Valor de F Puntos críticos 5% 10% 3,3158 2,4887 a) Calcular las medidas de resumen (media y varianza muestrales) de la variedad C indicando su expresión. b) Completar la tabla ANOVA e indicar: b.1) Cuál es el modelo de análisis de la varianza asociado a la muestra, identificando cada uno de sus términos. b.2) Qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla ANOVA. b.3) Cuál es la estimación insesgada de cada uno de los parámetros del modelo ANOVA y calcular sus valores. c) ¿Se puede considerar que no existen diferencias significativas entre el diámetro (a 75 cm. del suelo) de las tres variedades de melocotonero? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 4 c.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? c.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. ¿Cuál es el resultado del test? d) Obtener para cada par de variedades, un intervalo de confianza del 95% para la diferencia en término medio de sus diámetros, µi − µ j . A partir de dichos intervalos: d.1) deducir qué diferencias son significativas en base al método de la mínima diferencia significativa; d.2) examinar cuáles son las variedades con el menor diámetro y con el mayor diámetro. A.6.- Los datos que aparecen en la tabla siguiente provienen de un experimento realizado en la estación experimental de Rothamsted. El objetivo era medir la eficacia de tres insecticidas, el clorodinitrobenceno (CN), el carbón disulfido (CD) y un preparado propio denominado cymag (CM). Cada insecticida se aplicó a dosis normal (1) y doble (2). Por último se contó con un grupo control al que no se aplicó ningún insecticida. Los pesticidas se aplicaron antes de la siembra del trigo, y los datos recogidos muestran el incremento del número de gusanos encontrados en cada parcela después de la recolección del trigo. Insecticida Control 466 421 561 433 Incremento en el número de gusanos 1CN 1CD 1CM 2CN 222 194 306 92 219 221 176 114 332 308 215 80 298 256 199 128 2CD 166 172 111 80 2CM 28 179 165 82 a) Completar la tabla siguiente resultado de efectuar un análisis de la varianza para comparar la eficacia de los insecticidas: Fuente de variación Tratamientos Residual Total Grados de libertad Suma de cuadrados Cuadrados medios 65407.79 F 453567.71 b) Para un nivel de significación α=0.05, ¿cuál sería la conclusión en cuanto a la eficacia media de los insecticidas? c) Efectuar comparaciones entre las medias de los insecticidas a dosis normal con el mismo insecticida en dosis doble. ¿Qué conclusiones se obtienen? A.7.- Un químico del departamento de desarrollo de un laboratorio farmacéutico desea conocer cómo influye el tipo de aglutinante utilizado en tabletas de ampicilina de 500 mg. en el porcentaje de friabilidad; para lo cual eligió tres tipos de aglutinantes realizando cinco pruebas con cada uno de ellos. A continuación se muestra una parte de la tabla del análisis de la varianza obtenida en el experimento: Fuente de la Suma de Grados de Cuadrados F Variación cuadrados libertad medios Tratamientos Residual 0,398 Total 0,873 a) Completar la tabla del ANOVA. b) Considerando un nivel de significación α = 0.05 ¿Se podría aceptar que el aglutinante no afecta al porcentaje de friabilidad? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 5 c) En el experimento se obtuvieron las siguientes medias por aglutinante: y1. = 0.235 , y2. = 0.638 , y3. = 0.293 . En caso de que se hayan detectado diferencias significativas entre las medias de los tres aglutinantes, realizar los cálculos necesarios para comparar los distintos aglutinantes y averiguar porqué se ha producido el rechazo de la igualdad de medias. A.8. Se realizó un estudio de control de calidad en los cuatro hospitales de una zona metropolitana. Se pidió a las enfermeras del departamento de urgencias que evaluasen en una escala de 0 a 20 la calidad de la atención que se da en sus instalaciones con respecto a una cuestión determinada. A continuación se presentan los resultados obtenidos, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. Únicamente el hospital H3 es del Servicio Público de Salud. DATOS Y MEDIDAS DE RESUMEN Valoraciones H1 10 12 16 9 H2 18 15 14 17 13 H3 14 16 16 15 17 H4 9 8 10 11 6 Hospital H1 H2 H3 H4 18 Fuente: Blair, R.C. & Taylor, R.A. (2008) Bioestadística. Pearson TABLA ANOVA Variabilidad Entre hospitales Residual Total Suma de cuadrados Grados de libertad Cuadrado Medio 58,8167 4,4219 Valor de F media 11,75 15,4 16 desviación típica 3,0957 2,0736 1,4142 COMPARACIÓN POR PARES Intervalos de confianza del 95% para µ i − µ j Comparación límite inferior límite superior 1 con 3 -7,13 -1,37 2 con 3 3 con 4 4,50 9,90 a) Para el hospital H4, obtener la media y desviación típica muestrales, indicando su expresión matemática. Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la valoración del servicio es la misma en cualquiera de los cuatro hospitales, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuáles son el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener el intervalo de confianza del 95% para la diferencia de medias µ2 − µ3 basado en el método de la mínima diferencia significativa, indicando: c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido. c.4) Interpretar los tres intervalos de confianza de la tabla, en la que se compara el hospital público (H3), con los hospitales privados (H1, H2 y H4). En base a ellos, ¿se puede considerar que el hospital H3 es el que tiene una mejor valoración en términos medios? d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. Obtener el intervalo de confianza del 99% para la diferencia de medias µ1 − µ3 basado en el método de la mínima diferencia significativa. A.9.- Se ha estudiado el contenido en plata (tanto por ciento de plata) de monedas de Bizancio de cuatro épocas diferentes. Se analizaron cinco monedas de cada una de las épocas, obteniéndose los siguientes resultados: Época I Época II Época III Época IV 5,9 5,9 5,9 5,3 5,8 6,0 5,5 5,6 6,4 6,6 5,6 5,5 6,0 5,1 5,5 5,1 6,6 6,3 5,6 6,2 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 6 a) Para un nivel de significación α=0.10, ¿se podría admitir que no existen diferencias significativas entre los contenidos medios de plata de las cuatro épocas? En caso contrario, realizar las comparaciones por pares mediante el método de la mínima diferencia significativa (un nivel de significación α=0.10). b) Señalar cuáles son los supuestos teóricos necesarios para la correcta realización del apartado anterior. A.10.- Se quiere evaluar la eficacia de distintas dosis de un fármaco contra la hipertensión arterial, comparándola con la de una dieta sin sal. Para ello, se seleccionan al azar 25 hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no se le suministra ningún tratamiento, al segundo una dieta con un contenido pobre en sal, al tercero una dieta sin sal, al cuarto el fármaco a una dosis determinada y al quinto el mismo fármaco a otra dosis. Las presiones arteriales sistólicas de los 25 sujetos al finalizar los tratamientos son: 1 180 173 175 182 181 2 172 158 167 160 175 Grupo 3 163 170 158 162 170 4 158 146 160 171 155 5 147 152 143 155 160 a) Completar la tabla siguiente resultado de efectuar un análisis de la varianza para comparar la eficacia de los tratamientos: Fuente de variación Tratamientos Residual Total Grados de libertad Suma de cuadrados Cuadrados medios F 44,72 2905,04 b) Para un nivel de significación α=0.05, ¿cuál sería la conclusión en cuanto a la eficacia media de los tratamientos? c) Efectuar comparaciones entre las medias de los tratamientos de los grupos 2, 3, 4 y 5 con respecto al grupo de control (grupo 1). ¿Qué conclusiones se obtienen? A.11.- En una fábrica de automóviles se desea analizar el rendimiento de tres marcas de gasolina G1, G2 y G3. Para ello, se controlan los kilómetros recorridos por 18 motores de similares características que se encuentran regulados para funcionar a una velocidad constante. De los 18 motores a 6 se les proporciona la gasolina G1, a otros 6 G2 y a los 6 restantes G3. A cada motor se le suministra 40 litros de gasolina y funciona sin parar hasta quedar sin combustible. La tabla siguiente es la tabla incompleta del análisis de la varianza realizado para comparar los kilómetros medios recorridos por cada una de las tres marcas de gasolina: Origen de la variación Tratamiento Residual Total Grados de libertad Suma de cuadrados 12636 Cuadrados medios F 24362 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 7 a) Escribir las hipótesis nula y alternativa y los supuestos teóricos necesarios para la resolución del problema. b) Completar la tabla anterior. c) ¿Puede concluirse, a un nivel de significación α = 0.05, que los rendimientos medios de las tres marcas de gasolina son iguales? d) Si no se acepta la igualdad de los rendimientos y sabiendo que las medias de los kilómetros recorridos por cada una de las tres marcas fueron: x1. = 533 Km. (para los 6 motores que emplearon la marca G1), x 2. = 596 Km. (para la marca G2) y x 3. = 551 Km. (para G3). Analizar si alguna marca pudo producir dicho rechazo. A.12. Una muestra de 19 pacientes que fueron sometidos a cirugía de bypass cardíaco se asignaron al azar a tres grupos, cada uno de los cuales recibió un tratamiento de ventilación mecánica distinto. Tras 24 horas se determinó el nivel de folato de glóbulos rojos (ng/ml) para cada paciente. A continuación se presentan los resultados obtenidos y un análisis preliminar incompleto. Datos T1 243 251 275 291 347 354 380 T2 206 210 226 249 255 273 285 T3 241 258 270 293 328 Fuente:Vidakovic B (2017), Engineering Biostatistics, an introduction using MATLAB and WinBUGS T1 T2 T3 Q1 263 218 258 Medidas de localización y de dispersión Q2 Q3 Media desviación típica 291 350,5 305,86 54,22 249 264 243,43 30,52 293 Tabla ANOVA Variabilidad Entre tratamientos Residual Total Suma de cuadrados Grados de libertad 16 Cuadrado medio 6841,0827 1736,7857 COMPARACIÓN POR PARES: método i con método j Valor Intervalos de confianza del 95% para la diferencia de medias 1 con 2 1 con 3 2 con 3 de F Límites Inferior ─23,87 ─86,30 Superior 79,59 17,16 a) Se pide: a.1) Para el tratamiento T3, obtén las medidas de localización y de dispersión que faltan en la tabla correspondiente. Para el tratamiento T1 interpreta los cuartiles. ¿Qué tipo de asimetría se aprecia en la distribución muestral en base al gráfico de cajas para los tratamientos T1 y T2? a.2) Completa la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Para examinar si se puede considerar que en términos medios con los tres tratamientos el nivel de folato de glóbulos rojos es el mismo, se pide: b.1) Indica cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Indica cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Representa gráficamente el p-valor e indica cuál es el resultado del test. c) Utilizando el método de la mínima diferencia significativa, obtén un intervalo de confianza del 95% para la diferencia de medias del folato de glóbulos rojos con los tratamientos 1 y 2, indicando: c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido. Interpreta el intervalo obtenido, así como los demás intervalos de confianza de la tabla de “comparación por pares”. d) Responde a las siguientes cuestiones adicionales: d.1) Escribe la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. d.2) En el contraste del apartado b) para examinar si se puede considerar que en términos medios con los tres tratamientos el nivel de folato de glóbulos rojos es el mismo, ¿cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1%? ¿Cuál es el resultado del test para dicho nivel de significación? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 8 A.13. En un estudio para comparar 6 dietas para engorde de cerdos se registraron los siguientes aumentos de peso durante el período en que tuvo lugar el experimento (García (2004), cap. 7). El experimento se llevó a cabo con cerdos de similares características, que fueron criados separadamente, y las dietas fueron asignadas a los animales al azar. 1 2 3 4 5 6 Dieta Maíz Maíz y trigo Maíz y cebada Mijo Mijo y trigo Mijo y cebada 11,3 13,8 15,4 8,0 12,6 13,2 11,8 12,7 15,2 10,6 8,8 13,0 11,9 12,2 17,2 11,3 10,2 12,3 13,7 10,5 13,9 10,6 12,6 11,4 García, R.M. (2004). Inferencia Estadística y diseño de experimentos. Eudeba 13,3 10,9 13,9 Global Media 12,175 12,500 15,425 10,280 11,050 12,760 12,3074 Desviación típica 1,05000 1,27083 1,35739 1,30652 1,87883 0,95026 1,99382 La tabla de análisis de la varianza es la siguiente. Suma de Grados de Cuadrado Valor de Variabilidad cuadrados libertad medio F Dietas 67,03351852 13,40670370 7,75060641 Residual 21 Total Ptos. críticos (tablas F) 10% 5% 1% 2,1423 2,6848 4,0421 a) Se pide: a.1) Completar la tabla. a.2) Indicar brevemente cuál es el modelo de análisis de la varianza que describe los datos. b) ¿Existen diferencias significativas entre las dietas? b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste. b.2) Interpretar el resultado del test correspondiente en la gráfica de la distribución que corresponda. Considerar un nivel de significación del 1% c) Determinar: c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar las hipótesis H 0 siguientes (frente a las hipótesis alternativas contrarias correspondientes). H 0 : µi = µ j H 0 : µ1 = µ3 yi  − y j  -3,25 0,92999 Error típico Estadístico de contraste H 0 : µ 2 = µ3 H 0 : µ3 = µ 4 H 0 : µ3 = µ5 H 0 : µ3 = µ 6 5,145 0,88227 4,375 0,92999 2,665 0,88227 -2.925 0,88227 c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas?. A.14. Para comparar cuatro variedades de maíz (A, B, C y D), se llevó a cabo el siguiente experimento. Se seleccionaron 20 parcelas similares y se eligieron para el cultivo de cada variedad 5 de ellas al azar. La asignación resultante así como las cosechas obtenidas (en kg/parcela) son las siguientes. A 22.2 C 18.4 A 21.2 A 25.2 D 23.9 D 24.8 B 30.3 B 26.4 B 24.1 D 28.2 C 23.2 A 16.1 D 21.7 A 17.3 C 21.9 C 22.6 C 25.9 D 26.4 B 27.4 B 34.8 Media Varianza A 20.4 13.755 B 28.6 16.965 C 22.4 7.295 D 25.0 6.085 Media global 24.10 Varianza global 19.1895 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 9 La tabla de análisis de la varianza y los resultados de los tests de la mínima diferencia significativa para contrastar las hipótesis nulas que se indican (frente a las hipótesis alternativas contrarias correspondientes), son: H 0 : µi = µ j H 0 : µ1 = µ 2 H 0 : µ1 = µ3 H 0 : µ1 = µ 4 Fuente Suma de Grados de Cuadrado Valor yi • − y j • de variación cuadrados libertad medio de F -8.2 -2 -4.6 Variedad 188.2 62.7333 5.69 Error típico 2.1 2.1 2.1 Error Estadístico t -3.9048 -0.9524 -2.1905 Total p-valor 0.001261 0.355071 0.043645 a) Completar la tabla. ¿Qué diseño se utilizó para obtener la muestra? b) ¿Se puede considerar que no existen diferencias significativas entre las cuatro variedades? b.1) Formular el problema como un contraste de hipótesis. b.2) ¿Cuál es el estadístico de contraste del test correspondiente?. Interpretar el resultado del test en la gráfica de la distribución apropiada. Considerar un nivel de significación del 5%. c) ¿Se puede considerar que la variedad A es peor que la B? ¿Y peor que la C? ¿Y peor que la D? Indicar el valor del nivel de significación crítico de los tests correspondientes a cada una de las cuestiones anteriores. A.15. Se realizó un experimento para comparar cuatro productos químicos en fase de prueba para combatir la roya en las plantaciones de trigo. (La roya es un hongo que parasita en su interior extrayéndole las substancias alimenticias. Aparece en primavera como manchas amarilloanaranjadas en hojas y cañas). Se consideró un diseño completamente aleatorizado en parcelas homogéneas de 50 m2. Las cosechas de grano en kilogramos obtenidas en cada parcela, se muestran en la siguiente tabla. Cosecha Producto X52 B29 Z15 PP5 19.00 23.60 21.90 24.20 21.00 21.80 24.90 22.30 Datos 23.00 18.80 23.40 25.80 20.00 23.90 18.90 26.90 17.00 22.25 22.80 22.30 Global Media 20.00 22.07 22.38 24.30 22.1875 Varianza 5.000 4.122 4.977 4.255 6.3110 Saville, D.J. y Wood, G.R. (1997). Statistical methods: the geometric approach. Springer La tabla de análisis de la varianza es la siguiente. Fuente de Suma de Grados de Cuadrado Variación cuadrados Libertad medio Producto 15.4978 Error 4.5885 Total 19 Valor de F 3.3775 Ptos. críticos (tablas F) 10% 5% 1% 2.4618 3.2389 5.2922 a) Completar la tabla. ¿Cómo se calcula el cuadrado medio residual a partir de las varianzas muestrales de los tratamientos?. b) ¿Existen diferencias significativas entre los productos químicos? b.1) Formular el problema como un contraste de hipótesis. b.2) Indicar el criterio de rechazo al nivel de significación del 5% del test correspondiente. b.3) Interpretar el resultado del test en la gráfica de la distribución del estadístico de contraste. c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias de las cosechas correspondientes a los productos B29 y PP5 ( µ 2 − µ 4 ). d) Indicar brevemente: d.1) Cuál es el modelo de análisis de la varianza correspondiente al diseño experimental empleado. d.2) Qué hipótesis sobre el error experimental dan validez al análisis estadístico realizado. A.16. Se desea comparar el contenido de hierro de tres contenedores de ceniza de carbón en polvo. De cada contenedor se extraen aleatoriamente cinco muestras para determinar su contenido de hierro en porcentaje. Los resultados obtenidos y un análisis estadístico preliminar se presentan a continuación. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 10 DATOS Y MEDIDAS DE RESUMEN A B C TABLA ANOVA 1,81 1,8 1,79 1,83 1,82 1,84 1,8 1,83 1,79 1,82 1,76 1,79 1,74 1,73 1,78 A B C media 1,810 1,816 1,760 desviación típica 0,01581 0,02074 0,02550 Suma de Grados de Variabilidad cuadrados libertad Entre contenedores 2 Residual 12 Total 14 Cuadrado medio 0,004727 0,000443 Valor de F COMPARACIÓN POR PARES comparación A con B difer. media límite inferior límite superior Fuente: Alfassi, Z.B. et al (2005). Statistical treatment of analytical data. CRC Press µ1 − µ2 A con C µ1 − µ3 B con C µ 2 − µ3 -0,035015 0,023015 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar si se puede considerar que el contenido medio de hierro es el mismo en los tres contenedores, indicando: a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. a.3) Cuál es el resultado del test para un nivel de significación del 5%. c) Obtener los intervalos de confianza del 95% para las diferencias de medias µi − µ j (basados en el método de la mínima diferencia significativa) pendientes de calcular en la tabla de “comparación por pares”. En base a dichos intervalos decidir, si es posible, cuáles son los contenedores de mayor y de menor contenido de hierro. A.17. Uno de los factores que determina el grado de riesgo que un pesticida plantea a la salud humana es la tasa con la que lo absorbe la piel después del contacto. Una pregunta importante es si la cantidad en la piel aumenta con la duración del contacto, o si sólo aumenta durante un tiempo corto antes de estabilizarse. Para investigar esto último se aplicó una cantidad determinada fija de pesticida a 20 muestras similares de piel de rata. Se analizaron cuatro muestras de piel en cada uno de los intervalos de duración del contacto: de 1, 2, 4 10 y 24 horas. Las cantidades de compuestos químicos (en µg) asociados al pesticida que estaban en la piel vienen dadas en la tabla siguiente. Duración (h) 1 2 4 10 24 1,7 1,8 1,9 2,3 2,1 cantidad 1,5 1,6 1,7 1,9 2,2 absorbida 1,2 1,8 2,1 1,7 2,5 1,5 1,9 2,0 1,5 2,3 Global Media 1,475 1,775 1,925 1,85 2,275 1,86 Desviación típica 0,2062 0,1258 0,1708 0,3416 0,1708 0,3267 La tabla de análisis de la varianza es la siguiente. Suma de Grados de Cuadrado Valor de Ptos. críticos (tablas F) Variabilidad cuadrados libertad medio 5% 1% 0.1% F Entre duraciones 1,3280 0,3320 7,1143 3,06 4,89 8,25 Residual Total a) Se pide: a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos. a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental? b) ¿Se puede considerar que la duración del contacto no influye sobre la cantidad absorbida? b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste. b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda. c) Determinar: c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar las hipótesis nulas siguientes (frente a las hipótesis alternativas contrarias correspondientes). H 0 : µi = µ j H 0 : µ1 = µ 2 H 0 : µ2 = µ4 H 0 : µ 4 = µ10 H 0 : µ10 = µ 24 H 0 : µ 4 = µ 24 yi • − y j • Error típico Estadístico de contraste __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 11 c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas?. c.3) El intervalo de confianza del 95% para la diferencia de medias correspondientes a las duraciones de 4 h. y 24 h.. A.18. En un estudio sobre contaminación de las aguas fluviales se pretende contrastar si la cantidad media de fosfatos varía en tres lugares diferentes en el curso de un río. Para ello se tomaron diez observaciones independientes de una determinada cantidad de agua en cada uno de los tres lugares y se determinó la cantidad de fosfatos en mg/l. Los resultados obtenidos son los siguientes. Lugar: Fosfatos (mg/l) L1 96 84 116 96 102 107 104 Media 107,9 Desviación típica 14,2005 Media de la muestra total: 112,0333 125 124 125 L2 L3 76 107 120 77 99 114 88 139 110 116 130 111 147 109 105 118,4 109,8 23,32952 14,5968 Desviación típica de la muestra total: 17,86633 123 140 134 112 125 Fuente: González Manteiga, M. T. y Pérez de Vargas Luque, A. (2009). Estadística aplicada. Una visión instrumental. Díaz de Santos La tabla de análisis de la varianza es: Fuente de Variación Lugar Error experimental Total Suma de Grados de Cuadrado cuadrados libertad medio 626,0667 319,6630 Valor de F Punto crítico del 5% 3,354 a) Completar la tabla. b) ¿Se puede concluir que la concentración de fosfatos no es la misma en los tres lugares examinados? b.1) Formular el problema como un contraste de hipótesis. b.2) Interpretar el resultado del test en la distribución de referencia en base al nivel de significación del 5%. b.3) Representar gráficamente el p-valor del test. c) ¿Qué hipótesis sobre las muestras son necesarias para la validez del test anterior? Asumiendo que son válidas, ¿cuál es el valor de la estimación insesgada de la varianza del error experimental? A.19. Se desea comparar el desarrollo bacterial promedio con cuatro métodos diferentes de almacenamiento de carne. Se seleccionaron 12 piezas del mismo tamaño (75 gr.) y características similares y se asignaron al azar tres a cada método. Después de 9 días de almacenamiento a 4º C en la misma instalación, se midió el número de bacterias sicotrópicas en cada una de las piezas de carne. Estas bacterias se encuentran en la superficie de la carne y se asocian al deterioro de la carne. Como variable respuesta final se consideró el logaritmo del número de bacterias por cm2. Método de almacenamiento A B C D 7,66 5,26 3,51 7,41 6,98 5,44 2,91 7,33 7,80 5,80 3,66 7,04 Global Media 7,48 5,50 3,36 7,26 5,90 Desviación típica 0,43863 0,27495 0,39686 0,19468 1,75291 Fuente: Kuehl, R. (2001). Diseño de experimentos. Principios estadísticos para el diseño y análisis de investigaciones. Thomson A =envase de plástico con aire del ambiente., B = envasado al vacío, C = atmósfera 100% monóxido de carbono (CO), D = atmósfera mezcla de gases: 1% de CO, 40% de O2 y 59% de N. La tabla de análisis de la varianza correspondiente es la siguiente. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 12 Variabilidad Entre grupos Residual Total Suma de cuadrados Grados de libertad Cuadrado medio 10,9576 0,1159 Valor de F Ptos. críticos (tablas F) 10% 5% 1% 2,9238 4,0662 7,5910 33,8 a) Se pide: a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos. a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental? a.3) Calcular los residuos correspondientes al método B. b) ¿Se puede considerar que el método de envasado no influye de forma significativa en el desarrollo de las bacterias? b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste. b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda. Considerar un nivel de significación del 1%. c) Determinar el intervalo de confianza del 95% para la diferencia de medias correspondientes a cada par del cuadro siguiente: µ1 − µ3 Diferencia µ3 − µ 4 µ 2 − µ3 yi • − y j • Error típico Límite inferior Límite superior 0,2780 A.20. Se llevó a cabo un experimento para investigar cómo afecta la densidad de aves por m2 en la producción de huevos de gallinas de cierta estirpe. Se eligieron tres mil gallinas similares que se repartieron al azar en diez grupos de trescientas gallinas cada uno, los cuales se asignaron al azar a corrales de dimensiones adecuadas para las densidades A, B, C y D (densidades crecientes de la A – la más baja –, a la D –la más alta). Tras un período de adaptación, se midió el peso (g.) del huevo por gallina en la semana número 21. A continuación se presentan el diseño y los datos obtenidos junto con las medidas de resumen y la tabla ANOVA correspondientes. D 45,5 A 45,89 A 46,59 D 47,10 B 46,44 B 48,78 C 46,24 C 45,66 D 47,71 A 49,48 Media Desviación típica A 47,32 1,9031 B 47,61 1,6546 Media global Desviación típica global 46,9390 1,3389 C 45,95 0,4101 D 46,77 1,1414 Fuente: Collins, C. y Seeney, F. (1999). Statistical Experimental Design and interpretation. An introduction with agricultural examples. Wiley Fuente de variación Densidad Error Total Suma de cuadrados 12,7548 Grados de libertad Cuadrado medio 1,1260 2,1258 Valor de F a) Completar la tabla e indicar cómo se denomina el diseño empleado y cuál es el modelo de análisis de la varianza asociado a la muestra. ¿Qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla ANOVA? b) ¿Se puede considerar que no existen diferencias significativas entre las cuatro densidades? b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test correspondiente? b.2) Representar gráficamente el nivel de signifcación crítico del test correspondiente. b.3) ¿Cuál es el resultado del test con un nivel de significación del 5%?. c) Contrastar la hipótesis de igualdad de varianzas de los pesos de los huevos que resultan de considerar las densidades A y D, indicando: __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 13 c.1) cuál es el estadístico de contraste y su distribución; c.2) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado del test. A.21. Se realizó un estudio para evaluar un método de detección de plaguicidas en los cultivos de verduras. Se aplicó dieldrin (un pesticida de uso común) marcado con Carbono 14 (radiactivo) a rábanos en crecimiento. Catorce días después se aplicó el proceso de extracción y análisis del contenido de dicho pesticida en los rábanos. El plaguicida era la única fuente de Carbono 14, por lo que se consideró la proporción de Carbono 14 en la pulpa de las verduras como indicador de la proporción del pesticida en ellas. En la tabla siguiente se muestran los datos obtenidos al utilizar distintas concentraciones del solvente acetonitrilo en el proceso de extracción. Concetración de acetonitrilo: baja moderada alta Porcentaje de 23,37 25,13 23,78 27,74 20,39 20,87 20,78 20,19 18,87 19,69 19,29 18,10 Carbono 14 en la 25,30 25,21 22,12 20,96 20,01 20,23 20,73 19,53 18,42 19,33 17,26 18,09 pulpa de las verduras 23,11 22,57 24,59 23,70 18,87 18,17 23,34 22,45 18,69 18,82 18,72 18,75 Media 23,9650 20,4633 18,6692 Varianza 3,1728 1,9607 0,4222 La tabla de análisis de la varianza es: Fuente de Variación Concentración del solvente Error experimental Total Suma de Grados de Cuadrado cuadrados libertad medio 235,2187 33 35 Valor de F Punto crítico del 5% 3,2849 1,8519 a) Completar la tabla. b)¿Se puede concluir que la concentración de acetonitrilo que se utiliza en el proceso de extracción influye en el porcentaje de Carbono 14 que se detecta en la pulpa de las verduras? b.1) Formular el problema como un contraste de hipótesis. b.2) Interpretar el resultado del test en la distribución de referencia en base al nivel de significación del 5%. b.3) Representar gráficamente el p-valor del test. Si procede, realizar comparaciones por pares utilizando el método de la mínima diferencia significativa. c) ¿Qué hipótesis sobre las muestras son necesarias para la validez del test anterior? Asumiendo que son válidas, ¿cuál es el valor de la estimación insesgada de la varianza del error experimental? A.22. Se sabe que el dióxido de carbono tiene un efecto crítico en el crecimiento microbiológico. Cantidades pequeñas de CO2 estimulan el crecimiento de muchos microorganismos, mientras que altas concentraciones inhiben el crecimiento de la mayor parte de ellos. Esto último se utiliza comercialmente cuando se almacenan productos alimenticios perecederos. En un estudio para investigar el efecto del CO2 sobre la tasa de crecimiento de Pseudomonas fragi, un corruptor de alimentos, se administraron tres presiones atmosféricas diferentes en seis cultivos con cada nivel de presión. Los datos obtenidos, el cambio porcentual en la masa celular después de un tiempo de crecimiento de una hora, son los siguientes. media desviación típica 45,5 41,1 38,3 40,2 38,5 29,8 38,9000 0,29 5,1657 29,5 22,8 19,2 20,6 29,2 24,1 24,2333 0,5 4,3131 24,9 17,2 22,6 17,8 22,1 10,5 19,1833 0,86 5,1790 En el análisis de la varianza se obtuvieron los siguientes resultados: Variabilidad Entre presiones Residual Total Suma de cuadrados Grados de libertad Cuadrado medio 629,3606 Valor de F 15 1619,2628 a)¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA? Completar la tabla. b) Para examinar si se puede admitir que no existen diferencias en la respuesta media con las tres presiones de CO2, se pide: __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 14 b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. ¿Cuál es el resultado del test? c) ¿Existen diferencias significativas entre las medias de las dos presiones más altas?. ¿Y entre las medias de la presión más baja y la presión más alta? Razonar la respuesta en base al método de la mínima diferencia significativa considerando un nivel de significación del 5%. A.23. Se investigó la pérdida de peso en porcentaje del peso inicial de la carne de res tipo milanesa, tras cinco días desde la fecha de envasado. En el estudio se consideraron 20 muestras de carne similares y se asignaron cinco de ellas, elegidas al azar, a cada uno de los cuatro tipos de envolturas. Los resultados obtenidos fueron los siguientes: media desviación típica 5,33 4,95 5,10 7,14 7,84 6,0720 1. Icopor 1,32483 6,95 7,90 4,48 7,32 6,41 2. Biopak 6,6120 1,30964 3. Cry-0-Vac 4,95 4,44 3,48 3,92 8,62 5,0820 2,05327 2,41 2,83 2,93 2,38 2,11 2,5320 4. Shopak 0,34032 total 5,0745 2,05612 Fuente: Melo Martínez, O.O. y otros (2007). Diseño de experimentos, métodos y aplicaciones. Universidad Nacional de Colombia En el análisis de la varianza se obtuvieron los siguientes resultados: Suma de Grados de Cuadrado Variabilidad cuadrados libertad medio Entre envolturas 49,1164 Residual 31,2083 Total Valor de F a)¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA? Completar la tabla. b) Para examinar si se puede considerar que la envoltura no afecta a la pérdida media de peso, se pide: b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? b.2) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. ¿Cuál es el resultado del test? c) Obtener un intervalo de confianza del 95% para la diferencia en término medio de la pérdida de peso de las envolturas Icopor y Biopak. A la vista del intervalo obtenido, ¿se puede concluir que existen diferencias significativas entre ambas envolturas en base al método de la mínima diferencia significativa? A.24. Se sabe que cierto compuesto químico tiene influencia sobre el crecimiento de una especie de planta a lo largo del tiempo. Se utilizaron tres concentraciones del compuesto (1, 2 y 3) con objeto de comparar su efecto sobre el crecimiento medio de la planta. Se utilizaron cuatro plantas de características análogas para cada una de las tres concentraciones del compuesto y se obtuvieron los siguientes resultados de crecimiento en cm. al cabo de un mes. Concent. crecimiento medias Tabla ANOVA 1 2 3 7,6 7,5 4,7 8,1 7,3 5,7 8,3 7,0 6,3 7,5 6,9 6,1 7,875 7,175 5,70 Fuente de variación Concentración Error exper. Total Suma de cuadrados Grados de libertad Cuadrado Medio 4,930833 Valor de F 9 12,056667 a) Para examinar si se puede considerar que en términos medios las distintas concentraciones tienen el mismo efecto sobre el crecimiento de la planta, se pide: a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.2) ¿Cuál es el resultado del test para un nivel de significación del 5%? a.3) Completar la tabla ANOVA. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a ella? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 15 b) Examinar cuál o cuáles son las concentraciones mejores (para el crecimiento de la planta) en base al método de la mínima diferencia significativa. Razonar la respuesta a partir de los intervalos de confianza del 95% para las diferencias de medias de cada par, completando los cálculos que faltan. µ1 − µ2 Diferencia µ 2 − µ3 µ1 − µ3 1,3850424 2,9649576 Límite inferior Límite superior c) Contrastar si se puede admitir que la varianza del crecimiento de la planta es la misma con concentración 1 que con la concentración 2. Considerar un nivel de significación del 5%. A.25. Se desea determinar si la cantidad de carbón empleado en la fabricación de acero tiene algún efecto en la resistencia a la tensión de este. Se investigaron cuatro porcentajes de carbón de interés: 0,2%; 0,3%; 0,4% y 0,5%. Para cada porcentaje de carbón se seleccionaron, en forma aleatoria del mismo lote, cinco muestras de acero y se midieron las resistencias a la tensión (en kg por cm2), que se muestran a continuación. Concentr. 0,2% 0,3% 0,4% 0,5% resistencia 1240 1430 1480 1600 1350 1510 1460 1690 1390 1410 1530 1640 medias 1280 1530 1560 1710 1320 1460 1510 1630 total Tabla ANOVA 1316 1468 1508 1654 1486,5 Fuente de variación Concentración Error exper. Total Suma de cuadrados Grados de libertad Cuadrado medio 96551,6667 16 328255 a) Para examinar si se puede considerar que en términos medios la resistencia es la misma con cualquiera de las cuatro concentraciones, se pide: a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.2) ¿Cuál es el resultado del test para un nivel de significación del 5%? a.3) Completar la tabla ANOVA. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a ella? b) Examinar si existe una concentración óptima (que produce la máxima resistencia a la tensión) en base al método de la mínima diferencia significativa. Razonar la respuesta a partir de los intervalos de confianza del 95% para las diferencias de medias de cada par, completando los cálculos que faltan. Diferencia Límite inferior Límite superior µ0,2 − µ0,3 µ0,2 − µ0,4 µ0,2 − µ0,5 -217,85 -86,15 -257,85 -126,15 -403,85 -272,15 µ0,3 − µ0,4 µ0,3 − µ0,5 µ0,4 − µ0,5 -251,85 -120,15 A.26. Se realizó un estudio para examinar la pérdida de peso de probetas de resina a altas temperaturas. Se seleccionaron 15 probetas de igual tamaño, 5 de cada uno de los tres tipos de resina empleados. Tras exponer las probetas a una temperatura de 371 ºC durante 400 horas, se determinó la pérdida de peso en tanto por ciento de cada una. Los resultados fueron los siguientes. Resina pérdida de peso media desviación típica R1 R2 25,2 25,4 24,6 25,6 25,0 27,5 29,1 28,9 28,6 27,8 25,16 28,38 0,3847 0,6979 R3 28,4 28,9 28,2 27,8 27,3 28,12 0,6058 La tabla de análisis de la varianza para los datos anteriores es: Fuente de Variación Resina Error experimental Total Suma de Grados de Cuadrado cuadrados libertad medio 31,9960 Valor de F 36,0040 Asumiendo que son tres muestras independientes de variables normales con la misma varianza, se pide: __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 Valor de F 16 a) Examinar si se puede admitir que la pérdida media de peso es la misma para las tres resinas. a.1) Formular el problema como un contraste de hipótesis. a.2) Interpretar el resultado del test en la distribución de referencia para un nivel de significación del 5%. b) Comparar los diferentes pares de resinas mediante el método de la mínima diferencia significativa a partir de intervalos de confianza del 95%. ¿Se puede concluir que alguna resina sea la mejor (por conllevar una menor pérdida de peso)? A.27 Cuando se inyecta un antibiótico en la sangre, una parte de él se une a la proteína sérica, lo que reduce el efecto medicinal. Se midió la tasa (en porcentaje) de antibiótico que se unió a la proteína sérica en un estudio realizado en 12 vacas similares con cierta enfermedad a las que se administró uno de los tres tipos de antibióticos disponibles elegido al azar. Los datos obtenidos y un análisis preliminar se muestran a continuación. Media Desviación típica A1 (Chloramphenicol) A2 (Erythromycin) A3 (Tetracycline) Variabilidad Entre antibióticos Residual Total Suma de cuadrados 29,2 32,8 25,0 24,2 27,8 3,99 21,6 17,4 18,3 19,0 19,075 1,8062 27,3 32,6 30,8 34,8 31,375 3,1711 Grados de Cuadrado Valor libertad medio de F 160,1308 9,7461 Comparación por pares. Intervalos de confianza del 95% Comparación: A1 con A2 A1 con A3 A2 con A3 µi − µ j µ1 − µ3 µ 2 − µ3 µ1 − µ2 yi • − y j • lím. inferior lím. superior 8,725 3,7313 13,7187 -3,5750 -8,5687 1,4187 a) Para examinar si se puede considerar que en términos medios la tasa de antibiótico que se une a la proteína sérica es la misma con los tres antibióticos, se pide: a.1) Completar la tabla ANOVA. a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado del test? a.4) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. b) Obtener, mediante el método de la mínima diferencia significativa, el intervalo de confianza del 95% para la diferencia de medias µ2 − µ3 que completa la tabla de comparación por pares, indicando: b.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál es la expresión matemática del intervalo. b.2) En base a los tres intervalos de confianza, ¿con qué antibiótico será menor en términos medios el porcentaje del mismo que se une a la proteína sérica? A.28. Se desea comparar la eficacia de tres fertilizantes químicos para el maíz. A tal fin se consideraron 15 plantas similares cultivadas en idénticas condiciones de temperatura, humedad, suelo, etc. Las plantas se asignaron al azar a tres grupos, y se aplicó un fertilizante en cada grupo (la misma cantidad a todas las plantas). El crecimiento de las plantas de maíz al cabo de un mes se recoge en la tabla que sigue a continuación. Fertilizante 1 2 3 crecimiento 23 16 18 21 23 22 al cabo 24 20 25 de un mes 17 21 21 19 18 20 Global Media 20,8 19,6 21,2 20,5333333 Desviación típica 2,86356421 2,70185122 2,58843582 2,39017597 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 17 La tabla de análisis de la varianza correspondiente es la siguiente. Variabilidad Entre grupos Residual Total Suma de Grados de cuadrados libertad 6,93333333 2 88,8 Cuadrado medio 3,46666667 Valor de F Ptos. críticos (tablas F) 10% 5% 1% 2,8067 3,8853 6,9266 a) Se pide: a.1) Indicar cuál es el modelo de análisis de la varianza que describe los datos. a.2) Completar la tabla. ¿Cuál sería una estimación insesgada de la varianza del error experimental? b) ¿Se puede considerar que el fertilizante no influye de forma significativa sobre el crecimiento del maíz? b.1) Formular el problema como un contraste de hipótesis e indicar cuál es el estadístico de contraste. b.2) Interpretar el resultado del test en la gráfica de la distribución que corresponda. Considerar un nivel de significación del 1%. Realizar, si procede, las comparaciones de medias por pares mediante el método de la mínima diferencia significativa. A.29. Se realizó un experimento con cinco variedades de maíz con un diseño completamente aleatorizado en el cual se midió la cosecha de grano por planta en gms. Los datos obtenidos y la tabla ANOVA que se deriva de ellos siguen a continuación. Variedad: V1 V2 cosecha (g.) 62 62 60 de grano 57 58 59 por planta 60 61 57 Media 60 desv. 2,0976 Típica Media global: 58,95 62 61 60 60 61 61 60,1111 1,4530 V3 60 57 58 59 53 56 57 60 55 57,2222 2,3333 V4 56 57 58 62 61 60 58 60 59 2,0702 V5 61 57 58 62 55 59 57 61 58,75 2,4349 Desviación típica global: 2,2640 Fuente: Agarwal, B.L. y Agarwal, S.P. (2007). Statistical Analysis of Quantitative Genetics. New Age International Publishers Fuente de variación Variedad Error experimental Total Suma de Grados de Cuadrado Cuadrado libertad medio s 45,9556 Valor de F Punto crítico del 5% 10% 2,6415 2,1128 199,90 a) Completar la tabla e indicar cuál es el modelo de análisis de la varianza asociado a la muestra. ¿Qué hipótesis sobre el error experimental se asumen en el análisis estadístico asociado a la tabla ANOVA? b) ¿Se puede considerar que no existen diferencias significativas entre las cosechas medias de las cinco variedades? b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test correspondiente?. b.2) ¿Cuál es el resultado del test con un nivel de significación del 5%?. ¿Y al nivel de significación del 10%? b.3) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. Realizar, si procede, las comparaciones de medias por pares mediante el método de la mínima diferencia significativa. c) Contrastar la hipótesis de igualdad de varianzas de las cosechas de grano por planta de las variedades V1 y V4, indicando: c.1) cuál es el estadístico de contraste y su distribución; __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 18 c.2) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado del test. A.30. En un estudio comparativo de tres variedades de patata, se midió el número por cada mm2 de pelos glandulares repelentes de insectos en 10 plantas de cada variedad. Los datos resultantes fueron los siguientes. Variedad A B C 3,7 4,9 6,4 4,8 9,4 15,2 1,6 2,9 10,5 nº/ mm2 3,1 5,1 5,4 3,8 11,2 8,4 5,2 6,1 6,5 7,5 5,9 7,4 6,5 5,4 14,6 6,7 6,8 7,8 6,9 5,9 11,1 Fuente: Van Emden (2008). Statistics for terrified biologists. Blackwell Publishing La tabla de análisis de la varianza es: Fuente de variación Variedad Error Total Suma de cuadrados Grados de libertad 149,6030 Cuadrado medio Valor de F Punto crítico 1% 10% 5,4881 2,5106 5,54085 29 a) Completa la tabla e indicar cuál es la ecuación del modelo de análisis de la varianza asociado a la muestra. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA? b) ¿Se puede considerar que no existen diferencias significativas entre las tres variedades? b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test correspondiente?. b.2) Representar gráficamente el nivel de significación crítico del test. b.3) ¿Cuál es el resultado del test con un nivel de significación del 1%?. ¿Y con un nivel de significación del 10%? c) Contrastar la hipótesis de igualdad de varianzas del número (por cada mm2) de pelos glandulares repelentes de insectos en las variedades A y B, indicando: c.1) cuáles son las hipótesis a contrastar; c.2) cuál es el estadístico de contraste y su distribución; c.3) cuál es la región de aceptación del test de un nivel de significación del 5% y cuál es el resultado del test. A.31. En un estudio para comprobar el efecto que tienen las concentraciones de cobre en el agua sobre el tiempo de vida de los animales acuáticos se seleccionaron unos micro crustáceos denominados Daphnia magna (conocido como pulga de agua dulce) dado que estos animales tienen un corto período de vida. Se disponía de 15 daphnia para el estudio y de 3 contenedores, con las siguientes concentraciones de cobre: sin cobre, 20 µg/l, y 40 µg/l. Los tratamientos (niveles de cobre) se asignaron al azar a las unidades experimentales (los daphnia) con la única restricción de que a cada contenedor se le asignaba el mismo número de daphnias. Desafortunadamente un daphnia que había sido asignado al contenedor sin cobre murió antes de ser introducido en el contenedor por un descuido del investigador, por lo que sólo se dispone de cuatro observaciones del primer tratamiento. Los resultados del experimento (Weber y Skilling (2000, Cap. 7)) y la tabla ANOVA asociada se muestran a continuación. Tiempos de vida en días para distintas concentraciones de cobre Sin cobre 60 90 74 82 20 µg/l 58 74 50 65 68 40 µg/l 40 58 25 30 42 Tabla de análisis de la varianza __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 19 Fuente de variación Tratamiento Error experim. Total Suma de cuadrados Grados de libertad Cuadrado medio Valor de F 1% 5% 10% 1483.0000 4780.8571 Puntos críticos F Dunnett 7.21 3.45 3.98 2.53 2.86 a) Completar la tabla anterior e identificar qué entrada se corresponde con cada uno de los términos de la siguiente expresión de la descomposición de la varianza: p 2 •• i i• =i 1 =i 1 2 (n − 1) S= p ∑ n (Y − Y ) + ∑ (ni − 1) Si2 . b) Indicar: b.1) Cuál es el modelo de análisis de la varianza que describe cómo se generan los datos. b.2) ¿Qué hipótesis dan validez al F test que se deriva del análisis de la varianza? c) ¿Existen diferencias significativas entre los tratamientos con un nivel de significación α = 0.05 ? d) Resolver el mismo problema que en el apartado anterior en base al nivel crítico del contraste. e) Comparar los tiempos medios de vida de las dos concentraciones de cobre con el tiempo medio de vida "sin cobre", utilizando el método de la mínima diferencia significativa. A.32. Un granjero, tras cruzar cuatro linajes de gallinas, A, B, C y D, quiere comparar los huevos de los cuatro cruces siguientes: AB, AC, BC y BD. Los pesos de los huevos en gramos obtenidos en cuatro muestras, son los que se muestran a continuación (Kaps y Lamberson (2004)) Cruce AB AC BC BD 58 59 56 59 51 62 57 55 56 64 56 50 52 60 55 64 54 62 57 58 60 57 53 57 53 Kaps, M. y Lamberson, W. (2004). Biostatistics for Animal Science. CABI Publishing Media Desviación típica 55.75 3.15096357 61.40 1.94935887 56.00 0.81649658 56 55 55.90 3.81371793 Global 56.8888889 3.63035634 La tabla de análisis de la varianza es la siguiente. Fuente de variación Cruce Error Total Suma de cuadrados Grados de libertad 23 Cuadrado Valor de medio F 41.68888889 4.40645425 9.46086957 Ptos. críticos (tablas F) 10% 5% 1% 2.3387 3.0280 4.7648 a) Completar la tabla. b) ¿Existen diferencias significativas entre los cruces? b.1) Formular el problema como un contraste de hipótesis. b.2) Indicar el criterio de rechazo, al nivel de significación del 5%, del test correspondiente. b.3) Interpretar el resultado del test en la gráfica de la distribución del estadístico de contraste. c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia media de peso entre los huevos del cruce AB y el cruce BD ( µ1 − µ 4 ). d) Indicar brevemente cuál es el modelo de análisis de la varianza que describe cómo se generan los datos. ¿Qué hipótesis sobre las muestras dan validez al análisis estadístico realizado? A.33. Se realizó un estudio sobre tratamiento de aguas de desecho para comparar tres métodos de tratamiento para la extracción de carbono orgánico. Se utilizó un diseño completamente aleatorizado y los siguientes métodos de tratamiento: flotación de aire, separación con espuma y coagulación con cloruro férrico. Las mediciones de carbono orgánico de los tres tratamientos llevaron a los siguientes datos. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 20 Mediciones de carbono orgánico Método Datos Flotación 34.6 36.1 37.2 35.1 36.5 37.4 35.3 36.8 37.7 35.8 Separación 38.8 41.0 46.9 39.0 43.2 51.6 40.1 44.9 53.6 40.9 Coagulación 26.7 27.5 28.1 27.0 28.1 30.7 27.1 28.7 31.2 26.7 Global 36.25 1.04695 44 5.22430 28.18 1.60402 36.1433 7.26397 Media desviación típica La tabla ANOVA es la siguiente. Fuente de Variación Tratamientos Error Total Suma de cuadrados 1251.533 Grados de libertad 1530.194 29 Cuadrado medio 625.766 Valor de F Puntos críticos distrib. F 10% 1% 2.51 5.49 a) ¿Cuál es el modelo de análisis de la varianza (y sus hipótesis) que corresponde al diseño experimental anterior? b) ¿Existen diferencias significativas entre los métodos con un nivel de significación α = 0.01 ? c) Acotar el nivel de significación crítico del contraste del apartado anterior. ¿Se puede concluir que existen diferencias significativas entre los tratamientos en base al nivel de significación crítico? d) Calcular un intervalo de confianza con un nivel de confianza del 95% para la diferencia de medias de las mediciones de carbono orgánico de los métodos "separación con espuma" y "coagulación con cloruro férrico", µ 2 − µ3 . A.34. Una empresa desea estudiar la productividad media por hora en el montaje de un mecanismo electrónico en las tres fábricas que tiene, A, B y C. Para ello se midió el número de unidades que se montaron por hora en varios días seleccionados al azar en cada empresa, resultando los siguientes datos. Número de unidades por hora Fábrica 4.5 4.3 4.3 4.9 3.8 4.6 4.2 Datos Media Varianza A 4.4 4.7 4.8 3.8 4.3 4.9 4.2 4.7 4.5 4.43 0.1143 4.8 4.4 4.4 4.5 4.9 4.7 4.6 B 5.1 4.9 5.2 4.7 3.8 5.1 3.6 4.56 0.1794 4.6 4.6 4.2 4.1 4.2 4.8 C 3.7 4.2 4.3 4.2 4.5 4.1 4.2 4.1 4.6 4.6 4.3 4.0 4.0 3.9 4.25 0.0732 4.3 4.6 4.7 4.2 Global 4.419 0.1374 La tabla ANOVA es la siguiente. Fuente De Variación Tratamientos Error Total Suma de cuadrados 0.9141 Grados de libertad 7.2814 53 Cuadrado medio 0.4570 Valor de F Puntos críticos (tablas de la F ) 5% 1% 3.1788 5.0472 a) Completar la tabla. b) ¿Existen diferencias significativas entre los tratamientos con un nivel de significación α = 0.05 ? ¿Y con α = 0.01 ? c) Acotar el nivel de significación crítico del contraste del apartado anterior. ¿Se puede concluir que existen diferencias significativas entre los tratamientos en base al nivel de significación crítico? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 21 d) Calcular un intervalo de confianza con un nivel de confianza del 95% para la diferencia de medias de productividad entre cada par de empresas, µi − µ j . A.35. Tres granjeros utilizan métodos diferentes para engordar a sus cerdos hasta que alcanzan el peso óptimo para beicon. Para llevar a cabo una comparación de sus métodos, se seleccionaron cerdos similares y se contabilizaron el número de días de ceba desde que el cerdo deja de mamar hasta que alcanza el peso óptimo para beicon. Los datos obtenidos son los siguientes. A B C 105 104 107 101 100 115 112 107 108 103 107 98 99 104 105 113 110 97 112 108 103 105 Media Varianza A 104 29,6 B 106 12 C 106,375 36,55357143 Media global 105,59090909 Varianza global 24,25324675 Fuente: Mead, R.; Curnow, R.N. y Hasted, A.M. (1998). Statistical methods in agriculture and experimental biology. Chapman & Hall La tabla de análisis de la varianza y los resultados de los tests de la mínima diferencia significativa para contrastar las hipótesis nulas que se indican (frente a las hipótesis alternativas contrarias correspondientes), son: Punto Fuente de Suma de Grados de Cuadrado Valor Variación cuadrados libertad Medio de F crítico 10% Método 21,4432 10,7216 2,6056 Error 25,6776 Total H 0 : µi = µ j yi • − y j • Error típico Estadístico t H 0 : µ1 = µ 2 H 0 : µ1 = µ3 H 0 : µ 2 = µ3 -2,0000 2,7367 -2,3750 2,7367 -0,3750 2,5337 a) Se pide: a.1) Completar la tabla. a.2) ¿Qué diseño se utilizó para obtener la muestra? b) ¿Se puede considerar que no existen diferencias significativas entre los tres métodos? b.1) Formular el problema como un contraste de hipótesis. b.2) ¿Cuál es el estadístico de contraste del test correspondiente?. Interpretar el resultado del test en la gráfica de la distribución apropiada. Considerar un nivel de significación del 5%. c) Obtener un intervalo de confianza del 95% para cada una de las diferencias de medias poblacionales posibles. A.36. En un estudio para comparar cuatro variedades de melón, se cultivó cada una de las variedades en seis parcelas. Todas las parcelas eran similares. Las variedades se asignaron a las parcelas al azar, obteniéndose los datos y la tabla ANOVA que siguen a continuación. Cosecha Variedad A B C D 25.12 40.25 18.30 28.55 17.25 35.25 22.60 28.05 26.42 31.98 25.90 33.20 Datos 16.08 36.52 15.05 31.68 22.15 43.32 11.42 30.32 15.92 37.10 23.68 27.58 Global Media 20.49 37.40 19.49 29.90 26.82 Varianza 22.04 15.61 30.91 4.97 Fuente: Mead, R.; Curnow, R.N. y Hasted, A.M. (1998). Statistical Methods in agriculture and experimental biology. Chapman & Hall __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 22 Tabla ANOVA Fuente de Variación Variedades Error Total Suma de cuadrados 1291.477 Grados de libertad Cuadrado medio 430.492 Valor de F Puntos críticos (tablas de la F ) 5% 1% 3.0984 4.9382 1659.130 a) Completar la tabla indicando las relaciones entre las diferentes cantidades de la misma. b) ¿Existen diferencias significativas entre las variedades de melón con un nivel de significación α = 0.05 ?. ¿Y con α = 0.01 ?. ¿Cuál es la conclusión en base al nivel de significación crítico?. c) Calcular un intervalo de confianza de un nivel de confianza del 95% para la diferencia de medias de las cosechas entre las variedades A y D ( µ1 − µ 4 ). A.37. En una fábrica de galletas se desea saber si las harinas de sus cuatro proveedores producen la misma viscosidad en la masa. Para ello, produce durante un día 20 masas, 5 de cada tipo de harina y mide su viscosidad. Los resultados obtenidos se muestran en la siguiente tabla, junto con varias medidas de resumen, los gráficos de cajas asociados y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN viscosidad de la masa A B C D 97 97 99 96 91 91 96 92 96 95 97 95 95 96 100 98 92 93 98 94 media 94,2 94,4 98 95 Q1 92 93 97 94 Q2 95 95 98 95 Q3 96 96 99 96 Fuente: Garcia Leal, J. y otros (2007). Técnicas estadísticas aplicadas a la Biología.. Proyecto Sur Ediciones TABLA ANOVA Suma de Grados de Cuadrado Valor Variabilidad cuadrados libertad medio de F Entre proveedores 15,6 Residual 16 Total 126,8 a) Para la muestra del proveedor 1: a.1) Explicar cómo se obtiene la caja correspondiente. a.2) ¿Cuáles son los valores de las medidas de tendencia central y de dispersión que se reflejan en la caja? b) Para examinar si se puede considerar que en términos medios la viscosidad de la masa es la misma con la harina de los cuatro proveedores, se pide: b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? b.2) Representar en la gráfica de la distribución adecuada la región crítica del test de un nivel de significación del 10%. ¿Cuál es el resultado del test? b.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. c) Comparar mediante el método de la mínima diferencia significativa la viscosidad de la masa con las harinas de los proveedores 3 y 4. ¿Cuál es el resultado del test con un nivel de significación del 10%? ¿Y con un nivel de significación del 5%? A.38 Se llevó a cabo una evaluación metalúrgica de la resistencia de materiales fabricados con cuatro aleaciones de acero diferentes, A, B, C y D. Se fabricaron cinco barras del mismo tamaño y forma con cada una de las aleaciones y se sometieron a una fuerte tensión hasta alcanzar una deformación permanente. Los datos que siguen a continuación representan los máximos niveles de tensión (psi) logrados con cada barra y un análisis estadístico preliminar. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 23 TABLA ANOVA DATOS Y MEDIDAS DE RESUMEN A B C D 13,55 13,44 16,43 17,13 A B C D Total 14,24 13,75 15,88 17,77 11,97 12,88 16,93 16,55 media 13,108 13,302 16,384 17,142 14,984 12,56 14,11 17,33 16,23 13,22 12,33 15,35 18,03 desviación típica Fuente Aleaciones Error exper. Total Suma de Grados de Cuadrado cuadrados libertad medio 64,827320 21,609106,67 9,963760 0,622735 74,791080 Valor de F COMPARACIÓN POR PARES Comparación: µi − µ j A con B µ1 − µ2 B con C µ 2 − µ3 C con D µ3 − µ 4 yi • − y j • Fuente: Probability and Statistics for modern Engineering. PWS-Kent Límite inferior Límite superior Asumiendo que los datos son cuatro muestras independientes de variables normales con la misma varianza, se pide: a) Examinar si se puede considerar que en términos medios la resistencia de una barra es la misma para cualquiera de las cuatro aleaciones de acero, indicando: a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. a.3) Cuál es el resultado del test para un nivel de significación del 5%. Interpretarlo en la gráfica de la distribución de referencia. b) Si procede, comparar los pares de medias señalados en la tabla de “comparación por pares”. Obtener para ello, mediante el método de la mínima diferencia significativa, los intervalos de confianza del 95% correspondientes a cada diferencia de medias e interpretarlos. A.39 Se quiere averiguar si el porcentaje medio de proteínas en la leche se ve afectado por el tipo de pienso, se seleccionaron 15 vacas similares las cuales fueron asignadas al azar a tres grupos, cada uno de cinco vacas. En los dos primeros grupos, se incluyó en la dieta un pienso elaborado con productos transgénicos: en un grupo se usó pienso elaborado con soja A5403, y en el otro pienso elaborado con maíz T25. En el tercer grupo se incluyó un pienso convencional. Los resultados obtenidos fueron los siguientes. pienso: soja A5403 maíz T25 tradicional porcentaje 82,1 82,3 86,5 83,2 90,3 86,5 de proteínas 84,6 84,1 83,2 83,3 91,5 90,2 en la leche 83,1 84,2 89,3 media 83,24 84,08 89,56 varianza 1,198 2,007 3,538 Media global: 85,6267 Varianza global: 10,3407 Fuente: García Alonso, A. (2008). Ejercicios de estadística aplicada. UNED Fuente de Variación Pienso Error experimental Total Suma de Grados de Cuadrado cuadrados libertad Medio 117,7973 26,9720 144,76933 Valor de F H 0 : µi = µ j H 0 : µ1 = µ3 H 0 : µ 2 = µ3 yi • − y j • Error típico t a) Completar la tabla e indicar cuál es el modelo de análisis de la varianza asociado a la muestra. ¿Qué hipótesis sobre las muestras se asumen en el análisis estadístico asociado a la tabla ANOVA? b) ¿Se puede considerar que en términos medios el pienso no influye en el porcentaje de proteína de la leche de las vacas? __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 24 b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste del test correspondiente?. b.2) ¿Cuál es el resultado del test con un nivel de significación del 5%? b.3) Representar gráficamente el nivel de significación crítico del test correspondiente y acotar su valor. c) Comparar mediante el método de la mínima diferencia significativa cada una de las dietas con piensos transgénicos con la dieta de pienso convencional. Considerar un nivel de significación del 5%. A.40 Se llevó a cabo un estudio en un grupo determinado de población (sujetos del mismo sexo, de la misma edad, semejante peso inicial y antecedentes hereditarios similares) para comparar cuatro medicamentos antihiperlipidémicos diferentes. Los sujetos con hiperlipidemia presentan bajos niveles de HDL-C. En el grupo poblacional indicado, se seleccionó una muestra aleatoria de 64 sujetos con hiperlipidemia los cuales fueron asignados al azar a cuatro tratamientos con los medicamentos A, B, C y D. Después de seis meses con dichos tratamientos, se tomaron las muestras de sangre correspondientes y se midieron los niveles de HDL-C. Los resultados obtenidos y un análisis preliminar son los siguientes. DATOS Y MEDIDAS DE RESUMEN A B C D 21 26 28 33,7 37,6 41,6 37,5 41,4 20 26 29,5 32,1 39,7 39 39,8 39 A B C D 22,8 24,3 30,6 32,1 37,8 43,9 37,7 43,8 23,9 24,2 31,7 33,2 41,9 43 41,4 43 media 24,2250 32,0313 39,8250 39,7750 23,4 25,8 30,9 31,4 39,5 39,6 39,2 39,4 TABLA ANOVA 24 24,1 31,4 34 35 36,7 35 36,6 23,5 26,3 32,6 34,1 40,5 40,7 40,8 40,8 25,4 26,9 32,1 35,1 38,2 42,5 38,3 42,7 Suma de Grados de Fuente cuadrados libertad Medicamento 2667,2430 Error exper. 278,5044 Total 2945,7473 Cuadrado medio 889,0810 4,6417 Valor de F Punto crítico del 5% 2,7581 COMPARACIÓN POR PARES desviación típica 1,8849 1,8066 2,4236 2,4242 Comparación: diferencia media yi  − y j  Error típico Límite inferior Límite superior A con B µ1 − µ2 B con C µ 2 − µ3 C con D µ3 − µ 4 0,7617 Fuente: Díaz Narváez, V. P. (2009). Metodología de la investigación científica y bioestadística para profesionales y estudiantes de ciencias de la salud. Universidad Finis Terrae Asumiendo que los datos son cuatro muestras independientes de variables normales con la misma varianza, se pide: a) Examinar si se puede considerar que en términos medios los niveles de HDL-C son iguales con los cuatro medicamentos, indicando: a.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. a.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. a.3) Cuál es el resultado del test para un nivel de significación del 5%. Interpretarlo en la gráfica de la distribución de referencia. b) Si procede, comparar los niveles medios de HDL-C señalados en la tabla de “comparación por pares” en base a los intervalos de confianza del 95% obtenidos mediante el método de la mínima diferencia significativa. A.41 Se desea comparar la capacidad de cuatro laboratorios (A, B, C y D) para determinar la pureza en muestras de 1-bromopropano. Se tomaron 20 muestras homogéneas que fueron asignadas al azar a los laboratorios para su análisis. A continuación se presentan los resultados, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. Pureza 1-bromopropano A 73 75 73 75 73 B 74 74 75 74 74 C 68 69 69 70 69 D 71 72 72 71 73 media desviación típica A 73,8 1,095445 B 74,2 0,447214 C 69 0,707107 D 71,8 0,83666 TABLA ANOVA Fuente de variación Laboratorio Error experimental Total Suma de Grados de cuadrados libertad Cuadrado medio 28,2667 0,6500 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C A con D B con C B con D C con D límite inferior 3,72 0,92 4,12 1,32 -3,88 límite superior 5,88 3,08 6,28 3,48 -1,72 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 25 a) Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación de la pureza es la misma en cualquiera de los cuatro laboratorios, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando: c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se pueden extraer de cada uno de los seis intervalos de confianza de la tabla de “comparación por pares”? d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?. A.42 Para comparar los métodos que siguen tres laboratorios (A, B y C) para la determinación del lasalócido de sodio en un producto alimenticio para aves de corral, se proporcionaron muestras homogéneas de dicho alimento a los laboratorios. El laboratorio A es el laboratorio de referencia en la actualidad por lo que realizó nueve determinaciones independientes del lasalócido de sodio, mientras que los otros dos realizaron cada uno cinco determinaciones independientes. A continuación se presentan los resultados de cada laboratorio, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN Lasalócido de sodio A B C Lasalócido de sodio A B C 87 86 88 85 84 84 89 84 media 85,56 87 83,8 85 88 85 83 87 86 87 86 83 86 81 desviación típica 1,666667 1,581139 1,923538 TABLA ANOVA Fuente de Suma de Grados de variación cuadrados libertad Laboratorio Error experim. Total Cuadrado medio 12,8573 2,9389 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 90% Comparación A con B A con C B con C límite inferior 1,3071 límite superior 5,0929 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? Escribir la expresión del modelo de análisis de la varianza identificando cada uno de sus términos. b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación del lasalócido de sodio es la misma en cualquiera de los tres laboratorios, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener los intervalos de confianza del 90% para las diferencias de medias µ A − µ B y µ A − µC basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega en base a los tres intervalos de confianza de la tabla de “comparación por pares”? Contestad indicando además: c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados. c.2) Cuál son las expresiones matemáticas de los intervalos de confianza. c.3) Cuáles son los intervalos de confianza obtenidos. d) En la comparación de A con C, ¿se llegaría a la misma conclusión si se considerase un intervalo de confianza de un nivel de confianza del 95%? A.43. La anfetamina es una sustancia que suprime el apetito. En un estudio, una farmacóloga asignó aleatoriamente 24 ratas similares a tres grupos. Las ratas de cada grupo recibieron una inyección: las del primer grupo, de una solución salina (dosis 0 mg/kg de anfetamina), las del segundo grupo con una dosis de 2,5 mg/kg __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 26 de anfetamina, y las del tercer grupo con una dosis de 5 mg/kg de anfetamina. A las tres horas siguientes a la administración de la inyección se midió la cantidad de alimento consumido por cada animal (g de alimento consumido por kg de peso corporal). Los datos obtenidos y un análisis preliminar se muestran a continuación. dosis anfetamina D1: 0 mg/kg D2: 2,5 mg/kg D3: 5 mg/kg consumo de alimento (g/kg) media 112,6 102,1 90,2 81,5 105,6 93 106,6 108,3 99,9875 73,3 84,8 67,3 55,3 80,7 90 75,5 77,1 75,5 38,5 81,3 57,1 62,3 51,5 48,3 42,7 57,9 54,95 desviación típica 10,6521 10,7335 13,3012 Suma de Grados de Cuadrado Comparación por pares. Intervalos de confianza del 95% Variabilidad cuadrados libertad medio F p-valor Comparación: D1 con D2 D1 con D3 D2 con D3 µi − µ j Entre dosis 8134,1775 0,000001 µ1 − µ2 µ1 − µ3 µ 2 − µ3 Residual 21 yi • − y j • 24,4875 45,0375 Total 10973,366 lím. inferior 12,397 32,947 lím. Superior 36,578 57,128 a) Para examinar si se puede considerar que en términos medios la cantidad de alimento consumida por animal es la misma con cualquiera de las tres dosis, se pide: a.1) Completar la tabla ANOVA. a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado del test? b) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. c) Obtener, mediante el método de la mínima diferencia significativa, el intervalo de confianza del 95% para la diferencia de medias µ2 − µ3 que completa la tabla de comparación por pares, indicando: c.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál es la expresión matemática del intervalo. c.2) ¿Qué conclusiones se obtienen a partir de los intervalos de confianza de la tabla de comparación por pares? d) Indicar cuál es el modelo de análisis de la varianza en el que se basa el análisis estadístico del apartado a). ¿Cuál es la expresión matemática del cuadrado medio residual, cuál es su valor, y qué estima? A.44 Los televisores de un fabricante tienen una pieza que puede ser suministrada por tres proveedores, A, B y C. Se desea comparar los tiempos de vida en horas de las piezas de dichos proveedores. Se tomaron al azar 3 piezas de A, 5 de B y 4 de C y se examinó su tiempo de vida (h), con los que se llevó a cabo el siguiente análisis estadístico de datos, que está incompleto. DATOS Y MEDIDAS DE RESUMEN Tiempo de vida A 407 411 409 B 404 406 408 405 402 C 410 408 406 408 Media desviación típica A 409 2 B 405 2,2361 C TABLA ANOVA Fuente de variación Proveedor Error experimental Total Suma de Grados de cuadrados libertad Cuadrado medio Valor de F 4,5 4 11 COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C B con C límite inferior -2,456 -6,035 límite superior 4,456 0,035 Fuente: Spiegel, M.R. et al (2009) Probabilidad y Estadística. McGraw-Hill a) Para el proveedor C, obtener la media y desviación típica muestrales, indicando su expresión matemática. Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el tiempo de vida es el mismo para cualquiera de los tres proveedores, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 27 c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando: c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se pueden extraer de cada uno de los tres intervalos de confianza de la tabla de “comparación por pares”? A.45. Se midió la concentración de S-colesterol en 4 grupos de 5 participantes en diferentes dietas. Los participantes eran todas personas de características similares, y fueron asignadas al azar a las dietas. Los datos obtenidos y un análisis preliminar se muestran a continuación. DATOS Y MEDIDAS DE RESUMEN Dieta 1 Dieta 2 Dieta 3 Dieta 4 5,2 6,6 4,2 5,9 5,6 6,2 4,9 4,7 6,8 7,9 5,6 5,8 6,3 8,2 3,7 4,9 5,9 5,7 4,5 5,6 Media 5,96 6,92 4,58 5,38 desv. típica 0,61887 1,08490 0,71903 0,54498 Q1 5,6 6,2 4,2 4,9 Q2 5,9 6,6 4,5 5,6 Q3 6,3 7,9 4,9 5,8 Daniel, W (2004). Bioestadística. Ed. Limusa TABLA ANOVA: Variabilidad Entre dietas Residual Total Comparación: µi − µ j Suma de cuadrados D1 con D2 µ1 − µ2 Grados de Cuadrado Valor libertad medio de F 4,8540 0,5935 Intervalos de confianza del 95%: D1 con D3 D1 con D4 D2 con D3 µ1 − µ3 µ1 − µ4 µ 2 − µ3 D2 con D4 µ2 − µ4 D3 con D4 µ3 − µ 4 yi • − y j • -0,80 -0,96 lím. inferior -1,9929 -1,8329 lím. superior 0,07290 0,23290 a) Identificar los cuartiles en el gráfico de cajas y comentar el tipo de asimetría de las distribuciones muestrales. b) Calcular las medidas de dispersión representadas en el gráfico de cajas correspondientes a las dietas 1 y 2 y compararlas. c) Para examinar si se puede considerar que en términos medios la concentración de S-colesterol es la misma con las cuatro dietas, se pide: c.1) Completar la tabla ANOVA. c.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? c.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado del test? c.4) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. d) Obtener, mediante el método de la mínima diferencia significativa, un intervalo de confianza del 95% para cada par de diferencia de medias µi − µ j . En base a los intervalos, ¿con qué dieta/s cabe esperar el nivel de colesterol más bajo? A.46. Un laboratorio desea comparar tres métodos para la determinación de los niveles de glucosa en bebidas refrescantes: el método A, que utiliza un ensayo espectroscópico; el B, que utiliza un electrodo enzimático, y el C, que utiliza HPLC y es el método oficial (indicado por la AOAC, Asscociation of Official Analytical Chemists). Se realizó un experimento con 18 muestras homogéneas de refresco, que se repartieron al azar en tres grupos de seis. En cada grupo se determinó el nivel de glucosa (en mM) con una técnica. Los resultados obtenidos y algunas medidas de resumen se muestran a continuación. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 28 TABLA ANOVA DATOS Y MEDIDAS DE RESUMEN A B C 1,9 1,82 1,7 1,94 1,85 1,9 1,35 1,65 1,76 1,41 1,80 1,33 1,92 1,82 1,85 1,79 1,89 1,95 Fuente: Hibbert D.B. y Gooding, J.J. (2006). Data analysis for chemestry. Oxford University Press A B C media desviación típica 1,851667 0,085422 1,55 0,211943 1,87 0,060992 Suma de Grados de cuadrados Libertad 0,387478 0,279683 0,667161 Variabilidad Entre métodos Residual Total Comparación: H 0 : µi = µ j A con B H 0 : µ1 = µ2 Cuadrado medio Valor de F 0,018646 A con C H 0 : µ1 = µ3 B con C H 0 : µ 2 = µ3 yi • − y j • Error típico Estadístico t a) Para examinar si se puede considerar que en términos medios los resultados de los tres métodos son iguales, se pide: a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del test? a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. b) Si procede, comparar mediante el método de la mínima diferencia significativa las medias de cada par de dietas. Considerar un nivel de significación del 5%. A.47. En una ciudad se determinó la cantidad de fluoruro en el suministro de agua local mediante cuatro métodos colorimétricos, A, B, C y D. Con el fin de garantizar muestras de agua homogéneas, se tomaron todas de un único barril de 40 litros de agua. A continuación se presentan los datos obtenidos (en ppm) y un análisis estadístico preliminar incompleto. A B C D 2 5 1 3 A B C D fluoruro 3 6 4 4 3 2 1 1 TABLA ANOVA 5 2 4 2 media varianza 3,6 2,8 1,6 1,3 1,7 0,8 4 3 4 1 Variabilidad Entre métodos Residual Total Suma de Grados de cuadrados libertad Cuadrado medio 5,6 1,575 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C A con D B con C B con D C con D límite inferior ─1,28 ─0,48 ─0,88 0,32 ─0,48 límite superior 2,08 2,88 2,48 3,68 2,88 Fuente:Lazic Z.R. (2005); Design of Experiments in Chemical Engineering, A Practical Guide. Wiley Se asume que las determinaciones del fluoruro (en ppm) por cualquiera de los cuatro métodos sigue una distribución normal, con varianza constante σ2. a) Para completar el análisis preliminar se pide: a.1) Calcular la media y la varianza muestrales de las determinaciones del método A, ¿qué parámetros se estiman con dichos valores? ¿Son la media y la varianza muestrales estimadores insesgados de los correspondientes parámetros? ¿Qué interpretación tiene dicha propiedad? a.2) Completar la tabla ANOVA e indicar el valor del estimador insesgado de la varianza del error experimental σ2 así como su expresión matemática. b) ¿Se puede admitir que el método colorimétrico empleado no influye en la determinación del fluoruro (esto es, en términos medios los cuatro métodos dan igual)? Contestar respondiendo a los siguientes apartados. b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y cuál es la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test en base al p-valor. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 29 c) La tabla de “comparación por pares” contiene intervalos de confianza del 95% para varias diferencias de medias µi − µ j , obtenidos por el método de la mínima diferencia significativa. Si procede comparar las medias por pares, indicar: c.1) A qué conclusión se llega con cada uno de los cinco intervalos de confianza ya facilitados. c.2) Cuál es el intervalo de confianza correspondiente a la comparación A con D ( µ1 − µ 4 ). Especificar: i) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. ii) Cuál es la expresión matemática del intervalo de confianza, el intervalo obtenido y la conclusión. d) Indicar: d.1) la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. d.2) en el test del apartado b), cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1%; ¿cuál es el resultado del test para dicho nivel de significación? A.48 Se desea comparar la capacidad de cuatro laboratorios (A, B, C y D) para determinar la pureza en muestras de 1-bromopropano. Se tomaron 20 muestras homogéneas que fueron asignadas al azar a los laboratorios para su análisis. A continuación se presentan los resultados, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN Pureza 1-bromopropano 73 75 73 75 73 74 74 75 74 74 68 69 69 70 69 71 72 72 71 73 media desviación típica A 73,8 1,095445 B 74,2 0,447214 C 69 0,707107 D 71,8 0,83666 A B C D TABLA ANOVA Fuente de variación Laboratorio Error experimental Total Suma de Grados de cuadrados libertad Cuadrado medio 28,2667 0,6500 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C A con D B con C B con D C con D límite inferior 3,72 0,92 4,12 1,32 -3,88 límite superior 5,88 3,08 6,28 3,48 -1,72 a) Completar la tabla. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la determinación de la pureza es la misma en cualquiera de los cuatro laboratorios, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener el intervalo de confianza del 95% para la comparación A con B basada en el método de la mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando: c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ A − µ B . ¿Qué conclusiones se pueden extraer de cada uno de los seis intervalos de confianza de la tabla de “comparación por pares”? d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del apartado b). ¿Cuál es el resultado del test para dicho nivel de significación?. A.49 Un fabricante de neumáticos realizó unas pruebas en laboratorio para comparar sus neumáticos (marca A=M1) con los de dos marcas competidoras (B=M2 y C=M3). Mediante un estudio de simulación se determinó el recorrido en miles de millas (en iguales condiciones de conducción para las tres marcas) hasta que el desgaste alcanzó un valor determinado. A continuación se presentan los datos obtenidos (miles de millas) y un análisis estadístico preliminar incompleto. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 30 DATOS Marca M1 M2 M3 65 61 65 61 62 67 62 63 68 64 60 66 63 64 65 59 64 62 MEDIDAS ESTADÍSTICAS DE RESUMEN desviación Marca media típica Q1 Q2 M1 63 1,58114 62 63 M2 61,75 1,66905 60,5 62 M3 65,83 1,47196 65 65,5 63 Q3 64 63 67 Fuente: Quirk, T.J. (2016) Excel 2016 for Engineering Statistics. Springer TABLA ANOVA Variabilidad Entre marcas Residual Total Suma de cuadrados Grados de libertad Cuadrado medio 16 2,5208 Valor de F 11,52 COMPARACIÓNES POR PARES. Intervalos de confianza del 95% para la diferencia de medias Comparación límite inferior límite superior M1-M2 ─0,67 3,17 M1-M3 M2-M3 ─5,90 ─2,27 Se asume que el desgaste de los neumáticos de cualquiera de las tres marcas sigue una distribución normal, con varianza constante σ2. a) Para completar el análisis preliminar se pide: a.1) Calcular la medida de dispersión representada en el gráfico de cajas de cada marca, ¿qué interpretación tiene dicha medida? Indicar el tipo de asimetría de las correspondientes distribuciones muestrales, en base al gráfico de cajas, y en base a las medidas de tendencia central disponibles para cada marca en la tabla de “medidas estadísticas de resumen”. a.2) Completar la tabla ANOVA e identificar el valor del estimador insesgado de la varianza del error experimental así como su expresión matemática. ¿Qué significa que el estimador sea insesgado? b) Examinar, en base al p-valor, si se puede considerar que el recorrido medio hasta llegar al desgaste prefijado se puede considerar el mismo para las tres marcas, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener el intervalo de confianza del 95% para la diferencia de medias µ1 − µ3 utilizando el método de la mínima diferencia significativa. Indicar: c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) ¿Cuál es el intervalo de confianza obtenido para µ1 − µ3 ? Interpretar los tres intervalos de confianza de la tabla de “comparación por pares”. ¿A qué conclusiones se llega? d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del apartado b). ¿Cuál es el resultado del test para dicho nivel de significación? A.50 En un estudio de laboratorio se consideraron n=18 muestras homogéneas de un mismo compuesto orgánico para determinar su porcentaje de cloro. Para llevar a cabo las determinaciones se prepararon otras tantas soluciones de nitrato de plata (AgNO3), n1=5 con nitrato de plata del fabricante, A, n2=6 con nitrato de plata del fabricante B, y n1=7 con nitrato de plata del fabricante C. La asignación de las muestras del compuesto orgánico a las soluciones de nitrato de plata de los diferentes fabricantes se hizo al azar. Los porcentajes de cloro obtenidos, algunas medidas de resumen y parte de la tabla de análisis de la varianza se muestran a continuación. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 31 Fabricante c l o r o Medidas resumen media varianza A 5,2 4,4 5,45 5,8 5,6 5,29 0,2955 B 5,5 5,1 5,5 5,98 5,6 5,56 C 4,45 5,45 4,65 4,4 4,9 4,95 5,4 5,54 0,0789 TABLA ANOVA Variabilidad Fabricante Residual Total Suma de Grados de cuadrados libertad 1,4209 2,6450 17 Cuadrado medio 0,1763 COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C B con C límite inferior ─0,7920 ─0,1198 límite superior 0,2920 0,9284 a) Obtener el valor, e indicar la expresión matemática, de la media y de la varianza de las determinaciones de cloro llevadas a cabo con nitrato de plata del fabricante C. ¿Cuál es el valor de la medida de tendencia central y de la medida de dispersión representadas en el gráfico de cajas correspondiente a la muestra C?. ¿Cuál es la interpretación de dichas medidas? ¿Qué otra información se puede extraer de dicho gráfico? Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, el porcentaje de cloro (en el compuesto orgánico considerado) es el mismo cualquiera que sea el fabricante del nitrato de plata utilizado. Responder contestando a las siguientes cuestiones: b.1) Cuáles son la hipótesis nula y la hipótesis alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener el intervalo de confianza del 95% para para la diferencia de medias µ B − µC basada en el método de la mínima diferencia significativa. Explicar el cálculo de dicho intervalo indicando: c.1) Cuáles son el estadístico y la distribución de referencia y los puntos críticos utilizados. c.2) Cuál es la expresión matemática del intervalo de confianza. c.3) Cuál es el intervalo de confianza obtenido para la diferencia de medias µ B − µC . c.4) ¿Qué conclusiones se pueden extraer de cada uno de los tres intervalos de confianza de la tabla de “comparación por pares”? d) Escribir la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. Cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1% en el test del apartado b). ¿Cuál es el resultado del test para dicho nivel de significación? A.51. Un laboratorio desea comparar tres métodos para la determinación de los niveles de glucosa en bebidas refrescantes: el método A, que utiliza un ensayo espectroscópico; el B, que utiliza un electrodo enzimático, y el C, que utiliza HPLC y es el método oficial (indicado por la AOAC, Asscociation of Official Analytical Chemists). Se realizó un experimento con 18 muestras homogéneas de refresco, que se repartieron al azar en tres grupos de seis. En cada grupo se determinó el nivel de glucosa (en mM) con una técnica. Los resultados obtenidos y algunas medidas de resumen se muestran a continuación. DATOS Y MEDIDAS DE RESUMEN A B C 1,9 1,82 1,7 1,94 1,85 1,9 1,35 1,65 1,76 1,41 1,80 1,33 1,92 1,82 1,85 1,79 1,89 1,95 Fuente: Hibbert D.B. y Gooding, J.J. (2006). Data analysis for chemestry. Oxford University Press A B C media desviación típica 1,851667 0,085422 1,55 0,211943 1,87 0,060992 Valor de F TABLA ANOVA Variabilidad Entre métodos Residual Total Comparación: H 0 : µi = µ j Suma de Grados de cuadrados Libertad 0,387478 0,279683 0,667161 A con B H 0 : µ1 = µ2 Cuadrado medio Valor de F 0,018646 A con C H 0 : µ1 = µ3 B con C H 0 : µ 2 = µ3 yi • − y j • Error típico Estadístico t __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 32 a) Para examinar si se puede considerar que en términos medios los resultados de los tres métodos son iguales, se pide: a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del test? a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. b) Si procede, comparar mediante el método de la mínima diferencia significativa las medias de cada par de dietas. Considerar un nivel de significación del 5%. A.52. Para comparar los métodos que siguen tres laboratorios (L1, L2 y L3) para la determinación de la concentración de albúmina en suero sanguíneo, se proporcionó a cada laboratorio una muestra de un mismo suero estándar. Cada laboratorio realizó seis determinaciones independientes de la concentración de albúmina. A continuación se presentan los resultados de cada laboratorio, varias medidas de resumen muestrales, los gráficos de cajas asociados y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN concentración (g/l) media Q1 Q2 Q3 L1 41,3 42,3 42,1 41,2 42,9 41,7 41,3 41,9 42,3 L2 42,7 40,5 40,2 41,8 43,1 42,2 41,75 40,5 42 42,7 L3 43,7 43,4 42,9 43,1 44,3 42,1 43,25 42,9 43,25 43,7 Fuente: Sánchez, J. y Villalobos, M. (2010). Tratamiento de los resultados analíticos. Cano Pina – Ediciones Ceysa TABLA ANOVA Variabilidad Entre laboratorios Residual Total Suma de Grados de Cuadrado cuadrados libertad medio 4,0556 15 0,7852 17 Valor de F a) Para la muestra correspondiente al laboratorio 1: a.1) Calcular la media y la desviación típica. a.2) Indicar los valores de las medidas de tendencia central y de dispersión que se reflejan en el gráfico de cajas. b) Para examinar si se puede considerar que en términos medios los resultados de los tres laboratorios son iguales, se pide: b.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? b.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del test? b.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. c) Comparar mediante el método de la mínima diferencia significativa las determinaciones de los laboratorios 1 y 3. Considerar un nivel de significación del 5%. A.53. En un estudio sobre el proceso de blanqueado del papel, se determinó el brillo de la pulpa (el GEB –General electric brightness- expresado como porcentaje de un GEB máximo) en muestras de pulpa homogéneas tratadas con tres blanqueantes químicos diferentes. DATOS BQ1 BQ2 BQ3 TABLA ANOVA 77,20 74,47 72,75 76,21 72,88 80,52 79,31 81,91 80,35 77,39 79,42 78,02 81,60 80,80 80,63 media BQ1 BQ2 BQ3 desv. típica 74,702 1,9810 79,896 1,6789 80,094 1,3973 Fuente: Ugarte, MD y otros (2008) Probability and statistics with R.. CRC Press Variabilidad Entre blanqueantes Residual Total Comparación: estimación\parámetro yi • − y j • límite inferior límite superior Suma de Grados de cuadrados libertad 93,4842 Cuadrado medio Valor de F 2,8985 BQ1 con BQ2 µ1 − µ2 BQ1 con BQ3 µ1 − µ3 BQ2 con BQ3 µ 2 − µ3 -7,540064 -2,847936 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 33 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar si se puede considerar que el brillo de la pulpa es el mismo con los tres blanqueantes, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test para un nivel de significación del 5%. c) Si procede, comparar mediante el método de la mínima diferencia significativa las medias del brillo de cada par de blanqueantes, en base a intervalos de confianza del 95%. A.54. Se llevó a cabo un experimento para examinar el efecto de la velocidad de flujo del C2F6 sobre la uniformidad del grabado químico de una oblea de silicio usada en la fabricación de circuitos integrados. Se probaron tres velocidades de flujo, cada una en seis unidades de prueba. La uniformidad resultante (en porcentaje) y un análisis estadístico preliminar son los siguientes. DATOS Y MEDIDAS DE RESUMEN Q1 Q3 flujo de C2F6 (SCCM) 2,7 3,8 125 4,2 4,9 160 3,4 4,6 200 2,6 2,7 3 3,2 3,8 4,6 3,6 4,2 4,2 4,6 4,9 5 2,9 3,4 3,5 4,1 4,6 5,1 Fuente: Montgomery (2003) Diseño y análisis de experimentos. Limusa-Wiley flujo de C2F6 (SCCM) 125 160 200 media desviación típica 4,4167 3,9333 0,523132 0,821381 TABLA ANOVA Variabilidad Entre flujos Residual Total Suma de Grados de cuadrados libertad Cuadrado Medio 1,8239 0,5087 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 90% comparación límite inferior límite superior 125con 160 125 con 200 160 con 200 -0,3781 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? Calcular la media y la desviación típica de la uniformidad correspondientes a un flujo de 125 SCCM de C2F6. b) Examinar, considerando un nivel de significación del 10%, si se puede considerar que, en términos medios, la velocidad del flujo afecta a la uniformidad del grabado químico, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener, si procede, los intervalos de confianza del 90% para las diferencias de medias µi − µ j basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega? A.55. Para evitar la corrosión por picadura de unas chapas metálicas expuestas en el exterior se emplean tres tratamientos, A, B y C. En un estudio se tomaron 15 chapas homogéneas, que se asignaron al azar a tres grupos, aplicándose un tratamiento distinto a cada grupo. Tras un período determinado se midió la profundidad de las picaduras (en mm) en cada chapa Los datos obtenidos y un análisis preliminar se muestran a continuación. DATOS Y MEDIDAS DE RESUMEN Profundidad de las picaduras A 1 1,5 1,3 1,4 1,3 B 1,1 1,6 1,5 1,5 1,4 C 1,7 1,7 1,6 1,7 1,8 Profundidad de picaduras media desviación típica A 1,3 0,187083 B 1,42 0,192354 C 1,7 0,070711 TABLA ANOVA Suma de Grados de Variabilidad cuadrados libertad Tratamiento Residual Total Cuadrado medio 0,2107 0,0257 Valor de F Comparaciones por pares. Intervalos de confianza del 95% comparación A con B A con C B con C límite inferior -0,3408 límite superior 0,1008 __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 34 a) Para examinar si se puede considerar que en términos medios la profundidad de las picaduras es la misma con cualquiera de los tres tratamientos, se pide: a.1) Completar la tabla ANOVA. a.2) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.3) Representar en la gráfica de la distribución adecuada el nivel de significación crítico. ¿Cuál es el resultado del test? b) Indicar qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. c) Obtener, mediante el método de la mínima diferencia significativa, un intervalo de confianza del 95% para la diferencia de medias µ1 − µ3 y otro para µ2 − µ3 , indicando: c.1) Cuál es el estadístico pivote y su distribución, qué valores se utilizan de dicha distribución, y cuál es la expresión matemática del intervalo. c.2) ¿Qué conclusiones se obtienen a partir de los intervalos de confianza de la tabla de comparación por pares? d) Indicar cuál es el modelo de análisis de la varianza en el que se basa el análisis estadístico del apartado a). ¿Cuál es la expresión matemática del cuadrado medio residual, cuál es su valor, y qué estima? A.56. En un estudio sobre el principio activo de determinados comprimidos participaron tres laboratorios (A, B y C). Se seleccionaron al azar 18 comprimidos y se asignaron aleatoriamente 6 a cada laboratorio. Cada laboratorio determinó la cantidad en mg de ingrediente activo por comprimido. A continuación se presentan los resultados obtenidos, varias medidas muestrales de resumen, y parte de la tabla de análisis de la varianza. DATOS Y MEDIDAS DE RESUMEN Contenido (mg) A 6,67 6,79 6,84 6,58 6,89 6,43 B 6,46 6,30 6 6,76 5,96 6,28 C 5,79 6,09 5,96 6,32 6,66 5,81 Q1 6,58 6 5,81 Ingrediente Q3 activo (mg) 6,84 A 6,46 B 6,32 C media 6,700 6,293 6,105 desviación típica 0,174356 0,297635 0,335187 Fuente: Ellinson, SL et al (2009) Practical Statistics for the Analytical Scientist, A Bench Guide. RSC Publishing TABLA ANOVA Variabilidad Entre laboratorios Residual Total Suma de cuadrados Grados de libertad Cuadrado medio 0,5549 0,0771 Valor de F COMPARACIÓN POR PARES. Intervalos de confianza del 95% Comparación A con B A con C límite inferior 0,0649 límite superior 0,7484 a) Para el laboratorio A, obtener e interpretar la medida de tendencia central y la medida de dispersión representadas en el gráfico de cajas. Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? b) Examinar, en base al p-valor, si se puede considerar que, en términos medios, la cantidad de principio activo obtenida por comprimido es la misma en cualquiera de los tres laboratorios, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener los intervalos de confianza del 95% para las diferencias de medias µ A − µC y µ B − µC basados en el método de la mínima diferencia significativa, indicando: c.1) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. c.2) Cuáles son las expresiones matemáticas de los intervalos de confianza. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 B con C 35 c.3) Cuáles son los intervalos de confianza obtenidos. c.4) ¿A qué conclusiones se llega en base a los tres intervalos de confianza de la tabla de “comparación por pares”? d) En la comparación de A con B, ¿se llegaría a la misma conclusión si se considerase un intervalo de confianza de un nivel de confianza del 99%? A.57 Un laboratorio farmacéutico está probando un nuevo antibiótico (N) para tratar una enfermedad infecciosa, y lanzarlo al mercado. Para ello se hizo un estudio con el fin de comparar su efecto con el de otros dos antibióticos ya existentes en el mercado para la misma enfermedad, A y B. La variable respuesta, Y, indica el grado de mejoría del paciente, según cierto parámetro fisiológico, después de serle administrado el tratamiento. Los resultados del ensayo clínico son: Antibiótico A B N 0,4 3,1 2,3 grado 1,1 2,7 3,5 de mejoría 0,7 0,3 3,8 3,0 2,8 3,2 0,9 2,9 2,9 2,7 3,6 3,4 2,8 2,7 Global Media 0,68 3,1 2,99 2,44 Varianza 0,1120 0,1750 0,1743 1,232 La tabla de análisis de la varianza es la siguiente. Suma de cuadrados 20,691 Variabilidad Entre grupos Residual Total Grados de libertad Cuadrado medio 10,3455 Valor de F Ptos. críticos (tablas F) 5% 1% 0.1% 23,408 a) Para examinar si se puede concluir que los antibióticos no tienen en términos medios el mismo grado de efectividad, se pide: a.1) ¿Cuál es el estadístico de contraste del test correspondiente?. a.2) Interpretar el resultado del test en la gráfica de la distribución apropiada. Considerar un nivel de significación del 5%. b) Comparar, si procede, el nuevo medicamento con cada uno de los ya existentes mediante el método de la mínima diferencia significativa. A.58 El agua puede contener radón disuelto en altas cantidades cuando proviene de acuíferos subterráneos. Cuando el agua se expone al aire, se libera el radón que contiene. Se realizó un experimento con agua enriquecida en radón para comparar cuatro diámetros (D1: 0.51, D2: 1.02, D3: 1.40 y D4: 1.99) de los orificios de las duchas domésticas. A continuación se presentan los datos obtenidos (radón liberado, %) y un análisis estadístico preliminar incompleto. D1 D2 D 3: D4 D1 D2 D3 D4 Radón liberado (%) 75 75 79 79 67 72 74 74 62 62 67 69 60 61 64 66 media 77 varianza 2,3094 65 62,75 3,5590 2,7538 TABLA ANOVA Fuente de variación Diámetro Error experimental Total Suma de Grados de cuadrados libertad 109,5000 615,7500 12 15 Cuadrado medio Valor de F 9,1250 Fuente: Montgomery, D.C. & Runger, G. C. (2003). Applied statistics and probability for engineers. Wiley COMPARACIÓN POR PARES. Intervalos de confianza del 95% (MDS): Límite D1 con D2 D1 con D3 D1 con D4 D2 con D3 D2 con D4 D3 con D4 inferior 0,60 7,35 9,60 2,10 4,35 superior 9,90 16,65 18,90 11,40 13,65 Se asume que el radón liberado (%) por cualquiera de los cuatro métodos sigue una distribución normal, con varianza constante σ2. a) Para completar el análisis preliminar se pide: a.1) Calcular la media y la varianza muestrales del radón liberado con orificios de diámetro D2, ¿qué parámetros se estiman con dichos valores? ¿Son la media y la varianza muestrales estimadores insesgados de los correspondientes parámetros? ¿Qué interpretación tiene dicha propiedad? a.2) Completar la tabla ANOVA e indicar el valor del estimador insesgado de σ2, la varianza del error experimental, incluido en la tabla. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 36 b) ¿Se puede admitir que el diámetro de los orificios de la ducha no influye en el radón liberado (esto es, en términos medios, el radón liberado es el mismo con cualquiera de los cuatro diámetros)? Contestar respondiendo a los siguientes apartados. b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y cuál es la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test en base al p-valor. c) La tabla de “comparación por pares” contiene intervalos de confianza del 95% para varias diferencias de medias µi − µ j , obtenidos por el método de la mínima diferencia significativa. Si procede comparar las medias por pares, indicar: c.1) A qué conclusión se llega con cada uno de los cinco intervalos de confianza ya facilitados. c.2) Cuál es el intervalo de confianza correspondiente a la comparación D3 con D4 ( µ3 − µ 4 ). Especificar: i) Cuáles son el estadístico, la distribución de referencia y los puntos críticos utilizados. ii) Cuál es la expresión matemática del intervalo de confianza, el intervalo obtenido y la conclusión. d) Indicar: d.1) la expresión del modelo de análisis de la varianza asociado a la tabla ANOVA identificando cada uno de sus términos. d.2) en el test del apartado b), cuáles son las regiones de aceptación y de rechazo para un nivel de significación del 1%; ¿cuál es el resultado del test para dicho nivel de significación? A.59 Se llevó a cabo un estudio en cierto tipo de animales para comparar el efecto de tres dietas, D1, D2 y D3, sobre el tiempo de coagulación de la sangre. Se eligió una muestra de animales de las mismas características y a cada animal se le asignó una de las tres dietas elegida al azar. Pasado un período prefijado, se determinó el tiempo de coagulación de la sangre. A continuación, se muestran los datos obtenidos (que también figuran en el fichero Excel con tu nombre, en la hoja P4), así como un análisis preliminar incompleto. Se asume que son tres muestras independientes de variables con distribución normal y de igual varianza. D1 62 60 63 59 t i e m p o D2 63 67 71 64 65 66 68 Media desviación típica D3: 56 62 60 61 63 64 63 58 Medidas de resumen D1 D2 61,0000 66,2857 1,8257 2,6904 Tabla ANOVA Variabilidad Entre dietas Residual Total Suma de cuadrados Grados de libertad 106,3036 16 Cuadrado medio 63,7430 6,6440 D3: 60,8750 2,7484 Fuente: Vidakovic (2011); Statistics For Bioengineering Science; Springer Comparaciones de medias por pares, método MDS Valor Intervalos de confianza del 95% para la diferencia de medias Comparación Límite inferior Límite superior de F D1 con D2 -8,7106 -1,8608 D2 con D3 2,5827 8,2387 a) Se pide: a.1) En base al gráfico de cajas, ¿qué tipo de asimetría se aprecia en la distribución muestral del tiempo de coagulación de la sangre con la dieta D3? a.2) Completa la tabla ANOVA. b) Para analizar si se puede considerar que en términos medios el tiempo de coagulación de la sangre es igual con las tres dietas, responde a las siguientes preguntas: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Utilizando la distribución de referencia, expresa matemáticamente el p-valor del test como una probabilidad e indica cuál es el resultado del test. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 37 c) Considera el método de la mínima diferencia significativa (MDS) para la comparación de medias por pares mediante intervalos de confianza del 95%. Indica: c.1) ¿A qué conclusión se llega en las comparaciones de medias correspondientes a los intervalos de confianza incluidos en la tabla “Comparaciones de medias por pares, método MDS”? c.2) Para la diferencia de medias del tiempo de coagulación de la sangre con las dietas D1 y D3, indica cuál es la expresión matemática del intervalo de confianza del 95% y cuál es el valor de cada uno de sus términos. Comenta el intervalo obtenido. A.60. Se pretende estudiar el efecto de la temperatura de conservación de los zumos naturales, sobre la valoración que los consumidores hacen de los mismos. Tras recoger la opinión dada por una muestra de 20 personas, se obtuvieron los siguientes resultados. Temperatura valoraciones media varianza 0º 5º 9,0 7,8 8,5 8,1 8,7 8 8,5 8,4 7,9 8 8,42 8,16 0,227 0,073 10º 7,5 6 7 6,5 6,8 6,76 0,313 15º 6 7 6,5 5,7 5,9 6,22 0,277 La tabla de análisis de la varianza es: Fuente de Suma de Grados de Cuadrado Valor Variación cuadrados libertad medio de F Temperatura Error experimental 16 0,2225 Total 20,658 19 a) Completar la tabla. b) ¿Se puede concluir que la temperatura de conservación influye en la valoración de los consumidores? b.1) Formular el problema como un contraste de hipótesis. b.2) Interpretar el resultado del test en la distribución de referencia en base al p-valor. c) Determinar: c.1) El valor del estadístico de contraste del test de la mínima diferencia significativa para contrastar las hipótesis nulas siguientes (frente a las hipótesis alternativas contrarias correspondientes). H 0 : µi = µ j H 0 : µ 0 = µ5 H 0 : µ5 = µ10 H 0 : µ10 = µ15 yi • − y j • Error típico Estadístico de contraste c.2) ¿Qué tests indican la existencia de diferencias significativas al 5% entre las medias comparadas? c.3) El intervalo de confianza del 95% para la diferencia de medias correspondientes a las temperaturas de 0º C y 15º C. d) ¿Qué hipótesis sobre las muestras son necesarias para la validez de los análisis estadísticos de los apartados b) y c)? A.61 Se está llevando a cabo un estudio para comprobar el efecto de tres dietas diferentes (A, B y C) en el nivel de colesterol de pacientes hipercolesterolémicos. Para ello se han establecido 3 grupos de pacientes similares (elegidos al azar), de tamaños 12, 8 y 10. Los niveles de colesterol, medidos después de dos semanas de dieta, se presentan a continuación. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021 38 TABLA ANOVA DATOS Y MEDIDAS DE RESUMEN A B C A B C 2,9 3,25 3,15 2,8 3 2,35 3,35 3,25 3 3,3 3,25 3,1 3,05 3,25 2,95 2,8 3,1 2,75 3,05 2,6 2,65 2,2 2,55 2,6 2,35 2,6 media 3,15 2,90 2,52 3,1 3 2,6 2,3 Suma de Grados de Variabilidad Cuadrados libertad Entre dietas 2,1727 2 Residual 0,9610 27 Total 3,1337 29 Comparación: H 0 : µi = µ j desviación típica 0,14302 0,19272 0,22998 yi • − y j • Error típico Estadístico t Cuadrado Valor p-valor medio de F 1,0863 30,5213 0,00000012 0,0356 A con B H 0 : µ1 = µ2 A con C H 0 : µ1 = µ3 0,25 0,08611 0,08078 B con C H 0 : µ 2 = µ3 Fuente: Carrasco, J.L. et al. (1994). Ejercicios y problemas de estadística médica. CIBEST a) Para examinar si se puede considerar que en términos medios los resultados de las tres dietas son iguales, se pide: a.1) Formular el problema como un contraste de hipótesis. ¿Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente? a.2) Representar gráficamente el nivel de significación crítico del test correspondiente. ¿Cuál es el resultado del test? a.3) Qué hipótesis sobre las muestras se asumen en el análisis estadístico anterior. b) Si procede, comparar los niveles medios de colesterol de cada par de dietas mediante el método de la mínima diferencia significativa. Considerar un nivel de significación del 5%. A62. Se llevó a cabo un experimento para comparar la resistencia a la tensión de barras fabricadas con aleaciones de fundición a tres altas temperaturas A, B y C. Se seleccionaron 6 barras al azar de cada fundición, obteniéndose los siguientes resultados, que se acompañan con algunos análisis estadísticos. DATOS Y MEDIDAS DE RESUMEN Resistencia Q1 Q3 a la tensión 88 92,9 A 86 90 B 92,5 96,2 C 88 89 88 86 94,8 92,9 86 90 91 85,9 88,6 89,6 92 94,2 96,5 96,2 95,6 92,5 Fuente: Kenett RS & Zacks S (2014) Modern industrial statistics, Wiley Resistencia a la tensión A B C media 89,783 88,517 desviación típica 3,351666 2,132057 TABLA ANOVA Suma de Grados de Fuente cuadrados libertad Fundiciones 119,3033 Error exp. 15 Total Cuadrado medio Valor de F 6,4891 COMPARACIÓN POR PARES. Intervalos de confianza del 95% comparación A con B A con C B con C límite inferior -1,8681 límite superior 4,4014 a) Completar la tabla ANOVA. ¿Qué requisitos deben de verificar las muestras para la validez del análisis estadístico asociado a la tabla ANOVA? Calcular la media y la desviación típica de resistencia a la tensión correspondientes a la fundición C. b) Examinar, considerando un nivel de significación del 5%, si se puede considerar que, en términos medios, la resistencia a la tensión es la misma con cualquiera de las tres fundiciones, indicando: b.1) Cuáles son las hipótesis nula y alternativa del contraste de hipótesis correspondiente. b.2) Cuál es el estadístico de contraste y la distribución de referencia del test correspondiente. b.3) Cuál es el resultado del test. c) Obtener, si procede, los intervalos de confianza del 95% para las diferencias de medias µi − µ j basados en el método de la mínima diferencia significativa. ¿A qué conclusiones se llega? d) Dibujar el gráfico de cajas de la tercera muestra. Identificar una medida de tendencia central y otra de dispersión en el gráfico. Utilizar dicho gráfico para examinar el tipo de asimetría de la distribución muestral. __________________________________________________________________________________________ Grao en Nutrición Humana e Dietética. Facultade de Ciencias, USC-Campus de Lugo Curso 2020-2021

20-21 NHD Problemas traballo ANOVA (tema 5)

Documentos relacionados

Productos

Apoyo

20-21 NHD Problemas traballo ANOVA (tema 5)

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib