SOLUCIONES PRÁCTICA 5. • • IC significa intervalo de confianza. • Para fijar ideas, decir que el IC para la media de las alturas de los individuos de una población es (a, b) al 95% quiere decir P(a<M<b)=0.95. Es decir, que la probabilidad de que la altura media de la población esté entre los valores “a” y “b” es de 0.95. O que el 95% de veces que calculemos la altura media a partir de una muestra de la población, el valor que encontraremos estará entre “a” y “b”. Lee bien los enunciados. El primer paso es averiguar cuál es el parámetro del que hay que calcular el intervalo de confianza. 1.- a) 95,0% IC para la media: [0,919496; 1,58959] b) Se supone que valores de creatina superiores a 1 indicarían que el riñón está afectado por el consumo abusivo de analgésicos. A la vista del IC, para algunas muestras el valor medio de creatina será menor que 1 (en concreto, estará en entre 0,919496 y 1. Para otras muestras será mayor que 1, porque estará entre 1 y 1,58959. De modo que el estudio no es concluyente. Si el IC hubiera sido, por ejemplo, [1,11; 1,58], entonces sí cabría sospechar que el abuso de analgésicos (en trabajadores de esa empresa) afecta al riñón (al 95% de confianza), porque para el 95% de las muestras que tomemos, elvalormedio de creatina es mayor que 1. 2.- a) 95,0% IC para la media: [40,4158; 41,9842]. b) Como se trata de estimar la media muestral y el tamaño de la muestra es 30 (justo en el límite de lo que se considera una muestra grande) no es necesario hacer ninguna hipótesis adicional. Eso es lo que dice el teorema del límite central: ¿has visto el vídeo http://www.bioestadistica.uma.es/baron/apuntes/ficheros/estad_uma_06_simu.mp4? Dura 37 minutos y te facilitará muchísimo entender la parte que queda de curso. 3.- 90,0% IC para p: [0,147895; 0,206149] b) No, porque queda fuera del intervalo...la información extraída de la muestra no apoya esa posibilidad. Fíjate en que, al 95%, para p es [0,142939;0,211835]. Con ese nivel de confianza sí sería plausible que el porcentaje de hipertensas fuera del 21%. 4.-95,0% IC para sigma: [5,07138; 17,3302]. Fíjate en que el enunciado proporciona ya lacuasivarianza. 95,0% IC para sigma cuadrado: [5,07138^2; 17,3302^2] 5.- 90,0% IC para la media: [0,0330196; 0,0509804] El IC está por encima de 0,03. NO es factible la vida en el embalse. 6.- 99,0% IC para p: [0,609916; 0,780301] 7.- Introducimos en Statgraphics, por este orden, los datos de amlodipino y enalapril . También es correcto hacerlo en el orden inverso. Las conclusiones son las mismas, aunque los IC no serán los mismos. En primer lugar, hay que decidir si los datos están o no pareados. La respuesta es NO, porque provienen de poblaciones independientes. Como no están pareados, hay que decidir si podemos suponer que las varianzas son o no iguales. Si fueran exáctamente iguales, su cociente sería 1. De modo que calculamos el IC para el cociente de varianzas y comprobamos si el 1 está o no en su interior. Al 90,0%, IC cociente de varianzas: [0,342231; 3,74478]. El IC obtenido indica que para algunas muestras la varianza que está en el numerador es más pequeña (por eso el cociente está entre 0,342231 y 1. Y para otras es mayor la varianza del numerador, porque el cociente está entre 1 y 3,74478. Como la varianza asociada al uno de los medicamentos no es para el 90% de las muestras mayor/menor que la otra, asumimos que son iguales. Podemos suponer varianzas iguales. Con eso, ya podemos calcular al 90,0% el IC para la diferencia de medias, que es [-3,62383; -0,709506]. Así, para el 90% de muestras que tomes, al calcular media_amlodipino – media_enalapril el resultado esun número menor que 0, en concreto, entre -3,62383 y -0,709506. Eso quiere decir que media_enalapril es mayor que media_amlodipino. Podemos suponer (al 90%) que una funciona mejor que otra porque el intervalo NO contiene al cero. Al 99% el intervalo SI contiene al cero. Así, la misma muestra, con una confianza del 90% indica que un medicamento es más efectivo que el otro, pero indica lo contrario al 99% de confianza. 8.- Los datos no son pareados (¿lo ves?) Calculamos al 90,0% el IC para el ratio varianzas: [0,458919; 0,838719]. Como 1 no está en el IC, concluimos que no son iguales Ahora se calcula 90,0% IC diferencia entre medias: [221,494; 225,706] suponiendo que las varianzas son distintas.(sigmas, dice Statgraphics). La conclusión es que, al 90% de confianza, el peso delniño al nacer con madre no fumadora es mayor que si la madre fuera fumadora. 9.- 99,0% IC diferencia proporciones [-0,405156; 0,182936] 10.- Fíjate de que en este caso los datos están pareados. Se ha recontado el nº de células a los mismos individuos ANTES y DESPUÉS de un tratamiento. 99,0% IC diferencia de medias [-186,833; 19,0831] Como el intervalo contiene al 0, la diferencia no es significativa. 11.- Ahora las muestras no están pareadas. 98,0% IC cociente varianzas: [0,202283; 2,9736] 98,0% IC diferencia medias: [-5,0472; 18,3272] Como el intervalo contiene al 0, la diferencia no es significativa. 12.- Ahora las muestras no están pareadas. 90,0% IC cociente varianzas: [0,622634; 6,29194] 90,0% IC diferencia: [-0,682213; 11,0822] Como el intervalo contiene al 0, la diferencia no es significativa. 13.- Datos pareados, porque los MISMOS pacientes son tratados con placebo y con el tratamiento. 90,0% IC diferencia medias: [0,222337; 2,17766] La diferencia es significativa pues el intervalo NO contiene al 0 14.- Ahora los datos vienen codificados: qué tratamiento a recibido cada lente se codifica con un 1 o un 2 anotado en la 2º fila. 99,0% IC cociente varianzas: [0,0373132; 8,32807] 99,0% IC diferencia medias: [-2,06551; 1,06551] No 15.- Fíjate de que en este caso los datos están pareados. 95,0% IC diferencia medias: [-0,0324334; 12,0324] 16.- 95,0% IC diferencia proporciones: [-0,0895651;-0,0104349] SI 99,0% IC diferencia proporciones: [-0,101997; 0,00199741] NO