1 Práctica 6.Intervalos de confianza Práctica 6 ANÁLISIS DE UNA MUESTRA INTERVALOS DE CONFIANZA Objetivos: Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza para estimar la media de una población. Uso del SPSS para el análisis de una muestra: cálculo de intervalos de confianza sobre la media poblacional. Índice: 1. Interpretación de los intervalos de confianza. 2. Análisis de una muestra con el SPSS 3. Ejercicios 2 Práctica 6.Intervalos de confianza 1. Interpretación de los intervalos de confianza. Podemos definir un estimador de intervalo como una regla que nos dice cómo utilizar las observaciones de una muestra para calcular dos números que definen el intervalo en el que, con un alto grado de confianza, estará incluido el parámetro estimado. El intervalo aleatorio resultante (aleatorio porque las observaciones de muestra empleadas para calcular los extremos del intervalo son variables aleatorias) se denomina intervalo de confianza, y la probabilidad (antes del muestreo) de que contenga el parámetro estimado es su nivel de confianza. Si un intervalo de confianza tiene un nivel de confianza igual a .95, decimos que es un intervalo de confianza al 95%. Si el nivel de confianza es .99, decimos que el intervalo de confianza es al 99%, etc. Para entender la utilidad de los intervalos de confianza vamos a trabajar con el siguiente ejemplo: Ejercicio 1: Estamos midiendo el caudal de agua de diferentes galerías de la isla de Tenerife. Sabemos que dicho caudal se distribuye según una normal de parámetros =200 y =0.61. Ya que no tenemos los datos: Generar con el SPSS una muestra de tamaño 100 para esta variable. Calcular la media y la varianza muestral de la muestra obtenida. Supongamos que no conocemos la media poblacional de la muestra que hemos obtenido y deseamos hacer una estimación por intervalos. Sabemos que una estimación puntual de la media poblacional es la media muestral ( que además es un estimador insesgado y de mínima varianza ). La estimación por intervalos la queremos hacer al 0.99 de nivel de confianza, esto es, queremos obtener un intervalo de confianza al 99% de probabilidad de que contenga el parámetro poblacional. Para ello buscamos un estadístico que sea función de los valores de la muestra y de la media poblacional . Este estadístico para nuestro caso x particular sería: z . Por el teorema Central del límite y al ser n lo suficientemente x grande z ~ N (0,1) . A fin de obtener un intervalo de confianza para primero necesitamos una expresión de probabilidad para el estadístico z. Planteamos la siguiente expresión: P( z / 2 z z / 2 ) (1 ) algo lógico si consideramos que z es la normal tipificada. Sustituyendo la expresión para z en la expresión de probabilidad y desarrollando obtenemos: P( z / 2 z z / 2 ) P( z / 2 x z / 2 ) x P( x z / 2 x x z / 2 x ) (1 ) En nuestro caso sabemos que x . n Práctica 6.Intervalos de confianza 3 Según esto, estará incluida en el intervalo ( x z / 2 x , x z / 2 x ) en el (1 ) % de los casos. Para nuestro ejemplo =0.01. Ejercicio 2: A partir de la muestra que hemos generado en el ejercicio 1, determinar el intervalo de confianza para la media poblacional al 95% de confianza. 2. Análisis de una muestra con el SPSS En este apartado describimos el uso del SPSS para el análisis de una muestra mediante la obtención de intervalos de confianza referidos a la media de la población de la que proviene la muestra. Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar el procedimiento Prueba T para una muestra, eligiendo el menú Analizar/Comparar medias/Prueba T para una muestra, con lo que aparece la siguiente pantalla: Esta pantalla nos permitirá obtener intervalos de confianza para las medias de aquellas variables que seleccionemos. Si seleccionamos Opciones aparece una ventana en la que podemos introducir el coeficiente (porcentaje) de confianza deseado para el intervalo. Por defecto es del 95%. Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS muestra en el Visor de resultados, bajo el título de Estadísticos para una muestra, el tamaño de la muestra, la media, la desviación típica y el error típico de la media. A continuación, bajo el título de Prueba para una muestra, encontramos el estadístico del contraste (t), los grados de libertad (gl), el p-valor bilateral ( Sig (bilateral) ), la diferencia de medias, el error típico de la diferencia y un intervalo de confianza para la diferencia de medias 0 . El intervalo de confianza que construye el SPSS es aquel para el cual la desviación típica poblacional ( ) es desconocida. En este caso utilizaremos el estadístico t s s , x t / 2 ~ tn-1 y el intervalo de confianza queda: x t / 2 n n n x s (Por ejemplo, los resultados siguientes se obtienen seleccionando la variable PH con un valor de prueba 7). Práctica 6.Intervalos de confianza 4 Conclusión: Con una probabilidad alta (0.99), 7 no es la media poblacional del PH en nuestro estudio ya que el valor 0 cae fuera del intervalo de confianza obtenido. Ejercicio 3: Obtener el intervalo de confianza para la media de sulfato al 95% de nivel de confianza. 4. Ejercicios 1. Suponga que un centro de cómputo regional desea evaluar el desempeño de su sistema de memoria en disco. Una medida del desempeño es el tiempo medio entre fallas de su unidad de disco. A fin de estimar este valor, el centro registró el tiempo entre fallas para una muestra aleatoria de 45 fallas de la unidad de disco. Los valores se encuentran en el fichero “fallas.sav” Determine si la muestra procede de una población con distribución normal. Estime el verdadero tiempo medio entre fallas con un intervalo de confianza Si el sistema de memoria en disco está funcionando correctamente, el verdadero tiempo medio entre fallas será mayor que 1700 horas. Con base en el intervalo del inciso a, ¿qué puede usted inferir acerca del sistema de memoria en disco? 2. La Instalación Experimental de Anillo Geotérmico, situada en Salton Sea en el sur de California, es una operación del Departamento de Energía de Estados Unidos que tiene como objetivo estudiar la factibilidad de generar electricidad a partir de las aguas calientes y de elevada salinidad del Salton Sea. Las experiencias operativas han demostrado que estas salmueras dejan depósitos de incrustaciones silíceas en las tuberías metálicas de las plantas, causando paros excesivos de las operaciones. Jacobsen et al. (Joumal of Testing and Evaluation, marzo de 1981) determinaron que las incrustaciones se pueden reducir en cierto grado agregando soluciones químicas a la salmuera. En un experimento de selección se agregó uno de cinco agentes antiincrustaciones distintos a cada una de cinco alícuotas de salmuera y luego se filtraron las soluciones. Se hizo una determinación de sílice (partes por millón de 5 Práctica 6.Intervalos de confianza dióxido de silicio) en cada muestra filtrada después de un tiempo de retención de 24 horas, con los siguientes resultados: 229 255 280 203 229 Estime la cantidad media de dióxido de silicio presente en las cinco soluciones con agentes antiincrustaciones. Utilice un intervalo de confianza de 99 por ciento. 3. Según un estudio, "la mayoría de las personas que mueren a causa del fuego y el humo en edificios divididos en compartimientos resistentes a los incendios -el tipo que se utiliza para hoteles, moteles, apartamentos e instalaciones de salubridad- mueren al intentar evacuar" (Risk Management, febrero de 1986). Los datos que siguen representan los números de víctimas que intentaron evacuar, para una muestra de 14 incendios recientes en edificios resistentes al fuego, divididos en compartimientos, informados en el estudio. Incendio Las Vegas Hilton (Las Vegas) Inn on the Park (Toronto) Westchase Hilton (Houston) Holiday Inn (Cambridge, Ohio) Conrad Hilton (Chicago) Providence College (Providence) Baptist Towers (Atlanta) Howard Johnson (New Orleans) Comell University (Ithaca, New York) Wesport Central Apartments (Kansas City, Missouri) Orrington Hotel (Evanston, Illinois) Hartford Hospital (Hartford, Connecticut) Milford Plaza (New York) MGM Grand (Las Vegas) Murieron en intento de evacuación 5 5 8 10 4 8 7 5 9 4 0 16 0 36 Fuente: Macdonald, J. N., "Is evacuation a fatal flaw in fire fighting philosophy?", Risk Management, vol. 33, núm. 2, febrero de 1986, pág. 37. Utilice el SPSS para construir un intervalo de confianza al 98% para el verdadero número medio de víctimas por incendio que mueren al tratar de evacuar edificios resistentes al fuego divididos en compartimentos. Interprete el intervalo construido en el inciso b.