IG12: ESTADÍSTICA DE ITIG. PRÁCTICAS DE STATGRAPHICS. PRÁCTICA 4: Estimación. Contraste de hipótesis Nombre y Apellidos............................................................... Grupo .... Los gráficos y las tablas de frecuencias que no caben en su apartado, incluirlos en la parte de atrás del folio o en otro folio. El objetivo de esta práctica es estimar una muestra con datos no tomados de la realidad, y que sigan una determinada distribución de probabilidad. Por otra parte buscarán intervalos que respondan a ciertas demandas, y se contrastarán hipótesis estimadas, siguiendo modelos teóricos. 1. Genera dos muestras aleatorias de tamaño 50 de una distribución normal con la media y la varianza que tu quieras. plot>probability distributions>normal.Elegimos la media y la varianza que queramos>pinchamos el icono que se crea en nuestro análisis con un disco de grabar :save results . Aparece un cuadro de diálogo, y en él, en la columna de la izquierda, marcamos que queremos generar esa muestra aleatoria; en la columna de la derecha nos indica el nombre que por defecto le colocará a los datos que va a generar. Marcamos el OK, y los datos ya se han generado. Para verlos vamos al icono <untitled> y en la primera columna los tenemos generados, que por defecto son 100. Si queremos más o menos, el proceso es: plot>probability distributions>normal>tabular options>random numbers>pane options allí indicamos el tamaño de la muestra, luego igual tenemos que ir a save reusults y el proceso es el mismo. 2. Haz un breve análisis descriptivo de las dos muestras usando las técnicas de las prácticas anteriores. Medidas descriptivas de centralización de dispersión, gráficas, etc. 3. Con la primera muestra: a) Contrasta la hipótesis de que la media poblacional de la muestra1 es realmente la que has impuesto a un nivel de confianza del 98% suponiendo varianza desconocida. PRÁCTICAS DE STATGRAPHICS Describe>numeric data>one-variable analysis>elegimos la variable primera>tabular options>hipothesis test. El nivel de confianza es un valor “C” que responde a la siguiente ecuación C=1-, donde se llama nivel de significación; por tanto será lo mismo decir que queremos un nivel de confianza del 98%, como un del 2%, que es lo que podemos modificar en la opción pane options, ya que por defecto el programa proporciona el 95% de confianza. En pane options también podemos modificar la media y el contraste de hipótesis. b) Contrasta la hipótesis de que la media poblacional de la muestra2 es menor o igual que el valor que has impuesto para la media a un nivel de confianza del 96%. Describe>numeric data>one-variable analysis>elegimos la variable segunda>tabular options>hipothesis test>pane options> y en el contraste indicamos less than. c) Construye un intervalo de confianza para la media de la población de la muestra1 al 99%. Describe>numeric data>one-variable analysis>elegimos la variable primera>tabular options> confidence intervals> si queremos modificar el nivel de confianza en pane options. Nos crea dos intervalos de confianza, para la media y para la desviación típica. Con las dos muestras a la vez: a) Construye un intervalo de confianza para la diferencia de medias, del 95%. Compare>two samples>two sample comparison> Aparece una pantalla de diálogo donde en la primera columna están las variables a tener en cuenta. Elegimos una y otra y las colocamos en los campos correspondientes>OK>tabular options>comparison of means>pane options para modificar el nivel de confianza. b) Para distintos niveles de confianza (3 niveles) contrasta la hipótesis de que las medias poblacionales de ambas muestras son iguales. 4. Con el objetivo de ver la relación entre horas trabajadas en un taller y unidades producidas, se tomó una muestra de ambas variables, obteniéndose los siguientes resultados: PRÁCTICA 4: ESTIMACIÓN, CONTRASTE DE HIPÓTESIS. 2 PRÁCTICAS DE STATGRAPHICS X = horas de trabajo diarias Y = unidades producidas X 60 60 60 62 62 73 73 74 74 74 75 78 78 80 80 82 82 84 84 84 84 Y 250 240 245 245 250 292 292 298 300 300 300 310 314 310 310 320 336 336 336 340 340 Se pide, suponiendo normalidad: a) Calcular el intervalo de confianza para la media poblacional de las horas trabajadas al nivel de significación de 0.05. b) Contrastar la hipótesis de que la media poblacional de las unidades producidas es de 65 con un nivel de confianza de 0.99. 5. Sobre 16 individuos se estudian las siguientes características: el salario mensual (Y, en miles de pesetas), los años de estudio (X1) y la edad (X2). Y 200 200 300 250 175 150 150 300 300 150 175 200 175 100 150 350 X 1 17 12 17 17 13 8 8 17 12 12 12 8 8 11 13 13 X 2 28 40 32 32 36 40 30 36 34 34 36 36 40 28 30 40 Se pide: a) Calcular el intervalo de confianza para la media poblacional de la variable 'años de estudios' al nivel de confianza de 0.95. b) Contrastar, con un nivel de significación de 0.01, la hipótesis de que la media poblacional de la variable 'salario mensual' es 310. 6. Para realizar un estudio sobre la formación básica en asignaturas de matemáticas, se tomó una muestra de 20 alumnos que cursarán las asignaturas de Estadística y Matemáticas resultando: Estadística 1. 5 3 3 3 3 4 5 5 5 5 5. 5 6 6 . 5 6 . 5 7 7 7. 5 7. 5 8 9. 5 Matemáticas 1 3 5 4 5 4 6 5 6 4 . 5 5 6 5 6 . 5 7 6 . 5 7 7 6. 5 8 Se pide: PRÁCTICA 4: ESTIMACIÓN, CONTRASTE DE HIPÓTESIS. 3 PRÁCTICAS DE STATGRAPHICS a) Representar gráficamente las notas de ambas asignaturas por separado considerando 5 intervalos de amplitud por variable. b) ¿Cuánto vale el cuadrado del coeficiente de correlación lineal entre ambas variables?. Calcular la recta de regresión de la asignatura Estadística en función de Matemáticas. c) Contrastar la hipótesis de que no hay diferencias significativas entre ambas variables con una confianza de 0.98. d) Calcular el intervalo de confianza para la varianza de la variable Estadística. El cuadrado del coeficiente de correlación lineal, lo encontramos una vez hemos calculado la recta de regresión en el apartado R-squared. Diferencias significativas se refiere a la media y la desviación típica. Calcular el intervalo de confianza para la varianza, es elevar al cuadrado cada uno de los extremos del intervalo de la desviación típica. PRÁCTICA 4: ESTIMACIÓN, CONTRASTE DE HIPÓTESIS. 4