Distribución de estadísticos muestrales (copia de la catedra estadistica y biometría) La actividad básica aquí propuesta es llevar a cabo un experimento estadístico mediante el cual se puedan estudiar características distribucionales (funciones de probabilidad) de medidas de resumen como lo son la media y la varianza muestral. EXPERIMENTO ESTADÍSTICO 0: Abrir el archivo “Medias.idb” que se encuentra en la carpeta datos de infostat. El archivo contiene 30 registros de rendimientos de un híbrido de maiz, en qq/ha. Para fines prácticos solo el conjunto de los primeros 15 datos de este archivo será considerado como la población de rendimientos de obtener cuando se usa el híbrido. Para lograr este conjunto de 15 datos, se deberán desactivar del 16 al 30. Para ello seleccione dichos casos, presione el botón derecho del del ratón y en el menú que aparece active la opción Desactivar caso. Los casos desactivados mostrarán el número de caso entre paréntesis. Ejercicio 1: Con los 15datos de la población se le pide: a) Calcule la media, el desvío estandar(D.E), la varianza poblacional(Var(n)), el valor mínimo y el máximo. Para ello utilice Estadisticas, medidas de resumen… PEGUE LA TABLA, MEDIDAS DE RESUMEN. ……………………………………………………………………………………….. …………………………………………………………………………………. b) Construya un histograma de frecuencias relativas, con 5 intervalos de igual amplitud, con un solo decimal en el eje X, y con un descriptivo título. Gráficos histograma. PEGUE EL GRÁFICO ............................................................................................................................... ............................................................................................................................... EXPERIMENTO ESTADÍSTICO 1: Usando una rutina de simulación realice un muestreo aleatorio simple sin reposición a un conjunto finito de datos, para obtener todas las muestras posibles de tamaño 3. Para cada muestra se obtendrán la media y la composición de cada muestra. El objetivo es estudiar la distribución de las medias. Ejercicio 1: Utilizando el menú Aplicaciones Didácticas Todas las muestras posibles obtenga la composición de cada muestra posible de tamaño 3. Para ello: a) En la ventana Todas las muestras posibles, en el campo Valores en la población, seleccione el nombre de la columna que contiene los datos, en este caso “columna1”. b) En la subsiguiente ventana ingrese la información correspondiente en el campo Tamaño muestral (3). Observe que en el campo Muestras posibles aparece el número total de muestras que se pueden obtener con el tamaño muestral ingresado y que en los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros. c) Active la opción Valores observados en la muestra. Presione el botón Obtener muestras. Al finalizar el proceso se obtendrá una tabla llamada Valores observados en la muestra con tantas columnas como el tamaño muestral usado para hacer el muestreo; en este caso habrá 3 columnas las cuales contienen, respectivamente, el primero, el segundo y el tercer dato que componen la muestra, siendo cada fila de la tabla una muestra. d) Teniendo en cuenta los resultados anteriores, ¿qué datos (3) componen las siguientes muestras: muestra 1, muestra 20, muestra 105, muestra 210, muestra 328 y muestra 455? Ejercicio 1: Utilizando el menú Aplicaciones Didácticas Todas las muestras posibles obtenga la composición de cada muestra posible de tamaño 3. Para ello: e) En la ventana Todas las muestras posibles, en el campo Valores en la población, seleccione el nombre de la columna que contiene los datos, en este caso “columna1”. f) En la subsiguiente ventana ingrese la información correspondiente en el campo Tamaño muestral (3). Observe que en el campo Muestras posibles aparece el número total de muestras que se pueden obtener con el tamaño muestral ingresado y que en los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros. g) Active la opción Valores observados en la muestra. Presione el botón Obtener muestras. Al finalizar el proceso se obtendrá una tabla llamada Valores observados en la muestra con tantas columnas como el tamaño muestral usado para hacer el muestreo; en este caso habrá 3 columnas las cuales contienen, respectivamente, el primero, el segundo y el tercer dato que componen la muestra, siendo cada fila de la tabla una muestra. h) Teniendo en cuenta los resultados anteriores, ¿qué datos (3) componen las siguientes muestras: muestra 1, muestra 20, muestra 105, muestra 210, muestra 328 y muestra 455? COPIE LA TABLA DE LAS MUESTRAS Y RESPONDA EL INC. H) ----…………………………………………………………………………………………… …………………………………………………………………………………………… Ejercicio 2: Trabajando con la tabla Medias.idb (que contiene los datos poblacionales): a) Realice nuevamente el muestreo usando como tamaño de muestra 3 (n=3) pero ahora active la opción Media muestral para obtener la media de cada una de las muestras que se generarán. b) En los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros, registre los mismos. c) Presione el botón Obtener muestras. Al finalizar el proceso, aparecerá una nueva tabla llamada Media muestral con una columna Media(n=3) que contendrá en cada fila la media de la correspondiente muestra (en esa columna se indica entre paréntesis el tamaño muestral usado en el muestreo). Nota: Ud. podría verificar los resultados anteriores calculando la media de cada fila de la tabla Valores observados en la muestra. Para ello podría usar la opción Fórmulas del menú Datos o la calculadora. REGISTRE LA MEDIA POBLACIONAL Y LA VARIANZA POBLACIONAL Y COPIE LA TABLA DE LAS MEDIAS MUESTRALES. …………………………………………………………………………………………… …………………………………………………………………………………………… Ejercicio 3: Para visualizar la distribución de las medias muestrales obtenidas realice un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. obtenido el histograma: a) Solicite un ajuste Normal. b) Ajuste el eje X usando 1 decimal. (GUARDE EL GRAFICO) c) Use Estadísticas Medidas Resumen y calcule la media y la varianza de las medias muestrales. PEGUE EL GRAFICO GUARDADO Y LAS MEDIDAS DE RESUMEN. d) Compárelos con los valores correspondientes en la población desde la que se extrajeron las muestras. Redacte sus hallazgos. Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las siguientes: x y 2 x 2 N n n N 1 donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las medias muestrales (n=3). e) En base al histograma y los valores de los parámetros, caracterice la distribución de las medias muestrales. Redacte sus hallazgos. …………………………………………………………………………………………… …………………………………………………………………………………………… EXPERIMENTO ESTADÍSTICO 2: Mediante el proceso de simulación usado en el Experimento 1 ahora se realizará un muestreo aleatorio simple sin reposición desde el mismo archivo (Medias.idb), para obtener todas las muestras posibles de tamaño 12. Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como población de partida, obtenga las medias muestrales de todas las muestras posibles de tamaño 12. Para ello, utilice el menú Aplicaciones Didácticas Todas las muestras posibles. En los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros, registre los mismos. Al finalizar el proceso se deberá tener un archivo con una columna llamada Media(n=12). Ejercicio 2: Para visualizar la distribución de las medias muestrales obtenidas realizar un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. obtenido el histograma: a) Solicite un Ajuste Normal. b) Ajuste el eje X usando 1 decimal. c) Use Estadísticas Medidas Resumen y calcule la media y la varianza de las medias muestrales. PEGUE EL GRAFICO GUARDADO Y LAS MEDIDAS DE RESUMEN. …………………………………………………………………………………………………………………………………………………… …………………………………………………………………………………………………………………………………………………… d) Compárelos con los valores correspondientes en la población desde la que se extrajeron las muestras. Redacte sus hallazgos. …………………………………………………………………………………………………………………………………………………… ………………………………………………………………………………………………………………………………………………….. Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las siguientes: x y 2 x 2 N n n N 1 donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las medias muestrales (n=12). En base al histograma y los valores de los parámetros, caracterice la distribución de las medias muestrales. Redacte sus hallazgos ……………………………………………………………………………….. EXPERIMENTO ESTADÍSTICO 3: En forma similar a las indicaciones dadas en el Experimento 1, estudie la distribución de las varianzas muestrales para muestras de tamaño 3. Para ello tenga presente requerir, en el muestreo, la obtención de las varianzas muestrales en el campo Varianza muestral corregida. Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como población de partida, obtenga las varianzas muestrales corregidas de todas las muestras posibles de tamaño 3. Para ello, utilice el menú Aplicaciones Didácticas Todas las muestras posibles. Al finalizar el proceso Ud. deberá tener un archivo con una columna llamada VarianzaC(n=3). Ejercicio 2: Para visualizar la distribución de las varianzas muestrales obtenidas en el ejercicio anterior realice un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. PEGUE EL GRÁFICO Y REDACTE SUS HALLAZGOS. a) Comparar la forma de la distribución de las medias muestrales y la correspondiente a las varianzas muestrales para muestras de igual tamaño. Ejercicio 3: Usando el archivo Varianza muestral corregida, generado en el ejercicio anterior, que contiene la columna VarianzaC(n=3), realice el siguiente procedimiento: a) Active Datos Fórmulas, aparecerá una ventana Calcular, para escribir una fórmula. b) Cambie el nombre de la columna VarianzaC(n=3) por VarianzaC para poder utilizarlo en la fórmula. c) Escriba: c = VarianzaC*2/44.67. Esto es: multiplicar las varianzas muestrales obtenidas por n-1 y dividirlas por la varianza poblacional. Esta transformación será adicionada en una nueva columna denominada “c”. Los valores que constituyan la columna “c” se ajustarán a una distribución Chi cuadrado. d) Para visualizarlo realice un histograma de frecuencias para la columna “c” y luego pida un Ajuste Chi cuadrado. PEGUE EL GRÁFICO Y REDACTE HALLAZGO.