Estadística y Biometría – 2003 Guía de Ejercitación 2 La ejercitación propuesta en esta guía tiene como objetivo estudiar la distribución de la media y de la varianza muestrales a través del uso del software estadístico InfoStat. Las salidas obtenidas desde el computador se discutirán en clase destacando cómo analizar los resultados y la importancia de los mismos en el contexto de las situaciones planteadas a continuación y de otras situaciones problemáticas similares, comunes en el ámbito de las ciencias agropecuarias. Para realizar los ejercicios lea atentamente los enunciados y consignas. Recuerde que el programa estadístico posee una versión electrónica del Manual de usuario en donde se explican y detallan todos los procedimientos estadísticos disponibles. Distribución de estadísticos muestrales En la realidad acceder a todos los valores de una población es generalmente impracticable y sólo se trabaja con los datos provenientes de una muestra. No obstante, para el tratamiento de los datos extraídos de una muestra es necesario conocer propiedades distribucionales. Por ejemplo, sabiendo que la altura del plantín es una característica relacionada a la sobrevida del mismo después del trasplante, podría ser de interés conocer la probabilidad de obtener plantines de tomate con altura promedio mayor que 170mm, trabajando con muestras de tamaño 50. En este caso para calcular dicha probabilidad sería necesario conocer la distribución de las medias de muestras de tamaño 50. La actividad básica aquí propuesta es llevar a cabo un experimento estadístico mediante el cual se puedan estudiar características distribucionales de medidas resumen como lo son la media y la varianza muestral. EXPERIMENTO ESTADÍSTICO 1: Usando una rutina de simulación realice un muestreo aleatorio simple sin reposición a un conjunto finito de datos, para obtener todas las muestras posibles de tamaño 3. Para cada muestra se obtendrán la media y la composición de cada muestra. El objetivo es estudiar la distribución de las medias. Para conducir el experimento realice la ejercitación propuesta a continuación, trabajando sobre el archivo Medias.idb (que se encuentra en la carpeta Datos de InfoStat), El archivo contiene 30 registros de rendimientos de un híbrido de maíz, en qq/ha. Para fines prácticos sólo el conjunto de los primeros 15 datos de este archivo será considerado como la población de rendimientos posibles de obtener cuando se usa el híbrido. Para lograr este conjunto de 15 datos, se deberán desactivar los casos del 16 al 30. Para ello seleccione dichos casos, presione el botón derecho del ratón y en el menú que aparece active la opción Desactivar caso. Los casos desactivados mostrarán el número de caso (columna Caso) entre paréntesis. Ejercicio 1: Utilizando el menú Aplicaciones Didácticas Todas las muestras posibles obtenga la composición de cada muestra posible de tamaño 3. Para ello: 1 Estadística y Biometría – 2003 Guía de Ejercitación 2 a) En la ventana Todas las muestras posibles, en el campo Valores en la población, seleccione el nombre de la columna que contiene los datos, en este caso “columna1”. b) En la subsiguiente ventana ingrese la información correspondiente en el campo Tamaño muestral (3). Observe que en el campo Muestras posibles aparece el número total de muestras que se pueden obtener con el tamaño muestral ingresado y que en los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros. c) Active la opción Valores observados en la muestra. Presione el botón Obtener muestras. Al finalizar el proceso se obtendrá una tabla llamada Valores observados en la muestra con tantas columnas como el tamaño muestral usado para hacer el muestreo; en este caso habrá 3 columnas las cuales contienen, respectivamente, el primero, el segundo y el tercer dato que componen la muestra, siendo cada fila de la tabla una muestra. d) Teniendo en cuenta los resultados anteriores, ¿qué datos (3) componen las siguientes muestras: muestra 1, muestra 20, muestra 105, muestra 210, muestra 328 y muestra 455? Ejercicio 2: Trabajando con la tabla Medias.idb (que contiene los datos poblacionales): a) Realice nuevamente el muestreo usando como tamaño de muestra 3 (n=3) pero ahora active la opción Media muestral para obtener la media de cada una de las muestras que se generarán. b) En los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros, registre los mismos. c) Presione el botón Obtener muestras. Al finalizar el proceso, aparecerá una nueva tabla llamada Media muestral con una columna Media(n=3) que contendrá en cada fila la media de la correspondiente muestra (en esa columna se indica entre paréntesis el tamaño muestral usado en el muestreo). Nota: Ud. podría verificar los resultados anteriores calculando la media de cada fila de la tabla Valores observados en la muestra. Para ello podría usar la opción Fórmulas del menú Datos o la calculadora. Ejercicio 3: Para visualizar la distribución de las medias muestrales obtenidas realice un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. Ejercicio 4: obtenido el histograma: a) Solicite un ajuste Normal. b) Ajuste el eje X usando 1 decimal. c) Copie el gráfico y péguelo en un documento Word. d) Use Estadísticas Medidas Resumen y calcule la media y la varianza de las medias muestrales. Compárelos con los valores correspondientes en la población desde la que se extrajeron las muestras. Redacte sus hallazgos. Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población 2 Estadística y Biometría – 2003 Guía de Ejercitación 2 finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las siguientes: x y 2 x 2 N n n N 1 donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las medias muestrales (n=3). e) En base al histograma y los valores de los parámetros, caracterice la distribución de las medias muestrales. Redacte sus hallazgos. EXPERIMENTO ESTADÍSTICO 2: Mediante el proceso de simulación usado en el Experimento 1 ahora se realizará un muestreo aleatorio simple sin reposición desde el mismo archivo (Medias.idb), para obtener todas las muestras posibles de tamaño 12. Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como población de partida, obtenga las medias muestrales de todas las muestras posibles de tamaño 12. Para ello, utilice el menú Aplicaciones Didácticas Todas las muestras posibles. En los campos Media poblacional y Varianza poblacional, aparecen los valores de estos parámetros, registre los mismos. Al finalizar el proceso se deberá tener un archivo con una columna llamada Media(n=12). Ejercicio 2: Para visualizar la distribución de las medias muestrales obtenidas realizar un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. Ejercicio 3: obtenido el histograma: a) Solicite un Ajuste Normal. b) Ajuste el eje X usando 1 decimal. c) Copie el gráfico y péguelo en un documento Word. d) Use Estadísticas Medidas Resumen y calcule la media y la varianza de las medias muestrales. Compárelos con los valores correspondientes en la población desde la que se extrajeron las muestras. Redacte sus hallazgos. Nota: para verificar los valores paramétricos calculando la media de las medias muestrales y la varianza de las medias muestrales, tenga en cuenta que cuando se hace un muestreo sin reposición desde una población finita las expresiones para obtener la esperanza y la varianza de la variable media muestral son las siguientes: x y 2 x 2 N n n N 1 3 Estadística y Biometría – 2003 Guía de Ejercitación 2 donde μ y σ2 son, respectivamente, la esperanza y la varianza de los datos poblacionales, N es el tamaño de la población (en este caso N=15) y n el tamaño de muestra con el que se obtuvieron las medias muestrales (n=12). e) En base al histograma y los valores de los parámetros, caracterice la distribución de las medias muestrales. Redacte sus hallazgos. EXPERIMENTO ESTADÍSTICO 3: En forma similar a las indicaciones dadas en el Experimento 1, estudie la distribución de las varianzas muestrales para muestras de tamaño 3. Para ello tenga presente requerir, en el muestreo, la obtención de las varianzas muestrales en el campo Varianza muestral corregida. Ejercicio 1: Trabajando con la tabla Medias.idb, es decir la que tiene los 15 datos considerados como población de partida, obtenga las varianzas muestrales corregidas de todas las muestras posibles de tamaño 3. Para ello, utilice el menú Aplicaciones Didácticas Todas las muestras posibles. Al finalizar el proceso Ud. deberá tener un archivo con una columna llamada VarianzaC(n=3). Ejercicio 2: Para visualizar la distribución de las varianzas muestrales obtenidas en el ejercicio anterior realice un histograma de frecuencias relativas. Para ello, use el menú Gráficos Histograma. a) Copie el gráfico y péguelo en un documento Word. Redacte sus hallazgos. b) Comparar la forma de la distribución de las medias muestrales y la correspondiente a las varianzas muestrales para muestras de igual tamaño. Ejercicio 3: Usando el archivo Varianza muestral corregida, generado en el ejercicio anterior, que contiene la columna VarianzaC(n=3), realice el siguiente procedimiento: a) Active Datos Fórmulas, aparecerá una ventana Calcular, para escribir una fórmula. b) Cambie el nombre de la columna VarianzaC(n=3) por VarianzaC para poder utilizarlo en la fórmula. c) Escriba: c=VarianzaC*2/44.67. Esto es: multiplicar las varianzas muestrales obtenidas por n-1 y dividirlas por la varianza poblacional. Esta transformación será adicionada en una nueva columna denominada “c”. Los valores que constituyan la columna “c” se ajustarán a una distribución Chi cuadrado. d) Para visualizarlo realice un histograma de frecuencias para la columna “c” y luego pida un Ajuste Chi cuadrado. 4