PRÁCTICA 1b: ESTADÍSTICA DESCRIPTICA UNIDIMENSIONAL Abre el fichero Temperaturas. En él se recogen registros de temperaturas (Temp1 y Temp2) correspondientes a dos zonas, una de ellas cálida (A, correspondiente a Temp1) y otra fría (B, correspondiente a Temp2). Para los datos correspondientes a Temp1: 1.- Calcula media, moda y mediana; valora su proximidad y explícalo a partir de la normalidad de la variable. 2.- Calcula varianza, desviación típica y coeficiente de variación; interpreta este último. 3.- Dibuja el diagrama de cajas, y localiza los datos atípicos, si los hay. Vuelve a calcular la media, la desviación típica y el coeficiente de variación excluyendo el dato atípico. ¿Hay alguna variación? ¿Cabía esperarlas? ¿Aparece ahora algún dato atípico? (NOTA: cuando hayas realizado el ejercicio, borra la condición que hayas introducido para quitar el atípico que aparecía inicialmente, de modo que sea incluido en los ejercicios que vienen a continuación) 4.- Visualiza las clases en las que Statgraphics ha agrupado los datos, e indica en qué porcentaje de días se rebasaron los 35 grados. 5.- Visualiza el histograma, y el gráfico de densidad suavizada. ¿Sugiere el gráfico algún tipo de asimetría? A pesar de ello, ¿podríamos aceptar, a partir de los coeficientes de asimetría tipificada y curtosis tipificada, que los datos provienen de una población normal? Visualiza el gráfico de caja y bigotes: ¿cómo se plasma la asimetría en dicho gráfico? 6.- Calcula la temperatura que fue rebasada en el 85% de ocasiones. Calcula la temperatura por debajo de la cuál se mantuvo la temperatura del 65% de los días. 7.- Visualiza el diagrama de dispersión correspondiente a Temp1. Utilizando la barra localizadora, separa las temperaturas menores o iguales que 29º C (coloréalas primero); indica a qué filas corresponden (recuerda que para poder visualizar la información referente a cada punto tienes que cambiar de la opción localizar, a la opción seleccionar). Idem para las temperaturas superiores a 38ºC. 8.- Calcula el valor de la desviación típica de Temp2. ¿Podríamos, a partir de las desviaciones típicas de Temp1 y Temp2, identificar en cuál de las dos zonas está más dispersa la temperatura? ¿Por qué? 9.- Observa que el coeficiente de variación de Temp2 es anormalmente alto. El histograma, sin embargo, no revela una dispersión exagerada… ¿A qué puede ser debido, entonces? Para Temp2, 10.- Calcula media, moda y mediana. Valora su proximidad y explícalo a partir de la asimetría de la variable. 11.- Dibuja el diagrama de cajas. ¿Hay datos atípicos? 12.- Calcula el rango. ¿Qué significa? ¿Cuál es el rango de Temp1? Si tuviéramos que comparar las dispersiones de Temp1 y Temp2 únicamente a partir de los rangos (lo cuál no es recomendable), ¿qué podríamos decir? 13.- Visualiza el histograma. ¿Sugiere el gráfico algún tipo de asimetría? A pesar de ello, ¿podríamos aceptar, a partir de los coeficientes de asimetría tipificada y curtosis tipificada, que los datos provienen de una población normal? 14.- Visualiza las clases en las que Statgraphics ha agrupado los datos ¿En qué porcentaje de días se rebasaron los 3 grados? ¿Y los 4,5? (para esta segunda pregunta, botón derecho + opciones de ventana; en Límite inferior, introduce 4.5; uno menos la frecuencia relativa de la primera clase, multiplicada por 100, te dará la respuesta). 15.- Calcula la temperatura que en B fue rebasada únicamente en un 10% de ocasiones. 16.- Sigue la ruta Descripción + Datos Cualitativos + Tabulación para construir un gráfico de sectores a partir de los valores de la variable Temp2. Identifica rápidamente la moda a partir de dicho gráfico de sectores. 17.- A partir de la ruta del ejercicio anterior, indica las frecuencias de las temperaturas de Temp2, y el porcentaje de días en los que la temperatura fue de 1 grado. 18.- Para comparar las dispersiones de A y B, vamos a hacer lo siguiente: a) Localiza el mínimo de las temperaturas en B; comprueba que es -2.0. b) Genera DOS nuevas variables (llámalas TtempA y TtempB) que sean TtempA:= Temp1 + 3, TtempB:= Temp2 +3. Es decir, estas variables son el resultado de sumar tres grados centígrados a cada una de las temperaturas observadas. Date cuenta de que esto no es más que un cambio de escala (en lugar de poner el cero de temperaturas donde está, lo ponemos tres grados más abajo). c) Se puede demostrar que al sumar a todos los datos de una misma variable un cierto número, la media de la nueva variable es la anterior, aumentada en esa cantidad que estamos sumando; sin embargo, la varianza y la desviación típica no varían. Comprueba esto en las nuevas variables que has creado. d) Calcula los coeficientes de variación y decide, en base a ellos, si hay mayor dispersión en A o en B. e) ¿Se mantiene la conclusión del apartado anterior si en lugar de sumar 3 a cada temperatura, sumamos 10, ó 20? 19.- Crea las nuevas variables TA:=2*Temp1 + 1; TB:=2*Temp2 +1. Compara los histogramas de Temp1 y TA, así como los de Temp2 y TB. ¿Qué sucede? Crea ahora la variable TC:= Temp2^2, y compara los histogramas de Temp2 y TC. ¿Qué sucede ahora? ¿Puede decirse que las transformaciones lineales preservan la forma de los datos, mientras que otras transformaciones –por ejemplo, cuadráticas- la alteran? 20.- ¿Es posible que la media de un conjunto de datos sea negativa? ¿Y la desviación típica? ¿Y la cuasivarianza? ¿Y el coeficiente de asimetría?