PRÁCTICA 1b: ESTADÍSTICA DESCRIPTICA UNIDIMENSIONAL

Anuncio
PRÁCTICA 1b: ESTADÍSTICA DESCRIPTICA UNIDIMENSIONAL
Abre el fichero Temperaturas. En él se recogen registros de temperaturas (Temp1 y Temp2) correspondientes a dos
zonas, una de ellas cálida (A, correspondiente a Temp1) y otra fría (B, correspondiente a Temp2).
Para los datos correspondientes a Temp1:
1.- Calcula media, moda y mediana; valora su proximidad y explícalo a partir de la normalidad de la variable.
2.- Calcula varianza, desviación típica y coeficiente de variación; interpreta este último.
3.- Dibuja el diagrama de cajas, y localiza los datos atípicos, si los hay. Vuelve a calcular la media, la desviación típica
y el coeficiente de variación excluyendo el dato atípico. ¿Hay alguna variación? ¿Cabía esperarlas? ¿Aparece ahora
algún dato atípico? (NOTA: cuando hayas realizado el ejercicio, borra la condición que hayas introducido para quitar
el atípico que aparecía inicialmente, de modo que sea incluido en los ejercicios que vienen a continuación)
4.- Visualiza las clases en las que Statgraphics ha agrupado los datos, e indica en qué porcentaje de días se rebasaron
los 35 grados.
5.- Visualiza el histograma, y el gráfico de densidad suavizada. ¿Sugiere el gráfico algún tipo de asimetría? A pesar de
ello, ¿podríamos aceptar, a partir de los coeficientes de asimetría tipificada y curtosis tipificada, que los datos
provienen de una población normal? Visualiza el gráfico de caja y bigotes: ¿cómo se plasma la asimetría en dicho
gráfico?
6.- Calcula la temperatura que fue rebasada en el 85% de ocasiones. Calcula la temperatura por debajo de la cuál se
mantuvo la temperatura del 65% de los días.
7.- Visualiza el diagrama de dispersión correspondiente a Temp1. Utilizando la barra localizadora, separa las
temperaturas menores o iguales que 29º C (coloréalas primero); indica a qué filas corresponden (recuerda que para
poder visualizar la información referente a cada punto tienes que cambiar de la opción localizar, a la opción
seleccionar). Idem para las temperaturas superiores a 38ºC.
8.- Calcula el valor de la desviación típica de Temp2. ¿Podríamos, a partir de las desviaciones típicas de Temp1 y
Temp2, identificar en cuál de las dos zonas está más dispersa la temperatura? ¿Por qué?
9.- Observa que el coeficiente de variación de Temp2 es anormalmente alto. El histograma, sin embargo, no revela una
dispersión exagerada… ¿A qué puede ser debido, entonces?
Para Temp2,
10.- Calcula media, moda y mediana. Valora su proximidad y explícalo a partir de la asimetría de la variable.
11.- Dibuja el diagrama de cajas. ¿Hay datos atípicos?
12.- Calcula el rango. ¿Qué significa? ¿Cuál es el rango de Temp1? Si tuviéramos que comparar las dispersiones de
Temp1 y Temp2 únicamente a partir de los rangos (lo cuál no es recomendable), ¿qué podríamos decir?
13.- Visualiza el histograma. ¿Sugiere el gráfico algún tipo de asimetría? A pesar de ello, ¿podríamos aceptar, a partir
de los coeficientes de asimetría tipificada y curtosis tipificada, que los datos provienen de una población normal?
14.- Visualiza las clases en las que Statgraphics ha agrupado los datos ¿En qué porcentaje de días se rebasaron los 3
grados? ¿Y los 4,5? (para esta segunda pregunta, botón derecho + opciones de ventana; en Límite inferior, introduce
4.5; uno menos la frecuencia relativa de la primera clase, multiplicada por 100, te dará la respuesta).
15.- Calcula la temperatura que en B fue rebasada únicamente en un 10% de ocasiones.
16.- Sigue la ruta Descripción + Datos Cualitativos + Tabulación para construir un gráfico de sectores a partir de los
valores de la variable Temp2. Identifica rápidamente la moda a partir de dicho gráfico de sectores.
17.- A partir de la ruta del ejercicio anterior, indica las frecuencias de las temperaturas de Temp2, y el porcentaje de
días en los que la temperatura fue de 1 grado.
18.- Para comparar las dispersiones de A y B, vamos a hacer lo siguiente:
a) Localiza el mínimo de las temperaturas en B; comprueba que es -2.0.
b) Genera DOS nuevas variables (llámalas TtempA y TtempB) que sean TtempA:= Temp1 + 3, TtempB:=
Temp2 +3. Es decir, estas variables son el resultado de sumar tres grados centígrados a cada una de las
temperaturas observadas. Date cuenta de que esto no es más que un cambio de escala (en lugar de poner el
cero de temperaturas donde está, lo ponemos tres grados más abajo).
c) Se puede demostrar que al sumar a todos los datos de una misma variable un cierto número, la media de la
nueva variable es la anterior, aumentada en esa cantidad que estamos sumando; sin embargo, la varianza y
la desviación típica no varían. Comprueba esto en las nuevas variables que has creado.
d) Calcula los coeficientes de variación y decide, en base a ellos, si hay mayor dispersión en A o en B.
e) ¿Se mantiene la conclusión del apartado anterior si en lugar de sumar 3 a cada temperatura, sumamos 10, ó
20?
19.- Crea las nuevas variables TA:=2*Temp1 + 1; TB:=2*Temp2 +1. Compara los histogramas de Temp1 y TA, así
como los de Temp2 y TB. ¿Qué sucede? Crea ahora la variable TC:= Temp2^2, y compara los histogramas de Temp2
y TC. ¿Qué sucede ahora? ¿Puede decirse que las transformaciones lineales preservan la forma de los datos, mientras
que otras transformaciones –por ejemplo, cuadráticas- la alteran?
20.- ¿Es posible que la media de un conjunto de datos sea negativa? ¿Y la desviación típica? ¿Y la cuasivarianza? ¿Y
el coeficiente de asimetría?
Descargar