Estadística Descriptiva Univariante

Anuncio
MÉTODOS ESTADÍSTICOS DE LA INGENIERÍA. CURSO 2007-2008
PRÁCTICA 1: Estadística Descriptiva Univariante
Usaremos para las Prácticas el programa Statgraphics Plus 5.1 (versión española).
Los procedimientos que se van a utilizar en esta primera práctica están en:
(Menu) DESCRIPCIÓN > DATOS NUMÉRICOS > ANÁLISIS UNIDIMENSIONAL
(Menu) DESCRIPCIÓN > DATOS CUALITATIVOS > TABULACIÓN
(Menu) COMPARACIÓN > DOS MUESTRAS > COMPARACIÓN DE DOS MUESTRAS
Los ficheros de datos que se van a utilizar son
Coches.sf3
Desviaciones_08.sf3
Para abrirlos: CTRL+F12
(se encuentran en la carpeta C:\Archivos de programa\Statgraphics\Statgraphis Plus5.1\Data\)
¡ATENCIÓN: el programa no permite tener abierto más de un fichero de datos a la vez! Podéis grabar el
trabajo como Statfolio (extensión sgp) en un disquete. Además tendréis que grabar el fichero de datos. ES
IMPORTANTE que no cerreis ninguna ventana antes de grabar, para no perder el trabajo.
EJERCICIO 1:
El fichero coches.sf3 contiene los datos del consumo (en litros/100 Km) de todos los modelos
nuevos de Monovolúmenes de tamaño medio que existen actualmente en el mercado y sus
emisiones de CO2 (en g/Km), además del tipo de motorización de cada vehículo (Gasolina o
Diesel). Vamos a estudiar descriptivamente la variable Emisiones:
1. ¿En qué intervalo toma valores la variable? (es decir, ¿cuál es el mínimo y cuál es el
máximo?).
2. Haz un histograma para los datos de las emisiones de CO2, ajustando adecuadamente L0 y LK
y responde:
2.1. ¿Cuántas clases tiene, por defecto? ¿Corresponde este valor al que proporciona la
fórmula de Sturges?
2.2. ¿Qué valor has introducido como extremo inferior de la primera clase (L0 )? ¿Qué valor
has introducido como extremo superior de la última (LK)?
2.3. ¿En torno a qué intervalo de la variable parece encontrarse el centro de gravedad de los
datos? (Aquí no se trata de dar el valor exacto de la media, sino de utilizar el gráfico
para observar en torno a qué zona del eje X parece situarse el centro de gravedad del
histograma.)
2.4. ¿Los datos se sitúan simétricamente o parece haber asimetría en la disposición de los
datos? ¿Cómo describirías esa asimetría (si la hay)?
3. Dibuja un diagrama de cajas de los datos de las emisiones de CO2 y contesta:
3.1. ¿Se observan diferencias, en la asimetría, respecto de lo observado en el histograma?
3.2. ¿Se detectan datos atípicos?
3.3. Si has contestado afirmativamente a la pregunta anterior, determina cuáles y cuántos son
y si son próximos o alejados. (Para resolver este apartado es conveniente utilizar el
comando “Selección” de Statgraphics, además de determinar con la calculadora en qué
intervalo estarían los atípicos próximos y en cuál los alejados). Observa a qué modelos
de coche corresponden, ¿se considerarían datos erróneos?
4. Calcula las medidas necesarias para responder a las siguientes preguntas:
4.1. ¿Por debajo de qué valor están el 50% de las emisiones?
4.2. ¿Cuál es la emisión media de estos vehículos?
4.3. ¿Por debajo de que número se encuentra el 90% de las emisiones de estos vehículos?
4.4. ¿En qué intervalo se encuentra el 50% central de los datos?
4.5. Si nos fijamos en las emisiones de vehículos con consumo menor que 10 litros, ¿cuál es
la emisión media observada?
4.6. Entre los vehículos que consumen menos de 10 litros, el 30% de ellos emiten menos
de... ¿cuántos gramos de CO2 por Km?
5. Si consideramos las emisiones de CO2 entre los vehículos Diesel y los de Gasolina, ¿qué
diferencias observas (posición, variabilidad, simetría,...)? Coméntalas, incidiendo en su
significado respecto del nivel de contaminación de los vehículos.
6. Obtén un diagrama de sectores para la variable Motorización y responde: ¿Qué tipo de
motorización presenta mayor número de modelos donde elegir? ¿Cuál es su porcentaje
respecto del total?
EJERCICIO 2:
La variable Desviaciones1, en el fichero Desviaciones_08.sf3, contiene dos variables; la primera,
Desviaciones1 contiene los valores de las diferencias al cuadrado de unas medidas respecto de
un valor prefijado.
1. Realiza un diagrama de cajas para estos datos para determinar qué tipo de asimetría tienen.
2. Construye las variables T1, T2, T3 y T4, transformadas de Desviaciones1 mediante las
transformaciones 1/x, x½, Ln x, y x2.
3. ¿Qué cambios respecto de la simetría provocan en los datos originales estas
transformaciones?
4. Las transformaciones anteriores no son lineales y no tienen las mismas propiedades que ellas.
Por ejemplo, se puede comprobar que la media de las nuevas variables no es la transformada
de la media de la variable original. Calcula media y mediana de la variable original, y de
estas nuevas variables y completa la tabla de la hoja de respuestas, para comparar.
5. Por último, haz lo mismo para la variable Desviaciones2, realiza un diagrama de cajas para
estos datos para determinar qué tipo de asimetría tienen y repite los apartados 2 y 3, para esta
nueva variable.
Descargar