Medidas de Tendencia Central y de Variación Universidad Metropolitana

Anuncio
Medidas de Tendencia Central y de Variación
Medidas de Tendencia Central y de Variación
Universidad Metropolitana
Programa Ahora
STAT 555
Taller 2
Widalys Vélez Díaz
# S00342308
25 de junio de 2015
Profesora Sylvia Cosme Montalvo
1
2
Medidas de Tendencia Central y de Variación
I.
¿Cuáles son las propiedades de un conjunto de datos numéricos?
Aunque la presentación de datos numéricos es esencial no se limita a la presentación de
datos, observación y análisis. También se examinan sus propiedades como las medidas de
tendencia central, variación y forma.
II.
Explique a qué se refiere la propiedad de posición o tendencia central. Demuestre la
propiedad con un ejemplo gráfico.
La propiedad de posición o tendencia central es la medida en la que todo el grupo de valores
de datos se encuentran alrededor de un valor central o típico.
III.
Compare la moda, media y mediana y detalle las ventajas y desventajas de la utilización
de cada una de estas medidas de tendencia central. Prepare una tabla que incluya las
fórmulas de cada medida, ventajas y desventajas para datos no agrupados y datos
agrupados.
Medidas
Definición
Moda
Media
Ventajas
Desventajas
Fórmulas
Valor que aparece
con mayor
frecuencia en un
conjunto de datos.
1, 1, 1, 2, 3, 4, 5
La aparición de
algún valor extremo
no afecta la moda.
Se usa sólo para fines
descriptivos, porque
varía más entre muestras
que otras medidas de
tendencia central.
Aparece con más
frecuencia
Es al medida más
común en las
medidas de
Actúa como un
punto de balance de
manera que las
Cualquier valor extremo
afecta mucho la media.
Debido a eso, no es el
N+1 / 2
Sumas los valores
1 es la moda
3
Medidas de Tendencia Central y de Variación
tendencia central
Mediana
IV.
Es un valor que
parte el arreglo
ordenado por la
mitad.
observaciones más
pequeñas
compensan a las más
grandes. Ninguna
otra medida de
tendencia central de
uso común posee
esta característica.
Es usada a menudo
porque no es
sensible a los
valores extremos
mejor promedio para
describir o resumir un
conjunto de datos que
tiene valores extremos.
Si se ignora la
posibilidad de igualdad
en los valores de los
datos, que se pueden
atribuir a mediciones
imprecisas, cualquier
observación
seleccionada al azar es
tan susceptible de
exceder a la mediana.
y los divides por el
número de valores
11, 12, 13, 14, 15
13 es la mediana
Detalle la diferencia entre medidas de tendencia central y medidas de tendencia no
central.
La mayor parte de los conjuntos de datos muestra una tendencia bien determinada a
agruparse o aglomerarse alrededor de cierto punto central. Para cualquier conjunto específico de
datos, casi siempre se puede seleccionar algún valor típico, o promedio, para describir todo el
conjunto. Este valor típico descriptivo es una medida de tendencia central o ubicación. Los
cincos tipos de promedios que se utilizan con frecuencia como medidas de tendencia central son
al media aritmética, la mediana, la moda, el rango medio (o centro de recorrido) y el eje medio.
Los cuartiles (también son llamados cuantiles) son las medidas de tendencia no central que se
utilizan con mayor frecuencia y se emplean sobre todo para resumir o describir las propiedades
de conjuntos grandes de datos numéricos. Son medidas descriptivas que parten los datos
4
Medidas de Tendencia Central y de Variación
ordenados en cuatro. Otros cuartiles que se utilizan a menudo son los deciles, que separan los
datos ordenados en diez partes, y los percentiles, que los dividen en cien partes.
V.
¿Qué significa la propiedad de variación? Demuestre a través de un gráfico dicha
propiedad.
Una segunda propiedad importante para describir un conjunto de datos numéricos es la
variación. La variación es la cantidad de dispersión o separación, que presentan los datos. Dos
conjuntos de datos pueden diferir tanto en la tendencia central como en la variación. Cinco
medidas de variación incluyen el recorrido, el rango intercuartil, la varianza, la desviación
estándar y el coeficiente de variación.
100
80
East
60
West
40
North
20
0
1st Qtr 2nd Qtr 3rd Qtr 4th Qtr
VI.
Desarrolle una tabla con la definición, diferencias, ventajas y desventajas en la utilización
de las siguientes medidas de variación:
Medidas de
Variación
Rango
Rango Intercuartil
Definición
Ventajas
Desventaja / Diferencia
Es la diferencia entre
Es la medida de
los valores más grandes
variación más simple.
y los más pequeños.
Ignora la forma en que
se distribuyen los datos.
Sensible a los valores
atípicos.
Es la distancia entre el
primer y tercer cuartil.
A diferencia del rango,
es un estadístico
Medida estable de
desembolso. Se usa
5
Medidas de Tendencia Central y de Variación
A veces es llamado la
dispersión H.
para construir los
diagramas de caja y
bigote.
robusto.
Varianza
Es la media aritmética
del cuadrado de las
desviaciones respecto a
la media de una
distribución estadística.
La varianza de una
muestra es un buen
estimador de la
varianza de la
población.
Como establece la
variabilidad, es
importante tener en
cuenta, que en ciertos
casos, es preferible
emplear otras medidas
de dispersión ante las
características de las
distribuciones.
Desviación
Estándar
Mide la dispersión
“promedio” alrededor
de la media. Es la raíz
cuadrada de la
varianza.
Es la medida de
variación más
utilizada.
Tiene las mismas
unidades que los datos
originales.
Coeficiente de
Variación
Mide la dispersión en
los datos con relación a
la media. Es una
indicación relativa de la
variación.
Se puede utilizar para
comparar la
variabilidad de dos o
más conjuntos de
datos medidos en
unidades diferentes.
Siempre se expresa
como porcentaje, no en
términos de las unidades
de los datos específicos.
VII.
¿Cómo ayuda la regla empírica a explicar las formas en que un conjunto de datos
numéricos se conglomeran y se distribuyen?
En la mayor parte de los conjuntos de datos, una porción considerable de las observaciones
tienden a agruparse, más o menos cerca de la mediana. En los conjuntos de datos con sesgo a la
derecha, la agrupación ocurre a la izquierda (o abajo) de la mediana, en los conjuntos de datos
con sesgo a la izquierda tienden a agruparse a la derecha (o arriba) de la mediana. En conjuntos
de datos simétricos, donde la media y la mediana son iguales, con frecuencia las observaciones
tienden a agruparse en torno a estas medidas de tendencia central. Cuando no existe un sesgo
extremo y se observa este tipo de agrupación en un conjunto de datos, se puede utilizar la
Medidas de Tendencia Central y de Variación
llamada regla empírica para examinar la propiedad de variabilidad de los datos y adquirir una
idea más clara de lo que mide la desviación estándar.
VIII.
Defina y explique la propiedad de la forma de una distribución de datos numéricos.
Presente dicha propiedad a través de los gráficos generalmente utilizados.
Dos estadísticas relacionadas con la forma de una distribución de datos numéricos es la
Oblicuidad (Skewness). Ésta mide la cantidad de asimetría en una distribución. La segunda
es la Curtosis (Kurtosis) la cual mide la concentración relativa de los valores en el centro de
una distribución en comparación con las colas.
Skewness: Simétrica o asimétrica
Kurtosis:
IX.
¿Por qué son útiles las técnicas de análisis exploratorio de datos resumen de cinco
números y diagrama de caja y bigotes?
6
Medidas de Tendencia Central y de Variación
7
Son útiles porque el análisis exploratorio de datos resumen de cinco números ayuda a
describir el centro, extensión y forma de los datos. El diagrama de caja y bigotes (Box Plots)
sirve para visualizar la variabilidad de una variable y comparar distribuciones de la misma
variable; además de ubicar valores extremos.
X.
¿Cuáles son algunos aspectos éticos que están presentes cuando se hace la distinción
entre el uso apropiado e inapropiado de medidas descriptivas de resumen que se publican
en periódicos y revistas?
El análisis de datos es objetivo. Debe reportar las medidas de resumen que mejor describen y
comunican los aspectos importantes del conjunto de datos. La interpretación de los datos es
subjetiva, debe ser hecha en forma justa, neutral y clara. Entre los aspectos éticos se encuentran
el que se debe documentar tanto los resultados buenos y malos. Debe ser presentado de manera
justa, objetiva y neutral. No se debe utilizar medidas de resumen inapropiados para distorsionar
los hechos.
XI.
Conéctese a la dirección electrónica www.prenhall.com/berenson. Seleccione la edición
11 del libro Basic Business Statistics, de Berenson, Levine y Krehbiel. Entre al enlace
“companion website”, seleccione en la parte superior el capítulo 3: “Numerical
Descriptive Measures”. En la parte izquierda de la página seleccione “Self-Study
Quizzes”. Entre al enlace de “Multiple Choice” conteste la prueba, sométala a
evaluación. Envíe los resultados a la dirección electrónica del facilitador y a su dirección
electrónica para que la imprima y la traiga al taller para aclarar dudas. Este ejercicio
debe incluirse en el portafolio.
La prueba fue contestada y enviada a la profesora a través del enlace del libro.
Medidas de Tendencia Central y de Variación
Referencias
Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2001). Estadística para administración.
México: Pearson Educación.
Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2011). Basic Business Statistics (11th ed.).
Pearson.
Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2011). Basic Business Statistics (12th ed.).
Pearson.
Definición de varianza - Qué es, Significado y Concepto. (2008). Retrieved from
http://definicion.de/varianza/
8
Descargar