Medidas de Tendencia Central y de Variación Medidas de Tendencia Central y de Variación Universidad Metropolitana Programa Ahora STAT 555 Taller 2 Widalys Vélez Díaz # S00342308 25 de junio de 2015 Profesora Sylvia Cosme Montalvo 1 2 Medidas de Tendencia Central y de Variación I. ¿Cuáles son las propiedades de un conjunto de datos numéricos? Aunque la presentación de datos numéricos es esencial no se limita a la presentación de datos, observación y análisis. También se examinan sus propiedades como las medidas de tendencia central, variación y forma. II. Explique a qué se refiere la propiedad de posición o tendencia central. Demuestre la propiedad con un ejemplo gráfico. La propiedad de posición o tendencia central es la medida en la que todo el grupo de valores de datos se encuentran alrededor de un valor central o típico. III. Compare la moda, media y mediana y detalle las ventajas y desventajas de la utilización de cada una de estas medidas de tendencia central. Prepare una tabla que incluya las fórmulas de cada medida, ventajas y desventajas para datos no agrupados y datos agrupados. Medidas Definición Moda Media Ventajas Desventajas Fórmulas Valor que aparece con mayor frecuencia en un conjunto de datos. 1, 1, 1, 2, 3, 4, 5 La aparición de algún valor extremo no afecta la moda. Se usa sólo para fines descriptivos, porque varía más entre muestras que otras medidas de tendencia central. Aparece con más frecuencia Es al medida más común en las medidas de Actúa como un punto de balance de manera que las Cualquier valor extremo afecta mucho la media. Debido a eso, no es el N+1 / 2 Sumas los valores 1 es la moda 3 Medidas de Tendencia Central y de Variación tendencia central Mediana IV. Es un valor que parte el arreglo ordenado por la mitad. observaciones más pequeñas compensan a las más grandes. Ninguna otra medida de tendencia central de uso común posee esta característica. Es usada a menudo porque no es sensible a los valores extremos mejor promedio para describir o resumir un conjunto de datos que tiene valores extremos. Si se ignora la posibilidad de igualdad en los valores de los datos, que se pueden atribuir a mediciones imprecisas, cualquier observación seleccionada al azar es tan susceptible de exceder a la mediana. y los divides por el número de valores 11, 12, 13, 14, 15 13 es la mediana Detalle la diferencia entre medidas de tendencia central y medidas de tendencia no central. La mayor parte de los conjuntos de datos muestra una tendencia bien determinada a agruparse o aglomerarse alrededor de cierto punto central. Para cualquier conjunto específico de datos, casi siempre se puede seleccionar algún valor típico, o promedio, para describir todo el conjunto. Este valor típico descriptivo es una medida de tendencia central o ubicación. Los cincos tipos de promedios que se utilizan con frecuencia como medidas de tendencia central son al media aritmética, la mediana, la moda, el rango medio (o centro de recorrido) y el eje medio. Los cuartiles (también son llamados cuantiles) son las medidas de tendencia no central que se utilizan con mayor frecuencia y se emplean sobre todo para resumir o describir las propiedades de conjuntos grandes de datos numéricos. Son medidas descriptivas que parten los datos 4 Medidas de Tendencia Central y de Variación ordenados en cuatro. Otros cuartiles que se utilizan a menudo son los deciles, que separan los datos ordenados en diez partes, y los percentiles, que los dividen en cien partes. V. ¿Qué significa la propiedad de variación? Demuestre a través de un gráfico dicha propiedad. Una segunda propiedad importante para describir un conjunto de datos numéricos es la variación. La variación es la cantidad de dispersión o separación, que presentan los datos. Dos conjuntos de datos pueden diferir tanto en la tendencia central como en la variación. Cinco medidas de variación incluyen el recorrido, el rango intercuartil, la varianza, la desviación estándar y el coeficiente de variación. 100 80 East 60 West 40 North 20 0 1st Qtr 2nd Qtr 3rd Qtr 4th Qtr VI. Desarrolle una tabla con la definición, diferencias, ventajas y desventajas en la utilización de las siguientes medidas de variación: Medidas de Variación Rango Rango Intercuartil Definición Ventajas Desventaja / Diferencia Es la diferencia entre Es la medida de los valores más grandes variación más simple. y los más pequeños. Ignora la forma en que se distribuyen los datos. Sensible a los valores atípicos. Es la distancia entre el primer y tercer cuartil. A diferencia del rango, es un estadístico Medida estable de desembolso. Se usa 5 Medidas de Tendencia Central y de Variación A veces es llamado la dispersión H. para construir los diagramas de caja y bigote. robusto. Varianza Es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza de una muestra es un buen estimador de la varianza de la población. Como establece la variabilidad, es importante tener en cuenta, que en ciertos casos, es preferible emplear otras medidas de dispersión ante las características de las distribuciones. Desviación Estándar Mide la dispersión “promedio” alrededor de la media. Es la raíz cuadrada de la varianza. Es la medida de variación más utilizada. Tiene las mismas unidades que los datos originales. Coeficiente de Variación Mide la dispersión en los datos con relación a la media. Es una indicación relativa de la variación. Se puede utilizar para comparar la variabilidad de dos o más conjuntos de datos medidos en unidades diferentes. Siempre se expresa como porcentaje, no en términos de las unidades de los datos específicos. VII. ¿Cómo ayuda la regla empírica a explicar las formas en que un conjunto de datos numéricos se conglomeran y se distribuyen? En la mayor parte de los conjuntos de datos, una porción considerable de las observaciones tienden a agruparse, más o menos cerca de la mediana. En los conjuntos de datos con sesgo a la derecha, la agrupación ocurre a la izquierda (o abajo) de la mediana, en los conjuntos de datos con sesgo a la izquierda tienden a agruparse a la derecha (o arriba) de la mediana. En conjuntos de datos simétricos, donde la media y la mediana son iguales, con frecuencia las observaciones tienden a agruparse en torno a estas medidas de tendencia central. Cuando no existe un sesgo extremo y se observa este tipo de agrupación en un conjunto de datos, se puede utilizar la Medidas de Tendencia Central y de Variación llamada regla empírica para examinar la propiedad de variabilidad de los datos y adquirir una idea más clara de lo que mide la desviación estándar. VIII. Defina y explique la propiedad de la forma de una distribución de datos numéricos. Presente dicha propiedad a través de los gráficos generalmente utilizados. Dos estadísticas relacionadas con la forma de una distribución de datos numéricos es la Oblicuidad (Skewness). Ésta mide la cantidad de asimetría en una distribución. La segunda es la Curtosis (Kurtosis) la cual mide la concentración relativa de los valores en el centro de una distribución en comparación con las colas. Skewness: Simétrica o asimétrica Kurtosis: IX. ¿Por qué son útiles las técnicas de análisis exploratorio de datos resumen de cinco números y diagrama de caja y bigotes? 6 Medidas de Tendencia Central y de Variación 7 Son útiles porque el análisis exploratorio de datos resumen de cinco números ayuda a describir el centro, extensión y forma de los datos. El diagrama de caja y bigotes (Box Plots) sirve para visualizar la variabilidad de una variable y comparar distribuciones de la misma variable; además de ubicar valores extremos. X. ¿Cuáles son algunos aspectos éticos que están presentes cuando se hace la distinción entre el uso apropiado e inapropiado de medidas descriptivas de resumen que se publican en periódicos y revistas? El análisis de datos es objetivo. Debe reportar las medidas de resumen que mejor describen y comunican los aspectos importantes del conjunto de datos. La interpretación de los datos es subjetiva, debe ser hecha en forma justa, neutral y clara. Entre los aspectos éticos se encuentran el que se debe documentar tanto los resultados buenos y malos. Debe ser presentado de manera justa, objetiva y neutral. No se debe utilizar medidas de resumen inapropiados para distorsionar los hechos. XI. Conéctese a la dirección electrónica www.prenhall.com/berenson. Seleccione la edición 11 del libro Basic Business Statistics, de Berenson, Levine y Krehbiel. Entre al enlace “companion website”, seleccione en la parte superior el capítulo 3: “Numerical Descriptive Measures”. En la parte izquierda de la página seleccione “Self-Study Quizzes”. Entre al enlace de “Multiple Choice” conteste la prueba, sométala a evaluación. Envíe los resultados a la dirección electrónica del facilitador y a su dirección electrónica para que la imprima y la traiga al taller para aclarar dudas. Este ejercicio debe incluirse en el portafolio. La prueba fue contestada y enviada a la profesora a través del enlace del libro. Medidas de Tendencia Central y de Variación Referencias Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2001). Estadística para administración. México: Pearson Educación. Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2011). Basic Business Statistics (11th ed.). Pearson. Berenson, M. L., Levine, D. M., & Krehbiel, T. C. (2011). Basic Business Statistics (12th ed.). Pearson. Definición de varianza - Qué es, Significado y Concepto. (2008). Retrieved from http://definicion.de/varianza/ 8