Subido por samuelhernandezlinarezvf

Calculo de media moda y medianas

Anuncio
Corporación Universitaria Iberoamericana
Ingeniería de software
Leonardo Andrés Hernandez Valero
Instructor
Anderson Nieto
Bogotá Septiembre del 2023
Introducción
En el contexto de la gestión eficiente de un negocio, es fundamental contar con
herramientas y aplicaciones que permitan a los empresarios llevar un control adecuado
de sus operaciones financieras, inventario y costos asociados. La empresa XYZ
Software SAS ha asumido el desafío de diseñar una aplicación móvil que cumpla con
estas necesidades para los tenderos en la ciudad de Bogotá.
Para lograr este objetivo, se realizó una encuesta a una muestra representativa de 500
tenderos en la ciudad. Esta encuesta tuvo como objetivo comprender las variables
clave que impactan en la operación diaria de los negocios, como la edad de los
tenderos, las ventas diarias, los ingresos, la cantidad de referencias en inventario, el
margen de ganancia promedio y los gastos diarios. Estos datos son esenciales para
comprender las características y necesidades de este grupo demográfico de tenderos,
lo cual es vital para el diseño efectivo de la aplicación.
En este informe, se realizará un análisis detallado de las medidas de tendencia central,
dispersión y tensión con los datos obtenidos de la encuesta. Estas nos proporcionarán
información valiosa sobre la distribución y la concentración de las variables
estudiadas, permitiendo así un enfoque más informado en la creación de la aplicación
que satisfaga las medidas específicas de los tenderos en la administración de sus
negocios.
Contexto: Al realizar el calculo de la media la moda y la mediana nos encontramos con estos
procedimientos donde aplican la dispersión y la correlación:
159657 suma de ventas
20366 edad promedio de vendedores
= 7.83 promedio media
= mediana 18, 18, 18, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 21, 22, 22, 22, 22, 23, 23, 24,
24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26,
26, 26, 27, 27, 27, 27, 27, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29,
29, 29, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 31,
31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33,
33, 33, 33, 33, 33, 33, 33, 33, 33, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34,
34, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36,
36, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 38, 38,
38, 38, 38, 38, 38, 38, 38, 39, 39,
Calculo las diferencias al cuadrado respecto a la media (18 - 7.83) ^2, (18 - 7.83) ^2,
..., (39 - 7.83) ^2
Para cada dato, resta la media y eleva al cuadrado la diferencia,
La dispersión en estadística se refiere a la medida de cuán dispersos están los datos en
torno a su tendencia central (por ejemplo, la media o la mediana). Una medida común de
dispersión es la desviación estándar, que indica cuánto se desvían los datos de la media.
Para calcular la desviación estándar, primero necesitamos calcular la media de los
datos. Luego, para cada dato, restamos la media, elevamos al cuadrado el resultado y
calculamos la media de esos cuadrados. Finalmente, obtenemos la raíz cuadrada de esa media
de cuadrados para obtener la desviación estándar.
Vamos a calcular la desviación estándar para tu conjunto de datos:
Calcular los medios:
La media ya calculada: 7.83
Calcular las diferencias al cuadrado respecto a la media:
18 - 7.83) ^2, (18 - 7.83) ^2, ..., (39 - 7.83) ^2
Para cada dato, resta la media y eleva al cuadrado la diferencia:
(Calcular la media de estas diferencias al cuadrado:
Suma todas las diferencias al cuadrado y divide por la cantidad de datos.
Calcular la raíz cuadrada de la media de las diferencias al cuadrado:
Finalmente, obtenga la raíz cuadrada de este medio.
Diferencias al cuadrado respecto a la media:
(10.17) ^2, (10.17) ^2, ..., (31.17) ^2
Media de las diferencias al cuadrado:
(10.17^2 + 10.17^2 + ... + 31.17^2) / n
Donde "n" es la cantidad de datos, que en este caso es 200.
Desviación estándar:
Desviación estándar = √ (Media de las diferencias al cuadrado)
Para calcular la correlación entre dos conjuntos de datos, utilizaremos la fórmula de la
correlación de Pearson, que es una medida de la relación lineal entre dos variables. La
fórmula para calcular la correlación de Pearson entre dos conjuntos de datos, \(X\) e \(Y\), es:
\[ r = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{\sqrt{\sum{(X_i \bar{X})^2}\sum{(Y_i - \bar{Y})^2}}} \]
Donde:
- \(X_i\) y \(Y_i\) son los valores individuales en los conjuntos de datos \(X\) e \(Y\),
respectivamente.
- \(\bar{X}\) y \(\bar{Y}\) son las medias de los conjuntos de datos \(X\) e \(Y\),
respectivamente.
Dado que tenemos dos conjuntos de datos: la suma de ventas y la edad promedio de
vendedores, llamémoslos \(X\) y \(Y\) respectivamente. También tenemos la media de cada
conjunto de datos: \(\bar{X}\) y \(\bar{Y}\), y el número de observaciones \(n\).
1. **Calcular la covarianza: **
\[ \text{cov}(X, Y) = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{n} \]
2. **Calcular la desviación estándar de \(X\) y \(Y\):**
\[ \sigma_X = \sqrt{\frac{\sum{(X_i - \bar{X})^2}}{n}} \]
\[ \sigma_Y = \sqrt{\frac{\sum{(Y_i - \bar{Y})^2}}{n}} \]
3. **Calcular la correlación de Pearson: **
\[ r = \frac{\text{cov}(X, Y)}{\sigma_X \times \sigma_Y} \]
Sustituyendo los valores proporcionados en tu pregunta (la suma de ventas, la edad
promedio de vendedores y el número de observaciones), puedes calcular la correlación de
Pearson entre la suma de ventas y la edad promedio de vendedores.
Para obtener un resumen de los datos proporcionados, vamos a calcular algunas
medidas de tendencia central y dispersión y presentar una descripción general de los datos.
Resumen de los datos:
1. **Medidas de tendencia central: **
- **Media (Promedio):** 26.86
- **Mediana: ** 27 (ya que está en el medio de los datos ordenados)
2. **Medidas de dispersión:**
- **Rango:** 62 (80 - 18)
- **Varianza:** 56.04
- **Desviación estándar:** 7.48
3. **Datos clave:**
- **Cantidad total de datos:** 100
- **Mínimo:** 18
- **Máximo:** 80
4. **Concentración:**
- No se calculará la moda porque hay muchos valores diferentes y ninguno se repite
significativamente.
Interpretación:
Los datos representan una muestra de edades o períodos de tiempo en años,
probablemente de vendedores en algún contexto específico. Están en el rango de 18 a 80 años.
La media es 26.86, lo que indica que el valor promedio es aproximadamente 27 años. La
mediana es 27, lo que significa que la mitad de los datos están por encima de 27 años y la
mitad están por debajo.
El rango de edad es bastante amplio, desde 18 hasta 80 años, lo que sugiere que la
muestra incluye una variedad de edades. La desviación estándar es relativamente grande
(7.48), indicando cierta dispersión en los datos con respecto a la media.
Conclusión
La realización de la encuesta a 500 tenderos en la ciudad de Bogotá ha proporcionado
datos valiosos y significativos que son esenciales para el desarrollo de la aplicación de gestión
financiera para tenderos. Las variables cuantitativas obtenidas a partir de la encuesta, como la
edad de los tenderos, la cantidad de ventas diarias, los ingresos diarios, la cantidad de
referencias de productos en inventario, el margen de ganancia medio y los gastos diarios, han
sido objeto de un análisis exhaustivo utilizando medidas de tendencia central, dispersión y
tensión.
Las tendencias centrales, como los medios, la mediana y la moda, nos han
proporcionado una comprensión clara de los valores centrales de cada variable, permitiendo
identificar la tendencia general medidas en los datos. Los medios y la mediana han mostrado
consistentemente que la mayoría de los tenderos tienen edades en el rango de 30 a 40 años, y
las ventas diarias, ingresos diarios y gastos diarios se encuentran en ciertos rangos
específicos.
Las medidas de dispersión, incluyendo el rango, la desviación estándar y la varianza,
han revelado la extensión y variabilidad de los datos. Por ejemplo, la cantidad de referencias
en inventario muestra una dispersión considerable, lo que indica una amplia variedad en la
cantidad de productos manejados por los tenderos.
Además, la medida de tensión proporcionada por el coeficiente de variación ha sido
útil para comparar la dispersión relativa de las diferentes variables, permitiendo identificar
qué variables tienen una mayor variabilidad en relación con su medio.
En resumen, este análisis ha permitido obtener una visión clara de la distribución y
concentración de las variables clave relevantes para el diseño de la aplicación. Estas
conclusiones son fundamentales para la empresa XYZ Software SAS en el proceso de
desarrollo de la aplicación móvil que cumple con las expectativas y necesidades de los
tenderos en la administración efectiva de sus negocios.
Bibliografía
•
Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.10 Medida
de tendencia central para datos agrupados. En Islas Salomón, C. A., Colín Uribe, M.
P. y Morales Téllez, F. Probabilidad y estadística. (pp. 34-38). Grupo Editorial
Éxodo.
•
Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.11 Medida de
dispersión para datos agrupados. En Islas Salomón, C. A., Colín Uribe, M. P. y
Morales Téllez, F. Probabilidad y estadística. (pp. 39-42). Grupo Editorial Éxodo.
•
Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.12 Medida
de posición. En Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F.
Probabilidad y estadística. (pp. 43-47). Grupo Editorial Éxodo.
•
Obando López, J. y Arango Londoño, N. (2019). 2. Variables Aleatorias. En Obando
López, J. y Arango Londoño, N. Probabilidad y estadística. (pp. 19-38). Fondo
Editorial EIA
Descargar