Corporación Universitaria Iberoamericana Ingeniería de software Leonardo Andrés Hernandez Valero Instructor Anderson Nieto Bogotá Septiembre del 2023 Introducción En el contexto de la gestión eficiente de un negocio, es fundamental contar con herramientas y aplicaciones que permitan a los empresarios llevar un control adecuado de sus operaciones financieras, inventario y costos asociados. La empresa XYZ Software SAS ha asumido el desafío de diseñar una aplicación móvil que cumpla con estas necesidades para los tenderos en la ciudad de Bogotá. Para lograr este objetivo, se realizó una encuesta a una muestra representativa de 500 tenderos en la ciudad. Esta encuesta tuvo como objetivo comprender las variables clave que impactan en la operación diaria de los negocios, como la edad de los tenderos, las ventas diarias, los ingresos, la cantidad de referencias en inventario, el margen de ganancia promedio y los gastos diarios. Estos datos son esenciales para comprender las características y necesidades de este grupo demográfico de tenderos, lo cual es vital para el diseño efectivo de la aplicación. En este informe, se realizará un análisis detallado de las medidas de tendencia central, dispersión y tensión con los datos obtenidos de la encuesta. Estas nos proporcionarán información valiosa sobre la distribución y la concentración de las variables estudiadas, permitiendo así un enfoque más informado en la creación de la aplicación que satisfaga las medidas específicas de los tenderos en la administración de sus negocios. Contexto: Al realizar el calculo de la media la moda y la mediana nos encontramos con estos procedimientos donde aplican la dispersión y la correlación: 159657 suma de ventas 20366 edad promedio de vendedores = 7.83 promedio media = mediana 18, 18, 18, 19, 19, 19, 19, 19, 19, 20, 20, 20, 20, 20, 21, 22, 22, 22, 22, 23, 23, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 30, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 32, 32, 32, 32, 32, 32, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 33, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 34, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 36, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 38, 39, 39, Calculo las diferencias al cuadrado respecto a la media (18 - 7.83) ^2, (18 - 7.83) ^2, ..., (39 - 7.83) ^2 Para cada dato, resta la media y eleva al cuadrado la diferencia, La dispersión en estadística se refiere a la medida de cuán dispersos están los datos en torno a su tendencia central (por ejemplo, la media o la mediana). Una medida común de dispersión es la desviación estándar, que indica cuánto se desvían los datos de la media. Para calcular la desviación estándar, primero necesitamos calcular la media de los datos. Luego, para cada dato, restamos la media, elevamos al cuadrado el resultado y calculamos la media de esos cuadrados. Finalmente, obtenemos la raíz cuadrada de esa media de cuadrados para obtener la desviación estándar. Vamos a calcular la desviación estándar para tu conjunto de datos: Calcular los medios: La media ya calculada: 7.83 Calcular las diferencias al cuadrado respecto a la media: 18 - 7.83) ^2, (18 - 7.83) ^2, ..., (39 - 7.83) ^2 Para cada dato, resta la media y eleva al cuadrado la diferencia: (Calcular la media de estas diferencias al cuadrado: Suma todas las diferencias al cuadrado y divide por la cantidad de datos. Calcular la raíz cuadrada de la media de las diferencias al cuadrado: Finalmente, obtenga la raíz cuadrada de este medio. Diferencias al cuadrado respecto a la media: (10.17) ^2, (10.17) ^2, ..., (31.17) ^2 Media de las diferencias al cuadrado: (10.17^2 + 10.17^2 + ... + 31.17^2) / n Donde "n" es la cantidad de datos, que en este caso es 200. Desviación estándar: Desviación estándar = √ (Media de las diferencias al cuadrado) Para calcular la correlación entre dos conjuntos de datos, utilizaremos la fórmula de la correlación de Pearson, que es una medida de la relación lineal entre dos variables. La fórmula para calcular la correlación de Pearson entre dos conjuntos de datos, \(X\) e \(Y\), es: \[ r = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{\sqrt{\sum{(X_i \bar{X})^2}\sum{(Y_i - \bar{Y})^2}}} \] Donde: - \(X_i\) y \(Y_i\) son los valores individuales en los conjuntos de datos \(X\) e \(Y\), respectivamente. - \(\bar{X}\) y \(\bar{Y}\) son las medias de los conjuntos de datos \(X\) e \(Y\), respectivamente. Dado que tenemos dos conjuntos de datos: la suma de ventas y la edad promedio de vendedores, llamémoslos \(X\) y \(Y\) respectivamente. También tenemos la media de cada conjunto de datos: \(\bar{X}\) y \(\bar{Y}\), y el número de observaciones \(n\). 1. **Calcular la covarianza: ** \[ \text{cov}(X, Y) = \frac{\sum{(X_i - \bar{X})(Y_i - \bar{Y})}}{n} \] 2. **Calcular la desviación estándar de \(X\) y \(Y\):** \[ \sigma_X = \sqrt{\frac{\sum{(X_i - \bar{X})^2}}{n}} \] \[ \sigma_Y = \sqrt{\frac{\sum{(Y_i - \bar{Y})^2}}{n}} \] 3. **Calcular la correlación de Pearson: ** \[ r = \frac{\text{cov}(X, Y)}{\sigma_X \times \sigma_Y} \] Sustituyendo los valores proporcionados en tu pregunta (la suma de ventas, la edad promedio de vendedores y el número de observaciones), puedes calcular la correlación de Pearson entre la suma de ventas y la edad promedio de vendedores. Para obtener un resumen de los datos proporcionados, vamos a calcular algunas medidas de tendencia central y dispersión y presentar una descripción general de los datos. Resumen de los datos: 1. **Medidas de tendencia central: ** - **Media (Promedio):** 26.86 - **Mediana: ** 27 (ya que está en el medio de los datos ordenados) 2. **Medidas de dispersión:** - **Rango:** 62 (80 - 18) - **Varianza:** 56.04 - **Desviación estándar:** 7.48 3. **Datos clave:** - **Cantidad total de datos:** 100 - **Mínimo:** 18 - **Máximo:** 80 4. **Concentración:** - No se calculará la moda porque hay muchos valores diferentes y ninguno se repite significativamente. Interpretación: Los datos representan una muestra de edades o períodos de tiempo en años, probablemente de vendedores en algún contexto específico. Están en el rango de 18 a 80 años. La media es 26.86, lo que indica que el valor promedio es aproximadamente 27 años. La mediana es 27, lo que significa que la mitad de los datos están por encima de 27 años y la mitad están por debajo. El rango de edad es bastante amplio, desde 18 hasta 80 años, lo que sugiere que la muestra incluye una variedad de edades. La desviación estándar es relativamente grande (7.48), indicando cierta dispersión en los datos con respecto a la media. Conclusión La realización de la encuesta a 500 tenderos en la ciudad de Bogotá ha proporcionado datos valiosos y significativos que son esenciales para el desarrollo de la aplicación de gestión financiera para tenderos. Las variables cuantitativas obtenidas a partir de la encuesta, como la edad de los tenderos, la cantidad de ventas diarias, los ingresos diarios, la cantidad de referencias de productos en inventario, el margen de ganancia medio y los gastos diarios, han sido objeto de un análisis exhaustivo utilizando medidas de tendencia central, dispersión y tensión. Las tendencias centrales, como los medios, la mediana y la moda, nos han proporcionado una comprensión clara de los valores centrales de cada variable, permitiendo identificar la tendencia general medidas en los datos. Los medios y la mediana han mostrado consistentemente que la mayoría de los tenderos tienen edades en el rango de 30 a 40 años, y las ventas diarias, ingresos diarios y gastos diarios se encuentran en ciertos rangos específicos. Las medidas de dispersión, incluyendo el rango, la desviación estándar y la varianza, han revelado la extensión y variabilidad de los datos. Por ejemplo, la cantidad de referencias en inventario muestra una dispersión considerable, lo que indica una amplia variedad en la cantidad de productos manejados por los tenderos. Además, la medida de tensión proporcionada por el coeficiente de variación ha sido útil para comparar la dispersión relativa de las diferentes variables, permitiendo identificar qué variables tienen una mayor variabilidad en relación con su medio. En resumen, este análisis ha permitido obtener una visión clara de la distribución y concentración de las variables clave relevantes para el diseño de la aplicación. Estas conclusiones son fundamentales para la empresa XYZ Software SAS en el proceso de desarrollo de la aplicación móvil que cumple con las expectativas y necesidades de los tenderos en la administración efectiva de sus negocios. Bibliografía • Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.10 Medida de tendencia central para datos agrupados. En Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. Probabilidad y estadística. (pp. 34-38). Grupo Editorial Éxodo. • Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.11 Medida de dispersión para datos agrupados. En Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. Probabilidad y estadística. (pp. 39-42). Grupo Editorial Éxodo. • Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. (2018). 1.12 Medida de posición. En Islas Salomón, C. A., Colín Uribe, M. P. y Morales Téllez, F. Probabilidad y estadística. (pp. 43-47). Grupo Editorial Éxodo. • Obando López, J. y Arango Londoño, N. (2019). 2. Variables Aleatorias. En Obando López, J. y Arango Londoño, N. Probabilidad y estadística. (pp. 19-38). Fondo Editorial EIA