Subido por Wilsinho Hilasaca

Herramientas-de-Excel-para-Estadística

Anuncio
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
PROFESORES: ÁLVARO TOLEDO SAN MARTÍN
INÉS VICENCIO PARDO
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA
2015
PROFESOR: ÁLVARO TOLEDO SAN MARTÍN
Licenciado en Matemáticas, Estadístico y
Magíster en Estadística de la Pontificia
Universidad Católica de Chile.
Coordinador
de
Estadística
del
Departamento de Matemática y Física ,
Universidad Bernardo O´Higgins. Atiende
las cátedras de Estadística I y Estadística
II, Matemática Básica, Álgebra y Cálculo I
de la Universidad Bernardo O`Higgins
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
APUNTE: HERRAMIENTAS DE EXCEL
PARA ESTADÍSTICA
CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA
2015
PROFESORA: INÉS VICENCIO PARDO
Profesora de Matemática y Computación,
Universidad de Santiago de Chile. Magíster
en Estadística Pontificia Universidad
Católica de Chile.
Coordinadora de Matemática y Álgebra del
Departamento de Matemática y Física ,
Universidad Bernardo O´Higgins. Atiende
las cátedras de Estadística I y Estadística II,
Matemática Básica, Álgebra y Cálculo I.
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
CONTENIDO
PRESENTACIÓN.................................................................................................................................... 7
1.
Activación de la herramienta de análisis de datos de MS Office Excel. ...................................... 8
2.
Confección de Tabla de frecuencias con función tabla dinámica .............................................. 10
2.1
Despliegue de opciones en Tabla Dinámica ........................................................................ 12
3.
Estadística Descriptiva con la función Análisis de datos. ........................................................... 14
4.
Construcción de un Histograma. ............................................................................................... 20
4.1
Una aplicación de medidas descriptivas. ............................................................................. 27
4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E
HISTOGRAMA ................................................................................................................................ 37
5.
Tablas de contingencia .............................................................................................................. 39
5.1
6.
ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA........................... 46
Probabilidades y Teorema de Bayes .......................................................................................... 47
6.1
ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES ....... 56
6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y TEOREMA
DE BAYES ....................................................................................................................................... 58
7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS
Excel. ................................................................................................................................................. 75
7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la
herramienta Análisis de datos de MS Excel. ................................................................................. 78
7.1.1
Distribución discreta: .................................................................................................... 79
7.1.2
Distribución Uniforme: ................................................................................................. 81
7.1.3
Distribución Normal: ..................................................................................................... 82
7.1.4
Distribución de Bernoulli: ............................................................................................. 83
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
5
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
8.
7.1.5
Distribución Binomial:................................................................................................... 84
7.1.6
Distribución Poisson: .................................................................................................... 86
7.1.7
Frecuencia Relativa: ...................................................................................................... 87
Distribuciones de probabilidad Discreta .................................................................................... 89
8.1.
Probabilidad con distribución Binomial. ............................................................................. 90
8.2.
Probabilidad con distribución Binomial Inversa. ................................................................ 91
8.3.
Probabilidad con distribución Hipergeométrica. ................................................................ 91
8.4.
Probabilidad con Distribución de Poisson. ......................................................................... 92
8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
DISCRETA ....................................................................................................................................... 94
9.
Distribuciones de probabilidad Continua .................................................................................. 95
9.1.
Probabilidad con distribución Exponencial......................................................................... 96
9.2.
Probabilidad con distribución Normal. ............................................................................... 97
9.3.
Distribución Normal Inversa. .............................................................................................. 97
9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
CONTINUA ..................................................................................................................................... 99
10.
Tablas bivariadas continuas y cálculo de probabilidades ...................................................... 100
10.1
ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS............................... 112
10.2
EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA ................................... 113
CONCLUSIÓN ................................................................................................................................... 114
BIBLIOGRAFÍA .................................................................................................................................. 115
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
6
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
PRESENTACIÓN
Dentro del ámbito de la Estadística como ciencia aplicada, un estudiante de Ingeniería debe adquirir
conocimientos que abarcan temas de análisis descriptivo de variables, problemas de probabilidad,
estimación de modelos probabilístico y simulación de distribuciones de probabilidad, además de la
inferencia estadística y el estudio de modelos estadísticos multivariados.
El propósito de este material de apoyo es proveer al estudiante de Ingeniería (y de otras carreras) los
conocimientos aplicados en software para desarrollar y comprender los contenidos del curso Estadística I
(Estadística Aplicada) impartido por el Departamento de Matemática y Física para la Facultad de Ingeniería y
Administración. El software a utilizar será Microsoft Excel. Se ha seleccionado Excel dado que es un
programa de uso masivo que cuenta con las herramientas básicas suficientes para realizar tablas, gráficos,
análisis de dados y que nuestro futuro profesional Ingeniero sin duda, podrá utilizar en el campo laboral.
La organización de este documento sigue el orden de un programa de Estadística Matemática habitual y que
es similar al orden de los contenidos que se tratan el curso de Estadística I (Estadística Aplicada). Incluye en
un principio los pasos para activar la herramienta “Análisis de datos” que dispone Excel para Estadística,
luego, se concentra el documento en el análisis descriptivos de datos y el análisis gráfico, luego, ejemplifica
el cálculo de probabilidad abarcando hasta el importante Teorema de Bayes, para luego, entrar en el análisis
de las variables aleatorias discretas y continuas haciendo énfasis en la capacidad de Excel para realizar
simulaciones de este tipo de variables. Finalmente se complementa con la construcción de tablas bivariadas
para datos continuos (y discretos) como extensión al caso de variables cualitativas.
Este material es de carácter inédito, pues corresponde a la recolección de cursos y experiencias de análisis
en el software Excel realizada por los autores en distintos cursos de estadística realizados en distintas casas
de estudio. Algunos de los problemas propuestos se recopilaron de textos de Estadística que son citados
habitualmente en la bibliografía de un curso formal de Estadística Matemática.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
7
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
1. Activación de la herramienta de análisis de datos de MS Office Excel.
Para la activación de la herramienta análisis de datos de Excel, realice los siguientes pasos:
Abra una hoja de Excel
Haga “click” en la pestaña de “Archivo” ubicada en la parte superior izquierda de la hoja de Excel.
Figura 1: Ubicación de la opción archivo en planilla Excel
Se desplegará un menú en el costado izquierdo de la hoja.
Figura 2: Ubicación de “Opciones” en la planilla Excel
En el menú haga “click” en “Opciones”
Se desplegará la siguiente ventana, de la cual debe seleccionar la opción “complementos”, luego haga “click”
en “herramientas para análisis” y finalmente “click” en “ir”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
8
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 3. Esquema de pasos para seleccionar la herramienta de análisis del menú complementos.
En la ventana siguiente debe hacer “click” en la opción “herramienta para análisis” y luego aceptar.
Figura 4. Ventana de complementos.
La herramienta de análisis de datos ha sido activada. Para visualizarla se debe ir a la opción “Datos” de la
barra superior de la hoja de Excel. En la parte final aparecerá activada la opción “Análisis de datos”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
9
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 5. Visualización de la herramienta de análsis de datos .
2. Confección de Tabla de frecuencias con función tabla dinámica
1
La siguiente tabla dinámica, será confeccionada con la base de datos dado.xlsx , la cual representa el
resultado obtenido del lanzamiento en 100 oportunidades de un dado equilibrado.
Figura 6. Ubicación de función Tabla dinámica
1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar.
2. Seleccionar la opción “Tabla dinámica”.
1
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
10
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 7. Ingreso de datos en función tabla dinámica.
3. Ingresar los datos en la opción “Tabla o rango”. Cabe destacar que por defecto Excel usará el dato
ubicado en la primera fila como el título de la tabla dinámica.
4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
5. Hacer “click” en “Aceptar”
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
11
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
2.1
Despliegue de opciones en Tabla Dinámica
Figura 8. Opciones Tabla Dinámica.
3.
En el recuadro “Seleccionar campos para agregar al informe” desplazar el campo con el nombre de la
variable (N°caraDado) hasta el recuadro “Etiqueta de fila”.
Figura 9. Ilustración de construcción de tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
12
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.
Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de N°caraDado”, y
seleccionar la opción “configuración de campo de valor”.
Figura 10. Menú configuración “Campo de Valor”
5.
Cambiar la opción “Suma” por la opción “Cuenta”.
6.
Hacer “click” en “Aceptar”.
Figura 11. Tabla dinámica
Con esto se ha generado una tabla de frecuencias absolutas para la variable de estudio N°caraDado, la cual,
resume la cantidad de veces que se obtuvo cierta cara del dado.
Por ejemplo, la cara del dado con el valor 1, se obtuvo 22 veces de los 100 lanzamientos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
13
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
3.
Estadística Descriptiva con la función Análisis de datos.
El objetivo de este video es mostrar el uso de la herramienta Análisis de Datos para la obtención de
estadísticas descriptivas y confección de un histograma de frecuencias.
Primero debemos seleccionar el menú de DATOS y hacer ““click”” en la herramienta “Análisis de Datos”
Figura 12. Selección de opción análisis de datos.
Cabe notar que cuando se utiliza un programa estadístico para los cálculos de estadísticos descriptivos, no es
necesario confeccionar tablas de frecuencias.
Las tablas de frecuencias serán de utilidad para la confección de gráficos y para presentar resumen de la
información en el informe final.
Para nuestro ejemplo utilizaremos la información que tenemos de las estaturas de 100 personas, disponibles
2
en el archivo “Ejemplo descriptivas.xlsx ”.
Abrimos el archivo y tenemos:
2
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
14
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 13. Base de datos “Ejemplo descriptivas.xlsx”.
Con esta base de datos mostraremos lo que entrega la herramienta “Análisis de Datos” en su opción,
“Estadísticas Descriptivas”.
Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la
opción Estadísticas Descriptivas y finalmente ““click”” en aceptar.
Figura 14. Opción Estadísticas Descriptivas.
Se despliega el siguiente cuadro:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
15
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 15. Ventana de ingreso de datos.
En esta ventana debemos ingresar el rango de datos que analizaremos, en este caso serán la columna donde
se encuentran las estaturas de las 100 personas, si se incluye en el rango de entrada el nombre de la
variable, entonces se debe marcar la opción “Rótulos en la primera fila”.
Figura 16. Ingreso de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
16
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para las opciones de salida, marcaremos la opción Rango de Salida, y le indicamos una celda contigua a la
columna de datos, por ejemplo la D1, entonces los resultados que nos entregue Excel quedarán a partir de
esta celda.
También si se estima por orden, podemos optar por dejar los resultados en una nueva hoja.
Marcamos Resumen de estadísticas y Aceptar.
Figura 17. Resumen de estadísticas.
Excel nos entrega el listado de estadísticas descriptivas para la Variable Estatura
Figura 18. Salida computacional de la opción análisis de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
17
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Las estaturas están medidas con dos decimales que indican los centímetros, podemos entonces dejar las
estadísticas descriptivas que obtuvimos también con dos decimales, esto facilitará la interpretación.
Seleccionamos el rango de los valores de las medidas y con el botón derecho seleccionamos “Formato de
celdas”.
Figura 19. Opciones de presentación de datos.
Y luego seleccionar formato número, “posición de decimales”: 2, y Aceptar
Figura 20. Modificar decimales de la salida de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
18
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Queda la siguiente presentación:
Figura 21. Resumen de estadísticas con dos decimales.
Las interpretaciones de las medidas de tendencia central son las siguientes:
Media:
- La media o promedio de las estaturas de las 100 personas es 1,60 metros, un metro y sesenta centímetros.
Mediana:
- El 50% de las personas con menores estaturas miden a lo más 1,61 metros , un metro y 61 centímetros,
también podemos decir que el 50% de las personas más altas miden más de 1,61 metros.
Moda:
- Lo más frecuente en estas 100 personas es que midan aproximadamente 1,49 metros.
Por otra parte la Desviación Estándar, que es la raíz cuadrada de la varianza, nos da una aproximación del
promedio de las desviaciones de los datos respecto de su media.
En nuestro ejemplo la desviación estándar es de 0,15 metros, es decir 15 cm, por lo que podemos decir que
los datos tienen una desviación promedio aproximada respecto de los datos de 15 cm. Si tuviésemos las
edades de otro grupo de personas, entonces podríamos comparar homogeneidad entre ellos, a menor
desviación estándar entonces los datos son más homogéneos (datos más cercanos a promedio, menor
dispersión de los datos)
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
19
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.
Construcción de un Histograma.
Veamos ahora la construcción del histograma de frecuencia para los datos disponibles en la planilla
“Ejemplo descriptivas”.
Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la
opción Histograma y finalmente ““click”” en aceptar.
Figura 22. Función Histograma.
Al hacer ““click”” en Aceptar, nos muestra el siguiente Cuadro
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
20
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 23. Ventana de ingreso de datos .
Aquí en el “rango de entrada” seleccionamos los datos que tenemos de las estaturas, en la opción “Rango
de clase” no ingresaremos información, ya que queremos que el programa determine el número de clases
de nuestro Histograma, marcamos “rótulo”, seleccionamos un “rango de salida”, finalmente marcamos las
opciones “Porcentaje acumulado” , “Crear gráfico” y aceptamos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
21
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 24. Opciones “Porcentaje acumulado” y “Crear gráfico (Histograma)”.
Excel nos entrega una tabla de frecuencias con los porcentajes acumulados de dichas frecuencias, asociados
a una clase que Excel determina, aquí el programa para las 100 estaturas determinó un resumen
construyendo 11 intervalos.
Figura 25. Salida computacional de opción “Histograma”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
22
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
El histograma de frecuencias, además, muestra el gráfico de líneas con los porcentajes acumulados.
Para visualizar mejor, agrandamos el gráfico y nos posesionamos sobre las barras para cambiar el ancho de
estas, recordemos que la variable estaturas es continua y las barras se deben visualizar juntas formando un
polígono de frecuencias.
Hacemos “click” con el botón derecho del mouse sobre una de las barras, seleccionamos dar formato a
serie de datos
Figura 26. Opciones de formato.
Luego cambiamos el Ancho del intervalo, de 150% a 0% y presionamos Enter.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
23
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 27. Modificaciones al ancho del intervalo.
Con esta misma opción, seleccionamos ahora el ícono del balde que es para relleno y líneas, y hacemos
“click”.
Figura 28. Opciones de serie.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
24
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Luego elegimos un color negro para las líneas de las barras, cerramos la ventana.
Figura 29. Ingreso de nombre a histograma.
Lo único que falta es escribir un título adecuado y dar nombre al eje de las clases.
Hacemos “click” sobre el título y lo modificamos, escribiremos “Histograma de frecuencia de las Edades”, de
igual forma hacemos “click” sobre clase en el eje de las abscisas y lo modificamos, escribiremos allí “clase de
las edades”.
Tenemos finalizado el histograma de frecuencias.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
25
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 30. Histograma completo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
26
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.1
Una aplicación de medidas descriptivas.
Una sociedad de Ingenieros consultores, decidió adquirir un nuevo Odómetro para tomar mediciones de
larga distancia, la decisión de hacer esta inversión fue necesaria dado que el que tienen actualmente ya
tiene 6 años de antigüedad y las últimas muestras de medición a un cierto punto que se han hecho con tal
instrumento, han tenido diferencias notorias.
La medición que la empresa entrega entre dos puntos es el promedio de las mediciones hechas en tres
días distintos y a distintas horas del día, esto para no tener sesgo por factores como clima, luminosidad o
interrupciones externas.
El nuevo instrumento es tecnológicamente más avanzado y de mayor precisión (menor margen de error,+/0,5% ), según lo que asegura la compañía que lo vendió.
La empresa además de empezar a utilizar el nuevo odómetro, sigue utilizando el antiguo, dado la gran
demanda de proyectos en los cuales sus servicios de medición han sido contratados.
Los ingenieros está consciente de la necesita contar con dos de estos instrumentos pero quieren tener
alguna evidencia de que las mediciones tomadas por el antiguo odómetro son realmente más inexactas
con respecto a su media, que las mediciones tomadas por el nuevo.
Para esto los ingenieros deciden, ya conociendo una distancia entre dos puntos de 61,5 metros, tomar dos
muestras donde se harán 10 mediciones de esta distancia conocida, (10 días distintos), cada una con los dos
odómetros respectivamente (en metros), con las que calcularan medidas descriptivas, principalmente para
comparar medidas de tendencia central y de dispersión.
Los resultados de estos cálculos ayudaran a tomar la decisión de desechar o seguir utilizando el antiguo
odómetro
3
Las medidas obtenidas se encuentran en el archivo “medidas_odometro.xlsx ” , abriendo el archivo ,
tenemos:
3
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
27
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 31. Base de datos “medidas_odometro.xlsx”.
Para los cálculos de las medidas de tendencia central, utilizaremos la herramienta de análisis de datos
“Estadísticas descriptivas.
En el menú principal, elegimos la opción “datos”, luego “Análisis de datos”, y “Estadística descriptiva
Figura 32. Opción Estadística Descriptiva.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
28
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Calculamos primero las estadísticas descriptivas de las mediciones hechas con el odómetro antiguo, en el
rango de entrada marcamos el rango donde están las medidas que se tomaron con el odómetro antiguo, de
la B2 a la B11, y en el rango de salida la celda F1, desde esa celda se desplegarán, los resultados y ACEPTAR
Figura 33. Ingreso de datos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
29
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Hacemos doble “click” entre las columna F y G, para ajustar el tamaño de la columna F al contenido.
Tenemos entonces:
Figura 34. Desciptivos de Odómetro Antiguo.
El mismo procedimiento hacemos ahora para obtener las estadísticas descriptivas de las medidas tomadas
con el odómetro Nuevo, los ubicamos a partir de la celda I1 para poder tener una mirada conjunta de los
cálculos obtenidos, tenemos entonces:
Figura 35. Comparación de descriptivos de odómetros (Antiguo y Nuevo)
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
30
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Observado los resultados obtenidos, marcaremos con un color de relleno gris, las estadísticas relevantes
Figura 36. Comparación de algunos descriptivos.
Con respecto a las medias obtenidas, tenemos entre ellas una diferencia de 0,425 metros, es decir 42, 5 cm,
puede ser bastante dependiendo del contexto de la medición, y lo más importante que en relación al valor
exacto, el odómetro nuevo, entrega una media más cercana a la medida real que es 61,5.
Con respecto a la desviación estándar obtenida, claramente las medidas tomadas por el odómetro antiguo,
presentan una mayor dispersión entre ellas, esto puede generar una mayor diferencia entre los promedios
finales cuando se tomen sólo tres medidas.
Otro dato importante acá es el Rango, indicador también de dispersión de los datos, el rango que se dan en
las medidas tomadas por el odómetro antiguo es un metro superior con respecto a lo que presentan las
medidas tomadas por el odómetro nuevo.
Si observamos también el coeficiente de asimetría, nos podemos dar cuenta de que las mediciones tomadas
con el odómetro nuevo presentan una marcada asimetría negativa, esto quiere decir que los tatos en su
mayoría, se presentan superiores al promedio
Figura 37. Comparación de coeficientes de asimetría.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
31
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ahora obtendremos los histogramas de frecuencias para visualizar mejor el comportamiento de los datos.
Usando la misma herramienta “Datos”, “Análisis de Datos” , “Histograma”
Figura 38. Confección de histogramas.
Para las medidas tomadas con el odómetro antiguo, el rango de entrada es desde la celda B2 a la B11, y el
rango de salida desde la celda F17, ACEPTAR
Figura 39. Ingreso de datos.
Excel para confeccionar el histograma de frecuencias, genera intervalos para agrupar las frecuencias, en este
caso generó cuatro intervalos, donde las marcas de clases se muestran a partir de la celda que indicamos
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
32
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
para la salida.
Figura 40. Salida de histograma 1.
Como las variables son continuas, corresponde ajustar el histograma con intervalos continuos, nos
posesionamos sobre las barras y haciendo clic con el botón derecho elegimos la opción “Dar formato a la
serie de datos”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
33
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 41. Formato de serie de datos.
Y luego indicamos un 0% en el ancho del intervalo
Figura 42. Modificación del ancho del histograma.
Con la misma opción “Formato serie de datos”, ahora elegimos “Relleno y Líneas”, marcamos “línea sólida”,
color negro, para visualizar mejor las barras en el histograma
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
34
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 43. Resultado de la modificación del ancho del histograma.
En la gráfica se visualiza la asimetría negativa que daba el coeficiente de asimetría,-0,6527, mayores
frecuencias sobre el promedio.
Ahora repetimos los pasos anteriores para obtener el histograma de frecuencias para las medidas tomadas
con el odómetro nuevo
Nos queda:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
35
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 44. Comparación de Histogramas de Odómetros.
La gráfica aquí se visualiza más simétrica con respecto al su promedio, y se corrobora con el coeficiente de
asimetría obtenido que es de 0,3266, que en este caso sería una leve asimetría positiva.
Con la información obtenida se puede concluir que de acuerdo a la diferencia que se presenta en el
promedio calculado por el odómetro antiguo respecto de la verdadera distancia y además respecto del
promedio más preciso entregado por el odómetro nuevo, más la mayor dispersión indicada tanto por la
desviación estándar, como por el rango de los datos de las mediciones obtenidas también por el odómetro
antiguo y la marcada asimetría negativa que se genera en la distribución de estos, se debería dar de baja el
odómetro antiguo y comprar otro nuevo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
36
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4.2
EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E
HISTOGRAMA
4
1. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Confecciones una tabla de frecuencias para la variable Exámenes . Ingrese el archivo Excel generado
en el buzón habilitado en la plataforma del laboratorio.
2. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un resumen de descriptivos para la variable Exámenes. Ingrese el archivo Excel generado en
el buzón habilitado en la plataforma del laboratorio.
Preguntas independientes:
a.
b.
c.
d.
e.
f.
Indique el valor de la media.
Indique el valor de la moda.
Determine el valor de la desviación estándar (corregida)
Determine el coeficiente de variación.
Determine los cuartiles de la distribución de los datos.
Determine el rango intercuartil.
3. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un histograma para la variable Exámenes. Ingrese el archivo Excel generado en el buzón
habilitado en la plataforma del laboratorio.
4. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Confecciones una tabla de frecuencias para la variable alumnos. Ingrese el archivo Excel generado
en el buzón habilitado en la plataforma del laboratorio.
4
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
37
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5
5. Considere la base de datos “Examenes.xlsx ” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un resumen de descriptivos para la variable alumnos. Ingrese el archivo Excel generado en
el buzón habilitado en la plataforma del laboratorio.
Preguntas independientes:
a.
b.
c.
d.
e.
f.
Indique el valor de la mediana.
Indique el valor del coeficiente de asimetría.
Determine el valor de la desviación estándar (corregida)
Determine el coeficiente de variación.
Determine los cuartiles de la distribución de los datos.
Determine el rango intercuartil.
6. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad.
Realice un histograma para la variable alumnos. Ingrese el archivo Excel generado en el buzón
habilitado en la plataforma del laboratorio.
5
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
38
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5.
Tablas de contingencia
El objetivo de este video es mostrar la forma de construir una tabla de contingencia a partir de una tabla
bivariada para dos variables cualitativas y que posteriormente servirá de base para la construcción de una
tabla de contingencia.
Recordemos que una tabla bivariada es aquella que resume las frecuencias absolutas conjuntas y
marginales, a partir de ellas se pueden obtener medidas de estadísticos marginales y condicionales, además
la tabla de contingencia resume la misma información pero en términos de probabilidades.
Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos, esta
base contiene dos variables que son: el “sexo” y el “nivel de estudios” de 20 personas.
Lo primero que haremos es construir la tabla bivariada, para estos utilizaremos una Tabla dinámica.
Tomando posición en cualquiera de las celdas donde se encuentran los datos, seleccionamos del menú la
opción insertar y posteriormente la opción Tablas dinámicas, (primera opción que aparece en el menú).
Figura 45. Base de datos “Ejemplo tabla contingencia.xlsx6”
Aparecerá el siguiente cuadro:
6
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
39
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 46. Ingreso de matriz de datos.
Al habernos posicionado en una celda de los datos Excel toma por defecto los datos adyacentes que no
tienen celdas vacías y es lo que muestra marcado con las líneas punteadas y que además aparece como
rango de entrada en el recuadro. Cuando se trabaja con este tipo de tablas la base de datos no puede tener
celdas vacías.
En este recuadro también se solicita que se elija dónde queremos que esté la tabla, aquí seleccionaremos
una celda adyacente a los datos, a veces por orden los más conveniente será una nueva hoja.
Seleccionamos aceptar y se crea automáticamente la tabla dinámica, pero vacía
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
40
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 47. Pantalla de campos de tabla dinámica.
Excel muestra a la derecha las opciones de la tabla dinámica, agrega automáticamente los campos que
identificó de la base de datos, que son justamente los nombres de los rótulos de cada variables.
La tabla dinámica espera que le indiquemos cuales de estos campos incluiremos en ella. Como queremos
construir una tabla bivariada debemos incluir las dos variables, dejando una de ellas asociada a área de las
filas y la otra al área de las columnas.
Seleccionamos entonces ambas variables, por defecto la tabla dinámica las deja automáticamente
asociadas a las columnas, pero sólo dejamos ahí la variable “Nivel de Estudios” y arrastramos la variable
“Sexo”, hacia el área de las filas.
Figura 48. Ingreso de variables en filas y columnas.
Para que aparezcan el conteo de los datos debemos arrastrar nuevamente cualquiera de los dos campos a la
casilla “Valores”, para este ejemplo arrastraremos el campo Sexo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
41
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 49. Tabla dinámica final.
En esta tabla de doble entrada podemos observar las frecuencias conjuntas absolutas y marginales.
Por ejemplo tenemos que 6 mujeres tienen un nivel de estudios Medio, también del total de las personas 10
son hombres y 10 son mujeres.
Ahora llevaremos esta tabla en términos de probabilidades, que es la tabla de contingencia.
Posicionándonos sobre la tabla dinámica construida, hacemos “click” sobre el botón derecho y elegimos la
opción, “Mostrar valores como” y luego % del total general.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
42
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 50. Modificación de valores en tabla dinámica.
La tabla queda ahora mostrando las frecuencias porcentuales conjuntas y marginales
Figura 51. Valores como porcentajes en tabla dinámica.
Finalmente posicionados nuevamente sobre la tabla, hacemos “click” con el botón derecho del Mouse y
elegimos la opción “Formato del número” y luego “número” y dos decimales.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
43
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 52. Modificación de valores a probabilidades.
La tabla queda ahora mostrando las probabilidades de ocurrencia condicionales y marginales.
Figura 53. Valores como probabilidades en tabla dinámica.
Ahora esta tabla de contingencia contiene las probabilidades conjuntas y marginales calculadas a partir de
las frecuencias conjuntas y marginales que teníamos en la tabla bivariada.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
44
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 54. Interpretación de algunos valores en tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
45
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
5.1
ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA
El objetivo de este video es mostrar la forma de construir una tabla de contingencia con la función
Tabla dinámica
Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos.
Esta base contiene dos variables que son: “género” y “nivel de estudios” de 20 personas.
1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a
2.
3.
4.
5.
trabajar.
Seleccionar la opción “Tabla dinámica”.
Ingresar los datos en la opción “Tabla o rango”.
Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es
posible indicar que aparezcan en una hoja nueva.
Hacer “click” en “Aceptar”
6. En el recuadro “Seleccionar campos para agregar al informe” desplazamos el campo “nivel de
estudio” hasta el recuadro “Etiqueta de fila” y el campo “sexo” hasta el recuadro “Etiqueta de
columna”. Finalmente desplazar cualquiera de los campos hasta el recuadro “Valores”
7. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de
N°caraDado”, y seleccionar la opción “configuración de campo de valores”.
8. Cambiar la opción “Suma” por la opción “Cuenta”.
9. Hacer “click” en “Aceptar”.
Ejemplos de lectura de la tabla:
En el estudio participaron 10 hombres y 10 mujeres.
4 individuos tienen un nivel de estudio “Básico”
3 individuos en el estudio son de sexo “masculino” y tiene un nivel de estudio “Medio”
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
46
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6.
Probabilidades y Teorema de Bayes
El objetivo de este video es estudiar la obtención de probabilidades condicionales y a través del el teorema
de Bayes.
Ya en el video 3, se estudió el cálculo de probabilidades simples, obtenidas las frecuencias marginales de una
tabla de contingencia. Recordemos también que la tabla de contingencia fue construida con una tabla
dinámica.
Rescatando la tabla de contingencia construida en el video 3, ahora la utilizaremos para obtener
probabilidades condicionales y aplicar el teorema de Bayes.
Las variables asociadas son “sexo” y “nivel de estudios” de 20 personas, construiremos el diagrama de árbol
para mostrar las probabilidades conjuntas y condicionales.
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de
los eventos
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
47
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 55. Definición de eventos asociados a las variables de estudio.
Ahora utilizando la herramienta para escribir formulas, escribiremos las probabilidades conjuntas en
términos de la intersección de los eventos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
48
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 56. Opción ingreso de ecuación en planilla Excel.
Entonces:
La probabilidad de que la persona tenga educación básica y sea de género femenino es igual a 0,1
La probabilidad de que la persona tenga educación media sea de género femenino es igual a 0,3
La probabilidad de que la persona tenga educación superior y sea de género femenino es igual a 0,1
De igual forma:
La probabilidad de que la persona tenga educación básica y sea de género masculino es igual a 0,1
La probabilidad de que la persona tenga educación media y sea de género masculino es igual a 0,15
La probabilidad de que la persona tenga educación superior y sea de género masculino es igual a 0,25
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
49
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 57. Ingreso de probabilidades con editor de ecuaciones.
Observemos que la suma de todas las probabilidades conjuntas es 1.
Comenzamos ahora a confeccionar el diagrama de árbol para representar las probabilidades condicionales.
Escribimos en una misma columna pero con separación de seis celdas, el recorrido de la variable sexo, es
decir Femenino y Masculino, y en la celda de abajo colocamos las probabilidades totales correspondientes, y
centramos el contenido de las celdas.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
50
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 58. Formato para ingreso de diagrama de árbol.
En la siguiente columna y celda por medio, colocamos los tipos de educación definidos en los eventos, estos
son EB, EM, ES, y los alineamos estos a la derecha.
Figura 59. Ingreso de probabilidades en para árbol de probabilidad.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
51
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para dibujar las flechas del diagrama de árbol, usando del menú principal la opción “Insertar “y luego
elegimos la opción “formas”, y el icono de la flecha
Figura 60. Ingreso de “ramas” del árbol de probabilidad.
Dibujamos tres flechas para hacer el diagrama.
Figura 61. Árbol de probabilidades.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
52
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Una vez dibujadas las flechas, colocaremos en la columna siguiente, las probabilidades condicionales
asociada a cada evento, debemos recordar que cuando dos eventos son independientes se cumple que la
probabilidad de la intersección de ellos es igual a la multiplicación de las probabilidades de cada evento.
Dejando una columna de separación y nuevamente haciendo uso de la herramienta para escribir
ecuaciones, expresamos y obtenemos las probabilidades condicionales que corresponden a cada rama del
diagrama de árbol según la propiedad vista en clases.
Hacemos “click” en Insertar y luego ecuación, arrastramos el cuadro hasta la celda contigua a la primera
rama del árbol, y escribimos
“La probabilidad de que la persona tenga educación básica dado que es de género femenino es igual a la
probabilidad de que tenga educación básica y sea de género femenino dividido por la probabilidad de que la
persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2”.
Conviene copiar las fórmulas y solo cambiar los eventos correspondientes. Con el botón derecho hacemos
“click” en copiar y luego pegamos frente a la segunda rama del árbol y así sucesivamente.
Ahora modificamos cada formula quedando:
La probabilidad de que la persona tenga educación media dado que es de género femenino es igual a la
probabilidad de que tenga educación media y sea de género femenino dividido por la probabilidad de que la
persona sea de género femenino, esto es 0,3 dividido por 0,5, igual a 0,6
Para la tercera rama:
La probabilidad de que la persona tenga educación superior dado que es de género femenino es igual a la
probabilidad de que tenga educación superior y sea de género femenino dividido por la probabilidad de que
la persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2
De igual forma para la cuarta rama:
La probabilidad de que la persona tenga educación básica dado que es de género masculino es igual a la
probabilidad de que tenga educación básica y sea de género masculino dividido por la probabilidad de que la
persona sea de género masculino, esto es 0,1 dividido por 0,5, igual a 0,2
Para la quinta rama:
La probabilidad de que la persona tenga educación media dado que es de género masculino es igual a la
probabilidad de que tenga educación media y sea de género masculino dividido por la probabilidad de que la
persona sea de género masculino, esto es 0,15 dividido por 0,5, igual a 0,3
Y para la sexta rama:
La probabilidad de que la persona tenga educación superior dado que es de género masculino es igual a la
probabilidad de que tenga educación superior y sea de género masculino dividido por la probabilidad de que
la persona sea de género masculino, esto es 0,25 dividido por 0,5, igual a 0,5
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
53
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 62. Ejemplos de cálculo de probabilidad condicional.
Observemos acá que la suma de las probabilidades condicionales de los niveles de educación dado los
géneros Femenino y Masculino indistintamente, también suman uno.
Entonces podemos decir por ejemplo que:
La probabilidad de que una persona tenga un nivel de educación medio, dado que es de sexo femenino es
de un 60%
La probabilidad de que una persona tenga nivel de educación superior dado que es de sexo masculino es de
un 50%.
Veamos que pasa ahora si queremos responder a la pregunta:
¿Cuál es la probabilidad de que una persona sea mujer sabiendo que su nivel de educación es Básico?
La respuesta nos las da el teorema de Bayes.
Para poder calcular esta probabilidad necesitamos conocer la probabilidad total de tener Educación básica, y
esta es :
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
54
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
“P de EB, educación básica, es igual a P de EB inter F(femenino), más P de EB y M(masculino) y esto de
acuerdo a la propiedad de la probabilidad condicional, es igual a “P de F por P de EB dado F”, más “P de M
por P de EB dado F”
Una vez más utilizando la herramienta para escribir ecuaciones, escribiremos la probabilidad que deseamos
obtener
Elegimos insertar, ecuación y arrastramos la ecuación para responder la pregunta
Escribimos, probabilidad de que una persona sea de género femenino, sabiendo que tiene educación básica
es igual, seleccionamos en el menú superior herramientas de ecuaciones y luego fracción, en el numerador
colocamos la probabilidad conjunta “P de F inter EB, educación básica y en el denominador “P de ED,
educación básica”, que es la probabilidad de lo que está dado o conocido.
Y es igual a la probabilidad de que la persona sea de género femenino por la probabilidad de que tenga
estudios básicos sabiendo que es de género femenino, dividido por la probabilidad total de tener estudios
básicos.
Figura 63. Ejemplo de aplicación del teorema de Bayes.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
55
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6.1
ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES
En este video practicaremos el cálculo de probabilidad y el teorema de Bayes en base a la tabla de
contingencia creada en el video de Tablas de contingencia.
Primero, adaptaremos la tabla de contingencia a una tabla de probabilidades, para esto marcamos el
recuadro de la tabla dinámica y hacemos “click” con el botón derecho. De la lista de opciones
seleccionamos “Mostrar valores como” y elegimos “% del total general”, luego seleccionamos solo el
área de la tabla dinámica donde hay porcentajes y hacemos “click” con el botón derecho,
seleccionamos la opción “Formato de número” y luego elegimos “número” con esto logramos que
nuestra tabla de contingencia ahora sea una tabla de probabilidades.
Resolución de los problemas propuestos:
1. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este tenga un nivel de
estudio Básico?
Esta pregunta es una probabilidad marginal, la obtenemos directamente de la tabla de
probabilidades, específicamente en el total fila del nivel de estudio básico.
2. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este sea hombre y tenga
nivel de estudio Superior?
Esta pregunta es una probabilidad conjunta, la obtenemos directamente de la tabla de
probabilidades, específicamente en la intersección de “Hombre” y “Superior”.
3. Si se sabe que un individuo seleccionado al azar es mujer. ¿Cuál es la probabilidad de que tenga
un nivel de estudio Medio?
Esta pregunta está condicionada, se sabe que el individuo es mujer y lo que se pregunta es por la
probabilidad que tenga nivel de estudio Medio. Para resolverlo dividimos la probabilidad conjunta
de Mujer y nivel de estudio Medio, entre la probabilidad de que el individuo sea mujer.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
56
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Si se sabe que un individuo seleccionado al azar tiene un nivel de estudio Medio,
¿Cuál es la probabilidad que sea Mujer?
Indicación: debe utilizar el resultado de la pregunta anterior
Esta pregunta puede ser resuelta igual que la pregunta anterior, pero utilizaremos el
teorema de Bayes tal como pide la indicación. Por lo que, multiplicaremos la
probabilidad obtenida en la pregunta anterior por la probabilidad de que el individuo sea
mujer, esto nos da la probabilidad conjunta de Mujer y nivel de estudio medio, luego, lo
dividimos por la probabilidad de que el individuo tenga un nivel de estudio Medio
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
57
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
6.2
EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y
TEOREMA DE BAYES
7
1.
Considere la base de datos Favoritos.xlsx la cual contiene información sobre 23 personas a las
cuales se les consultó respecto a color y mascota favoritos. Con los datos confecciones una tabla de
contingencia utilizando la función Tabla dinámica, luego ingrese el documento en el buzón
habilitado en la plataforma de laboratorio.
2.
Considere la base de datos Favoritos.xlsx la cual contiene información sobre 23 personas a las
cuales se les consultó respecto a color y mascota favoritos. Con los datos confeccione una tabla de
probabilidades, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio.
Preguntas independientes en base a los datos Favoritos.xlsx:
7
3.
¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color rojo y su mascota
preferida sea un perro?
4.
¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color morado y su
mascota preferida sea un hámster?
5.
¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color negro?
6.
¿Cuál es la probabilidad que un individuo seleccionado al azar su mascota preferida sea un conejo?
7.
Si se sabe que a una persona seleccionada al azar le gusta el color amarillo. ¿Cuál es la probabilidad
de que su mascota favorita sea un hámster?
8.
Si se sabe que a una persona seleccionada al azar le gusta el color azul. ¿Cuál es la probabilidad de
que su mascota favorita sea un gato?
9.
Si se sabe que una persona seleccionada al azar su animal favorito es un conejo . ¿Cuál es la
probabilidad de que su color favorito sea negro?
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
58
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
El caso es el siguiente:
Una Empresa minera adquirió instaló hace una un año una estación de monitoreo para medir la
concentración de material particulado en el aire, esta estación está programada para tomar mediciones
cada 8 hora y en caso de que la medición detecte que los niveles de polución superan los 150 µg/m³
(PM10), la alarma se activará automáticamente.
De sonar la alarma, la empresa debe parar la faena hasta lograr bajar los niveles de polución bajo el nivel
máximo permitido, de lo contrario se venir una inspección en ese momento, la empresa será multada.
Ya con un año de funcionamiento, la empresa minera ha detectado errores en el funcionamiento de la
estación de monitoreo, pero no tiene presupuestado la renovación de esta, por el alto costo de inversión.
Por lo anterior la empresa pide al departamento de prevención de riesgos que de acuerdo a los registros de
las mediciones tomadas por dicha estación en relación al funcionamiento de la alarma en los últimos 6
meses, determine por una parte
1. ¿Cuál es la probabilidad de que la empresa sea multada?
2. ¿Cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?
3. ¿Cuál es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener
alerta ninguna?
4. ¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se
activa la alarma?
La información antes pedida servirá como evidencia para tomar la decisión de quedarse con esta estación de
monitoreo o adquirir otra.
Para dar respuesta a los requerimientos de la gerencia se pueden obtener por una parte, preguntas 1 y 2,
calculando una probabilidad condicional y por otra parte, preguntas 3 y 4, utilizando el teorema de Bayes.
Veamos como:
Abrimos el archivo que contiene la base de datos Monitoreo_polucion.xlsx
8
Observamos que tenemos cuatro campos de información, que son, la Fecha, la hora, el nivel de polución y el
registro de si activó o no la alarma.
Para generar la tabla de contingencia no es adecuado usar la variable cuantitativa Nivel de polución dado
que se hará el conteo según categorías y estas no existen, por lo que será conveniente antes categorizarlas.
Recordemos que la empresa tiene establecido como norma, que los niveles de polución P10, no pueden
sobrepasar los 150 µg/m³, entonces de acuerdo a esto categorizaremos.
8
Base de datos disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
59
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Para esto utilizaremos la función SI, insertamos una nueva columna adyacente a la que tiene los registros
del Nivel de Polución
Figura 64. Categorización de la variable Nivel de polución.
La nueva variable la llamaremos “Condición del Nivel de Polución”, que tendrá como recorrido
P: si el nivel de polución cumple con la norma establecida, <=150 µg/m³
NP: Si el nivel de polución supera la norma establecida, es decir >150 µg/m³
Escribimos el nombre al inicio de la columna
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
60
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 65. Ingreso de columna adyacente para la categorización.
Posicionados en la celda B2, insertamos la función lógica SI, esta función permitirá categorizar la variable
numérica, asociando la categoría P o NP, según corresponda
Figura 66. Uso de función lógica =SI().
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
61
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
La función SI, requiere de ingresar la prueba lógica, y la asignación que se hará en caso de que la evaluación
sea verdadera o falsa
Figura 67. Ingreso de variable a categorizar.
En nuestro ejemplo la prueba lógica es evaluar si cada dato de la variable nivel de polución cumple con la
norma establecida por la empresa, luego escribiremos
Figura 68. Ingreso de valores “Verdadero” y “Falso”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
62
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Hacemos clic en aceptar y nos queda para la primera celda asociado “P”, permitido cuando la medición fue
127.
Posicionados en la esquina inferior derecha de la celda evaluada, arrastramos el mouse para copiar en el
resto de las celdas
Figura 69. Extensión de función SI al resto de la columna adyacente.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
63
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
La base de datos ahora se presenta
Figura 70. Base de datos luego del ingreso de variable categorizada.
Ya estamos listos para crear la tabla de contingencia que finalmente nos permitirá obtener las
probabilidades condicionales.
En la tabla de contingencia estarán resumidas las frecuencias de las variables
Condición del nivel de polución (Permitido/ No Permitido)
Activación de la alarma ( SI / NO)
Posicionados en la primera celda de nuestra base de datos, insertamos la tabla dinámica, recordemos que
este procedimiento ya fue estudiado en el video 3 , de construcción de tablas de contingencia.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
64
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 71. Confección de tabla dinámica para el problema.
Quedó seleccionado el rango que contempla nuestra base de datos, y le indicamos que la tabla dinámica
quede en la misma hoja donde están los datos, dando como referencia la celda G2
Figura 72. Ingreso de celda para salida de opciones de tabla dinámica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
65
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Se crea la tabla dinámica
Figura 73. Opciones de tabla dinámica.
Marcamos los campos “Condición del nivel de polución “y “Activación de la Alarma”
Figura 74. Ingreso de variables en fila y columna.
Arrastramos el campo activación de la alarma hacia las columnas y luego para completar la tabla con los
valores resumidos, debemos arrastrar cualquiera de los campos incluidos en la tabla hacia el recuadro
Valores.
Aparece ahora completa la tabla bivariada con las frecuencias conjuntas, marginales y totales.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
66
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 75. Tabla dinámica para el problema.
Ahora a partir de la tabla bivariada generaremos la tabla de contingencia
Posicionados sobre alguna frecuencia conjunta de la tabla bivariada, hacemos “click” con el botón derecho y
elegimos la opción “mostrar valores como” y luego “porcentaje del total general”
Figura 76. Modificación de valores de tabla dinámica.
La tabla se muestra ahora con porcentajes del total, nuevamente hacemos “click” con el boton derecho para
elegir la opción formato número
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
67
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 77. Valores de tabla dinámica en porcentajes.
Y luego “número“, dos decimales y ACEPTAR.
Figura 78. Modificación de valores de porcentaje a probabilidades.
Automaticamente aparece la tabla de contingencia.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
68
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 79. Valores de tabla dinámica en probabilidades.
Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de
los eventos y las probabilidades totales
Nuestros eventos son:
NP: Nivel de Polución no permitido
P : Nivel de Polución Permitido
NO : No se activa la alarma
SI : Se activa la alarma
Probabilidades conjuntas
P(
P(
P(
(
)
)
)
)
81
Probabilidades Totales
( )
( )
( )
( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
69
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 80. Cálculo de probabilidades conjuntas y marginales (totales).
Antes de calcular las probabilidades pedidas, contruiremos el arbol de las probabilidades condicionales que
nos permitirán aplicar el teorema de bayes.
Partiremos el árbol con la variable “Nivel de Polución”, dado que es natural entender que la alarma sonará
dependiendo del nivel de polución que haya en la faena.
Confeccionamos el árbol, utilizando herramientas de dibujo e insertando las fórmulas correspondientes.
Figura 81. Ingreso de árboles de probabilidad.
Para responder a las pregunta de la gerencia, antes debemos plantear las probabilidades que darán las
respuesta.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
70
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
1.
¿Cuál es la probabilidad de que la empresa sea multada?
Debemos entender que la empresa será multada sólo si los trabajadores siguen trabajando con niveles de
polución no permitidos, y esto ocurrirá si en ese momento no suena la alarma.
Entonces debemos calcular la probabilidad condicional de que no suene la alarma, sabiendo que hay niveles
de polución no permitido.
(
(
)
)
(
)
Luego existe un 70% de probabilidad de que la empresa sea multada
Contestemos ahora la segunda pregunta:
2. ¿cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?
Para responder a esta pregunta debemos entender que debemos calcular la probabilidad de suene la alarma
sabiendo que los niveles de polución están dentro de las normas permitidas.
(
(
)
(
)
)
( )
La probabilidad de que la empresa detenga sus faenas sin haber sido necesario es de un 10%
Para completar el árbol con las otras probabilidades condicionales, las calcularemos
(
)
(
)
(
)
(
(
)
)
( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
71
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 82. Cálculo de probabilidades condicionales.
Respondamos ahora la tercera y cuarta pregunta
3.- ¿Cual es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener
alerta ninguna?
(
)
Al plantear la probabilidad nos damos cuenta que es a priori, es decir según lo planteado en el diagrama de
árbol, necesitamos saber cuál es la probabilidad de que suene la alarma sabiendo que no ha sonado la
alarma.
Utilizando el teorema de Bayes
(
)
(
(
)
)
(
)
(
(
)
)
( )
La probabilidad de que los trabajadores estén respirando un aire con nivel de polución no permitida, sin
que haya sonado la alarma es de un 8%
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
72
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 83. Lectura de “ramas” en árbol de probabilidad.
El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información
que tenemos en la tabla de contingencia
(
(
)
)
(
)
La probabilidad de que los trabajadores estén respirando niveles de polución no permitidos, sabiendo que la
alarma no se ha activado es de un 8%
Finalmente respondemos a la última pregunta:
4.-¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se
activa la alarma?
Aquí debemos calcular la probabilidad de que realmente los niveles de polución son altos cuando sabemos
que ha sonado la alarma, es decir
(
)
Esta probabilidad según nuestro diagrama de árbol, también es a priori, por lo que debemos aplicar el
teorema de Bayes
(
)
(
(
)
(
)
)
(
(
)
)
( )
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
73
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 84. Lectura de “ramas” en árbol de probabilidad.
El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información
que tenemos en la tabla de contingencia
(
)
(
)
( )
La probabilidad de que los niveles de polución realmente no estén dentro de la norma permitida, sabiendo
que la alarma se ha activado es de un 25%
Conclusión:
De acuerdo a las probabilidades obtenidas, por una parte en relación a la empresa, la alta probabilidad de
ser multados 70%, aun cuando el riesgo tener pérdidas al detener las faenas no siendo necesario sea de un
10%, conjuntamente con un 25% de probabilidad de que los niveles de polución realmente no estén dentro
de la norma permitida, sabiendo que la alarma se ha activado , y , en relación a la seguridad de los
trabajadores, baja probabilidad, un 8% , de tener niveles de polución no permitidos cuando la alarma no se
ha activado, se puede concluir que la sugerencia, para evitar multas y perdidas, considerando que ya
existiendo aunque sea un 1% de riesgo para los trabajadores, la empresa debe tomar la decisión de invertir
en un nuevo instrumento que alerte con precisión sobre los niveles de polución no permitidos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
74
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.
La opción “Generación de números aleatorios” de la herramienta Análisis de datos
de MS Excel.
Ir a la opción “datos” en la barra superior y seleccionar “Análisis de datos”.
De la ventana de opciones seleccionar “Generación de números aleatorios”
Figura 85. Opción “Generación de números aleatorios”.
Hacer “click” en aceptar.
Descripción del menú de la opción generación de números aleatorios:
Figura 86. Ventana de opciones de Números aleatorios.
1: número de variables: Corresponde a la cantidad de columnas de datos que queremos generar. En este
caso, ingresaremos el valor 1 para así generar una sola columna con datos simulados.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
75
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
2: cantidad de números aleatorios: indica la cantidad de datos por columna que serán simulados. En este
caso ingresaremos 100, es decir, por cada columna de datos ingresada en la parte anterior, aparecerán 100
datos asociados.
3: Distribución: Ofrece un conjunto de distribuciones de probabilidad de uso frecuente en estadística.
Seleccionaremos “Normal” para este ejemplo. Para más detalle sobre el uso de cada distribución disponible
en esta opción, ir al video: “Anexo de distribuciones”
4: Parámetros: Esta opción depende de la distribución seleccionada. Como hemos seleccionado la opción
“Normal” dejaremos los valores por defecto de la opción, es decir, el valor 0 para la media y 1 para la
desviación estándar.
Figura 87. Opción distribución Normal.
5: Iniciar con: Corresponde al valor semilla con el cual se genera la secuencia de números aleatorios, si se
ingresa un valor, entonces Excel guardará la misma secuencia de números cada vez que en este campo se
ingrese tal número. En este caso, lo dejaremos en blanco.
6: Opciones de salida:
Rango de salida: se debe ingresar una celda donde se desea que se inicie la presentación de los
resultados del análisis. Es una opción útil si se quiere visualizar el resultado de la generación de números
aleatorios en la misma hoja donde se está trabajando.
En una hoja nueva: Corresponde a la opción por defecto, el resultado aparecerá en una hoja nueva
dentro de la misma planilla de Excel.
En un libro nuevo: Los resultado de la simulación de datos aparecerán en un libro nuevo de Excel.
En este caso seleccionaremos la opción “Rango de Salida”, luego, seleccionaremos la celda A1.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
76
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 88. Opción distribución Normal del ejemplo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
77
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1
“Anexo de distribuciones” de la opción “Generación de números aleatorios” de la
herramienta Análisis de datos de MS Excel.
Revisaremos en esta sección las distintas opciones para generar números aleatorios disponibles en la opción
“Análisis de datos”.
Figura 89. Lista de distribuciones para simular.
La opción “Generación de números aleatorios” permite simular números aleatorios para ocho distribuciones
que se describen a continuación:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
78
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.1
Distribución discreta:
Se generan números aleatorios para un conjunto de valores enteros a los cuales se asocia a priori una
probabilidad de aparición del valor de la variable.
Figura 90. Opción distribución Discreta.
Para utilizar esta opción, se debe tener una tabla de probabilidades “a priori” para una variable aleatoria
discreta.
A modo de ejemplo simularemos el lanzamiento en 100 oportunidades de un dado de seis caras equilibrado.
A esta variable se le asocia en la literatura la distribución Uniforme Discreta.
Construiremos la Tabla de probabilidades a priori relacionada al problema:
X
P(X=x)
1
0,16666667
2
0,16666667
3
0,16666667
4
0,16666667
5
0,16666667
6
0,16666667
Tabla 1. Tabla de probabilidad para la aparición de una cara en un dado de 6 caras
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
79
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingreso de datos en la ventana de opciones:
Figura 91. Ingreso de tabla a “priori” en distribución discreta.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
80
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.2
Distribución Uniforme:
Genera números con igual probabilidad en un intervalo de valores predeterminado. Por defecto los
valores aparecen entre 0 y 1, lo cual, es equivalente a la función “=ALEATORIO()”.
Figura 92. Opción distribución Uniforme.
A modo de ejemplo se simularán 100 valores de la distribución Uniforme entre 0 y 1.
Figura 93. Ingreso de valores en opción distribución Uniforme.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
81
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.3
Distribución Normal:
Simula números aleatorios de una distribución Normal con media y desviación estándar definidas por el
usuario. Por defecto el programa proporciona una media 0 y desviación estándar 1, la cual, corresponde a
los valores de la distribución Normal Estándar.
Figura 94. Opción distribución Normal.
A modo de ejemplo se simularán 100 valores de la distribución Normal Estándar.
Figura 95. Ingreso de valores en opción distribución Normal.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
82
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.4
Distribución de Bernoulli:
Genera números aleatorios correspondientes a la distribución de Bernoulli. Es decir, para un experimento
aleatorio con dos posibles resultados donde el valor 0 indica “fracaso” y 1 “éxito”.
Se debe ingresar la probabilidad de éxito.
Figura 96. Opción distribución de Bernoulli.
A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir con Probabilidad = 0,5 donde la variable recibe el valor 0 si se obtiene un “sello” y un 1 si se obtiene
“cara”. Es decir, la variable de estudio sería: X: número de veces que se obtiene una cara al lanzar una
moneda 1 vez.
Figura 97. Ingreso de valores en opción distribución de Bernoulli.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
83
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
Hacer ““click”” en Aceptar.
7.1.5
Distribución Binomial:
Genera números aleatorios correspondientes a una distribución Binomial. Es decir, para N experimentos
de Bernoulli independientes, con probabilidad de éxito “p”.
Figura 98. Opción distribución Binomial
A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es
decir probabilidad=0,5 en 5 ocasiones, donde los valores representan el número de caras obtenidas en los 5
lanzamientos.
Figura 99. Ingreso de valores en opción distribución Binomial.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
84
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar
una moneda honesta.
En la opción “Número de muestras” ingresar el valor 5, el cual indica la cantidad de veces que se lanza la
moneda, es decir, el número de experimentos de Bernoulli independientes.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
85
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.6
Distribución Poisson:
Genera números aleatorios correspondientes a la distribución de Poisson para un valor esperado de la
variable denominada Lambda.
Figura 100. Opción distribución de Poisson.
A modo de ejemplo, se simularan 100 valores correspondientes a una distribución de Poisson con valor
esperado de la variable igual a 2. Esta simulación podría representar, por ejemplo, a una variable aleatoria X:
número de hermanos que tiene un alumno del curso de Estadística.
Figura 101. Ingreso de valores en opción distribución de Poisson.
En la opción “Lambda” ingresar el valor 2, el cual indica el valor esperado de hermanos que tiene un alumno
del curso de Estadística.
Hacer ““click”” en Aceptar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
86
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
7.1.7
Frecuencia Relativa:
Genera una secuencia predeterminada de valores en un incremento y repeticiones definidas por el
usuario.
Figura 102. Opción frecuecia relativa.
A modo de ejemplo, se simulará una serie de valores entre 1 y 4, con incrementos de 1 unidad donde el
número será repetido dos veces y la secuencia en 3 ocasiones.
Figura 103. Ingreso de valores en opción frecuencia relativa.
Detalle de la función Frecuencia Relativa:
Parámetros: indica el rango de valores a generar
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
87
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
De: es el mínimo de los valores a generar
A: es el máximo valor a generar
Incremento: indica la cantidad a incrementar luego de generar el mínimo
En este caso se define De: 1 a 4 , incremento 1, es decir, se generarán números del 1 al 4, de 1 en 1.
Repitiendo cada número: indica la cantidad de veces que se repetirá un número antes de pasar al siguiente.
En este caso ingresamos el valor 2.
Repitiendo la secuencia: indica la cantidad de veces que se repite la secuencia de valores, es decir, números
de 1 a 4, con incremento 1, repetidos 2 veces. En este caso ingresamos el valor 3.
Hacer ““click”” en Aceptar.
Observación: En este ejemplo se han simulado tres secuencias de números del 1 al 4 con incremento 1 y
repetición 2 veces para cada número. Con un cálculo simple notamos que la cantidad de números a
generar serán 24, por lo que no coincidirá con los 100 valores ingresados en la opción “cantidad de
números aleatorios”, o sea, si los parámetros ingresados generan una secuencia superior a la “cantidad de
números aleatorios” predefinida, la secuencia finalizará en este valor.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
88
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
8.
Distribuciones de probabilidad Discreta
En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad en variables
aleatorias discretas.
A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono
.
Figura 104. Opción “Insertar función”.
Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran
disponibles las funciones asociadas al tema a tratar.
Figura 105. Función “Estadísticas”.
Otra opción es ingresar directamente la función asociada.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
89
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad discreta.
Si usted desea replicar estos cálculos, descargue la planilla “Video 6-Ejercicios de variable discreta”.
8.1.
Probabilidad con distribución Binomial.
Figura 106. Opción probabilidad con distribución Binomial.
Ejemplos:
Figura 107. Ejemplo cálculo Binomial exacta.
Para resolver este problema, realice los siguientes pasos:
1.
Seleccionamos la opción asociada a la distribución Binomial
2.
3.
4.
5.
Ingresamos el número de éxitos
Ingresamos el número de ensayos totales
Luego, la probabilidad de éxito asociada al problema
Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
Figura 108. Ejemplo cálculo Binomial acumulada.
1. Seleccionamos la opción asociada a la distribución Binomial
2. Ingresamos el número de éxitos
3. Ingresamos el número de ensayos totales
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
90
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
4. Luego, la probabilidad de éxito asociada al problema
5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada, sea la acumulada hasta el valor ingresado
8.2.
Probabilidad con distribución Binomial Inversa.
Figura 109. Opción cálculo inversa de probabilidad Binomial.
Figura 110. Ejemplo cálculo inversa de probabilidad Binomial.
1.
2.
3.
4.
8.3.
Seleccionamos la opción asociada a la distribución Binomial Inversa
Ingresamos el número de ensayos totales
Luego, la probabilidad de éxito asociada al problema
Finalmente ingresamos la probabilidad acumulada del problema
Probabilidad con distribución Hipergeométrica.
Figura 111. Opción probabilidad con distribución Hipergeométrica.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
91
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 112. Ejemplo cálculo de probabilidad Hipergeométrica exacta.
1.
2.
3.
4.
5.
6.
8.4.
Seleccionamos la opción asociada a la distribución Hipergeométrica
Ingresamos el número de éxitos
Ingresamos el número de extracciones sin reposición
Ingresamos el tamaño de la población de éxitos
Luego, el tamaño de la población total, es decir, la suma de fichas azules y rojas
Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
Probabilidad con Distribución de Poisson.
Figura 113. Opción probabilidad con distribución de Poisson.
Figura 114. Ejemplo cálculo de probabilidad Poisson exacta.
1.
2.
3.
4.
Seleccionamos la opción asociada a la distribución de Poisson
Ingresamos el número de éxitos
Ingresamos el valor promedio asociado a la variable de estudio
Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada
sea exacta.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
92
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 115. Ejemplo cálculo de probabilidad Poisson acumulada.
1.
2.
3.
4.
Seleccionamos la opción asociada a la distribución de Poisson
Ingresamos el número de éxitos
Ingresamos el valor promedio asociado a la variable de estudio
Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
93
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
8.1
EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
DISCRETA
1.
¿Cuál es la probabilidad de obtener 3 caras al lanzar una moneda 5 veces?
2.
¿Cuál es la probabilidad de obtener a lo más 3 caras al lanzar una moneda 5 veces?
3.
En 7 lanzamientos, ¿Cuál es el número más grande de caras que se puede esperar, con una
probabilidad de 0.98?
4.
Genera 100 observaciones provenientes de una distribución binomial con probabilidad de éxito 0.4
y n=7.
5.
Si X es binomial con probabilidad de éxito 0.4 y n=7. ¿Cuál es la probabilidad de que X sea a lo más
4. Es decir P(X ≤ 4)?
6.
Si X es binomial con probabilidad de éxito 0.9 y n=6. ¿Cuál es la probabilidad de que X sea 4. Es
decir P(X = 4) ?
7.
¿Qué valor tiene una distribución de Poisson con varianza 6, cuya probabilidad acumulada es 0.92?
8.
Genere 100 observaciones provenientes de una distribución de Poisson de parámetro lambda = 6.
9.
Calcule la probabilidad de que una variable que tiene distribución Hipergeométrica de parámetros
N=9 r=4 y n=3 sea igual a 2.
10. Genere 100 observaciones provenientes de una distribución Poisson con probabilidad de éxito 0.9.
11. Si X es Poisson con media 6. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)?
12. Sea X Hipergeométrica(N=20,r=7,n=8). ¿Cuál es la probabilidad de que X sea a lo más 4, es decir,
P(X ≤ 4)?
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
94
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9.
Distribuciones de probabilidad Continua
En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad para variables
aleatorias continuas.
A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono
.
Figura 116. Opción “Insertar función”.
Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran
disponibles las funciones asociadas al tema a tratar.
Figura 117. Función “Estadísticas”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
95
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad continua.
Si usted desea replicar estos cálculos, descargue la planilla “Video 7-Ejercicios de variable continua”.
9.1.
Probabilidad con distribución Exponencial.
Figura 118. Opción Probabilidad con distribución Exponencial.
Figura 119. Ejemplo cálculo de probabilidad Exponencial acumulada.
1.
2.
3.
4.
Seleccionamos la opción asociada a la distribución Exponencial.
Ingresamos el valor de la variable.
Ingresamos el valor del parámetro asociado a la variable de estudio.
Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
Nota: Si se ingresa la opción “FALSO” solo entregará la imagen del valor de la variable en la función de
densidad exponencial, esto, no es una probabilidad.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
96
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9.2.
Probabilidad con distribución Normal.
Figura 120. Opción Probabilidad con distribución Normal.
Figura 121. Ejemplo cálculo de probabilidad Exponencial acumulada.
1.
2.
3.
4.
5.
Seleccionamos la opción asociada a la distribución Normal
Ingresamos el valor de la variable
Ingresamos el valor de la media
Ingresamos el valor de la desviación estándar
Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad
entregada sea la acumulada hasta el valor especificado.
9.3.
Distribución Normal Inversa.
Figura 122. Opción distribución Normal Inversa.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
97
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 123. Ejemplo uso de función Normal Inversa.
1.
2.
3.
4.
Seleccionamos la opción asociada a la distribución Normal Inversa.
Ingresamos el valor del percentil, es decir, la probabilidad que acumula bajo él, el valor del
contenido del envase de leche desconocido.
Ingresamos el valor de la media.
Ingresamos el valor de la desviación estándar.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
98
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
9.1
EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA
CONTINUA
1.
Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la
probabilidad de que tal variable sea al menos 3,8.
2.
Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la
probabilidad de que tal variable sea a lo más 4.
3.
Sea X una variable aleatoria con distribución Normal de media 100 y desviación estándar 50. Simule
1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
teóricos.
4.
Si X es una variable aleatoria con distribución Uniforme, donde 0<x<2. Determine la probabilidad de
que tal variable tome valores entre 1 y 1,5.
5.
Sea X una distribución Uniforme entre 0 y 1. Simule 1000 observaciones aleatorias desde X, calcula
su promedio y varianza. Compara con los resultados teóricos.
6.
Sea X una distribución Uniforme entre 0 y 1. Determine la probabilidad de que tal variable tome
valores entre 0,2 y 0,3.
7.
Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 0,2. Simule 10
observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados
teóricos. Luego repita lo mismo para 100 y 1000 simulaciones.
8.
Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 1. Determine la
probabilidad de que la variable aleatoria tome valores de al menos 0,5.
9.
Sea X una variable aleatoria con distribución Exponencial con valor Varianza igual a 1/25.
Determine la probabilidad de que la variable aleatoria tome valores de al menos 5.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
99
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
10.
Tablas bivariadas continuas y cálculo de probabilidades
El objetivo de este video es mostrar la construcción de tablas bivariadas utilizando la herramienta de Excel,
tablas dinámicas.
En nuestro ejemplo tenemos la fluctuación del dólar y el euro en un mismo mes, las variables con las que
trabajaremos son continuas y el interés será poder ver las frecuencias conjuntas en intervalos del mes.
Construiremos una tabla bivariada con 4 intervalos, entonces las frecuencias conjuntas resumidas en la
tabla mostrará la cantidad de días en que las monedas en conjunto tienen según su valor.
Lo primero que haremos es abrir el archivo “datos tabla bivariada”, hacemos ““click”” en “abrir”, archivo
Ahora que tenemos los datos, observamos que son 20 datos correspondientes a las variaciones de dólar y
euro en 20 días del mes de diciembre de 2014.
Posesionándonos en la primera celda de los datos hacemos ““click”” en insertar, tabla dinámica, tal como lo
hemos hecho en el video 3 referido a tablas bivariadas para variables cualitativas.
La primera columna corresponde al día del mes en que ocurrió la variación, este dato no es variable en
estudio, por lo que modificaremos el rango de entrada, incluyendo solo las columnas donde están los
valores del dólar y el euro.
La tabla la dejaremos en la misma hoja donde están los datos, para esto indicaremos en el rango de salida la
celda F1, y aceptamos.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
100
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 124. Ventana de opciones tabla dinámica.
Tenemos ahora la tabla dinámica, debemos indicarle los campos o variables que se incluirán, para este
ejemplo serán ambas variables.
Arrastramos el campo dólar hacia la casilla de las filas y el campo euros hacia la casilla de las columnas.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
101
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 125. Ingreso de variables fila y columna.
Observamos que la presentación de la tabla no es adecuada, dado que por ser variables continuas los datos
en su mayoría son distintos.
Lo que haremos será construir intervalos para ambos recorridos a modo de poder tener una mejor
presentación y resumen de las frecuencias conjuntas y marginales.
El número de intervalos se puede determinar por una formula conocida o bien según el objetivo del estudio.
En este caso será de interés visualizar el comportamiento de la variación de las monedas en cuatro niveles
de sus valores, entonces tendremos las frecuencias conjuntas resumidas en cuatro intervalos para ambas
variables.
Necesitaremos obtener los valores extremos y el rango, antes de construir los intervalos.
Para esto nos ubicaremos en las celdas por debajo de los datos, usted puede colocarlas donde desee o sea
más conveniente.
Colocaremos las fórmulas que permiten obtener el máximo, mínimo, rango y amplitud de lo s intervalos.
En la columna A a partir de la fila 23, escribiremos Máximo, Mínimo, Rango y amplitud.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
102
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 126. Elementos para cálculo de amplitud de “dólar” y “euro”.
En la celda B23, escribimos la fórmula igual MAX, paréntesis y marcamos el rango de los datos, en este caso
de la “variación del dólar”, ENTER
Figura 127. Cálculo de máximo.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
103
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
En celda B24, escribimos la formula igual MIN, paréntesis el rango de los datos, cierre de paréntesis
Figura 128. Cálculo de mínimo.
En celda B25, escribimos la fórmula para obtener el Rango, igual B23 menos B24, ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
104
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 129. Cálculo de Rango.
Finalmente escribimos la fórmula para obtener la amplitud de los intervalos, es igual B25 dividido por 4,
ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
105
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 130. Cálculo de amplitud.
Ahora copiamos estas mismas fórmulas para obtener máximo, mínimo, rango y amplitud de los intervalos,
para la variable “variación del euro”. Marcamos las celdas B23 a B26 y ubicando la cruz negra en la esquina
inferior derecha, arrastramos hacia las celdas C23 a C26, ENTER
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
106
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 131. Ampliación de cálculo a variable “euro”.
Ahora que ya conocemos la amplitud de los intervalos de ambas variables, volveremos a la tabla dinámica
para generar los intervalos que resumirán las frecuencias conjuntas.
Primero nos posesionamos sobre cualquier valor de variación del dólar, con el botón derecho elegimos
agrupar
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
107
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 132. Modificación de columna “dólar”.
Luego aparece un recuadro que muestra el máximo, el mínimo y pide que ingresemos la amplitud de los
intervalos, fijarse que son los mismos valores de máximo y mínimo que ya habíamos obtenido, en “POR”,
colocaremos la amplitud 3,99, y ACEPTAR
Figura 133. Ventana de modificación de columna “dólar”.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
108
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Automáticamente genera cuatro intervalos para la variable “variación del dólar”
Figura 134. Variable “dólar” modificada a intervalos.
Los mismos pasos haremos para la variable “variación del euro”
Figura 135. Ventana de modificación de columna “euro”.
La tabla ahora queda
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
109
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 136. Variable “euro” modificada a intervalos.
Para finalizar solo basta arrastrar cualquiera de los campos a la casilla valores, esto hará que la tabla
entregue las frecuencias conjuntas que deseamos tener
Figura 137. Ingreso de variable a campo de valores.
Ahora podemos interpretar algunas frecuencias en ellas:
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
110
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
Figura 138. Valores seleccionados para ejemplificar uso de tabla.
En cuatro de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron ambas en su
valor más bajo.
De igual forma, en tres de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron
ambas en su valor más alto.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
111
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
10.1
ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS
Analizaremos la construcción de una tabla bivariada para el caso donde las variables de origen
son de naturaleza continua. Si una variable de estudio es continua, esta debe ser segmentada en
intervalos.
Previo a la construcción de la tabla como tal, se debe realizar el cálculo de la amplitud de los
intervalos que se utilizarán para la representación de la tabla bivariada. Debemos recordar que la
amplitud de un intervalo se determina dividiendo el rango de la variable por la cantidad de
intervalos que deseamos. Para nuestro ejemplo calcularemos 4 intervalos para cada variable.
Ahora, realizamos los mismos pasos que para una tabla bivariada discreta, es decir:
1.
2.
3.
4.
5.
6.
7.
En el menú seleccionamos “Insertar”
Seleccionamos “Tabla Dinámica”
Ingresamos los datos en “Tabla o rango”
Desplazamos el campo “dólar” a la “etiqueta de filas”
Desplazamos el campo “euro” a la “etiqueta de columna”
Desplazamos cualquiera de los campos a “Valores”
Seleccionamos la opción “cuenta” en la “Configuración de campo de valor”
Como se observa la tabla hasta ahora construida no es muy estética, para mejorarla se hará el
ingreso de los intervalos para las variables continuas.
8.
9.
10.
11.
Hacer “click” con el botón derecho sobre un valor de la fila “dólar”
Seleccionar la opción “Agrupar”
En la opción “por” ingresar el valor de la amplitud del dólar
Repetir los mismos pasos para la columna “euro”
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
112
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
10.2
EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA
9
1.
Utilice la base de datos “PruebaEst.xls ” para confeccionar una tabla de frecuencias bivariada. Esta
base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en años) y Prueba
(Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos básicos de
estadística. Se pide ingresar en el buzón de la plataforma de laboratorio la tabla bivariada para las
variables Edad y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables
continuas.
2.
Utilice la base de datos “PruebaEst.xls” para confeccionar una tabla de frecuencias bivariada. Esta
base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en años) y Prueba
(Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos básicos de
estadística. Se pide ingresar en el buzón de la plataforma de laboratorio la tabla bivariada para las
variables Sexo y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables
continuas.
3.
Utilice la base de datos “Examenes.xlsx ” la cual contiene información sobre el número de
preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que
rindieron el respectivo examen en cierta universidad. Se pide ingresar en el buzón de la plataforma
de laboratorio la tabla bivariada para tales variables. Nota: usted debe determinar la cantidad de
cortes sobre las variables continuas.
4.
Utilice la base de datos “SalarioUSA.xls ” la cual contiene las siguientes variables: SEXO (0: hombre,
1:mujer), SALARIO HORA (dólares por hora de trabajo), EDAD (en años) e HIJOS (número de hijos
del encuestado). Confecciones una tabla bivariada para las variables SALARIO HORA y EDAD. Esta
tabla debe ser ingresada en el buzón habilitado en la plataforma de laboratorio. Nota: usted debe
determinar la cantidad de cortes sobre las variables continuas.
5.
Utilice la base de datos “SalarioUSA.xls” la cual contiene las siguientes variables: SEXO (0: hombre,
1:mujer), SALARIO HORA (dólares por hora de trabajo), EDAD (en años) e HIJOS (número de hijos
del encuestado). Confecciones una tabla bivariada para las variables SEXO y SALARIO HORA. Esta
tabla debe ser ingresada en el buzón habilitado en la plataforma de laboratorio. Nota: usted debe
determinar la cantidad de cortes sobre las variables continuas.
10
11
9
Base de datos “PruebaEst.xls” disponible en la página web del Departamento de Matemática y Física.
10
Base de datos “Examenes.xlsx” disponible en la página web del Departamento de Matemática y Física.
11
Base de datos “SalarioUSA.xls” disponible en la página web del Departamento de Matemática y Física.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
113
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
CONCLUSIÓN
El análisis de datos es una habilidad fundamental que cualquier ingeniero debe dominar. La herramienta
análisis de datos presenta una solución eficaz y de fácil manejo para tratar un conjunto de datos dado. La
tabulación de datos (tema 2 del apunte) es el punto inicial en la presentación de un informe pues resume en
forma estética los datos, el resumen descriptivo (tal como se trato en el tema 3) es de gran relevancia pues
permite dar una primera mirada al comportamiento de los datos, cabe notar que Excel en esta opción
(Estadística Descriptiva) no proporciona medidas de posición por lo que, el alumno debe internalizar en la
obtención de tales medidas. El análisis gráfico aquí presentado en la forma del Histograma es uno de los
tantos tipos de presentación gráfica que se pueden realizar. Se recomienda al alumno internalizar en la
opciones de gráfico en Excel disponible en el menú superior, específicamente en la opción “Insertar”). El
cruce de variables también es un complemento importante en una investigación, buscar relaciones entre
variable de naturaleza cualitativa y/o cuantitativa podría denotar comportamientos no observados a simple
vista en los resúmenes individuales de información, por ello se presentó en el tema 5 (caso cualitativo) y
tema 10 (caso cuantitativo) la función “Tabla dinámica”. Se recomienda al alumno internalizar en el uso de
tablas bivariadas, por ejemplo, para un alumno de Ingeniería comercial podría interesarle la aplicación en
Carteras de Inversión y a un alumno de otras ingenierías los test Estadísticos asociados a la independencia de
variables u homogeneidad de ésta (Test Chi-cuadrado).
Los temas relacionados a variables discretas y continua, además de los métodos de simulación son el punto
inicial de las teorías que se desarrollan es cursos de Investigación de Mercados, Econometría y Simulación. El
alumno debe interiorizar el uso de distribuciones de probabilidad discreta y continua, ya que, muchos
fenómenos están relacionados con estos en otras ciencias. En este Apunte sólo se muestran las
distribuciones que son de uso habitual en cursos de Estadística, por lo que, se recomienda investigar sobre
otras distribuciones de probabilidad (ejemplo: Distribución Geométrica, Binomial Negativa, Gamma, Beta,
Triangular, ente otras) y la relación con las tratadas en este apunte que son las que dispone Excel en la
opción “Generación de números aleatorios”.
Finalmente se espera que este apunte sea el pie para el desarrollo de habilidades computacionales y
estadísticas en los futuros ingenieros de la Universidad Bernardo O’Higgins. También, que desarrolle interés
por temas de estadística avanzada y sea motivación para internalizar temas de inferencia estadística los
cuales se tratan en el curso de Estadística II.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
114
Vicerrectoría Académica
Facultad de Ingeniería y Administración
Departamento de Matemática y Física
BIBLIOGRAFÍA
Jay L. Devore. (2001). Probabilidad y Estadística para Ingeniería y Ciencias. México: Thomson Learning.
Richard I. Levine y David S. Rubin. (2010). Estadística para la Administración. México: Pearson.
Robert Johnson y Patricia Kuby. (2004). Estadística elemental, Lo esencial. México: Thomson.
Ronald E. Walpole, et al. (2007). Probabilidad y Estadística para ingeniería y ciencias. México: Pearson
Prentice Hall.
Paul Newbold, Williams L. Carlson y Betty Thorne. (2008). Estadística para administración y economía.
España: Pearson Prentice Hall.
HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA
115
Descargar
Colecciones de estudio