Este documento es de distribución gratuita y llega gracias a “Ciencia Matemática” www.cienciamatematica.com El mayor portal de recursos educativos a tu servicio! Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas INSTITUTO TECNOLÓGICO DE APIZACO DEPARTAMENTO DE CIENCIAS BÁSICAS www.itapizaco.edu.mx/~cbasicas ESTADÍSTICA ADMINISTRATIVA I (Licenciatura en administración) M. en C. JOSÉ LUIS HERNÁNDEZ GONZÁLEZ www.itapizaco.edu.mx/~joseluis Estadística Administrativa I pag. 1 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas ESTADÍSTICA ADMINISTRATIVA I (Licenciatura en administración) OBJETIVO GENERAL DEL CURSO. Analizará y aplicará conceptos y técnicas de la probabilidad y estadística descriptiva e inferencial en la solución de problemas en áreas de su competencia. I Distribuciones de frecuencia. 1.1 Conceptos de estadística y su clasificación 1.2 Recopilación de datos 1.3 Distribución de frecuencia 1.3.1 Histogramas, polígonos de frecuencia, ojivas 1.4 Medidas de tendencia central para un conjunto de datos y datos no agrupados 1.4.1 Media, media ponderada 1.4.2 Mediana 1.4.3 Moda 1.4.4 Relación entre media, mediana y moda 1.5 Medidas de dispersión para un conjunto de datos y datos agrupados 1.5.1 Rango 1.5.2 Desviación media 1.5.3 Varianza 1.5.4 Desviación estándar 1.6 Coeficiente de variación 1.7 Coeficiente de asimetría de Pearson II Introducción a la probabilidad y valor esperado 2.1 Introducción a la probabilidad 2.1.1 Definición y expresión 2.2 Eventos mutuamente excluyentes y no excluyentes 2.3 Reglas de adición 2.4 Eventos independientes, dependientes, probabilidad condicional 2.5 Reglas de multiplicación 2.6 Diagrama de árbol 2.7 Combinaciones y permutaciones 2.8 Análisis combinatorio 2.9 Teorema de Bayes 2.10 Valor esperado o esperanza matemática III Tipos de distribuciones variables aleatorias discretas y continuas 3.1 Binomial 3.1.1 Propiedades: media, varianza y desviación estándar 3.1.2 Gráfica Estadística Administrativa I pag. 2 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas 3.2 Poisson 3.2.1 Propiedades: media, varianza y desviación estándar 3.2.2 Gráfica 3.3 Hipergeométrica 3.3.1 Propiedades: media, varianza y desviación estándar 3.3.2 Gráfica 3.4 Normal 3.4.1 Propiedades: media, varianza y desviación estándar 3.4.2 Gráfica 3.5 Aproximación de la normal a la binomial 3.5.1 Propiedades: media, varianza y desviación estándar 3.5.2 Gráfica IV Muestreo y estimaciones 4.1 Definición de muestreo 4.1.1 Tipos de muestreo aleatorio, sistematizado, estratificado y conglomerados 4.2 Concepto de distribución de muestreo de la media 4.2.1 Distribución muestral de la media con σ conocida y desconocida 4.2.2 Distribución muestral de la µ1-µ1 con σ conocida y desconocida 4.2.3 Distribución muestral de la proporción 4.2.4 Distribución muestral p1-p2 4.3 Teorema del límite central 4.4 Tipos de estimaciones y características 4.5 Determinación del tamaño de la muestra de una población 4.6 Intervalos de confianza para la media, distribución Normal y “t” 4.6.1 Determinación del tamaño de la muestra con grado de confianza y estimación µ 4.7 Intervalo de confianza para la diferencia entre dos medias µ1 - µ2 con y σ1≠σ2 conocidas, con el uso de la distribución normal y la “t” student 4.8 Una sola muestra: estimación de la proporción 4.9 Intervalo de confianza para la diferencia de dos proporciones V Control estadístico de Proceso 5.1. Introducción a la calidad total 5.2. Control estadístico 5.3. Tipos de variación 5.4. Graficas de control 5.4.1.Gráficas de control para la media del proceso: gráfica χ 5.4.2 Gráficas de control para la desviación estándar del proceso: (S) 5.4.3 Gráficas de control para el rango del proceso. Graficas ( R ) 5.4.4 Software estadístico Estadística Administrativa I pag. 3 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas BIBLIOGRAFÍA (Temario) 1) Levin I. Richard. Estadística para administradores Editorial: Prentice-Hall. Observaciones: 2) Mendenhall. Estadística para administradores. Editorial: Grupo Editorial Iberoamericana. _________________________ _________________________ _________________________ 3) Stephen P. Sha O. Estadística para economistas y administración de empresas. Editorial: Harreu. H. _________________________ _________________________ _________________________ 4) Kazmier. Estadística para administración economía y ciencias sociales. Editorial: McGraw Hill _________________________ _________________________ 5) Spiegel. Murray V. Estadística. Editorial: McGraw Hill _________________________ _________________________ _________________________ 6) William Mendenhall, D. Wackerly, L. Scheaffer. Estadística matemática en aplicaciones. Grupo Editorial Iberoamericana. _________________________ 7) Kenneth D. Hopkins B.R. Hopkins, V. Class. Estadística básica para las ciencias sociales y del comportamiento. Editorial: Prentice-Hall. 8) Walphole. Probabilidad y estadística. Editorial: McGrawHill. 9) John E. Freund A. Simon. Estadística elemental. Editorial: Prentice-Hall. 10) George Canavos. Probabilidad y estadística, aplicaciones y métodos. Editorial: McGrawHill Estadística Administrativa I pag. 4 (1) www.bibitec.org.mx (2) Programas: Mathcad y SSPS. M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas BIBLIOGRAFÍA (Apuntes) Estadística I Napoleón Labastida López I.P.N. – Limusa IMPORTANTE Entregar apuntes completos al Estadística Inferencial y Econometría José Felipe Padilla Díaz I.P.N. finalizar el curso. (con anotaciones de la clase en las copias y fechas, 4 revisiones Probabilidad y Estadística Walpole y Mier Mc Graw Hill durante el semestre) Las tareas o trabajos de investigación se deben entregar Probabilidad y Estadística Problemas de Probabilidad Hugo E. Borras García Rafael Iriarte B. Facultad de Ingeniería UNAM como mapas conceptuales. (en hojas blancas, nombre, fecha y número de lista, engrapado) Elaborar proyecto con algún LINKS software de la lista. Entregar reporte de lecturas Programa R (software libre) http://cran.r-project.org/ Winplot y Winstat (software libre) http://math.exeter.edu/rparris/winplot.html http://math.exeter.edu/rparris/winstats.html seleccionadas. Entregar 10 problemas resueltos por cada tema. http://www.minitab.com http://www.spss.com/corpinfo/ Estadística Administrativa I pag. 5 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas UNIDAD I RECOPILACIÓN DE LA INFORMACIÓN CONCEPTOS DE ESTADÍSTICA Y SU CLASIFICACIÓN ESTADÍSTICA. Es la ciencia que estudia los medios para derivar información válida a partir de un conjunto de datos. Es decir, estudia los mecanismos para la obtención de datos así como su manipulación y análisis. El estudio de la estadística se ha concretado primordialmente en el análisis de datos y su aplicación en la toma de decisiones, lo que ha permitido dividir a la estadística en: Estadística descriptiva Inferencia estadística (estadística inductiva o estadística analítica). ESTADÍSTICA DESCRIPTIVA. Es el proceso que se relaciona con los métodos y/o técnicas para la recopilación, organización y análisis de un conjunto de datos cuantitativos, con el objeto de describir en forma apropiada las diversas características de dicho conjunto. INFERENCIA ESTADÍSTICA. Es la técnica o metodología mediante la cual es posible realizar la estimación de las características de una población o realizar la toma de decisiones basados en resultados muestrales. DEFINICIONES POBLACIÓN. Es la totalidad de elementos de un grupo dado que posee una característica delimitada para el alcance de una investigación. MUESTRA. Se denomina muestra a una porción de datos representativos de una población. PASOS PARA EFECTUAR UN ESTUDIO ESTADÍSTICO El uso de los métodos estadísticos es muy variado y se aplican generalmente a distintos campos como son los negocios, economía, educación, medicina, ingeniería, etc. Para lo cual el proceso para realizar un estudio estadístico está constituido de las siguientes etapas: 1. Formulación del problema. Para realizar el estudio de un problema es necesario delimitarlo y formularlo adecuadamente, definiéndolo de manera clara y precisa. 2. Diseño del experimento. Esta etapa se basa primordialmente en obtener un máximo de información empleando un mínimo de costo y tiempo. Estadística Administrativa I pag. 6 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas 3. Recopilación de datos. Los datos provienen de observaciones reales o de documentos que se usan de manera cotidiana, es la parte que consume mayor tiempo la cual la podemos obtener de: a. Bancos de datos b. Entrevistas o cuestionarios c. Observación directa o mediciones experimentales 4. Organización y descripción. Consiste en desglosar los datos en algunas propiedades sencillas, se incluye el problema de elaborar modelos matemáticos apropiados de los datos. 5. Inferencia estadística. Consiste en obtener conclusiones acerca de la población muestreada que dio lugar a los datos recopilados, es el principal objetivo de las investigaciones estadísticas. 6. Interpretación y decisión. Consiste en la fase final del estudio la cual determinará si una solución es adecuada o no, dependiendo de los resultados obtenidos. OBTENCIÓN DE DATOS Dentro de un proceso de investigación una de las actividades que se realizan es la recopilación de datos, la cual es el acopio de información y se incluye desde elaborar fichas bibliográficas hasta la aplicación de cuestionarios con el empleo de técnicas de muestreo. Existe una gran variedad de técnicas para realizar la investigación, que se deberán seleccionar de acuerdo a las necesidades del problema, así como a diferentes factores como son el tiempo, costo, tipo de actividades a realizar, recursos humanos, etc. Las técnicas de recopilación de datos las podemos realizar con: Investigación documental Investigación de campo LA INVESTIGACIÓN DOCUMENTAL. Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos aquellos documentos registrados en diferentes dispositivos físicos a los que podemos tener acceso en forma directa o indirecta para su consulta y se puede clasificar en: 1.- Documental bibliográfica 4.- Documental audiográfica 2.- Documental hemerográfica 5.- Documental videográfica 3.- Documental escrita 6.- Documental iconográfica LA INVESTIGACIÓN DE CAMPO. Consiste en obtener información directa mediante diferentes actividades por contacto directo con el hecho que se quiere investigar así como las personas relacionadas y se puede realizar: a) Por observación directa b) Por interrogación LA OBSERVACION. Es el procedimiento empírico básico, el cual consiste en realizar la percepción intencionada de una actividad determinada mediante la experimentación la cual consiste Estadística Administrativa I pag. 7 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas en la obtención de datos cuantitativos por medio de la medición del fenómeno que se este observando. Para realizar la observación se utilizan diversos instrumentos auxiliares los cuales son: 1.- La ficha de campo 2.- Estudio de Actividades realizadas con anterioridad, biografías, etc. 3.- La entrevista 4.- La encuesta LA ENTREVISTA. Es una de las técnicas más comunes y es considerada como la relación directa entre el investigador y el objeto de estudio a través de individuos o grupos con el fin de obtener testimonios reales. a) Entrevistas formales b) Entrevistas informales LA ENCUESTA. Consiste en recopilar información sobre una parte e la población, en donde la información recopilada puede emplearse para un análisis cuantitativo con el fin de identificar las magnitudes del problema. a) Un cuestionario b) Una cedula de entrevista EL CUESTIONARIO. Es un eficaz auxiliar en la observación científica que contiene aspectos del fenómeno esenciales, las cuales son preguntas formuladas por escrito y no es necesaria la presencia del investigador. - Cuestionarios por correo - Cuestionario administrado por el entrevistado - Cuestionario administrado por el entrevistador LA CEDULA. Tiene carácter de anónimo, donde el encuestador es quien llena la cedula de entrevista, además de que es posible aclara la información sobre las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural. Investigación Documental Bibliográfica Hemerográfica Escrita Audiográfica Videográfica Iconográfica Dispositivo magnético Ficha de campo Observación directa Actividades anteriores Entrevista Formal Informal Encuesta Cuestionario Cédula de entrevista Campo Por interrogación Estadística Administrativa I pag. 8 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Organización, presentación y medición de la información ESTADÍSTICA DESCRIPTIVA Medidas descriptivas. Es posible realizar una interpretación o análisis de los datos mediante diferentes medidas descriptivas que nos permiten extraer y resumir las principales características de los datos. Las medidas descriptivas pueden calcular a partir de una muestra o de una población, además es necesario realizar una tabla de frecuencias cuando los datos son demasiados para poder graficarlos e interpretarlos. DISTRIBUCIÓN DE FRECUENCIAS Distribución de Frecuencia: Es una representación tabular en la cual se disponen datos divididos en grupos ordenados numéricamente y que se denominan clases o categorías. Al construir una tabla de distribución de frecuencias, debemos de: 1) Se selecciona el número adecuado de clases para la tabla. 2) Se selecciona un intervalo de clase o anchura apropiada. 3) Establecer los límites de clase para evitar traslapes. La selección del número de clases depende de la cantidad de datos sin embargo, se propone de entre 5 y 15. CÁLCULO DE NÚMEROS DE CLASES Para calcular el número de clases de una tabla de frecuencias podemos usar las siguientes expresiones ó fórmulas: a) Raíz cuadrada k = b) n Regla de Sturges k = 1 + 3.3 log n c) Regla de Stockes k = Estadística Administrativa I pag. 9 ln(n ) +1 ln(2) M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Considere los siguientes datos aleatorios: 15 7 5 10 18 20 19 14 17 10 13 20 10 11 16 7 19 12 1 4 3 16 15 13 8 5 20 7 2 6 3 9 10 13 19 n = 35 a) Raíz cuadrada k = = 5.916 ≈6 b) Regla de Sturges k = 1 + 3.3 log (35) = 6.095 ≈6 c) Regla de Stockes k = ln(n ) +1 ln(2) = 6.129 ≈6 35 Rango= 20 – 1 = 19 I= recorrido 19 = = 3.1667 ≈ 4 k 6 Si redondeamos a I = 4 tendremos k = 5 y si redondeamos a I = 3, tendremos k = 6, por simplicidad se toma en este ejemplo I = 4 y k = 5. Clase Frecuencias Frecuencias Frecuencias Frecuencias frecuencias Marca de acumuladas relativas acumuladas clase relativas li ls f f Fa fr far x 0.5 a menos de 4.5 xxxxx 5 5 5/35 5/35 2.5 4.5 a menos de 8.5 xxxxxxx 7 12 7/35 12/35 6.5 8.5 a menos de 12.5 xxxxxxx 7 19 7/35 19/35 10.5 12.5 a menos de 16.5 xxxxxxxx 8 27 8/35 27/35 14.5 16.5 a menos de 20.5 xxxxxxxx 8 35 8/35 35/35 18.5 35 k = Número de clases 35 ls = Límite Superior li = Límite Inferior I = Ancho de clase Estadística Administrativa I pag. 10 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas HISTOGRAMAS Histograma de Frecuencias: Está formado por un conjunto de barras rectangulares, levantadas sobre el eje de las abscisas (x), cuyas áreas son proporcionales a las frecuencias, la altura de cada frecuencias barra representa a la frecuencia. 9 8 7 6 5 4 3 2 1 0 2.5 6.5 10.5 14.5 16.5 marca de clase Polígonos de frecuencia: Es un diagrama de línea que usa los mismos ejes y escala del histograma, formando un polígono. frecuencias 10 8 6 4 2 0 -1.5 2.5 6.5 10.5 14.5 16.5 20.5 16.5 20.5 marca de clase frecuencias 10 8 6 4 2 0 -1.5 2.5 6.5 10.5 14.5 marca de clase Estadística Administrativa I pag. 11 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Diagramas acumulativos (ojivas): En ocasiones se desea mostrar la distribución de datos, en forma acumulada. Las frecuencias acumuladas se pueden formar sobre una base “menor que” ó “mayor frecuencias acumuladas que” y se obtienen sumando en orden ascendente o descendente las frecuencias. 40 30 20 10 0 0.5 4.5 8.5 12.5 16.5 20.5 16.5 20.5 frecuencias acumuladas límites 40 35 30 25 20 15 10 5 0 0.5 4.5 8.5 12.5 límites Efecto de la cantidad de datos en un histograma. Estadística Administrativa I pag. 12 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas MEDIDAS DE TENDENCIA CENTRAL O DE POSICIÓN La mayoría de los datos se muestra la tendencia de agruparse alrededor de un punto central y es posible elegir un valor promedio que describa al conjunto. Las más usuales son: la Media Aritmética, la Mediana, Moda y el Rango Medio. Media aritmética n ∑ xi muestra x = i =1 n x1 + x 2 + K + x n n = N ∑ xi población µ = i =1 N Mediana Md = n +1 posición 2 Nota: Es importante ordenar los datos de mayor a menor o de menor a mayor. Moda (Mo) Es aquel valor con mayor frecuencia. Rango medio x mayor + x menor 2 Rm = Media geométrica n M g = n Π x i = n x1x 2 K x n i =1 Estadística Administrativa I pag. 13 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas utilizando logaritmos n ∑ log x i x i =1 M g = 10 n = 10 x log x 1 + log x 2 + K + log x n n Media armónica (M-1) n M −1 = n n = 1 1 1 + +K+ x1 x 2 xn 1 ∑x i =1 i Media cuadrática (Mc) n ∑ x i2 Mc = i =1 n x 12 + x 22 + K + x 2n = n Media aritmética ponderada n ∑ wixi x = i =1 n x1w 1 + x 2 x 2 + K + w n x n w1 + w 2 + K + w n = ∑ wi i =1 Cuartiles (Qi) Qi = ni Di = ni + 1 posición 2 + 1 posición 2 + 1 posición 2 4 Deciles (Di) 10 Percentiles (Pi) Pi = Estadística Administrativa I ni 100 pag. 14 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas MEDIDAS DE DISPERSIÓN Es una propiedad que describe a un conjunto de datos en relación al grado de variación o diseminación de los mismos las medidas mas usuales son el rango, la desviación media, la varianza y la desviación Estándar. Rango (recorrido, amplitud, oscilación) R = x mayor − x menor Desviación media (D. M.) D.M. = n | xi − x | i =1 n ∑ = | x1 − x | + | x 2 − x | + K + | x n − x | n Varianza n muestra s2 = ∑ i =1 σ2 = población (x i − x) 2 (x 1 − x) 2 + (x 2 − x) 2 + K + (x n − x) 2 = n −1 n −1 N ( x − µ) 2 i ∑ i =1 N Desviación estándar muestra (x i − x ) 2 s= s = ∑ n −1 i =1 población ( x i − µ) 2 σ= σ = ∑ N i =1 n 2 N 2 Coeficiente de variación cv = s x cv = σ µ Coeficiente de asimetría ca = Estadística Administrativa I 3( x − M d ) s pag. 15 ca = 3(µ − M d ) σ M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Ejemplo: Considere el siguiente conjunto de calificaciones obtenidas de una muestra de 8 alumnos del grupo. 80, 78, 60, 33, 80, 90, 80, 98 x = 80 + 78 + 60 + 33 + 80 + 90 + 80 + 98 599 = = 74.875 8 8 Md = 33 1 60 2 78 3 80 4 8+1 = 4.5 posición 2 80 5 80 6 90 7 98 8 4.5 posición Md = 80 Mo = 80 Rm = Q2 = 98 + 33 = 65.5 2 (8)(2) 4 + 1 = 4.5 posición 2 MEDIDAS DE DISPERSIÓN R = 98 − 33 = 65 s 2 = (80 − 9.36) 2 + (78 − 9.36) 2 + K + (98 − 9.36) 2 8 −1 s= 403.839 = 20.0958 cv = 20.0958 = 0.268 74.875 ca = 3(74.875 − 80) 20.0958 Estadística Administrativa I = 2826.88 = 403.839 7 = −.0765 pag. 16 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas DATOS AGRUPADOS Cuando el conjunto de datos es muy grande lo podemos organizar en una tabla de frecuencias y después calcular sus medidas como datos agrupados. n ∑ x ifi Media n = Número de datos x = i =1 n li = Límite inferior ∑ fi f = Frecuencia i =1 Mediana Moda Cuartiles Deciles Percentiles n − fa a I M d = li + 2 f ∆1 M o = li + ∆1 + ∆ 2 ni − fa a Q i = li + 4 f x = Valor Medio o marca de clase ∆1 = Diferencia entre la mayor frecuencia y la frecuencia anterior I ∆2 = Diferencia entre la mayor frecuencia y la frecuencia que le sigue I = Ancho de la clase ó intervalo I faa = Frecuencia acumulada anterior ni − fa a I D i = li + 10 f ni − fa a I Pi = li + 100 f k ∑ ( x − µ) 2 f i Varianza σ 2 = i =1 k ∑ fi i =1 Ejemplo: Calcular en la tabla de frecuencias anterior la media aritmética, mediana, moda, desviación estándar y comparar como datos no agrupados. Estadística Administrativa I pag. 17 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas f fa x xf (x-µ)2f 0.5 a menos de 4.5 5 5 2.5 12.5 387.2 4.5 a menos de 8.5 7 12 6.5 45.5 161.28 8.5 a menos de 12.5 7 19 10.5 73.5 4.48 12.5 a menos de 16.5 8 27 14.5 116.0 81.92 16.5 a menos de 20.5 8 35 18.5 148.0 414.72 ∑ 35 395.5 1049.6 li ls Media µ= 395.5 = 11.30 35 Mediana n 35 = = 17.5 en las frecuencias acumuladas, 2 2 Buscar en las frecuencias acumuladas el valor de como no aparece tómese el renglón con la frecuencia mayor a 17.5 que corresponde a la clase de 8.5 a menos de 12.5. li ls f fa x 0.5 a menos de 4.5 5 5 2.5 4.5 a menos de 8.5 7 12 6.5 8.5 a menos de 12.5 7 19 10.5 12.5 a menos de 16.5 8 27 14.5 16.5 a menos de 20.5 8 35 18.5 35 sustituir li = 8.5 faa = 12 f =7 I= 4 17.5 − 12 M d = 8.5 + 4 = 11.64 7 Moda Tomar la mayor frecuencia, considerar el valor de 8 en la clase de 12.5 a menos de 16.8. li = 12.5 ∆1 = 1 ∆2 = 0 I =4 1 M o = 12.5 + 4 = 16.5 1+ 0 Estadística Administrativa I pag. 18 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Varianza σ2 = 1049.6 = 29.99 35 σ= 29.99 = 5.473 Desviación estándar Comparativa de la media aritmética y la desviación estándar µ = 11.34 (no agrupados) 11.30 (agrupados) σ = 5.79 (no agrupados) 5.47 (agrupados) Asimetría. Es una medida del grado de distorsión respecto a la simetría que presenta una distribución de frecuencias. Cuando una distribución es perfectamente simétrica los valores de la media, la mediana y de moda son iguales. Simétrica Asimetría positiva (a la derecha) Asimetría negativa (a la izquierda) Curtósis. Mide el grado de apuntamiento de la distribución. La curva normal se toma como referencia para medir la curtósis. Si una curva es menos apuntada que la normal se dice que es platicúrtica y una curva más apuntalada que la normal se llama leptocúrtica. El termino mesocúrtica es utilizado para describir a la curva normal. Leptocúrtica Mesocúrtica Platicúrtica Estadística Administrativa I pag. 19 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas UNIDAD II INTRODUCCIÓN A LA PROBABILIDAD Y VALOR ESPERADO CONJUNTOS Y TÉCNICAS DE CONTEO DEFINICIÓN Y NOTACIÓN DE CONJUNTOS El término conjunto juega un papel fundamental en el desarrollo de las matemáticas modernas; Además de proporcionar las bases para comprender con mayor claridad algunos aspectos de la teoría de la probabilidad. Su origen se debe al matemático alemán George Cantor (1845 – 1918). Podemos definir de manera intuitiva a un conjunto, como una colección o listado de objetos con características bien definidas que lo hace pertenecer a un grupo determinado. Para que exista un conjunto debe basarse en lo siguiente: La colección de elementos debe estar bien definida. Ningún elemento del conjunto se debe contar más de una vez, generalmente, estos elementos deben ser diferentes, si uno de ellos se repite se contará sólo una vez. El orden en que se enumeran los elementos que carecen de importancia. NOTACIÓN A los conjuntos se les representa con letras mayúsculas A, B, C, ... y a los elementos con letras minúsculas a, b, c, ..., por ejemplo, el conjunto A cuyos elementos son los números en el lanzamiento de un dado. A = { 1, 2, 3, 4, 5, 6 } En base a la cantidad de elementos que tenga un conjunto, estos se pueden clasificar en conjuntos finitos e infinitos. FINITOS: Tienen un número conocido de elementos, es decir, se encuentran determinados por su longitud o cantidad. El conjunto de días de la semana INFINITOS: Son aquellos en los cuales no podemos determinar su longitud. El conjunto de los números reales Existen dos formas comunes de expresar un conjunto y la selección de una forma particular de expresión depende de la conveniencia y de ciertas circunstancias siendo: Estadística Administrativa I pag. 20 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas EXTENSIÓN: Cuando se describe a cada uno de los elementos. A = {a, e, i, o, u} COMPRENSIÓN: Cuando se enuncian las propiedades que deben tener sus elementos. A = {x | x es una vocal} Para describir si un elemento pertenece o no a un conjunto, se utiliza el símbolo de pertenencia o es elemento de, con el símbolo ∈, en caso contrario ∉. A = {1, 2, 3} 2 ∈ A; 5 ∉ A TIPOS DE CONJUNTOS CONJUNTO VACIÓ O NULO: Es aquel que no tiene elementos y se simboliza por ∅ o { }. A = {x2 + 1 = 0 | x ∈ R} El conjunto A, es un conjunto vacío por que no hay ningún número real que satisfaga a x2+1 = 0 CONJUNTO UNIVERSAL: Es el conjunto de todos los elementos considerados en una población o universo, en un problema en especial. No es único, depende de la situación, denotado por U o Ω. RELACIONES ENTRE CONJUNTOS IGUALDAD DE CONJUNTOS Considerando el conjunto A y el conjunto B, si ambos tienen los mismos elementos, es decir, si cada elemento que pertenece a A también pertenece a B y si cada elemento que pertenece a B pertenece también a A. A=B SUBCONJUNTO Si todo elemento de un conjunto A es también elemento de un conjunto B, entonces se dice que A es un subconjunto de B. Representado por el símbolo ⊂. A⊂BoB⊃A SUBCONJUNTOS PROPIOS Se dice que es un subconjunto propio de A sí todos los elementos de un conjunto B se encuentran incluidos en él A, denotado por ⊆. A⊆BoB⊇A Estadística Administrativa I pag. 21 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas CONJUNTO POTENCIA La familia de todos los subconjuntos de un conjunto se llama conjunto potencia. Si un conjunto es finito con n elementos, entonces el conjunto potencia tendrá 2n subconjuntos. A = {1, 2} El total de subconjuntos es: 22 = 4 {1,2}, {1}, {2}, { } CONJUNTOS DISJUNTOS Son aquellos que no tienen elementos en común, es decir, cuando no existen elementos que pertenezcan a ambos. F = {1, 2, 3, 4, 5, 6} G = {a, b, c, d, e, f} PARTICIÓN Cuando un conjunto es dividido en subconjuntos mutuamente excluyentes y exhaustivos, se le denomina partición. OPERACIONES DE CONJUNTOS Unión. Intersección. Diferencia. Complemento. Producto cartesiano. UNIÓN DE CONJUNTOS. Sean A y B dos subconjuntos cualesquiera del conjunto universal. La unión de A y B, expresada por A ∪ B, es el conjunto de todos los elementos que pertenecen a A o pertenecen a B. A ∪ B = {x | x ∈ A o x ∈ B} INTERSECCIÓN DE CONJUNTOS. Sean A y B dos conjuntos cualesquiera del conjunto universal. La intersección de A y B, expresada por A ∩ B, es el conjunto de todos los elementos que pertenecen a A y a B simultáneamente, es decir: A ∩ B = {x | x ∈ A y x ∈ B} Estadística Administrativa I pag. 22 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas DIFERENCIA DE CONJUNTOS O COMPLEMENTO RELATIVO. Sean A y B dos conjuntos cualesquiera del conjunto universal. La diferencia o complemento relativo de B con respecto a A, es el conjunto de los elementos que pertenecen a A, pero no pertenecen a B. A - B = {x | x ∈ A, x ∉ B} Nota: A - B ≠ B - A COMPLEMENTO ABSOLUTO O SIMPLEMENTE COMPLEMENTO. Sea A un subconjunto cualesquiera del conjunto universal. El complemento de A es el conjunto de elementos que perteneciendo al universo y no pertenecen al conjunto A, denotado por A’ o Ac. A’ = {x | x ∈ U, x ∉ A} Nota: A’ = U - A PRODUCTO CARTESIANO. Sean A y B dos conjuntos, el conjunto producto o producto cartesiano expresado por A x B está formado por las parejas ordenadas (a, b) donde a ∈ A y b ∈ B. A x B = {(a, b) | a ∈A y b ∈ B} LEYES DE CONJUNTOS DE IDEMPOTENCIA A∪A=A A ∩ A=A DE INVOLUCIÓN (A’)’ = A ASOCIATIVA (A ∪ B) ∪ C = A ∪ (B ∪ C ) (A ∩ B) ∩ C = A ∩ (B ∩ C) DE COMPLEMENTO A ∪ A’ = U A ∩ A’ = ∅ U’= ∅ ∅’= U CONMUTATIVA A ∪B = B ∪ A D’MORGAN (A ∪ B)’ = A’ ∩ B’ A ∩ B=B ∩ A (A ∩ B)’= A’ ∪ B’ DISTRIBUTIVA A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) DE IDENTIDAD A∪ U = U A∪ ∅ = A Estadística Administrativa I A ∩ U=A A ∩∅=∅ PRINCIPIO DE CONTEO n(A ∪ B) = n(A) + n(B) A∩B=∅ n(A ∪ B) = n(A) + n(B) - n(A ∩ B) A ∩ B ≠ ∅ pag. 23 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas DIAGRAMAS DE VENN Un diagrama de Venn es una representación pictórica de conjuntos en el plano. El conjunto universal U se representa por un rectángulo, cualquier otro conjunto se representa con un círculo. Una operación se representa mediante el sombreado de los elementos del conjunto. S A B A∪B EVENTOS EXPERIMENTO ESTADÍSTICO: Es el proceso mediante el cual se genera un conjunto de datos y puede ser determinístico o aleatorio. ESPACIO MUESTRAL: Son todos los posibles resultados que se obtienen de un experimento denotado por S o Ω. S = {1, 2, 3, 4, 5, 6} EVENTO SIMPLE: Son los eventos constituidos por un sólo elemento. A = {4} EVENTO COMPUESTO: Es cualquier evento que se puede descomponer en dos o más eventos simples. B = {2, 4, 6} EVENTOS MUTUAMENTE EXCLUYENTES: Llamados también disjuntos, no pueden ocurrir simultáneamente, es decir, la ocurrencia de ellos excluye la ocurrencia de los otros. A∩B=∅ EVENTOS INDEPENDIENTES: Cuando la ocurrencia o no ocurrencia de un evento no afecte la ocurrencia de otro evento. EVENTOS DEPENDIENTES: Si los eventos A y B están relacionados de tal modo que la ocurrencia de B depende de la ocurrencia de A, entonces A y B son independientes. Estadística Administrativa I pag. 24 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas TÉCNICAS DE CONTEO Para determinar el espacio muestral o el tamaño del espacio muestral, es necesario desarrollar algunas técnicas de enumeración las cuales son: El Diagrama de Árbol Análisis Combinatorio. DIAGRAMAS DE ÁRBOL Los diagramas de árbol son ordenaciones empleadas para enumerar todas las posibilidades lógicas de una secuencia de eventos, donde cada evento puede ocurrir en un número finito. Proporcionan un método sistemático de enumeración objetiva de los resultados. Ramas Raíz A continuación, se presenta un Diagrama de Árbol, referente a las respuestas que se pueden dar a tres preguntas de Verdadero o Falso. Tenemos dos opciones posibles para cada pregunta, V o F el árbol presenta dos ramas en cada pregunta. 1) La teoría de conjuntos fue desarrollada por G. Cantor. a) V b) F 2) G. Cantor es de origen francés. a)V b) F 3) La teoría de conjuntos sirve para simplificar la Estadística. a) V 2 V b) F 3) V F 1) V V F F V V F F V F F Estadística Administrativa I pag. 25 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Las diferentes formas en que se puede contestar son ocho y forman el espacio muestral. S = {VVV, VVF, VFV, VFF, FVV, FVF, FFV, FFF} Se tienen en un estante 3 libros uno de Álgebra, otro de Contabilidad y otro de Biología. ¿De cuántas formas distintas se pueden ordenar los libros? C B B A C C C A A B B A A B C {ACB, ABC, BCA, BAC, CAB, CBA} Álgebra Biología Álgebra Biología Contabilidad Contabilidad Álgebra Contabilidad Biología Contabilidad Biología Álgebra Álgebra Contabilidad Contabilidad Biología Biología Álgebra ANÁLISIS COMBINATORIO Los diagramas de árbol muestran objetivamente el número de resultados posibles en que se puede disponer de la ordenación de un conjunto de elementos, pero esta enumeración es limitada, pues a medida que aumenta el número de objetos dicha ordenación se complica, por lo que hay que utilizar otro procedimiento más sencillo para determinar el número total de resultados. Con este fin, nos Estadística Administrativa I pag. 26 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas apoyaremos en los conceptos permutaciones y combinaciones, los cuales tienen como base el principio fundamental del conteo. PRINCIPIO FUNDAMENTAL DE CONTEO Si un evento A puede ocurrir de n1 maneras, y una vez que este ha ocurrido, otro evento B puede ocurrir de n2 maneras diferentes, entonces el número total de formas diferentes en que ambos eventos pueden ocurrir en el orden indicado, es igual a n1 x n2. ¿De cuántas maneras pueden repartirse 3 premios a un conjunto de 10 personas, suponiendo que cada persona no puede obtener más de un premio? Aplicando el principio fundamental del conteo, tenemos 10 personas que pueden recibir el primer premio. Una vez que éste ha sido entregado, restan 9 personas para recibir el segundo, y posteriormente quedarán 8 personas para el tercer premio. De ahí que el número de maneras distintas de repartir los tres premios. n1 x n2 x n3 10 x 9 x 8 = 720 ¿Cuántas placas de automóvil se pueden hacer utilizando dos letras seguidas de tres cifras? No se admiten repeticiones. 26 x 25 x 10 x 9 x 8 = 468000 El símbolo ! se lee factorial y es el producto resultante de todos los enteros positivos de 1 a n; es decir, sea n un número entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1 se llama factorial de n. n! = n (n -1 ) (n -2 )...3 x 2 x 1 5! = 5 x 4 x 3 x 2 x 1 = 120 Por definición 0! = 1 PERMUTACIONES Una permutación de un conjunto de elementos, es un ordenamiento específico de todos o algunos elementos del conjunto, facilita el recuento de las ordenaciones diferentes que pueden hacerse con los elementos del conjunto. Nota: En una permutación el orden en que se disponen los elementos del conjunto es importante. PERMUTACIONES DE n ELEMENTOS Por el principio fundamental del conteo podemos enunciar que el número de permutaciones de n objetos distintos tomados de n en n, es: n Pn = n! Estadística Administrativa I pag. 27 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Se quiere conocer el conjunto de todas las disposiciones posibles de tres personas colocadas en hilera para tomar una fotografía. 3P3 = 3! = 6 Cinco personas desean nombrar un Comité Directivo compuesto de un presidente, un vicepresidente, un secretario, un tesorero y un vocal. ¿Cuántas maneras hay de constituir el comité? 5P5 = 5! = 120 Hay seis banderas de distintos colores. ¿Cuántas señales diferentes se pueden enviar usando las seis banderas al mismo tiempo? 6P6 = 6! = 720 PERMUTACIONES DE n ELEMENTOS EN DIFERENTES GRUPOS DE r ELEMENTOS. Podemos calcular el número de permutaciones nPr, de n elementos, tomados en grupos o subconjuntos de r elementos. n Pr = n! (n − r )! Si de un estante tomamos 2 de 3 libros ¿Cuántas permutaciones pueden realizarse? 3 P2 = 3! = 3! = 6 (3 − 2)! ¿Cuántas ternas pueden formarse con las 26 letras del alfabeto, si cada letra sólo puede utilizarse una sola vez? 26! 26! = = 15600 26 P3 = (26 − 3)! 23! Estadística Administrativa I pag. 28 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Cinco personas entran a una sala en la que hay 8 sillas. ¿De cuántas maneras diferentes pueden ocupar las sillas? 8! 8! = = 6720 8 P5 = (8 − 5)! 3! PERMUTACIONES DONDE NO TODOS LOS ELEMENTOS SON DIFERENTES. Si los elementos de un conjunto no son todos diferentes entre sí, es decir, algunos de los elementos son idénticos, la fórmula de las permutaciones presenta un nuevo aspecto. El número de permutaciones que se pueden formar en el caso de n elementos, cuando hay n1 elementos idénticos, n2 elementos de otro tipo idénticos, etcétera, es: n Pn1, n2, ..., nk = n! n1! n2! ... nk! ¿Cuántas palabras diferentes de cuatro letras pueden formarse con las letras LULU? 4 P2, 2 = 4! 24 = =6 2! 2! 4 S = {LLUU, LULU, UULL, ULUL, LUUL, ULLU} ¿Cuántas palabras de once letras pueden formarse con la palabra Mississippi?. 11! = 34650 4! 4! 2!1! 11 P4, 4, 2, 1 = ¿Cuántos mensajes pueden enviarse con diez banderas utilizándolas todas, si son cuatro negras, tres verdes y tres rojas? 10 = 4200 10 P4, 3, 3 = 4! 3! 3! PERMUTACIONES CIRCULARES Cuando los elementos se encuentran dispuestos en forma circular tenemos: n Pc = (n − 1)! ¿De cuántas maneras podemos ordenar 5 llaves en un llavero? 5 Pc = (5 − 1)! = 4! = 24 Estadística Administrativa I pag. 29 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas COMBINACIONES Ya sabemos que en una permutación el orden de los elementos es importante, pero cuando el orden de colocación carece de importancia, a la disposición de dichos elementos se le denomina combinación. Por lo tanto, una combinación es un subconjunto o una disposición de todos los elementos de un conjunto, sin tener en cuenta el orden de ellos. El número de combinaciones o subconjuntos no ordenados, cada uno formado por r elementos, que pueden obtenerse de un conjunto de n elemento es: n Cr = n! n! n o = (n − r )! r! r (n − r )! r! Si de un estante tomamos 2 de 3 libros, ¿Cuántas combinaciones pueden realizarse? 3 C2 = 3! 3! 6 = = =3 (3 − 2)! 2! 1! 2! 2 Por lo tanto, el resultado se reduce a 3 posibles formas ya que en una combinación el orden de los elementos no es importante. Se tienen cinco obreros para un trabajo especial que requiere de tres de ellos. ¿De cuántas maneras diferentes se puede seleccionar un equipo de tres? 5 C3 = 5! 5! 120 = = = 10 (5 − 3)! 3! 2! 3! 12 De un club de 20 socios, se van a seleccionar 3 para formar la mesa directiva. ¿De cuántas formas puede constituirse? 20 C 3 = Estadística Administrativa I 20! 20! 6840 = = = 1140 (20 − 3)! 3! 17! 3! 6 pag. 30 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Es conveniente observar que: =n Cn −r n Cr Así: 100 C 98 =100 C100 − 98 =100 C 2 FÓRMULA DEL BINOMIO (a + b ) n = n n ∑ r a n − r b r r = 0 AXIOMAS Y TEOREMAS DE LA PROBABILIDAD. DEFINICIONES DE LA PROBABILIDAD. La palabra probabilidad se utiliza para cuantificar nuestra creencia de que ocurra un acontecimiento determinado. Existen tres formas de estimar probabilidades: el enfoque clásico, el cual se aplica cuando todos los resultados posibles que se consideran igualmente probables; el de frecuencias relativas o probabilidad empírica, se refiere a la estimación con base en un gran número de experimentos repetidos en las mismas condiciones. El enfoque subjetivo basado en situaciones especiales, en las cuales no es posible repetir el experimento y sólo usa un grado de confianza personal. PROBABILIDAD CLÁSICA O DE LAPLACE (fines del siglo XVI). Bajo este concepto definiremos la probabilidad de obtener un determinado resultado A, en un experimento aleatorio como la relación por cociente, entre el número de casos favorables a su ocurrencia, y el número de casos posibles. Si representamos la probabilidad de ocurrencia del evento A, por P(A), se tendrá: P( A) = Casos favorables al evento A Casos posibles Esta es la definición clásica o apriori (antes de), es de aplicación fácil, pues no se necesita de ningún experimento para su cálculo, sino únicamente el conocimiento de las condiciones en que se realiza el experimento. Se supone que todos los resultados posibles son conocidos, y que todos tienen la misma probabilidad de ocurrir. Si una urna contiene 10 esferas blancas, 15 azules y 5 rojas, la probabilidad de extraer al azar una esfera blanca, es: 10 1 P (B) = = 30 3 Estadística Administrativa I pag. 31 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Esta probabilidad se basa en razonamientos abstractos y no depende de la experiencia, lo cual permite estimar probabilidades sin realizar una gran cantidad de experimentos. PROBABILIDAD FRECUENTISTA O DE VON MISES (frecuencias relativas 1957) La probabilidad experimental de que ocurra un evento es la frecuencia relativa observada con que ocurre ese evento. Si un experimento se realiza n veces, bajo las mismas condiciones y si ocurren n(A) resultados favorables al evento A, el valor estimado de la probabilidad de que ocurra A como resultado de la experimentación, puede determinarse de la manera siguiente: P( A) = n( A) n Donde n(A) es el número de veces que se observó realmente el evento A, y n es el número de veces que se efectuó el experimento. La probabilidad estimada, obtenida en esta forma, se denomina probabilidad experimental. A medida que aumenta el número de ensayos o experimentos, la probabilidad estimada de que ocurra un evento, que se obtiene a través de la frecuencia relativa, se va acercando al valor apriori. Por medio del enfoque de frecuencias relativas, la probabilidad se determina sobre la base de la proporción de veces que ocurre un resultado favorable, en un número de observaciones o experimentos. No hay supuesto previo de iguales probabilidades. De 70 alumnos que se inscribieron al curso de probabilidad y estadística en el semestre anterior. 15 no lo terminaron, 20 obtuvieron una calificación de NA y el resto lo aprobaron, ¿Cuál es la probabilidad de que un alumno acredite la materia? P( A) = 35 1 = 70 2 PROBABILIDAD SUBJETIVA (1969) La probabilidad estimada mediante los enfoques clásicos y experimental, son completamente objetivos, ya que se determinan con base en hechos reales. En cambio, en algunos casos se presentan situaciones en las cuales no es posible realizar experimentos repetitivos y los resultados tampoco son igualmente probables. En estas condiciones, la probabilidad de ocurrencia de un evento debe evaluarse en forma subjetiva. Tales apreciaciones suelen ser de criterio personal, y por lo tanto, dos personas pueden cuantificar en forma diferente, la probabilidad subjetiva del mismo evento. Podemos entonces considerar la probabilidad subjetiva como la evaluación personal de la ocurrencia de un evento incierto, que se hace con base en criterios o experiencias sobre casos semejantes. AXIOMAS DE PROBABILIDAD Los axiomas de la formulación moderna de la teoría de la probabilidad constituyen una base para deducir a partir de ellas un amplio número de resultados. Estadística Administrativa I pag. 32 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas La letra P se utiliza para designar la probabilidad de un evento, siendo P(A) la probabilidad de ocurrencia de un evento A en un experimento. AXIOMA 1 Si A es un evento de S, entonces la probabilidad del evento A es: 0 ≤ P(A) ≤ 1 Como no podemos obtener menos de cero éxitos ni más de n éxitos en n experimentos, la probabilidad de cualquier evento A, se representa mediante un valor que puede variar de 0 a 1. AXIOMA 2 Si dos eventos son mutuamente excluyentes, la probabilidad de obtener A o B es igual a la probabilidad de obtener A más la probabilidad de obtener B. P(A ∪ B) = P(A) + P(B) Excluirse mutuamente quiere decir que A y B no pueden ocurrir simultáneamente en el mismo experimento. Así, la probabilidad de obtener águila o sol en la misma tirada de una moneda será P(A ∪ B) = P(A) + P(B) P(A ∪ B) = 1/2 + 1/2 = 1. En general podemos decir que la suma de las probabilidades de todos los posibles eventos mutuamente excluyentes es igual a 1: P(A1) + P(A2) + P(A3) + ... + P(An) = 1 AXIOMA 3 Si A es un evento cualquiera de un experimento aleatorio y A’ es el complemento de A, entonces: P(A’) = 1 - P(A) Es decir, la probabilidad de que el evento A no ocurra, es igual a 1 menos la probabilidad de que ocurra. TEOREMAS DE LA SUMA DE PROBABILIDADES Suponiendo que P(A) y P(B) representan las probabilidades para los dos eventos A y B, entonces P(A ∪ B) significa la probabilidad de que ocurran A o B. Si representamos los eventos A y B en un Diagrama de Venn con A ∩ B = ∅ Estadística Administrativa I pag. 33 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com S A Departamento de Ciencias Básicas B A∩B=∅ Entonces A y B son conjuntos disjuntos o mutuamente excluyentes, o sea que no pueden ocurrir en forma simultánea P(A ∪ B) = P(A) + P(B) En cambio, si ambos eventos tienen puntos muestrales en común A ∩ B ≠ ∅ S A B A∩B≠∅ P(A ∪ B) = P(A) + P(B) - P(A ∩ B) PROBABILIDAD CONDICIONAL La probabilidad condicional se simboliza P(B/A), que se lee probabilidad de B, dado A, o la probabilidad de que ocurra B, condicionado a que haya ocurrido A. Se dice que dos o más eventos son independientes entre sí cuando la probabilidad de que ocurra uno no es influida por la ocurrencia de otro. Si A y B representan dos eventos y si la ocurrencia de A no afecta a la ocurrencia de B, y la ocurrencia de B no afecta a la ocurrencia de A, entonces se dice que A y B son Independientes. En este caso, la probabilidad de que ocurran A y B es igual al producto de sus respectivas probabilidades, y se expresa así: P(A ∩ B) = P(A) P(B) En una caja hay 5 esferas blancas, 4 rojas y 3 negras. Se extrae una esfera, se observa su color y se regresa a la caja. Bajo estas condiciones, ¿Cuál es la probabilidad de que al extraer 3 esferas, éstas sean de color rojo? 4 4 4 64 1 P (R1 ∩ R2 ∩ R3) = x x = = 12 12 12 1728 27 Estadística Administrativa I pag. 34 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Si dos eventos A y B no son independientes, es decir, si A y B son dependientes, la probabilidad compuesta de A y B no es igual al producto de sus probabilidades respectivas. Por lo cual, podemos decir, que para eventos dependientes: P(A ∩ B) ≠ P(A) P(B) Es decir: P(A ∩ B) = P(A) P(B / A) o P(B ∩ A) = P(B) P(A / B) En una caja hay 5 esferas blancas, 4 rojas y 3 negras. Si se extraen al azar 3 esferas en forma consecutiva, sin reemplazo, ¿ Cuál es la probabilidad de que las 3 sean de color rojo? Sea R1 el evento extraer una esfera roja. P(R1∩R2∩R3) = P(R1) P(R2 / R1) P(R3 / R1 ∩ R2) = 4 3 2 24 1 x x = = 12 11 10 1320 51 De la expresión P(A∩B) = P(A)P(B/A) despejamos P(B/A) y se obtiene la probabilidad condicional de "B dado A". P( A ∩ B) P (B / A ) = P( A) En forma análoga, la probabilidad condicional de "A dado B", es : P( A / B) = P (B ∩ A ) P (B ) Una caja contiene 200 focos, 50 azules y 50 rojos; de los cuales, 10 son defectuosos: 6 azules y 4 rojos. ¿Cuál es la probabilidad de que un foco elegido al azar, sea defectuoso (evento D)? P ( D) = 10 1 = 100 100 Si seleccionamos un foco al azar y se observa que éste es azul (evento A), ¿Cuál es la probabilidad de que el foco sea defectuoso, dado que es azul ? Escribiremos P(D/A), para representar la probabilidad del evento D, dado A. Entonces, puesto que hay 50 focos azules y de éstos, 6 son defectuosos P(D / A) = Estadística Administrativa I pag. 35 6 3 = 50 25 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas TEOREMA DE BAYES El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de probabilidades previas, se llama regla Bayesiana. Las probabilidades apriori o previas se conocen antes de obtener información alguna del experimento en cuestión. Las probabilidades aposteriori se determinan después de conocer los resultados del experimento. El teorema de Bayes consiste en un método para encontrar la probabilidad de una causa específica cuando se observa un efecto particular. Esto es, si el evento B ha ocurrido, ¿Cuál es la probabilidad de que fue generado por el evento A1 (que es una causa posible ) o por el A2 (otra causa posible)? Si suponemos que los eventos A1, A2, A3, ...., An, forman una partición de un espacio muestral S; esto es, que los eventos A1 son mutuamente excluyentes y su unión es S. Ahora, sea B otro evento, entonces : A1 An B A2 A3 A4 B = S ∩ B = (A1 ∪ A2 ∪ A3 ... ∪ An) ∩ B Donde Ai ∩ B son eventos mutuamente excluyentes. En consecuencia: P(B) = P(A1 ∩ B) + P(A2 ∩ B) + P(A3 ∩B) + ... + P(An ∩ B) Luego por la regla de multiplicación: P(B) = P(A1) P(B/A1) + P(A2) P(B/A2) + P(A3) P(B/A3) ... P(An) P(B/An) Si A1, A2, A3, ..., An es una partición de S, y B es cualquier evento. Entonces para cualquier i, P ( A i / B) = P(A i )P(B/A i ) P(A 1 )P(B/A 1 ) + P(A 2 )P(B/A 2 ) + ... + P(A n )P(B / A n ) Es decir: P ( A i / B) = Estadística Administrativa I P(A i )P(B/A i ) ∑ P(A i )P(B/A i ) pag. 36 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas La expresión anterior puede interpretarse de la manera siguiente: Si un evento puede ocurrir en más de una forma, entonces la probabilidad de que ocurra en una forma particular será igual a la razón de la probabilidad de que se presente la forma respecto a la probabilidad de que ocurra. Se tienen dos cajas. La caja I contiene 3 esferas rojas y 2 azules, en tanto que la caja II contiene 2 esferas rojas y 8 azules. Se arroja una moneda. Si se obtiene águila se saca una esfera de la caja I; si se obtiene sol se saca una esfera de la caja II. R indica el evento “sacar una esfera roja” mientras que I y II indican los eventos escoger caja I y caja II, respectivamente. Una esfera roja puede resultar al escoger cualquiera de las cajas. a) Hallar la probabilidad de sacar una esfera roja. P (R ) = P (I )P (R / I ) + P (II )P (R / II ) 1 3 1 2 2 P (R ) = + = 2 5 2 10 5 b) Hallar la probabilidad de que se escogiera la caja I, dado que la esfera es R, (es decir que el resultado de arrojar la moneda sea águila). La persona que arrojó la moneda no da a conocer si resultó águila o sol (de tal manera que la caja de la cual se sacó la esfera se desconoce) pero indica que se extrajo una esfera roja. Buscamos la probabilidad de que se escoja la caja I y se sabe que se sacó una esfera roja. Empleando el teorema de Bayes, esta probabilidad está dada por: P (I / R ) = P (I ) P ( R / I ) P(I )P(R / I ) + P(II )P(R / II ) 1 3 3 2 5 P (I / R ) = = 1 3 1 2 4 + 2 5 2 | 0 En un Instituto Superior, el 25 por ciento de los hombres y el 10 por ciento de las mujeres estudian Biología. Las mujeres constituyen el 60 por ciento del estudiantado. Si se selecciona en forma aleatoria un estudiante y resulta que está cursando Biología, determinar la probabilidad de que sea mujer. P(H) = 0.40; P(M) = 0.60; P (M / B ) = Estadística Administrativa I P(B/H) = 0.25; (0.6)(0.1) (9.4)(0.25) + (0.6)(0.1) pag. 37 P(B/M) = 0.10 = 0.375 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas FORMULARIO Factorial Casos favorables al evento A P( A) = Casos posibles n!=n(n-1)(n-2)…(3)(2)(1) P( A) = Permutaciones de n elementos Permutaciones de n elementos en diferentes grupos de r elementos. n Pr = P(A1) + P(A2) + P(A3) + ...... + P(An) = 1 P(A’) = 1 - P(A) Teoremas de la suma de probabilidades. Sí A ∩ B = ∅ P(A ∪ B) = P(A) + P(B) n! n Pn1, n2, ..., nk = n1! n2! ... nk! Sí A ∩ B ≠ ∅ P(A ∪ B) = P(A) + P(B) - P(A ∩ B) Permutaciones circulares = (n − 1)! Probabilidad condicional P(A ∩ B) = P(A) P(B) (Independientes) Combinaciones n Cr = 0 ≤ P(A) ≤ 1 n! (n − r )! Permutaciones donde no todos los elementos son diferentes. n Pc n Axiomas = n! n Pn n( A) P(A ∩ B) = P(A) P(B / A) n! (n − r )! r! P (B / A ) = Fórmula binomial (a + b ) n = P( A ∩ B) P( A) P(B ∩ A) = P(B) P(A / B) n ∑ r a n − r b r r = 0 n P( A / B) = Probabilidad de un evento P (B ∩ A ) P (B ) Teorema de Bayes P ( A i / B) = Estadística Administrativa I P(A i )P(B/A i ) P(A 1 )P(B/A 1 ) + P(A 2 )P(B/A 2 ) + ... + P(A n )P(B / A n ) pag. 38 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas UNIDAD III Distribución de probabilidad de variables aleatorias discretas ESPACIO MUESTRAL. El el conjunto de todos los resultados posibles de un experimento estadístico denotado por “S” o “ Ω ” VARIABLE. Se denomina variable a la entidad que puede tomar un valor cualesquiera durante la duración de un proceso dado. Si la variable toma un solo valor durante el proceso se llama constante. VARIABLE ALEATORIA: Es una función que asocia un número real a cada elemento del espacio muestral. Es decir son aquellas que pueden diferir de una respuesta a otra. Una variable aleatoria se puede clasificar en: Variable aleatoria discreta. Variable aleatoria continua. Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos cuantitativos discretos y son respuestas numéricas que resultan de un proceso de conteo. La cantidad de alumnos regulares en un grupo escolar. El número de águilas en cinco lanzamientos de una moneda. Número de circuitos en una computadora. El número de vehículos vendidos en un día, en un lote de autos Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido entre dos valores cualesquiera; ésta puede asumir infinito número de valores y éstos se pueden medir. La estatura de un alumno de un grupo escolar. El peso en gramos de una moneda. La edad de un hijo de familia. Las dimensiones de un vehículo. DISTRIBUCIONES Distribución de probabilidad. Es una distribución teórica de frecuencias que describe cómo se espera que varíen los resultados de un experimento. Existen diferentes tipos de modelos que permiten describir el comportamiento de fenómenos estadísticos que permiten hacer inferencias y tomar decisiones en condiciones de incertidumbre. P(x) Se pueden clasificar en: Estadística Administrativa I Discretas pag. 39 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Distribuciones discretas. Son aquellas donde las variables asumen un número limitado de valores, por ejemplo el número de años de estudio. Binomial Hipergeométrica Multinomial Poisson Discretas Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier valor dentro de determinados límites; por ejemplo, la estatura de un estudiante. Uniforme Continuas Exponencial Normal Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que, en realidad se han presentado cuando se lleva a cabo un experimento; en cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados posibles que podrían presentarse si se efectuara el experimento. Las probabilidades que se asocian a cada uno de los valores que toma la variable aleatoria x constituyen lo que se conoce como DISTRIBUCIÓN DE PROBABILIDAD, la cual puede ser representada Estadística Administrativa I pag. 40 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas mediante una función matemática, una gráfica o una tabla de valores. La diferencia consiste en que la función matemática se transforma en una función probabilística. S E0 E1 X x0 x1 P(X) p(x0) p(x1) ... ... ... En xn p(xn) Dados los eventos E1, E2, ..., En ⊂ S, se dice que x es una variable aleatoria, si a cada valor de xi que asume cada Ei, se le asocia su probabilidad de ocurrencia y cumple con las siguientes condiciones: a) La probabilidad para todo valor que asuma la variable aleatoria xi, será mayor o igual a cero pero menor que uno. 0 ≤ P(xi) ≤ 1 ∀ xi b) La suma de todas las probabilidades asociadas a todos los valores que toma la variable x, es igual a la unidad. n ∑ P(x i ) = 1 1 ∝ ∫ P(x i )dx =1 −∝ Encuentre la distribución de probabilidad de lanzar dos monedas y la variable aleatoria número de águilas. S X E0 E1 E2 {Lanzar dos monedas} Número de águilas 1 4 1 Caen x = 1 águilas P(E1) = 2 1 Caen x = 2 águilas P(E2) = 4 P(X) 1 2 Caen x = 0 águilas P(E0) = 1 4 X 0 Estadística Administrativa I pag. 41 1 2 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Existen ciertas características que diferencian a las distribuciones de probabilidad, llamadas momentos de la distribución que son: la media aritmética o esperanza matemática y la desviación estándar. FUNCIONES DE PROBABILIDAD DISCRETAS La distribución de probabilidad para una variable aleatoria discreta puede ser: 1.2.3.- Una relación teórica de resultados y probabilidades que se puede obtener de un modelo matemático y que representa algún fenómeno de interés. Una relación empírica de resultados y sus frecuencias relativas observadas. Una relación subjetiva de resultados relacionados con sus probabilidades subjetivas o artificiales que representan el grado de convicción del encargado en tomar decisiones sobre la probabilidad de posibles resultados. Sabemos que una variable aleatoria discreta o discontinua es aquella en la que existe una distancia bien definida entre dos de los valores consecutivos que asume; y dichos valores son numerables. Existen varios modelos matemáticos que representan diversos fenómenos discretos de la vida real. Las más útiles son: 1.La distribución uniforme discreta. 1.La distribución de probabilidad Binomial o de Bernoulli. 2.La distribución de probabilidad Hipergeométrica. 3.La distribución de probabilidad de Poisson. UNIFORME DISCRETA Si la variable aleatoria X asume valores de X1, X2, ..., Xk con iguales probabilidades, entonces la distribución uniforme es: f (x, k ) = 1 k P(x) x1 x2 xk k ∑ xi µ = i =1 k Estadística Administrativa I pag. 42 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco k ∑ (x i Departamento de Ciencias Básicas − µ )2 σ 2 = i =1 k La distribucióin de probabilidad del lanzamiento de un dado es: S = {1, 2, 3, 4, 5, 6} P (x = 1, 2, ..., 6) = 1 6 µ= σ 2 = 1+ 2 + 3+ 4 + 5 + 6 = 3.5 6 (1 − 3.5) 2 + (2 − 3.5) 2 + K + (6 − 3.6) 2 6 = 2.91 LA DISTRIBUCION BINOMIAL Esta distribución fue elaborada por Jacobo Bernoulli y es aplicable a un gran número de problemas de carácter económico y en numerosas aplicaciones como: - Juegos de azar. - Control de calidad de un producto. - En educación. - En las finanzas. La distribución binomial posee las siguientes propiedades esenciales: 1.2.- 3.4.5.- El espacio muestral contiene n ensayos idénticos. Las observaciones posibles se pueden obtener mediante dos diferentes métodos de muestreo. Se puede considerar que cada observación se ha seleccionado de una población infinita sin reposición o de una población finita con reposición. Cada observación se puede clasificar en una de dos categorías conocidas como éxito E o fracaso E', las cuales son mutuamente excluyentes es decir E ∩ E' = 0. Las probabilidades de éxito p y de fracaso q = 1 - p en un ensayo se mantienen constantes, durante los n ensayos. El resultado de cualquier observación es independiente del resultado de cualquier otra observación. La probabilidad de que el evento E ocurra x veces y el evento E' ocurra (n - x) veces en n ensayos independientes está dado por la fórmula binomial: n P(x, n, p) = p x qn - x x Estadística Administrativa I pag. 43 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco donde: Departamento de Ciencias Básicas p = Probabilidad característica o probabilidad de éxito. q = Probabilidad de fracaso x = Número de éxitos deseados n = Número de ensayos efectuados Si se lanza 4 veces una moneda, calcular el evento "Número de águilas que caen." datos: n = 4 ensayos. 1 p = probabilidad de éxito en un ensayo. 2 1 1 q = 1 - p = 1− = 2 2 x = 0, 1, 2, 3, 4 S = {lanzar 4 veces la moneda} A = {número de águilas que caen} 0 4 1 4 1 1 1 P (E0) = P 0,4, = = 2 0 2 2 16 1 3 1 4 1 1 4 P(E1) = P1,4, = = 2 1 2 2 16 2 2 3 1 1 4 1 1 6 P (E 2 ) = P 2,4, = = 2 2 2 2 16 1 4 1 1 4 P (E3) = P 3,4, = = 2 3 2 2 16 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: = np Estadística Administrativa I 2 = npq = npq = Media = Varianza = Desviación estándar 2 pag. 44 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas DISTRIBUCIÓN MULTINOMIAL Ocurre cuando en el experimento binomial cada intento tiene más de dos resultados posibles. Las probabilidades de ocurrencia p1, p2, ..., pk en un solo ensayo, la distribución de probabilidad de las variables aleatorias k1, k2, ..., kn que representan el número de ocurrencias de E1, E2, ..., En en n intentos independientes es: P(n, k 1 , k 2 , K , k n ) = n! k kn p 1 1 p k2 2 K pn k 1!k 2! K k n! Calcular la probabilidad de obtener dos veces el número 4, dos veces el número 5 y una vez el número 2, en el lanzamiento de un dado 5 veces. 2 2 1 5! 1 1 1 = 0.00385 2!2!1! 6 6 6 P(5, 2, 2, 1) = LA DISTRIBUCIÓN HIPERGEOMÉTRICA Se emplea para calcular la probabilidad de obtener determinado número de éxitos en un espacio muestral de n ensayos; pero a diferencia de la distribución binomial es que los datos de la muestra se extraen sin reemplazo en una población finita. Por esto es que el resultado de una observación depende o es afectado por el resultado de cualquier otra u otras observaciones anteriores. Es decir la distribución hipergeométrica se emplea para muestreos sin reemplazo de una población finita cuya probabilidad de ocurrencia cambia a lo largo del ensayo. Dado un espacio muestral S de tamaño N con los subespacios M ⊂ N y (N - M) ⊂ N entonces, la probabilidad de que en n ensayos x pertenezca a M y (n - x) pertenezca a (N - M) está dada por: M N − M x x − n P(x, N, M, n) = N n Gráficamente se puede representar como: Estadística Administrativa I E E’ M N-M x n-x pag. 45 N n M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas donde: N n M N-M x n-x = El tamaño de espacio muestral S = El número de ensayos = El número de éxitos en el espacio muestral = Número de fracasos del espacio muestral = Número de éxitos en la muestra = Número de fracasos de la muestra. Si en una empresa se presentan para cubrir dos vacantes 13 aspirantes de los cuales 5 son hombres y 8 son mujeres, calcular " El número de hombres contratados." N A E0 E1 E2 = {13 aspirantes para cubrir 2 vacantes} = {Número de hombres contratados} = Se contratan x0 = 0 hombres, equivale a contratar (n - x0) = 2 mujeres. = Se contratan x1 = 1 hombres, equivale a contratar (n - x1) = 1 mujeres. = Se contratan x2 = 2 hombres, equivale a contratar (n - x2) = 0 mujeres. E E’ M=5 N-M = 8 x=0 n-x = 2 N = 13 n=2 desarrollando N = 13 total de aspirantes M = 5 aspirantes hombres N-M = 8 aspirantes mujer n = 2 vacantes totales x = 0,1,2 hombres posibles a contratar n-x = 2,1,0 mujeres posibles a contratar 5 8 28 0 2 P (E0) = P (0,13,5,2) = = = 0.3588 = 35.88% 78 13 2 Estadística Administrativa I pag. 46 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas 5 8 40 1 1 P (E1) = P (1,13,5,2) = = = 0.5128 = 51.28% 78 13 2 5 8 10 2 0 P (E2) = P (2,13,5,2) = = = 0.1282 = 12.82% 78 13 2 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: M µ = n N σ2 = nM(N − M)(N − n) N 2 (N − 1) σ= 2 σ2 = Media = Varianza = Desviación estándar sustituyendo en el ejemplo anterior. 5 µ = 2 = 0.7693 13 σ2 = (2)(5)(13 − 5)(13 − 2) (13) 2 (13 − 1) σ= Estadística Administrativa I = 0.4339 0.4339 = 0.6587 pag. 47 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas DISTRIBUCIÓN HIPERGEOMÉTRICA GENERALIZADA (MULTIVARIADA) Si N resultados pueden dividirse en la k celdas N1, N2, ..., Nk con k1 ,k2, ..., kn elementos respectivamente, entonces la distribución de probabilidad representa el número de elementos selecionados, en una muestra aleatoria de tamaño n, es: N 1 N 2 N n K k 1 k 2 k n P(n; k 1, k 2 , K , k n ) = N n Si en un refrigerador hay 12 envases de refrescos de los cuales son 10 de manzana, 5 de naranja y 4 de uva, cúal es la probabilidad de que al surtir un pedido de 7 envases tomados al azar 2 sean de manzana, 4 de naranja y 1 de uva. N1 = 3 N2 = 5 N3 = 4 N = 12 k1 = 2 k2 = 4 k3 = 4 n=7 3 5 4 2 4 1 P (7;2,4,1) = = 0.0758 12 7 DISTRIBUCIÓN DE POISSON Esta función de distribución de variable discreta se emplea para calcular las probabilidades asociadas a la variable aleatoria dentro de un intervalo continuo de tiempo o espacio; este intervalo es generalmente una unidad de medida conocida: cm2, km, gramos, litros, pulgadas, etc. Algunos de los problemas que presentan como un fenómeno con distribución de Poisson son: - Los embotellamientos que se producen por día. - Número de llamadas por hora. - Defectos por m2 de tela. - Número de defectos por lote de un proceso de producción. - Número de negocios cerrados por semana. Estadística Administrativa I pag. 48 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas A este tipo de problemas se les conoce el número de éxitos x obtenidos por unidad de medida en n ensayos; pero es totalmente imposible conocer el número de fracasos (n - x). Se dice que se da un proceso de Poisson si se pueden observar eventos discretos en un intervalo continuo en forma tal que si se acorta el intervalo lo suficiente: 1.2.3.- La probabilidad de observar exactamente un éxito en el intervalo es estable. La probabilidad de observar dos o más éxitos en el intervalo es cero. La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de que suceda en cualquier otro intervalo. La distribución de Poisson se expresa mediante la siguiente fórmula. P (E) = P (x, λ ) = λ x e -λ x! donde: n = Número de ensayos x = Número de éxitos esperados en n ensayos e = 2.71828... = n p = Constante igual al número de éxitos promedio por unidad de medida p = Probabilidad constante durante el proceso igual al número de éxitos promedio por unidad de medida. Un conmutador recibe en promedio 5 llamadas sobre autos extraviados por hora. ¿Cuál es la probabilidad de que en una hora tomada al azar reciba? a) Ninguna llamada. b) Exactamente 3 llamadas. c) No más de 3 llamadas. Para este problema = 5, en otros casos deberá calcularse con: = n p. a) Ninguna llamada. x = 0 5 0 e .5 P (E 0 ) = P (0,5) = = 0.00674963 0! b) Exactamente 3 llamadas: x = 3 P (E 3 ) = P (3,5) = 5 3 e .5 = 0.1404 3! c) No más de 3 llamadas: x < 4 P(x < 4) = P(x ≤ 3) = P(x0 = 0) + P(x1 = 1) + P(x2 = 2) + P(x3 = 3) P(x < 4) = 0.0067+ 0.0337 + 0.0842 + 0.1406 = 0.2652 = 26.52 % Estadística Administrativa I pag. 49 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: µ = λ = np σ2 = λ σ= 2 λ = Media = Varianza = Desviación estándar DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES CONTINUAS DISTRIBUCIÓN NORMAL DE PROBABILIDAD. La función de densidad de probabilidad normal es comúnmente empleada en el análisis estadístico ya que existe una gran cantidad de fenómenos continuos de tipo económico, sociales, de ingeniería, bilógicos, entre otros los cuales son posible expresarlos con ella; siendo la base tanto para la descripción como para la inferencia. La distribución normal de probabilidad es una distribución continua de probabilidades que es simétrica y mesokúrtica. Representada por la siguiente figura. P(x) x La distribución normal de probabilidad es muy importante por las siguientes razones: 1.2.3.- Se sabe que las mediciones que se obtienen en muchos procesos aleatorios tienen esta clase de distribución. Con frecuencia puede utilizarse en probabilidades normales para aproximar otras distribuciones de probabilidad tales como la distribución Binomial y Poisson. Las distribuciones estadísticas como la media muestral y la proporción muestral tienen distribución normal cuando el tamaño de la muestra es grande, sin importar la forma de la distribución de la población de origen. En el caso de distribuciones continuas de probabilidad sólo es posible determinar el valor de probabilidad para un intervalo de valores. La altura de la función de densidad o curva de probabilidad para una variable con distribución normal está dada por: Estadística Administrativa I pag. 50 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco f(x) = 1 2π σ Departamento de Ciencias Básicas ( x − µ)2 - e 2σ 2 donde: = 3.1416 e = 2.7183 = Media de la distribución = Desviación estándar de la distribución La tabla de probabilidades normales se basan en la distribución específica de la distribución normal estándar, donde = 0 y = 1 cualquier valor de x de una población con distribución normal se puede convertir a su valor normal estándar equivalente z por la siguiente ecuación. z = x-µ σ CARACTERÍSTICAS DE UNA DISTRIBUCIÓN NORMAL DE PROBABILIDAD. 1.Es unimodal ya que sólo tiene un valor máximo en el que coincide la media, la mediana y la moda. 2.Presenta una forma de campana y es simétrica. 3.La media de una población distribuida normalmente se encuentra en el centro de su curva normal. 4.Los dos extremos de una distribución normal de probabilidad se extienden de manera indefinida y nunca tocan el eje horizontal. 5.Está determinada por medio de dos parámetros: la media y la desviación estándar. 6.El área total bajo la curva se considera igual a la unidad y se usa como masa probabilística. 7.El área comprendida bajo la curva entre dos valores x1 y x2 es igual a la probabilidad de que dicha variable suma cualquier valor dentro de ellos. El promedio de estudiantes inscritos en jardín de niños es de µ = 500, con una desviación estándar σ = 100. El número de alumnos inscritos tienen una distribución aproximadamente normal. ¿Cuál es la probabilidad de que el número de alumnos inscritos en una escuela elegida al azar sea?: a) entre 500 y 650. b) entre 450 y 600. c) menor de 500. d) menor de 500. e) menor de 300. f) mayor de 650. g) mayor de 400. h) menor de 610. Estadística Administrativa I pag. 51 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas SOLUCIÓN: a) P(500 < x < 650) x - µ 650 − 500 z = = = 1.50 σ 100 de las tablas estandarizadas obtenemos A = 0.4332 = 43.32% b) P(450 < x < 600) x - µ 450 − 500 z1 = 1 = = −0.50 σ 100 de las tablas estandarizadas obtenemos A1 = 0.1915 x - µ 600 − 500 z2 = 2 = = 1.00 σ 100 de las tablas estandarizadas obtenemos A1 = 0.3413 A = A1 + A2 = 0.1915 + 0.3413 = 0.5338 = 53.38% Estadística Administrativa I pag. 52 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas c) P(x > 500) 500 − 500 z= = 0.00 100 Sin embargo de la gráfica observamos que: A = 0.5000 = 50% d) P(x < 500) 500 − 500 z= = 0.00 100 Sin embargo de la gráfica observamos que: A = 0.5000 = 50% e) P(x < 300) 300 − 500 z1 = = 2.00 100 de las tablas estandarizadas obtenemos A1= 0.4772 = 47.72% A = 0.5 - A1 = 0.5 - 0.4772 = 0.0228 = 2.28% Estadística Administrativa I pag. 53 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas f) P(x > 650) 650 − 500 z1 = = 1.50 100 de las tablas estandarizadas obtenemos A1 = 0.4332 = 43.32% A = 0.5 - A1 = 0.5 - 0.4332 = 0.0668 = 6.68% g) P(x > 400) 400 − 500 z1 = = −1.00 100 de las tablas estandarizadas obtenemos A1 = 0.3413 A = A1 + 0.5 = 0.3413 + 0.5 = 0.8413 = 84.13% Estadística Administrativa I pag. 54 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas h) P(x < 610) 610 − 500 z1 = = 1.10 100 de las tablas estandarizadas obtenemos A1 = 0.3665 A = 0.5 + A1 = 0.5 + 0.3665 = 0.8665 = 86.65% Estadística Administrativa I pag. 55 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas TIPOS DE MUESTREOS No Probabilístico. Probabilístico. No probabilístico. Se usa el conocimiento y opinión personal para identificar los elementos de la población que se incluyen en la muestra. Muestreo por juicio Por cuota Por intervalo Probabilístico. Todos los elementos de la población tienen la misma posibilidad de participar en la muestra. Simple Sistemático Estratificado Por conglomerados Estrato Conglomerado Universo Elemento Estadística Administrativa I pag. 56 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Simple. Este tipo de muestreo, consiste en elaborar una lista de la población enumerándola, para posteriormente mediante la generación de número aleatorios es seleccionado cada uno de los elementos que constituyen la muestra, o mediante fórmulas de recurrencia diseñadas para éste propósito. Es adecuado cuando la población es pequeña y los elementos puedan enumerarse. 1 5 11 17 23 35 38 44 Sistemático. En este tipo de muestro, también se elabora una lista con los elementos de la población, pero en lugar de seleccionarlos de manera aleatoria, se recorre la lista y se va seleccionando cada elemento con un intervalo uniforme que se mide en tiempo, orden y espacio. Es más sencillo de aplicar que el simple, sin embargo, no es posible de utilizar con poblaciones grandes o con la posibilidad de que la población tenga datos con periodicidad. 3 Estadística Administrativa I 7 11 3 pag. 57 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Estratificado. En esta técnica, la población se divide en clases o estratos de acuerdo a una o más características importantes para realizar posteriormente la selección, que puede ser aleatoria o sistemática dentro de cada estrato. La definición de la clase debe ser lo suficientemente clara para evitar que alguno de los elementos se puedan ubicar en alguna de dos clases diferentes. Por conglomerados. Consiste en definir subgrupos de elementos homogéneos en forma natural y/o existen grupos ya definidos. No se requiere seleccionar de todos los conglomerados, y en ocasiones, es suficiente con seleccionar uno de los conglomerados con todos sus elementos, es posible utilizar el muestreo aleatorio considerando grupos en lugar de elementos. Estadística Administrativa I pag. 58 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas POBLACIONES Dependiendo de cómo se seleccionen los elementos para un estudio podremos tener las siguientes poblaciones: Población finita Población infinita Población finita. Se llama así a la población que es de tamaño limitado cuyos elementos son numerables. Población infinita. Se llama así a la población de tamaño limitado cuya cantidad de elementos son innumerables. MUESTREOS El hecho de regresar un elemento muestreado a la población antes de extraer otro elemento de la misma, determina si el muestreo es con o sin reemplazo Con reemplazo Sin reemplazo Con reemplazo. Si un elemento se extrae de la población y posteriormente se regresa a la misma, tiene la posibilidad de quedar incluido otra vez en la muestra en otra extracción. Sin reemplazo. Si el elemento extraído no se regresa a la población entonces, solamente formará parte de la muestra una sola vez. DISTRIBUCIONES MUESTRALES. La distribución de todos los valores posibles que pueden ser tomados por alguna estadística, calculados a partir de muestras del mismo tamaño extraídas aleatoriamente de la misma población, se llama distribución muestral de esa estadística. Las distribuciones muestrales pueden construirse empíricamente cuando se obtiene de una población finita, discreta. Para lo cual se procede como: 1.- De una población finita, discreta de tamaño N, se extraen aleatoriamente todas las muestras posibles de tamaño n. 2.- Se calcula la estadística de interés para cada muestra. 3.- Se enumeran en una columna los diferentes valores observados de la estadística y, en otra columna, la frecuencia correspondiente de la ocurrencia de cada uno de esos valores. Estadística Administrativa I pag. 59 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas EJEMPLO: Suponga se que de una población de tamaño N = 5 edades de niños, dadas como {6, 8, 10, 12, 14}, la media poblacional µ = 10 y la varianza poblacional σ2 = 8 y la varianza muestral es s2 = 10. Si extraemos todas las muestras posibles de tamaño n = 2, si consideramos un muestreo con remplazo y calculamos la media tendremos Nn muestras posibles es decir 52 = 25 posibles muestras de tamaño 2. x1 = ( 6 + 6)/2 x4 = ( 6 + 12)/2 x7 = ( 8 + 8)/2 x10 = ( 8 + 14)/2 x13 = (10 + 10)/2 x16 = (12 + 6)/2 x19 = (12 + 12)/2 x22 = (14 + 8)/2 x25 = (14 + 14)/2 = 6 = 9 = 8 = 11 = 10 = 9 = 12 = 11 = 14 x2 = ( 6 + 8)/2 x5 = ( 6 + 14)/2 x8 = ( 8 + 10)/2 x11 = (10 + 6)/2 x14 = (10 + 12)/2 x17 = (12 + 8)/2 x20 = (12 + 14)/2 x23 = (14 + 10)/2 = 7 = 10 = 9 = 8 = 11 = 10 = 13 = 12 x3 = ( 6 + 10)/2 x6 = ( 8 + 6)/2 x9 = ( 8 + 12)/2 x12 = (10 + 8)/2 x15 = (10 + 14)/2 x18 = (12 + 10)/2 x21 = (14 + 6)/2 x24 = (14 + 12)/2 = 8 = 7 = 10 = 9 = 12 = 11 = 10 = 13 LA TABLA DE FRECUENCIAS ES: X 6 7 8 9 10 11 12 13 14 Total Frecuencia 1 2 3 4 5 4 3 2 1 25 Frecuencia relativa 1/25 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 1 Las graficas son las siguientes: Distribución de la población Estadística Administrativa I pag. 60 Distribución muestral M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas DISTRIBUCIÓN MUESTRAL DE LA MEDIA TEOREMA:Si X1, X2,..., Xn constituyen una muestra aleatoria de una población finita que tiene la media y la varianza 2, entonces: E(x) = Población infinita: Población finita: σx = σx = = x σ n σ N-n N -1 n Que se denomina el error estándar de la media. A la fracción n se le llama fracción de muestreo. Cuando la fracción de muestreo es menor que 0.05, N no es necesario usar el multiplicador de población finita. TEOREMA DEL LIMITE CENTRAL. Si X1, X2,..., Xn constituye un muestra aleatoria de población infinita que tiene la media , la desviación estándar , entonces la distribución limitante es de: x −µ z= σ n DISTRIBUCIÓN t Si el tamaño de muestra es pequeño, los valores de S2, varian considerablemente de muestra a muestra, para ello es necesario usar la distribución t. t= x −µ s n Estadística Administrativa I pag. 61 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas DIFERENCIA DE MEDIAS Si se sacan al azar muestras independientes de tamaños n1 y n2 de dos poblaciones discretas o continuas, con medias µ1 µ2 y varianzas σ1 y σ2 respectivamente entonces la distribución muestral de la diferencia de medias X 1 − X 2 , esta distribuida aproximadamente en forma normal con medias y σ12 σ 22 2 µ X1 − X 2 = µ 1 − µ 2 y σ X 1 − X 2 = + varianzas: n1 n 2 Se tiene que (X1 − X 2 ) − (µ1 − µ 2 ) Z= σ12 σ 22 + n1 n 2 DISTRIBUCIÓN DE PROPORCIONES Si una población es infinita y distribuida binomialmente, si p y q son las probabilidades respectivas y considerando muestras de tamaño n extraídas de esta población, la distribución muestra de proporciones está dada por: ~ p−p z= p(1 − p) n DISTRIBUCION DE LA DIFERENCIA ENTRE DOS PROPORCIONES DE MUESTRAS. p 2 ) − (p 1 − p 2 ) (~ p1 − ~ z= p 1 (1 − p 1 ) p 2 (1 − p 2 ) + n1 n2 DISTRIBUCIÓN MUESTRAL DE σ Si S es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene varianza σ2, entonces los valores de la variable aleatoria X2 se calculan con: (n − 1)s 2 χ2 = σ2 σ DISTRIBUCIÓN MUESTRAL DE 1 σ2 Si S1 y S2 son las varianzas de variables aleatorias independientes de tamaños n1 y n2 , que se sacan de poblaciones normales con varianzas σ1 y σ2, respectivamente, entonces, S12 2 F= σ12 S 22 = σ 22 S12 σ12 S 22 σ 22 tiene una distribución F con v1 = n1 – 1 y v2 = n2 – 1 grados de libertad donde si se escribe fα(v1, v2) para fα con v1 y v2 grados de libertad, se tiene que: 1 f 1− α (v1 , v 2 ) = f α (v 2 , v1 ) Estadística Administrativa I pag. 62 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas PARÁMETROS Y ESTIMADORES Toda medida de tendencia central o de dispersión obtenida de una población, se conoce como parámetro de la población; aquellas que son obtenidas de una muestra se denominan estimadores, ya que con ellas se realizará la estimación de esos parámetros. Muestreo. Es la operación para tomar una muestra del universo. El objetivo es contar con datos necesarios para estimar parámetros en la población, hacer inferencia estadística con la mayor confiabilidad posible. Parámetros y estimadores más usuales Parámetros Media poblacional: N X µ=∑ i i =1 N Varianza poblacional: Estimadores Media muestral n x x=∑ i i =1 n Varianza muestral N σ2 = ∑ (X i − µ) 2 i =1 N Desviación estándar poblacional: N σ= ∑ (X i − µ) 2 i =1 N Donde X es el valor de cada medición desde i = 1 hasta N N es el número de elemento que constituyen la población bajo estudio Proporción poblacional de elementos con atributo: ∑ Xi Px = N N es el número de elementos de la población Estadística Administrativa I pag. 63 n s2 = ∑ (x − x) 2 i i =1 n −1 Desviación estándar n s2 = ∑ (x i − x) 2 i =1 n −1 Donde x es el valor de cada medición desde i = 1 hasta n n es el número de elemento que constituyen la muestra estudiada Proporción poblacional de elementos con atributo: ∑ xi px = n n es el número de elementos de la muestra M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas ESTIMACIÓN: Es el procedimiento que consiste en emplear los estadísticos obtenidos de una muestra para inferir o estimar los parámetros de una población. Existen dos tipos de estimaciones fundamentales: a) ESTIMACIÓN POR PUNTO b) ESTIMACIÓN POR INTERVALO DE CONFIANZA ESTIMACIÓN PUNTUAL O POR PUNTO ESTIMACIÓN PUNTUAL O POR PUNTO: Consiste en emplear un solo valor de la muestra para estimar el parámetro poblacional respectivo para que el estimador puntual sea bueno deberá reunir las siguientes características. INSESGADO: Es cuando al aumentar el tamaño de la muestra el valor del estadístico x se aproxima al valor del parámetroµ. En el caso de que sean diferentes decimos que es sesgado y que e = x–µ. CONSISTENTE: Es cuando al aumentar el tamaño de la muestra n, el valor del estadístico aproxima al valor del parámetroµ. n → N, x se x→µ EFICIENTE : Un estimador es eficiente cuando es de varianza mínima. SUFICIENTE: Un estimador es suficiente cuando es un estadístico que utiliza toda la información que posee una muestra sobre el parámetro que se estima. ESTIMACIÓN POR INTERVALOS DE CONFIANZA Es el rango dentro del cual se espera que se encuentre el valor del parámetro en cuestión, la ventaja de la estimación por intervalos es que muestra la exactitud con que estima el parámetro a menor longitud del intervalo mayor exactitud en la estimación. la probabilidad de que un intervalo contenga el parámetro que se estima se denomina coeficiente de confianza. Un valor cercano a la unidad indica un intervalo más reducido. Nivel de significancia α / 2 l-α α Estadística Administrativa I Nivel de confianza 1-α Nivel de significancia α / 2 Νivel de confianza Νivel de significancia pag. 64 M. en C. José Luis Hernández González Instituto Tecnológico de Apizaco www.cienciamatematica.com Departamento de Ciencias Básicas Intervalo de confianza para la media con n ≥ 30 y σ conocida. x − z α / 2σ x ≤ µ ≤ x + z α / 2σ x x ± zα / 2σx Intervalo de confianza para la media con n < 30 y σ desconocida. x − t α / 2s x ≤ µ ≤ x + t α / 2s x x ± t α / 2s x Intervalo de confianza para diferencia de medias σ1 y σ2 conocidas (x 1 − x 2 ) ± z α / 2 σ12 σ 22 + n1 n 2 Intervalo de confianza para diferencia de medias σ1 y σ2 desconocidas (x 1 − x 2 ) ± t α / 2 s p 1 1 + n1 n 2 (n 1 − 1)s 12 + (n 2 − 1)s 22 sp = n1 + n 2 − 2 ν = n1 + n2 –2 Intervalo de confianza para diferencia de medias σ1 ≠ σ2 desconocidas (x 1 − x 2 ) ± t α / 2 ν= Estadística Administrativa I s 12 s 22 + n1 n 2 s 12 s 22 + n 1 n2 2 2 2 s 12 s 22 n n 1 2 + n 1 −1 n 2 −1 pag. 65 M. en C. José Luis Hernández González www.cienciamatematica.com Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas Intervalo de confianza para σ2 (n − 1)s 2 2 (n − 1)s 2 〈σ 〈 2 χ α2 / 2 χ 1− α / 2 ν = n - 1 grados de libertad Intervalo de confianza para σ12 σ 22 s 12 1 s 22 f α/2( ν 1 ,ν 2 ) σ 12 s 12 〈 2 〈 2 f α/2( ν 1 , v 2 ) σ2 s2 ν1 = n1 - 1 ν2 = n 2 - 1 Estadística Administrativa I pag. 66 M. en C. José Luis Hernández González