INSTITUTO TECNOLÓGICO DE APIZACO Estadística DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS ESPACIO MUESTRAL. El conjunto de todos los resultados posibles de un experimento estadístico denotado por “S” o “ Ω ” VARIABLE. Se denomina variable a la entidad que puede tomar un valor cualesquiera durante la duración de un proceso dado. Si la variable toma un solo valor durante el proceso se llama constante. VARIABLE ALEATORIA: Es una función que asocia un número real a cada elemento del espacio muestral. Es decir son aquellas que pueden diferir de una respuesta a otra. Una variable aleatoria se puede clasificar en: Variable aleatoria discreta. Variable aleatoria continua. Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos cuantitativos discretos y son respuestas numéricas que resultan de un proceso de conteo. La cantidad de alumnos regulares en un grupo escolar. El número de águilas en cinco lanzamientos de una moneda. Número de circuitos en una computadora. El número de vehículos vendidos en un día, en un lote de autos Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido entre dos valores cualesquiera; ésta puede asumir infinito número de valores y éstos se pueden medir. La estatura de un alumno de un grupo escolar. El peso en gramos de una moneda. La edad de un hijo de familia. Las dimensiones de un vehículo. DEPARTAMENTO DE CIENCIAS BÁSICAS 1 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística DISTRIBUCIONES Distribución de probabilidad. Es una distribución teórica de frecuencias que describe cómo se espera que varíen los resultados de un experimento. Existen diferentes tipos de modelos que permiten describir el comportamiento de fenómenos estadísticos que permiten hacer inferencias y tomar decisiones en condiciones de incertidumbre. P(x) Se pueden clasificar en: Discretas x1 Distribuciones x2 xn x P(x) Continuas x1 xn x Distribuciones discretas. Son aquellas donde las variables asumen un número limitado de valores, por ejemplo el número de años de estudio. Discretas Binomial Hipergeométrica Multinomial Poisson Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier valor dentro de determinados límites; por ejemplo, la estatura de un estudiante. Uniforme Continuas Exponencial Normal DEPARTAMENTO DE CIENCIAS BÁSICAS 2 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados de un experimento que, en realidad se han presentado cuando se lleva a cabo un experimento; en cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados posibles que podrían presentarse si se efectuara el experimento. Las probabilidades que se asocian a cada uno de los valores que toma la variable aleatoria x constituyen lo que se conoce como DISTRIBUCIÓN DE PROBABILIDAD, la cual puede ser representada mediante una función matemática, una gráfica o una tabla de valores. La diferencia consiste en que la función matemática se transforma en una función probabilística. E1 S E0 X x0 x1 P(X) p(x0) p(x1) ... ... ... En xn p(xn) Dados los eventos E1, E2, ..., En ⊂ S, se dice que x es una variable aleatoria, si a cada valor de xi que asume cada Ei, se le asocia su probabilidad de ocurrencia y cumple con las siguientes condiciones: a) La probabilidad para todo valor que asuma la variable aleatoria xi, será mayor o igual a cero pero menor que uno. 0 ≤ P(xi) ≤ 1 ∀ xi b) La suma de todas las probabilidades asociadas a todos los valores que toma la variable x, es igual a la unidad. n ∑ P(x i ) = 1 1 ∝ ∫ P(x i )dx =1 −∝ Encuentre la distribución de probabilidad de lanzar dos monedas y la variable aleatoria número de águilas. S X {Lanzar dos monedas} Número de águilas E0 Caen x = 0 águilas E1 Caen x = 1 águilas E2 Caen x = 2 águilas 1 4 1 P(E1) = 2 1 P(E2) = 4 P(E0) = DEPARTAMENTO DE CIENCIAS BÁSICAS 3 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO P(X) Estadística 1 2 1 4 X 0 1 2 Existen ciertas características que diferencian a las distribuciones de probabilidad, llamadas momentos de la distribución que son: la media aritmética o esperanza matemática y la desviación estándar. FUNCIONES DE PROBABILIDAD DISCRETAS La distribución de probabilidad para una variable aleatoria discreta puede ser: 1.2.3.- Una relación teórica de resultados y probabilidades que se puede obtener de un modelo matemático y que representa algún fenómeno de interés. Una relación empírica de resultados y sus frecuencias relativas observadas. Una relación subjetiva de resultados relacionados con sus probabilidades subjetivas o artificiales que representan el grado de convicción del encargado en tomar decisiones sobre la probabilidad de posibles resultados. Sabemos que una variable aleatoria discreta o discontinua es aquella en la que existe una distancia bien definida entre dos de los valores consecutivos que asume; y dichos valores son numerables. Existen varios modelos matemáticos que representan diversos fenómenos discretos de la vida real. Las más útiles son: 1.La distribución uniforme discreta. 1.La distribución de probabilidad Binomial o de Bernoulli. 2.La distribución de probabilidad Hipergeométrica. 3.La distribución de probabilidad de Poisson. UNIFORME DISCRETA Si la variable aleatoria X asume valores de X1, X2, ..., Xk con iguales probabilidades, entonces la distribución uniforme es: f (x, k ) = DEPARTAMENTO DE CIENCIAS BÁSICAS 4 1 k M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística P(x) x1 x2 xk k ∑ xi µ= i =1 k k ∑ (x i − µ )2 σ 2 = i =1 k La distribucióin de probabilidad del lanzamiento de un dado es: S = {1, 2, 3, 4, 5, 6} P (x = 1, 2, ..., 6) = 1 6 µ= σ2 = 1+ 2 + 3+ 4 + 5 + 6 = 3 .5 6 (1 − 3.5) 2 + (2 − 3.5) 2 + K + (6 − 3.6) 2 6 = 2.91 LA DISTRIBUCION BINOMIAL Esta distribución fue elaborada por Jacobo Bernoulli y es aplicable a un gran número de problemas de carácter económico y en numerosas aplicaciones como: - Juegos de azar. - Control de calidad de un producto. - En educación. - En las finanzas. La distribución binomial posee las siguientes propiedades esenciales: 1.2.- 3.- El espacio muestral contiene n ensayos idénticos. Las observaciones posibles se pueden obtener mediante dos diferentes métodos de muestreo. Se puede considerar que cada observación se ha seleccionado de una población infinita sin reposición o de una población finita con reposición. Cada observación se puede clasificar en una de dos categorías conocidas como éxito E o fracaso E', las cuales son mutuamente excluyentes es decir E ∩ E' = 0. DEPARTAMENTO DE CIENCIAS BÁSICAS 5 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO 4.5.- Estadística Las probabilidades de éxito p y de fracaso q = 1 - p en un ensayo se mantienen constantes, durante los n ensayos. El resultado de cualquier observación es independiente del resultado de cualquier otra observación. La probabilidad de que el evento E ocurra x veces y el evento E' ocurra (n - x) veces en n ensayos independientes está dado por la fórmula binomial: n P (x, n, p) = p x qn - x x donde: p = Probabilidad característica o probabilidad de éxito. q = Probabilidad de fracaso x = Número de éxitos deseados n = Número de ensayos efectuados Si se lanza 4 veces una moneda, calcular el evento "Número de águilas que caen." datos: n = 4 ensayos. 1 p = probabilidad de éxito en un ensayo. 2 1 1 q = 1 - p = 1− = 2 2 x = 0, 1, 2, 3, 4 S = {lanzar 4 veces la moneda} A = {número de águilas que caen} 0 4 1 4 1 1 1 P (E0) = P 0,4, = = 2 0 2 2 16 1 3 4 1 4 1 1 P (E1) = P1,4, = = 16 2 1 2 2 2 2 6 1 4 1 1 P (E 2 ) = P 2,4, = = 16 2 2 2 2 3 1 4 1 4 1 1 P (E3) = P 3,4, = = 2 3 2 2 16 DEPARTAMENTO DE CIENCIAS BÁSICAS 6 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: µ = np σ 2 = npq σ= npq µ = Media σ2 = Varianza σ = Desviación estándar DISTRIBUCIÓN MULTINOMIAL Ocurre cuando en el experimento binomial cada intento tiene más de dos resultados posibles. Las probabilidades de ocurrencia p1, p2, ..., pk en un solo ensayo, la distribución de probabilidad de las variables aleatorias k1, k2, ..., kn que representan el número de ocurrencias de E1, E2, ..., En en n intentos independientes es: P(n, k 1 , k 2 , K , k n ) = n! k kn p 1 1 p k2 2 K pn k 1!k 2! K k n! Calcular la probabilidad de obtener dos veces el número 4, dos veces el número 5 y una vez el número 2, en el lanzamiento de un dado 5 veces. 2 2 1 5! 1 1 1 P(5, 2, 2, 1) = = 0.00385 2!2!1! 6 6 6 LA DISTRIBUCIÓN HIPERGEOMÉTRICA Se emplea para calcular la probabilidad de obtener determinado número de éxitos en un espacio muestral de n ensayos; pero a diferencia de la distribución binomial es que los datos de la muestra se extraen sin reemplazo en una población finita. Por esto es que el resultado de una observación depende o es afectado por el resultado de cualquier otra u otras observaciones anteriores. Es decir la distribución hipergeométrica se emplea para muestreos sin reemplazo de una población finita cuya probabilidad de ocurrencia cambia a lo largo del ensayo. Dado un espacio muestral S de tamaño N con los subespacios M ⊂ N y (N - M) ⊂ N entonces, la probabilidad de que en n ensayos x pertenezca a M y (n - x) pertenezca a (N - M) está dada por: DEPARTAMENTO DE CIENCIAS BÁSICAS 7 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística M N − M x x − n P(x, N, M, n) = N n Gráficamente se puede representar como: E E’ M N-M x n-x N n donde: N n M N-M x n-x = El tamaño de espacio muestral S = El número de ensayos = El número de éxitos en el espacio muestral = Número de fracasos del espacio muestral = Número de éxitos en la muestra = Número de fracasos de la muestra. Si en una empresa se presentan para cubrir dos vacantes 13 aspirantes de los cuales 5 son hombres y 8 son mujeres, calcular " El número de hombres contratados." N A E0 E1 E2 = {13 aspirantes para cubrir 2 vacantes} = {Número de hombres contratados} = Se contratan x0 = 0 hombres, equivale a contratar (n - x0) = 2 mujeres. = Se contratan x1 = 1 hombres, equivale a contratar (n - x1) = 1 mujeres. = Se contratan x2 = 2 hombres, equivale a contratar (n - x2) = 0 mujeres. DEPARTAMENTO DE CIENCIAS BÁSICAS E E’ M=5 N-M = 8 x=0 n-x = 2 8 N = 13 n=2 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística desarrollando N = 13 total de aspirantes M = 5 aspirantes hombres N-M = 8 aspirantes mujer n = 2 vacantes totales x = 0,1,2 hombres posibles a contratar n-x = 2,1,0 mujeres posibles a contratar 5 8 28 0 2 P(E0) = P(0,13,5,2) = = = 0.3588 = 35.88% 78 13 2 5 8 40 1 1 P(E1) = P(1,13,5,2) = = = 0.5128 = 51.28% 78 13 2 5 8 10 2 0 P(E2) = P (2,13,5,2) = = = 0.1282 = 12.82% 78 13 2 MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: M µ = n N σ2 = nM(N − M)(N − n) N 2 (N − 1) σ= σ2 µ = Media σ2 = Varianza σ = Desviación estándar DEPARTAMENTO DE CIENCIAS BÁSICAS 9 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística sustituyendo en el ejemplo anterior. 5 µ = 2 = 0.7693 13 σ2 = (2)(5)(13 − 5)(13 − 2) (13) 2 (13 − 1) σ= = 0.4339 0.4339 = 0.6587 DISTRIBUCIÓN HIPERGEOMÉTRICA GENERALIZADA (MULTIVARIADA) Si N resultados pueden dividirse en la k celdas N1, N2, ..., Nk con k1 ,k2, ..., kn elementos respectivamente, entonces la distribución de probabilidad representa el número de elementos selecionados, en una muestra aleatoria de tamaño n, es: N 1 N 2 N n K k 1 k 2 k n P(n; k 1, k 2 , K , k n ) = N n Si en un refrigerador hay 12 envases de refrescos de los cuales son 10 de manzana, 5 de naranja y 4 de uva, cúal es la probabilidad de que al surtir un pedido de 7 envases tomados al azar 2 sean de manzana, 4 de naranja y 1 de uva. N1 = 3 N2 = 5 N3 = 4 N = 12 k1 = 2 k2 = 4 k3 = 4 n=7 3 5 4 2 4 1 P(7;2,4,1) = = 0.0758 12 7 DEPARTAMENTO DE CIENCIAS BÁSICAS 10 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística DISTRIBUCIÓN DE POISSON Esta función de distribución de variable discreta se emplea para calcular las probabilidades asociadas a la variable aleatoria dentro de un intervalo continuo de tiempo o espacio; este intervalo es generalmente una unidad de medida conocida: cm2, km, gramos, litros, pulgadas, etc. Algunos de los problemas que presentan como un fenómeno con distribución de Poisson son: - Los embotellamientos que se producen por día. - Número de llamadas por hora. - Defectos por m2 de tela. - Número de defectos por lote de un proceso de producción. - Número de negocios cerrados por semana. A este tipo de problemas se les conoce el número de éxitos x obtenidos por unidad de medida en n ensayos; pero es totalmente imposible conocer el número de fracasos (n - x). Se dice que se da un proceso de Poisson si se pueden observar eventos discretos en un intervalo continuo en forma tal que si se acorta el intervalo lo suficiente: 1.2.3.- La probabilidad de observar exactamente un éxito en el intervalo es estable. La probabilidad de observar dos o más éxitos en el intervalo es cero. La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de que suceda en cualquier otro intervalo. La distribución de Poisson se expresa mediante la siguiente fórmula. P(E) = P(x, λ ) = λ x e -λ x! donde: n = Número de ensayos x = Número de éxitos esperados en n ensayos e = 2.71828... λ = n p = Constante igual al número de éxitos promedio por unidad de medida p = Probabilidad constante durante el proceso igual al número de éxitos promedio por unidad de medida. Un conmutador recibe en promedio 5 llamadas sobre autos extraviados por hora. ¿Cuál es la probabilidad de que en una hora tomada al azar reciba? a) Ninguna llamada. b) Exactamente 3 llamadas. c) No más de 3 llamadas. DEPARTAMENTO DE CIENCIAS BÁSICAS 11 M. en C. José Luis Hernández González INSTITUTO TECNOLÓGICO DE APIZACO Estadística Para este problema λ = 5, en otros casos deberá calcularse con: λ = n p. a) Ninguna llamada. x = 0 5 0 e .5 P (E 0 ) = P (0,5) = = 0.00674963 0! b) Exactamente 3 llamadas: x = 3 P (E 3 ) = P (3,5) = 5 3 e .5 = 0.1404 3! c) No más de 3 llamadas: x < 4 P(x < 4) = P(x ≤ 3) = P(x0 = 0) + P(x1 = 1) + P(x2 = 2) + P(x3 = 3) P(x < 4) = 0.0067+ 0.0337 + 0.0842 + 0.1406 = 0.2652 = 26.52 % MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas: µ = λ = np σ2 = λ σ= λ µ = Media σ2 = Varianza σ = Desviación estándar DEPARTAMENTO DE CIENCIAS BÁSICAS 12 M. en C. José Luis Hernández González