INSTITUTO SUPERIOR TECNOLÓGICO NORBERT WIENER Manual del Alumno ASIGNATURA: Estadística II PROGRAMA: S3C Lima-Perú 2 Manual del Alumno Índice General Pág. N° 1. Introducción: Análisis Combinatorio, técnicas de conteo .......................................................................................... 03 2. Permutaciones: simples y circulares .......................................................................................... 10 3. Introducción a la Probabilidad: espacios muestrales .......................................................................................... 17 4. Definición de probabilidad en espacios muestrales finitos .......................................................................................... 22 5. Practica Calificada Nº 01 .......................................................................................... 27 6. Axiomas de probabilidad: propiedades ......................................................................................... 28 7. Probabilidad condicional: Teorema de la multiplicación ....................................................................................... 33 8. Teorema de la Probabilidad total: Teorema de Bayes ....................................................................................... 43 9. Variables Aleatorias Discretas ....................................................................................... 53 10. Examen de la I Unidad Formativa ....................................................................................... 59 3 Manual del Alumno 11. Variables Aleatorias Continuas ......................................................................................... 60 12. Desigualdad de Tchevichev ........................................................................................ 67 13. Distribución Binomial ....................................................................................... 70 14. Distribución de Poisson ....................................................................................... 77 15. practica calificada Nº 02 ....................................................................................... 81 16. Distribución Normal ...................................................................................... 82 17. Teorema central del Limite ..................................................................................... 88 18. Pruebas de hipótesis .................................................................................... 93 19. Examen de la II Unidad Formativa ................................................................................... 107 4 Manual del Alumno SESION 01 INTRODUCCIÓN El término Estadística tiene diversos significados, dependiendo del modo en que se emplee; así pues, para un político, estará relacionado con algún tipo de récord nacional o regional; un científico lo relacionará con alguna técnica más o menos sofisticada de prueba de hipótesis; para un matemático, este término estará relacionado con alguna fórmula empleada para estimar algún parámetro de una variable aleatoria. Todos estos significados se agrupan para formar esta ciencia, rama de las matemáticas, la cual se fundamenta básicamente en la teoría de probabilidades. Antes de tratar de discutir este tema, será conveniente revisar algunas definiciones: Steel y Torrie dicen que la estadística "es la ciencia, pura y aplicada, que se encarga de crear, desarrollar y aplicar técnicas, de tal manera que la incertidumbre de las inferencias inductivas pueda ser evaluada". Según Lewis, "ciencia y técnica que se ocupa de reunir, analizar y resumir datos y de estimar la probabilidad de la inferencia que se haga con dichos datos". 5 Manual del Alumno Toro, define a la estadística como "ciencia que tiene por objeto agrupar metódicamente todos los hechos que se presten a una valuación numérica". Toro , define a la bioestadística como "parte de la biología que aplica a los seres vivientes los métodos estadísticos y el cálculo de probabilidades". La Estadística, particularmente desde el punto de vista aplicado al método científico, es una ciencia joven pudiéndose estudiar desde dos aspectos: el descriptivo y el inferencial: La Estadística Descriptiva. se ocupa de la representación objetiva de la información (datos) colectada; para esto se requiere al menos de un mínimo de conocimientos teóricos, así como de bastante habilidad para comunicar en forma clara un mensaje deseado, haciendo uso de figuras, gráficas, tablas, dibujos, etc. La Estadística Inferencial. trata de lo concerniente a la obtención de deducciones de una parte al todo, desarrollando para esto las técnicas de muestreo, las técnicas de estimación y las técnicas de prueba de hipótesis. Para llegar a la parte aplicada, y principalmente para conocer las bases sobre las que descansa esto, se necesita tener al menos un concepto somero acerca de mediciones, álgebra de conjuntos, probabilidades, variables, funciones, densidades, distribuciones y de límites de confianza en la estimación de parámetros o constantes poblacionales. Los objetivos que expone Güenter para un curso de este estilo, parecen muy apropiados para finalizar este capítulo de introducción: 6 Manual del Alumno Introducir a los estudiantes en el lenguaje y filosofía de la estadística. relacionarlos con los tipos de problemas que pueden ser conducidos a soluciones estadísticas. Presentar suficiente técnica estadística para que los estudiantes puedan trabajar algunos tipos estándar de problemas. Habilitar a los estudiantes para que puedan leer y comprender los resultados sumarizados de experimentos estadísticos llevados a cabo por otros investigadores. puede ser que algunos nunca tengan que llevar a cabo un experimento por sí mismos, pero puede ser que tengan que leer acerca del trabajo de otros en "Journals". PERMUTACIONES Permutación: Conjunto ordenado de n elementos. Notación: Pn ; Pn,n ; An, n Permutación de 5 elementos P5 = 5! Por lo que: Pn = n! P5 = 5! = 5 x 4 x 3 x 2 x 1 = 120 Ejemplo 1: Para el conjunto {a, b, c} existen las siguientes permutaciones: Solución: Abc, acb, bca, bac, cab, cba = 6 P3 = 3! = 6 7 Manual del Alumno Ejemplo 2: En una asamblea de accionistas, hay 6 personas que han solicitado hacer uso de la palabra ¿En cuántas órdenes diferentes pueden hablar, si es que no se ha establecido un orden de prioridades? Solución: P6 = 6! = 720 formas distintas Ejemplo 3: En un proceso de manufactura hay seis operaciones distintas, que se indican con A, B, C, D, E y F. En general no existe una secuencia fija para las operaciones, con la salvedad de que A debe efectuarse al principio y F al final. ¿Cuántas secuencias diferentes pueden ocurrir? Solución: A B C D E F P4 = 4! = 24 formas diferentes Cuando se toman parte de los elementos del conjunto se tiene: Pn,r = n! ( n r )! Ejemplo 4: Si : n = 5 P5,3 = y r=3 5! 5! 120 60 (5 3)! 2! 2 Ejemplo 5: 8 Manual del Alumno Hay 7 candidatos para desempeñar 3 tareas, si todos los candidatos son igualmente eficientes, ¿De cuántas maneras se puede efectuar la asignación? Solución: P7,3 = 7! 7! 7.6.5.4! 210 (7 3)! 4! 4! Ejemplo 6: De cuántas maneras 3 fresadoras, 4 tornos, 4 taladros y 2 cepillos pueden ordenarse en fila en un taller, de modo que el mismo tipo de máquina queden juntas. 3F 4T 4T 2C P3 = 3! P4 = 4! P4 = 4! P2 = 2! P4 = 4! 3! x 4! x 4! x 2! x 4! = 165,888 maneras diferentes Combinaciones : Una combinación de “ n ” elementos tomados de “ r ” en “ r ” es un subconjunto no ordenado de “r” elementos con r ≤ n. 9 Manual del Alumno 2 combinaciones formadas por r elementos son distintas, si difieren al menos en un elemento. Ejemplo 1: Sea el conjunto {a, b, c} de cuántas maneras podemos seleccionar: a) un elemento b) dos elementos c) tres elementos Solución: a) Existen 3 formas de seleccionar un elementos: a; b; c. b) Existen 3 formas de seleccionar dos elementos: ab, ac, bc c) Existe 1 forma de seleccionar 3 elementos: abc Notación: nCr; n r Para determinar el número de combinaciones de n elementos tomando de r en r: Crn n! r!(n r )! Ejemplo : Si n = 10 C710 r=7 10! 10! 10.9.8.7! 720 120 7!(10 7)! 7!.3! 7!.3! 6 10 Manual del Alumno Ejemplo 2: El congreso anglomexicano de administración pública, debe elegir el futuro comité ejecutivo que regirá a esa institución durante el próximo año. La comisión directiva se forma con 6 integrantes y este año han sido propuestos 7 representantes mexicanos y 4 ingleses para ser electos. Se pide determinar de cuántas maneras se puede integrar la comisión en los siguientes casos: a) b) Si en la comisión debe haber 4 mexicanos y 2 ingleses. Si en la comisión debe haber como mínimo 2 ingleses y 2 mexicanos. Solución: a) Los mexicanos se pueden escoger de: C47 7! 35 4!.3! Los ingleses se pueden escoger de: C24 4! 6 2!.2! Conjuntamente : C47 . C24 = 35 x 6 = 210 b) Se pueden presentar los casos: 1) 2 ingleses y 4 mexicanos: C24 C47 = 6 x 35 = 210 2) 3 ingleses y 3 mexicanos: C34 C37 = 140 3) 4 ingleses y 2 mexicanos: C44 C37 = 21 210 + 140 + 21 = 371 Ejemplo 3: 11 Manual del Alumno En los laboratorios “ELKO” hay 3 plazas vacantes de un total de 33 solicitudes de empleo, sólo 14 se han considerado aceptables, en bases en las entrevistas practicadas por el departamento de personal. ¿De cuántas maneras pueden asignarse las 3 plazas? a) Si todos los empleos son de la misma categoría b) Si un empleo es de gerente de ventas, uno es de agente visitador para las ciudades de Puebla y Tlaxcala y otro de agente visitador para las ciudades de Tampico y Cd. Madero. Solución: a) b) C314 364 14 P3 14! 2184 11! Problemas y Ejercicios Propuestos: 1. De 7 candidatos ¿ Cuántas ternos se pueden escoger? 2. 4 alumnos deciden el horario en el cual harán sus prácticas pre profesionales , sabiendo que existen 6 turnos disponible distintos y en cada turno debe asistir uno de ellos. Entonces cuántas formas pueden practicar 3. En la distribución de material para médico para 5 hospitales se tomó en cuenta lo siguiente : 12 Manual del Alumno A uno de ellos se debe entregar el material a las 8:30 al otro a las 9:00 y al siguiente a las 9:30 y así sucesivamente hasta el último . Si existe la posibilidad de variar el orden de entrega de material a cada hospital, entonces de cuantas formas distintas se entrega el material. 4. Cuántos objetos distintos deben existir para que el número de combinación que se puede formar , tomándolos de 2 en 2 sea igual a 6 veces el número de objetos 5. Calcular : 35!*28! 27!*36! 29! b) K 27!28! 36!37! c) K 37!36! a) K SESION 02 COMBINACIONES 13 Manual del Alumno Análisis Combinatorio Principio Fundamental del Conteo: Suponga que una persona tiene 2 formas de ir de una ciudad A a otra ciudad B; y una vez llegada a B, tiene 3 maneras de llegar a otra ciudad C, ¿De cuántas maneras podrá realizar el viaje de A a C pasando por B? Si empezó a pie, podrá tomar luego avión, carro o trasatlántico, y si empezó en bicicleta, también podrá tomar avión, carro o trasatlántico. La persona tuvo 6 formas diferentes de realizar el viaje que son: (iniciales) pa, pc, pt, ba, bc, bt. (2 x 3 = 6) Se puede representar en un diagrama de árbol Por lo que el principio fundamental del análisis combinatorio, puede expresarse así: 14 Manual del Alumno Si una primera decisión, operación o acción puede efectuarse de a formas diferentes, una segunda acción puede efectuarse de b formas diferentes, una tercera acción puede efectuarse de c formas diferentes y así sucesivamente hasta la enésima acción que puede efectuarse de z formas diferentes, entonces el número total de formas diferentes que pueden efectuarse estas n acciones es igual con: a x b x c x ... x z Este principio también se llama principio del análisis combinatorio ó principio multiplicativo. Ejemplo 1: ¿De cuántas maneras diferentes podrá vestirse un joven que tiene 3 camisas diferentes, 4 pantalones y 2 pares de calzado? Solución: 3 x 4 x 2 = 24 maneras diferentes Ejemplo 2: En una ciudad los números de teléfono constan de 5 dígitos, cada uno de los cuales se llama con alguno de los 10 dígitos (0 al 9). ¿Cuántos números diferentes pueden formularse? Solución: 10 x 10 x 10 x 10 x 10 = 100,000 números diferentes Ejemplo 3: La agencia de Publicidad PIPSA, ha obtenido la exclusividad respecto a una línea de polvos para preparar postres. A estos efectos la agencia ha decidido organizar un concurso nacional destinado a adivinar el nombre futuro de esa línea de productos. Las condiciones son: 15 Manual del Alumno a) Los nombres que se propongan deben ser de 4 letras. b) Ninguna letra debe repetirse. c) La primera y tercera letras deben ser consonantes. d) La segunda y cuarta letras deben ser vocales. e) Si una persona propone 2 veces el mismo nombre queda descalificada. ¿Cuántos nombres debe proponer una persona para estar seguro que participa en el sorteo público? Considerar 28 letras del alfabeto Solución: 23 x 5 x 22 x 4 = 10,120 nombres diferentes ¿Por qué esos números? Porque hay 28 letras del alfabeto, 23 consonantes y 5 vocales, pero se disminuyó de 23 a 22 en la primera y tercera cifra porque una de las condiciones es que las letras no se repitan. Así como 5 y 4 en la segunda y cuarta cifras, que son las vocales. Notación Factorial En algunos problemas de matemáticas se nos presentan multiplicaciones de números naturales sucesivos tal como: 4 x 3 x 2 x 1 = 24 ; 3x2x1=6 ; 2 x 1 = 2. Para abreviar estas expresiones, se usa una notación especial llamada notación factorial y nos denota las multiplicaciones sucesivas de n hasta l y se define como: 4 x 3 x 2 x 1 = 4! 3 x 2 x 1 = 3! Se lee: “cuatro factorial” o Se lee: “tres factorial” o “factorial de cuatro” “factorial de tres” 16 Manual del Alumno En términos generales: n(n-1)(n-2)...x 2 x 1 = n! Se lee “n factorial” o “factorial de n” Propiedades: a) para n natural n! = n(n-1)! Ejemplo: 7! = 7 x 6! = 7 x 6 x 5 x 4! b) 0! = 1 Ejemplos: 1) 5! = 5 x 4 x 3 x 2 x 1 = 120 2) 4! 3! = (24)(6) = 144 3) 4) 5) Cuando n es demasiado grande se suele utilizar la fórmula de Stirling: Ejemplo: Determinar 50! por Stirling: 17 Manual del Alumno 18 Manual del Alumno SESION 03 VARIACIONES Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con los números 1, 2 y 3. Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos. SESION 04 INTRODUCCIÓN A LA PROBABILIDAD Azar y Desconocimiento. El azar está relacionado con el desconocimiento. Un ejemplo nos puede ayudar; piense en un proceso industrial que produce grandes cantidades de un artículo determinado. No todos los artículos producidos son idénticos, cada artículo puede calificarse como ``bueno'' o ``defectuoso''. Si 19 Manual del Alumno de toda la producción se escoge un artículo ``a ciegas'', ese artículo puede resultar bueno o defectuoso. Esta es una situación azarosa (o aleatoria) y la parte esencial de este azar es que no sabemos si el artículo seleccionado es defectuoso. Claro que con experiencia en el proceso es posible cuantificar de una manera numérica qué tan factible es que el artículo sea defectuoso o no. Azar e incertidumbre. Hay otro concepto asociado al azar y es el de incertidumbre. Veamos un ejemplo. Respecto a una inversión, podemos estar contemplando invertir una cantidad de dinero. El retorno sobre la inversión puede ser fijo, como en el caso de una cuenta en un banco con interés fijo; pero pensemos en una empresa. El negocio puede resultar desde un gran éxito hasta un fracaso, es decir, la ganancia no es fija, sino que depende del éxito a obtener. Si no podemos evaluar qué tan factible es cada monto posible de la ganancia, tenemos una situación de incertidumbre. Por el contrario, si podemos tener una idea de qué tan probables son los diferentes resultados y entonces tendremos una situación de riesgo. Esta última es la que llamamos aleatoria o azarosa. Espacio Muestral y Probabilidad. El párrafo anterior se resume diciendo que en las situaciones o experimentos aleatorios tenemos dos elementos esenciales: 1. Una lista de posibilidades a futuro: espacio muestral 2. Una cuantificación de la incertidumbre sobre esa lista de posibilidades: asignación de probabilidades. 20 Manual del Alumno Cualquier problema o situación en la probabilidad, parte de esos dos elementos: Espacio Muestral y Probabilidades. ESPACIO MUESTRAL. El espacio muestral es el conjunto de todos los posibles resultados de un experimento o situación aleatoria. Si en una caja hay 10 manzanas y 2 están echadas a perder (¡al menos en este momento!), al extraer tres manzanas y ver cuantas son buenas podemos obtener 1, 2 o 3 buenas (¡0 buenas es imposible!). De modo que en este ejemplo el espacio muestral es: { 1, 2, 3 }. Si un juego consiste en tirar todos los volados que hagan falta hasta obtener tres águilas seguidas o hasta que sean 15 volados, si nos fijamos en el número de volados requeridos, el espacio muestral es: { 3, 4, 5, . . . , 15 }. Pero si nos fijáramos en el número de soles que resultan, entonces el espacio muestral es: { 0, 1, 2, . . . , 15 }. Es claro que para determinar el espacio muestral en un experimento aleatorio es necesario entender perfectamente: Qué se va a hacer. Qué se va a observar o contar. SUCESOS O EVENTOS. Cuando se tiene un espacio muestral llamamos, formalmente evento a cualquier subconjunto del espacio muestral. Decimos que un evento se realiza, cuando el resultado del experimento aleatorio es un elemento del evento. 21 Manual del Alumno Las dos definiciones anteriores son muy abstractas. Veamos un par de ejemplos. En el caso de contar cuantos volados hacen falta para conseguir tres águilas seguidas o tirar 15 volados; el espacio muestral son los números: 3, 4, 5, . . . , 15. Un evento podría ser { 3, 5, 7, . . . , 15}. Este evento corresponde a que el número de tiros necesario sea n ó n. Si al hacer los volados los resultados fueran: AASAASSSAAA (aquí nos detenemos porque han caído ya, tres águilas seguidas), el evento si se realizó porque el número necesario fue 11 y es n ó n . SSSAAA (aquí paramos porque ya hay tres águilas), el evento no se realizó. Podemos pensar que cada experimento al azar es un juego y que un evento es una lista de los resultados que hacen que YO gane. Otro ejemplo más. Al comprar llantas para mi auto, puede ser que manifiesten un defecto de fabricación dentro del período de garantía total y que el fabricante deba reponerlas. También puede pasar que el defecto se manifieste en el período de garantía parcial y que el fabricante bonifique sólo un porcentaje o que el defecto se manifieste después de vencido el período de garantía en cuyo caso el fabricante no paga nada. También puede pasar que las llantas no tengan defecto de fabricación aparente y que no haya garantía que reclamar. Como se puede considerar que las llantas que me vendieron se escogieron al azar de entre toda la producción, tenemos un experimento aleatorio. 22 Manual del Alumno El espacio muestral en este experimento es: S = { T, P1, P2, P3, N, OK }. Con la siguiente notación T: pago total, P1 pago del 50%, P2: pago del 30%, P3: pago del 10%, N: nada de pago, OK: llantas sin defecto. El evento { OK } sólo se realiza cuando las llantas no tienen defecto. En este último ejemplo se tiene un evento simple porque consta de un solo punto del espacio muestral. Será compuesto cuando tiene varios puntos del espacio muestral. Se llama evento imposible al que no puede ocurrir; éste evento corresponde al conjunto vacío. Otro evento extremo es el espacio muestral mismo que, puesto que siempre ocurre, se llama evento seguro. Problemas Propuestos: 1. En una caja hay 8 focos de los cuales 3 están fundidos. Se van a sacar los focos de uno en uno, hasta encontrar los tres fundidos. Si nos fijamos en el número de focos que se quedan en la caja ¿cuál es el espacio muestral? 2. En el experimento de los volados mencionado arriba. Si nos fijamos en el número de soles que salieron, describa en sus propias palabras, cuál es el evento { 0, 1, 2 }. Si los resultados fueron AASAASAAA ¿Por qué se detuvo el experimento? ¿Se realizó el evento? 3. Júntese con un compañero de este curso y entre los dos discutan y encuentren un ejemplo de un experimento aleatorio relacionado con las personas que están en la biblioteca después de las 10 de la noche. Expliquen cuál es el espacio muestral. Expliquen qué información necesitarían para asignar probabilidades. 23 Manual del Alumno 4. Con su mismo compañero, encuentren un ejemplo de un experimento aleatorio referente a las inscripciones. Detallen el espacio muestral. Propongan un evento. Den un ejemplo de un resultado que implique que el evento no se realizó y otro resultado donde el evento sí se haya realizado. 24 Manual del Alumno SESION 05 PRACTICA CALIFICADA SESION 06 PROBABILIDAD Aparte del espacio muestral, en cada experimento aleatorio hay una asignación primaria de probabilidades. Basados en la experiencia o en razonamientos de simetría, a cada elemento del espacio muestral le asignamos una evaluación de qué tan factible es. Esta evaluación se refleja en un porcentaje (número entre 0 y 1). Entre más factible sea el resultado, mayor es el porcentaje que se le asigna. Los casos extremos son: Un evento que no puede suceder, tiene probabilidad cero. Muchas veces estos eventos con probabilidad cero son imposibles por alguna contradicción lógica en su definición. Por ejemplo: ``que la suma de dos dados sea n ó n y los dos dados tengan el mismo número''. En el otro extremo hay eventos que siempre suceden y estos tienen probabilidad uno. Por ejemplo: ``que el número de águilas en dos volados sea menor o igual a 7.8'', aunque el evento pueda resultar extraño en su definición, siempre sucede y tiene probabilidad igual a 1. 25 Manual del Alumno La asignación toma la forma matemática de una función y se llama función de probabilidad. El dominio de esta función es el espacio muestral y su codominio es el intervalo real [ 0, 1 ]. Esta función nos da las probabilidades de los eventos simples. Para un evento compuesto, simplemente sumamos las probabilidades de los elementos que lo componen. EJEMPLOS. La probabilidad es un concepto muy viejo en las matemáticas. Actualmente lo aplicamos en prácticamente todos los campos de la actividad humana. La variedad de situaciones en que se aplica va desde la producción hasta la planeación a largo plazo de las empresas. Aunque esta es la visión moderna, y la razón de que estemos estudiando probabilidad en este curso, los orígenes del concepto son muy humildes, comenzó aplicándose a los juegos de azar. Pensemos en un dado perfectamente balanceado de modo que ninguno de los seis lados es favorecido. El espacio muestral es { 1, 2, 3, 4, 5, 6 }. La función de probabilidad le asigna a cada uno de los elementos del espacio muestral el valor de 1 / 6. Esta asignación la hacemos porque el dado está balanceado. Decimos que la probabilidad de un evento es el número de resultados favorables al evento entre el número de resultados posibles. 26 Manual del Alumno Por ejemplo, la probabilidad de que el resultado sea mayor que 4 es 2 / 6, porque hay 2 resultados favorables entre los 6 resultados posibles. Formalmente, el evento es A = { 5, 6 } y P[A] = 2/6. La probabilidad que resulta de esta manera, tiene una interpretación empírica; si hacemos una serie larga de lanzamientos del dado, y observamos la frecuencia de resultados favorables al evento A, esta frecuencia tiende a ser 2/6. Otro ejemplo: una urna con 50 papelitos numerados de los cuales se escoge uno para que tenga un premio. El espacio muestral es { 1, 2, 3, . . . , 50 }. La asignación de probabilidades es de 1 / 50 para cada resultado. Si yo compré los números 1, 14 y 18; el evento de que yo gane es { 1, 14, 18 } y la probabilidad de que gane es 3 / 50. SESION 07 PROBABILIDAD DE SUCESOS 27 Manual del Alumno Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos sucesos entre sí, así como de las posibles relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cómo se refleja esto en el cálculo de probabilidades. a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso será menor que la del suceso que lo contiene. Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un número par. Dijimos que el suceso a) está contenido en el suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50 Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor que la probabilidad del suceso que lo contiene, suceso b). b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos sucesos son las mismas. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que salga múltiplo de 2. Las soluciones coinciden en ambos casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 28 Manual del Alumno c) Intersección de sucesos: es aquel suceso compuesto por los elementos comunes de los dos o más sucesos que se intersectan. La probabilidad será igual a la probabilidad de los elemntos comunes. Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que sea mayor que 3. La intersección de estos dos sucesos tiene dos elementos: el 4 y el 6. Su probabilidad será por tanto: P(A B) = 2 / 6 = 0,33 SESION 08 PROBABILIDAD DE SUCESOS d) Unión de dos o más sucesos: la probabilidad de la unión de dos sucesos es igual a la suma de las probabilidades individuales de los dos sucesos que se unen, menos la probabilidad del suceso intersección 29 Manual del Alumno Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 P (A B) = 2 / 6 = 0,33 Por lo tanto, P (A u B) = (0,50 + 0,50) - 0,33 = 0,666 e) Sucesos incompatibles: la probabilidad de la unión de dos sucesos incompatibles será igual a la suma de las probabilidades de cada uno de los sucesos (ya que su intersección es el conjunto vacio y por lo tanto no hay que restarle nada). Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. La probabilidad del suceso unión de estos dos sucesos será igual a: P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166 Por lo tanto, 30 Manual del Alumno P(A u B) = 0,33 + 0,166 = 0,50 f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso (A) es igual a 1 P(A) Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un número par, luego su complementario, suceso (B), es que salga un número impar. La probabilidad del suceso (A) es igual a : P(A) = 3 / 6 = 0,50 Luego, la probabilidad del suceso (B) es igual a: P(B) = 1 - P(A) = 1 - 0,50 = 0,50 Se puede comprobar aplicando la regla de "casos favorables / casos posibles": P(B) = 3 / 6 = 0,50 g) Unión de sucesos complementarios: la probabilidad de la unión de dos sucesos complementarios es igual a 1. Ejemplo: seguimos con el ejemplo anterior: a) que salga un número par, y b) que salga un número impar. La probabilidad del suceso unión de estos dos sucesos será igual a: P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50 Por lo tanto, 31 Manual del Alumno P(A U B) = 0,50 + 0,50 = 1 32 Manual del Alumno SESION 09 AXIOMAS DE LA PROBABILIDAD Teniendo en cuenta las operaciones para hacer conjuntos nuevos, hay algunos hechos fundamentales respecto a la probabilidad que se cumplen siempre: 1. P(A) mayor o igual a 0 2. P(S) = 1 3. P(A ó B) = P(A) + P(B) si A y B son excluyentes. De estas tres propiedades, los matemáticos deducen un montón de reglas útiles para calcular probabilidades en situaciones más complicadas. A este tipo de proposiciones de las que se deducen otras, se les llama axiomas y los tres de arriba son los axiomas de la probabilidad. Algunas de las fórmulas más útiles, deducidas de los axiomas, son las siguientes. P( vacío ) = 0 P(A') = 1- P(A) P(A - B) = P(A) - P(A y B) Si A está contenido en B entonces P(A) menor o igual a P(B) P(A) menor o igual a 1 P(A ó B) = P(A) + P(B) - P(A y B). La deducción de estas leyes a partir de los tres axiomas es un ejercicio de ingenio matemático al que valdría la pena asomarse, pero en el que no tenemos intención de meternos de lleno. Ya que desde el punto de vista de este curso, lo interesante es aplicarlas. Respecto a la tercera de la reglas, note bien que la resta de conjuntos se define así: ``A - B'' es la colección de elementos de A que no están en B. 33 Manual del Alumno De tal suerte que P(A - B) debe contemplar sólo a elementos de A y por eso es que a P(A) no le restamos P(B) sino solamente P(A y B). Otro comentario lo merece la última regla: P(A ó B) = P(A) + P(B) - P(A y B). Es preciso restar P(A y B) ya que así no lo hiciéramos, se estaría tomando en cuenta dos veces a los elementos comunes a A y a B. Problemas Propuestos Resolver los siguientes ejercicios 1. Inventen un juego con dos dados. Como ejemplos, o tirar dos dados y el resultado no es la suma de los dados sino la multiplicación. o tirar dos dados y el resultado es 1000 si la suma de los dos es par y 5000 si la suma es n ó n. Escriban el espacio muestral y, teniendo en cuenta que las 36 parejas de posibles resultados con dos dados: { (1,1), (1,2), (1,3), . . . } son igualmente probables, encuentren la función de probabilidad para el juego que inventaron. Combinaciones de Sucesos o Eventos. Definir la unión e intersección de eventos. Obtener la probabilidad de la unión e intersección de eventos. Enunciar y aplicar las leyes de la probabilidad. Definir eventos mutuamente excluyentes y la partición de un espacio muestral. Establecer y aplicar la ley de la adición de la probabilidad para n eventos. 34 Manual del Alumno De la función de Probabilidad al cálculo de probabilidades Toda la información matemáticamente importante respecto a un experimento aleatorio se encuentra en: El espacio muestral. La función de probabilidad. El cálculo de la probabilidad de un evento se simplifica partiéndolo en eventos más sencillos y uniendo los pedazos de acuerdo a la llamada ley de la adición para probabilidades. Un ejemplo nos puede servir. Se van a tirar dos dados y yo gano si la suma de los dados da siete o aunque la suma no sea siete, si uno, al menos, de los dados cae en uno. Los resultados de tirar los dados son 36: S = { (1,1),(1,2),(1,3), . . . ,(6,6) }. Además, por la simetría interna de los dados, cada uno de estos 36 resultados es igualmente probable. Esto establece la función de probabilidad. Pasemos al problema de calcular la probabilidad de ganar. Una manera equivocada de resolver el problema es así. Yo gano si el primer dado cae uno o el segundo dado cae uno o la suma de los dos es siete. Como las respectivas probabilidades son: 1 / 6, 1 / 6 y 1 / 6. La probabilidad de que gane es la suma de estas tres, 1 / 2. Lo que tiene mal este razonamiento es que los eventos en que hemos partido el resultado 35 Manual del Alumno de que yo gane no son ajenos, y en estas circunstancias no se vale sumar las probabilidades y ya. Para responder correctamente hay que partir el resultado de que yo gane en más pedazos: que el primer dado caiga uno y el otro no o que el segundo caiga uno y el primero no o que los dos caigan uno o que la suma sea siete pero no haya ningún uno. Las respectivas probabilidades son: 5 / 36, 5 / 36, 1 / 36 y 4 / 36. Para una probabilidad total de ganar de: 15 / 36; esto es menor que 1 / 2 que es la que habíamos calculado mal. Fíjese que para resolver el problema lo partimos en pedazos más pequeños, los pedazos son ajenos. la probabilidad fue la suma de esos pedazos. En el ejemplo usamos un espacio muestral equiprobable. Problemas propuestos: Resuelva estos ejercicios. 1. Se van a tirar 5 monedas y el resultado va a ser el número de águilas menos el número de soles. Escriban el espacio muestral equiprobable para este experimento. (Debe tener 32 resultados). 2. Siguiendo con el ejercicio anterior, me van a dar una cantidad de pesos igual a la resta: [número de águilas] MENOS [número de soles]. Si sale negativo quiere decir que ¡yo pago! ¿Cuál es la probabilidad de que gane más de dos pesos? 36 Manual del Alumno 3. Si un dado se construye de modo que un 1 o un 2 ocurran dos veces más frecuentemente que un 5, mismo que se presenta tres veces más seguido que un 3 o un 4 o un 6. ¿Cuál es la probabilidad de que el número que se obtiene sea par? ¿Cuál la de que sea un cuadrado perfecto? ¿Cuál la de que sea mayor que 4? 4. ¿Cómo harían Uds. para construir un dado como el que se propone en el ejercicio anterior? 37 Manual del Alumno SESION 10 EXAMEN PARCIAL SESION 11 PROBABILIDAD CONDICIONAL Consideremos la siguiente situación. Se tienen tres urnas similares; por fuera son idénticas. Se sabe que en la urna 1 hay 3 bolas blancas y 19 azules, en la urna 2 hay 20 bolas blancas y 2 azules, en la urna 3 hay 11 bolas blancas y 11 azules. Se va a sacar una bola de una de las urnas. Puede ser azul o blanca. ¿Cuál es la probabilidad de que sea blanca? Hay cuatro posibles soluciones: 1. La probabilidad de una blanca es 3 / 22. Esto es porque si se escoge la urna 1, hay 3 de 22 bolas que son blancas. Esta respuesta nos deja pensando en que es muy arbitrario decir que la urna escogida es la 1. Si la urna escogida fuese la 1 esta sería la respuesta correcta. 2. De manera similar, podemos pensar que la urna escogida es la 2 y entonces la probabilidad de una bola blanca es 20 / 22. 3. Claro que, también, la urna escogida puede ser la 3 y entonces la probabilidad de blanca es 11 / 22. 38 Manual del Alumno 4. Como no se sabe cual es la urna escogida y las tres urnas tienen el mismo número de bolas, la probabilidad se calcula como si fuese una gran urna con 66 bolas de las cuales 3 + 20 + 11 son blancas y, así, la probabilidad es 34 / 66 ¿Cuál es la respuesta correcta? o ¿habrá otra que sea la respuesta correcta? Una cosa es clara; si podemos suponer que la urna escogida es la 1, la respuesta correcta es la primera. Lo mismo se puede decir de la segunda y la tercera. La cuarta es un poquito más atrevida y quizá sea correcta. Por lo pronto vamos a darle un nombre a las tres primeras: les llamamos probabilidad condicional. A la primera la llamamos ``probabilidad condicional de blanca dado que la urna es la 1''. A la segunda, la llamamos de manera similar condicional de blanca dado que la urna es la 2. A la tercera se le da un nombre análogo [¿Cuál nombre?]. Más adelante en el curso, veremos lo que se llama fórmula de la probabilidad total y entonces, veremos que la cuarta respuesta daría la ``probabilidad no condicional''. Por el momento ampliemos nuestras ideas sobre probabilidad condicional con un poco de matemáticas. Formalmente, definimos en clase la probabilidad condicional de la siguiente manera: P( A | B ) = [P( A y B )] / [P( B )] 39 Manual del Alumno El símbolo P( A | B ) lo leemos como probabilidad de A dado B. Lo interpretamos como la probabilidad de que, sabiendo que ya sucedió B, además suceda A. En el ejemplo de las urnas A sería el evento ``la bola es blanca''; B sería la urna correspondiente. Como lo que está abajo en el quebrado es la probabilidad de lo dado, la fórmula no es simétrica en A y B. Si los intercambiamos, da otro número. Esto se ve en el ejemplo ya que no es lo mismo que nos informen cual es el número de la urna escogida a que nos digan que la bola fue blanca y nos pregunten cuál es la urna. Esta fórmula no tiene sentido matemático si P(B) = 0. En tal caso decimos que la probabilidad condicional no está definida. Claro que eso está bien porque no puede haber sucedido algo que es imposible. Fíjese que esta fórmula se usará cuando haya una manera fácil de calcular las probabilidades no condicionales y la condicional sea difícil. Eso no fue el caso con el color de la bola y las urnas. Para ejemplificar el tipo de situación en que nos sirve la fórmula descrita, considere este problema. Se tiran dos dados y se sabe que el primero no tiene el número 5. ¿Cuál es la probabilidad de que la suma de los dados sea 8? Para resolver, llamemos B el evento: ``el primer dado no es 5''. A el evento: ``la suma de los dados es 8''. Con los datos se ve que: P(B) = 30 / 36. 40 Manual del Alumno Porque de las 36 parejas posibles, 6 tienen 5 en el primer dado. P(A y B) = 4 / 36. Porque sólo se obtiene 8, con las parejas (2,6), (3,5), (4,4) y (6,2) [La pareja (5,3) sí suma ocho pero tiene un 5 en el primer dado]. y, usando la fórmula, P(A|B) = 4 / 30. También hubiéramos podido calcular sin la fórmula, pero esa cuenta requiere más ingenio. En este ejemplo es fácil calcular las probabilidades no condicionales. Hay muchos problemas, como en el de las urnas, en que lo contrario es lo cierto: es fácil calcular la condicional y la podemos usar para calcular la conjunta. Si despejamos a P(A y B), tendremos una fórmula para calcular la probabilidad conjunta cuando sea fácil calcular la condicional. En clase hacemos un ejemplo simple de cálculo de probabilidad condicional con una tabla de dos clasificaciones cruzadas. En ese ejemplo se ven tres cosas: 1. La probabilidad condicional nos permite medir la información. En los ejemplos vimos como cambia la probabilidad de A, antes de conocer nada: P(A) y después de conocer la ocurrencia de el evento B: P(A | B). 2. En un extremo está el cambio enorme que corresponde a que A y B sean excluyentes (ajenos). En este caso la probabilidad podría llegar incluso a ser cero. 3. En el otro extremo están los eventos en los que sucede que P(A | B) = P(A). Esto quiere decir que la información de que B ocurrió no 41 Manual del Alumno cambia la probabilidad de A y decimos que A y B son independientes. Esta última característica, la independencia, juega un papel muy importante en la probabilidad y merece una atención más detallada. Por el momento debemos establecer una definición: A y B son eventos independientes si y sólo si P(A y B) = P(A) P(B) En forma equivalente decimos: A y B son eventos independientes si y sólo si P(A | B) = P(A) La equivalencia se sigue de una sustitución algebraica muy sencilla. La consecuencia de que esta sea una definición es que: para comprobar la independencia de dos eventos es preciso hacer ver que P(A y B) = P(A)P(B). Es importante remarcar la diferencia de concepto entre eventos independientes y eventos excluyentes o ajenos. En nuestro ejemplo se ve claramente que ambos conceptos son antitéticos. El hecho de que dos eventos se excluyan casi implica que no son independientes. La excepción se da en el caso degenerado de que alguno de ellos (o los dos), sea imposible. En el habla cotidiana, a veces, se confunden estos conceptos. Note que si A es imposible; P(A) = 0. Además ``A y B'' también es imposible y se tiene P(A y B) = P(A)P(B) ya que ambos lados de la igualdad valen cero . Pero éste es el único caso en que dos eventos son ajenos e independientes a la vez; en términos geométricos la idea de independencia se asemeja a la perpendicularidad y la de ``ajenos'' al paralelismo. 42 Manual del Alumno Probabilidades de Intersecciones de Sucesos o Eventos. Establecer y aplicar la ley general multiplicativa de la probabilidad para n eventos. Definir independencia de n eventos. Dada una colección de eventos, determinar si son o no independientes. Establecer y aplicar la ley particular multiplicativa de la probabilidad para n eventos independientes. Probabilidades conjuntas Con: la definición que hicimos de probabilidad condicional y la definición de independencia podemos establecer igualdades que nos auxilien para calcular la probabilidad de la ocurrencia simultánea de dos eventos. 1. Para dos eventos en general. P(A y B) = P(A) P(B | A) o Esta igualdad no es más que la definición de probabilidad condicional volteada al revés. o Para aplicar esta igualdad es preciso que contemos, de alguna manera indirecta, con la probabilidad condicional. o La igualdad se puede escribir también, condicionando sobre B, así. P(A y B) = P(B) P(A | B) 2. Para dos eventos independientes P(A y B) = P(A) P(B) 43 Manual del Alumno o Para poder usar esta igualdad se necesita saber, de otras fuentes, que A y B son independientes. o Esta igualdad no es más que la versión de la de arriba cuando P(B | A) = P(B). Estas igualdades son muy útiles cuando el experimento aleatorio se va a llevar a cabo en etapas temporales. Por ejemplo, suponga que una empresa recibe materia prima empaquetada en sobres de 300g. que vienen en cajas de 50 sobres cada una; suponga, además que cada sobre puede ser: bueno o deficiente. Para revisar una caja, se van a tomar, al azar, 3 sobres. si más de 2 sobres son deficientes se rechazará la caja completa. si ningún sobre es deficiente, se aceptará la caja completa. si hay 1 o 2 sobres deficientes, se tomarán otros 3 sobres y si el total de deficientes de los 6 sobres revisados, se pasa de 2, se rechazará la caja completa (en caso de ser 2 o menos, se acepta la caja). Una fuente secreta nos informa que una caja específica tiene 10 sobres deficientes. ¿Cuál es la probabilidad de que esa caja sea aceptada? El problema es complejo, trate Ud. de resolverlo, la respuesta involucra pensar en etapas, de acuerdo a los diferentes resultados de la primera etapa. El problema lo resolvemos en el salón. Más de dos Sucesos o Eventos Ambas igualdades se pueden llevar a tres o más eventos, como sigue: P(A y B y C) = P(A) P(B | A) P(C | A y B) o cualquier otro orden para el condicionamiento, por ejemplo: 44 Manual del Alumno P(A y B y C) = P(B) P(C | B) P(A | B y C) Para el caso de eventos independientes la igualdad se simplifica en su escritura: P(A y B y C) = P(A) P(B) P(C) La generalización de las fórmulas anteriores a más de tres eventos es inmediata. No olvide que para aplicar cualquiera de estas fórmulas es preciso conocer, previamente los valores de las probabilidades involucradas. Un ejemplo de uso de estas fórmulas es el siguiente: Si una pistola está cargada con 15 cartuchos, de los cuales 2 son inútiles y no funcionarán, ¿Qué probabilidad hay de que el primer cartucho funcione y los dos siguientes no? En este ejemplo, por la especificación del evento, podemos calcular las probabilidades condicionales por separado y eso nos lleva aplicar la primera de las fórmulas vistas arriba. La solución la damos en el pizarrón. Más sobre independencia Respecto a la independencia de dos eventos, hay algunas cosas muy elementales que agregar a la definición que hicimos en notas pasadas. 1. La independencia de dos eventos A y B, quiere decir que el saber que A sucedió no modifica la probabilidad de que B también haya sucedido. Como consecuencia saber que A no sucedió tampoco puede afectar a la probabilidad de B. Hacemos una demostración formal en el pizarrón. Podemos poner esto diciendo que 45 Manual del Alumno Si A y B son independientes, también lo son las tres siguientes pares: A' y B ; A y B' ; A' y B' (estamos usando el apóstrofe ' para denotar complemento) 2. Cuando se tienen tres eventos, se puede presentar una situación muy curiosa. Puede pasar que o A y B sean independientes y o A y C sean independientes y o B y C también sean independientes. Pero A, B y C NO sean independientes. Esta situación curiosa se describe diciendo que no basta que varios eventos sean independientes a pares, para que sean independientes. El ejemplo clásico es el de un experimento aleatorio con cuatro posibles resultados igualmente probables: 1, 2, 3 y 4 . o Si el resultado es 1, A gana y nadie más. o Si el resultado es 2, B gana y nadie más. o Si el resultado es 3, C gana y nadie más, pero o Si el resultado es 4, los tres A, B y C ganan. Usted puede calcular las probabilidades para darse cuenta que: o P(A y B) = P(A) P(B) o P(A y C) = P(A) P(C) o P(B y C) = P(B) P(C) pero P(A y B y C) no es igual a P(A) P(B) P(C). 46 Manual del Alumno 3. Una nota final de un estilo menos matemático. La palabra independencia se utiliza en otros contextos para denotar un sinnúmero de conceptos diferentes. Los ejemplos más comunes son en política, en historia, en derecho. En la ciencia se habla de variables independientes y el significado es diferente que el que usamos aquí. Aún en otras ramas de la matemática se usa la palabra independencia para denotar a otros conceptos. Cuando queremos distinguir la definición técnica que usamos en la probabilidad de otras nociones le ponemos un apellido a la independencia y decimos independencia estocástica. Es conveniente recordar que cuando existe duda si dos eventos son independientes o nó, la única forma de zanjar la cuestión es viendo si P(A y B) es igual o diferente al resultado de multiplicar P(A) P(B). Naturalmente que si la independencia de dos eventos está en duda, el cálculo de P(A y B) no se puede hacer simplemente multiplicando P(A) P(B) sino que se debe justificar de alguna otra manera. 47 Manual del Alumno SESION 12 TEOREMA DE BAYES Veamos un problema que nos llevará a una regla interesante de cálculo de probabilidades que se llama: el teorema de Bayes. En una etapa de la producción de un artículo se aplica soldadura y para eso se usan tres diferentes robots. La probabilidad de que la soldadura sea defectuosa varía para cada uno de los tres, así como la proporción de artículos que cada uno procesa, de acuerdo a la siguiente tabla. robot prob. Defect. prop. Proces. A 0.002 18% B 0.005 42% C 0.001 40% Tenemos un par de preguntas: Cuál es la proporción global de defectos producida por las tres máquinas Si tomo un artículo al azar y resulta con defectos en la soldadura, cuál es la probabilidad de que haya sido soldado por el robot C. (I) La primera pregunta nos va a llevar a lo que se conoce con el nombre de fórmula de la probabilidad total. Queremos conocer la proporción global de defectos delos tres robots. Después de reflexionar un momento se ve que si todas las soldaduras las pusiera el robot C, habría pocos defectos, serían 0.001 o 0.1%. En cambio, si todas las pone el B, ¡sería un desastre!, tendríamos cinco veces más: 48 Manual del Alumno 0.005 o 0.5%. De modo que en nuestra respuesta debemos tener en cuenta las diferentes proporciones de lo maquinado en cada robot. Nuestra idea es empezar por descomponer el evento ``defectuoso'' en ``viene del robot A y es defectuoso'' o ``viene del robot B y es defectuoso'' o ``viene del robot C y es defectuoso''. En símbolos tendremos P(d) = P(A y d) + P(B y d) + P(C y d) ó P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C) Antes de ponerle números y resolver nuestro problema fijémonos en la fórmula obtenida. 1. Hay tres eventos A, B y C que o son ajenos y o cubren todo el espacio muestral. 2. Conocemos las probabilidades de cada uno de ellos. 3. Además, conocemos las probabilidades condicionales de otro evento dado cada uno de ellos. La fórmula de arriba se llama fórmula de la probabilidad total. Llenando con nuestros números, tenemos que P(d) = (0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001) o sea que P(d) = 0.00286 casi 3 piezas por cada mil. Es bueno comparar este resultado con los porcentajes de soldaduras defectuosas de cada robot por separado. Podemos ver que el resultado se encuentra entre todas ellas y se encuentra relativamente cerca de los porcentajes de los robots más utilizados (el B y el C). Esto es muy razonable. 49 Manual del Alumno (II) La segunda pregunta es, a la vez más simple y más complicada. Nos va a llevar a lo que se conoce con el nombre de teorema de Bayes. La probabilidad que buscamos es una condicional pero al revés de las que tenemos. Buscamos P( C | d) para calcularla usamos la definición de probabilidad condicional: P( C | d) = [P(C y d)] / [P( d )] El numerador (lo de arriba) lo calculamos con P( C y d ) = P(C) P(d|C) y el denominador lo calculamos con la fórmula de probabilidad total P(d) = P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C) juntando las dos tenemos la fórmula de Bayes: P( C|d) = [P(C) P(d|C)] / [P(A) P( d|A) + P(B) P( d|B) + P(C) P( d|C)] Aplicándola a nuestro caso tenemos P(C|d) = [(0.40)(0.001)]/[(0.18)(0.002) + (0.42)(0.005) + (0.40)(0.001)] o sea P(C|d) = [0.0004]/[0.00286] = 0.1399 casi 14%. O sea que si tomamos una pieza al azar, la probabilidad de que haya sido soldada por el robot C es alta, 40%. Pero, como ese robot produce sólo 1 50 Manual del Alumno de cada mil soldaduras defectuosas, al saber que la pieza seleccionada es defectuosa, la probabilidad de que provenga del robot C disminuye a solamente 14%. Esto quiere decir que, en este caso el saber que la soldadura es defectuosa, nos provee con una gran cantidad de información. Si analizáramos, usando de nuevo la fórmula de Bayes las probabilidades de los robots A y B, tendríamos P(B|d) = 0.7343 y P(A|d) = 0.1259 Comparadas con las probabilidades de cada máquina sin saber que la pieza es defectuosa vemos un gran incremento en la probabilidad de B. Si, por el contrario la pieza no hubiese tenido defectos de soldadura, el mismo teorema de Bayes nos daría (haga Ud. las cuentas y ¡fíjese que no me haya equivocado yo!): P(A|no d) = 0.1802 P(B|no d) = 0.4191 y P(C|no d) = 0.4007 Las probabilidades no son idénticas a las probabilidades no condicionales, pero la diferencia es muy pequeña. Para apreciar mejor el cambio, pongamos en una sola tabla las probabilidades iniciales y las condicionales obtenidas bajo el conocimiento de la soldadura de la pieza. Robot P() P( |d) P( |no d) A 0.18 0.1259 0.1802 B 0.42 0.7343 0.4191 C 0.40 0.1399 0.4007 Es tan grande el éxito de los tres robots en el soldado correcto que el saber que la pieza no tiene defectos, prácticamente no altera las probabilidades de producción en uno u otro. 51 Manual del Alumno Por el contrario, el robot C es tan bueno, comparado con el B que, al saber que la pieza es defectuosa, las probabilidades cambian dramáticamente. En este ejemplo el cálculo de probabilidades condicionales nos cuantifica algo que el sentido común nos dice de otra forma. Note que la fórmula de Bayes nos sirvió para pasar de las probabilidades no condicionales a las condicionales. Otro ejemplo del uso del teorema de Bayes Otro ejemplo clásico del uso del teorema de Bayes es un problema de oro y plata. Hay tres bolsas que tienen, cada una dos monedas. Las de la primera son de oro, las de la segunda son de plata y las de la tercera son una de plata y otra de oro. Se escoge una bolsa al azar y de ella una moneda también al azar. Si la moneda es de oro, ¿cuál es la probabilidad de que la otra moneda en la bolsa sea de oro también? Primero notemos que la segunda bolsa no pudo haber sido elegida (porque no tiene monedas de oro), sólo pudo haber sido seleccionada la primera o la tercera. Si la bolsa elegida hubiese sido la tercera, el evento cuya probabilidad nos interesa no se realiza. De modo que el evento que nos interesa es equivalente a que se haya elegido la primera bolsa. Una vez establecido lo anterior, apliquemos el teorema de Bayes para calcular P(I|Au) = [P(I)P(Au|I)] / [P(I)P(Au|I) + P(II)P(Au|II) + P(III)P(Au|III)] Las probabilidades que entran al lado derecho de la igualdad las sacamos, inmediatamente, de las condiciones del problema y después de hacer cuentas tenemos: P(I|Au) = 2 / 3 52 Manual del Alumno Este problema es clásico porque existe una ``solución'' a la que muchas personas llegan y es falsa. El argumento es el siguiente. Como todas las bolsas son igualmente posibles, y el hecho de que la primer moneda extraída sea de oro, nos indica que no se trata de la segunda bolsa. Concluimos que las dos bolsas restantes tienen igual probabilidad y, por tanto, la probabilidad de que la otra moneda sea de oro es 1/2. Si Ud. piensa de acuerdo a este razonamiento (¡erróneo!), es muy difícil que encuentre en qué se equivoca. Lo que está mal es que lo que averiguamos, al saber que la moneda extraída es de oro, es algo más que el rechazo de la segunda bolsa. Si sólo nos dijeran que la bolsa escogida al azar no fue la segunda, sin informarnos del metal de la moneda sacada, todavía tendríamos incertidumbre respecto a la primer moneda; todavía podríamos apostar a si ésta es de oro o de plata. Al decirnos que la moneda fue de oro, estamos aprendiendo algo más, y eso echa por tierra el argumento de ``igual probabilidad para las dos bolsas restantes''. Lo interesante del problema es que, si nos hubieran dicho que la moneda sacada fue de plata, aplicando la fórmula de Bayes, llegamos a la conclusión de que la probabilidad de que la otra moneda sea también de plata es 2/3 [¡Haga Ud. las cuentas!]. Es decir, si vamos a apostar al metal de la otra moneda, nos conviene apostar por el metal de la primera. Este ejemplo nos lleva a reflexionar sobre el uso adecuado de la información contenida en ``lo dado'' en el cálculo de la probabilidad condicional. 53 Manual del Alumno Problemas Propuestos : 1. Una mujer portadora de hemofilia clásica da a luz tres hijos. a) ¿Cual es la probabilidad de que de los tres hijos, ninguno esté afectado por la enfermedad? b) ¿Cual es la probabilidad de que exactamente dos de los tres niños esté afectado? 2. El 60% de los individuos de una población están vacunados contra una cierta enfermedad. Durante una epidemia se sabe que el 20% la ha contraído y que 2 de cada 100 individuos están vacunados y son enfermos. Calcular el porcentaje de vacunados que enferma y el de vacunados entre los que están enfermos.. 3. La proporción de alcohólicos que existe en la población de Málaga es, aproximadamente, un 10%; no obstante, en las bajas que dan los médicos de la Seguridad Social difícilmente se encuentra el diagnóstico de alcoholismo. Aparecen sin embargo diagnosticados de hepatopatías, lumbalgias, etc., que pueden hacer sospechar alcoholismo subyacente. Se realizó un estudio que puso de manifiesto que el 85% de los individuos alcohólicos y el 7% de los no alcohólicos sufrían tales patologías. Se desea saber cuál es la probabilidad de que un individuo con esas patologías sea realmente alcohólico. 4. Dos tratamientos A y B curan una determinada enfermedad en el 20% y 30% de los casos, respectivamente. Suponiendo que ambos actúan de modo independiente, cuál de las dos siguientes estrategias utilizaría para curar a un individuo con tal enfermedad: a) Aplicar ambos tratamientos a la vez. 54 Manual del Alumno b) Aplicar primero el tratamiento B y, si no surte efecto, aplicar el A. 5. Se eligen al azar 3 deportistas de un equipo de 10 integrantes para realizar un control antidopaje; Se sabe que 2 de los jugadores del equipo han tomado sustancias prohibidas. ¿Cuál es la probabilidad de elegir para el análisis a alguno de los infractores? 6. Estamos interesados en saber cuál de dos análisis A y B es mejor para el diagnóstico de una determinada enfermedad, de la cual sabemos que la presentan un 10% de individuos de la población. El porcentaje de resultados falsos positivos del análisis A es del 15% y el de B es del 22%. El porcentaje de falsos negativos de A es del 7% y de B es del 3%. ¿Cuál es la probabilidad de acertar en el diagnóstico con cada método? 7. Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal técnica tiene una sensibilidad del 91% y una especificidad del 98%. En la población que nos ocupa la probabilidad de colelitiasis es del 20%. a) Si a un individuo de tal población se le aplican los ultrasonidos y dan positivos, ¿cuál es la probabilidad de que sufra la colelitiasis? b) Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la enfermedad? 8. Entre los estudiantes de una Facultad de Filosofía y Letras se dan las siguientes proporciones: el 40% son hombres. El 70% de los varones fuman, mientras que entre las mujeres sólo fuman el 20%. Escogido un estudiante al azar, calcúlese la probabilidad de que fume. 9. Los estudios epidemiológicos indican que el 20% de los ancianos sufren un deterioro neuropsicológico. Sabemos que la tomografía axial 55 Manual del Alumno computerizada (TAC) es capaz de detectar este trastorno en el 80% de los que lo sufren, pero que también da un 3% de falsos positivos entre personas sanas. Si tomamos un anciano al azar y da positivo en el TAC, ¿cuál es la probabilidad de que esté realmente enfermo? 10. Sabemos que tiene estudios superiores el 15% de la población española, estudios medios el 40%, estudios primarios el 35% y no tiene estudios el 10%. Los desempleados no se distribuyen proporcionalmente entre esas categorías, dado que de entre los de estudios superiores están sin trabajo el 10%, entre los de estudios medios el 35%, entre los de estudios primarios el 18%, y entre los que no tienen estudios el 37%. Obtenga las probabilidades de que extraído uno al azar, éste sea: a) Titulado superior, sabiendo que está parado. b) Un sujeto sin estudios que está en paro. c) Un sujeto con estudios primarios o que está trabajando. 11. Una enfermedad puede estar producida por tres virus A, B, y C. En el laboratorio hay 3 tubos de ensayo con el virus A, 2 tubos con el virus B y 5 tubos con el virus C. La probabilidad de que el virus A produzca la enfermedad es de 1/3, que la produzca B es de 2/3 y que la produzca el virus C es de 1/7. Se inocula un virus a un animal y contrae la enfermedad. ¿Cuál es la probabilidad de que el virus que se inocule sea el C? 12. El 70% de los estudiantes aprueba una asignatura A y un 60% aprueba otra asignatura B. Sabemos, además, que un 35% del total aprueba ambas. Elegido un estudiante al azar, calcular las probabilidades de las siguientes situaciones: a) Haya aprobado la asignatura B, sabiendo que ha aprobado la A. 56 Manual del Alumno b) Haya aprobado la asignatura B, sabiendo que no ha aprobado la A. c) No haya aprobado la asignatura B, sabiendo que ha aprobado la A. d) No haya aprobado la asignatura B, sabiendo que no ha aprobado la A. 13. La cuarta parte de los conductores de coche son mujeres. La probabilidad de que una mujer sufra un accidente en un año es de 5/10.000, y para los hombres es de 1/10.000. Calcúlese la probabilidad de que si acaece un accidente, el accidentado sea hombre. 14. En un campus universitario existen 3 carreras sanitarias. Se sabe que el 50% cursan estudios de Enfermería, el 30% Medicina y el 20% Veterinaria. Los que finalizaron sus estudios son el 20, 10 y 5% respectivamente. Elegido un estudiante al azar, hállese la probabilidad de que haya acabado la carrera. 57 Manual del Alumno SESION 13 VARIABLE ALEATORIA Frecuentemente el resultado de un experimento aleatorio se denota con un número: el resultado de lanzar un dado, el número de unidades defectuosas entre 10 unidades seleccionadas, el tiempo que hay que esperar para que se presente una falla en un circuito, el número de estaciones de una red de computadoras que requieren la atención del servidor de la red en un momento dado, el número de personas en una comunidad que requieren atención médica en un día especificado, el peso sumado de las personas que están en un elevador en un momento determinado del día, la cantidad en dinero de lo transportado en un camión antes de que sufra una descompostura, etc. A un número tal, le llamamos variable aleatoria. Ponga atención al hecho de que una variable aleatoria no es una variable en el sentido usual. Las variables que estamos acostumbrados a manejar son, por ejemplo: el peso de un cohete que va quemando el combustible que lo impulsa, la distancia del piso a un objeto que cae hacia él, la concentración de una solución dentro de un tanque conforme pasa el tiempo, etc. En los ejemplos anteriores el valor de la variable puede cambiar con el tiempo, pero es 58 Manual del Alumno predecible a partir de las leyes de la mecánica, la química, la hidráulica o alguna otra ciencia. Con una variable aleatoria la situación es enteramente diferente. El valor de una variable aleatoria no se puede conocer con exactitud de antemano a la realización del experimento. ¿Qué otros ejemplos de variables aleatorias se le ocurren además de los mencionados arriba? Al contestar esta pregunta tenga en cuenta que el azar debe jugar algún papel en la medición de la variable y que su valor no debe ser predecible. Una variable aleatoria presenta dos características importantes: 1. Una colección (conjunto) de valores posibles al que llamamos imagen de la variable aleatoria (antes lo llamábamos espacio muestral). 2. Una probabilidad asociada a los posibles resultados la cual queda expresada mediante una función de probabilidad. Las variables aleatorias que tienen un conjunto de posibles valores discreto, se llaman discretas. Estas variables son el resultado de contar . ¿Cuáles de las variables aleatorias mencionadas arriba son discretas? Ciertamente el peso de las personas en el elevador no es discreto, pero entre las otras ¿cuáles son discretas? Por otra parte, las variables aleatorias cuyos valores posibles se encuentran en cualquier parte de un intervalo, se llaman continuas. Estas variables son el resultado de medir. El hecho de que una variable aleatoria nos interesa cuando aún no tiene un valor específico, nos obliga a utilizar una notación extraña al referirnos a ella. Denotamos con letras mayúsculas a las variables aleatorias y con minúsculas a los valores que contemplamos para ellas. 59 Manual del Alumno Si tomamos como variable aleatoria el resultado (suma) de lanzar dos dados, desde el punto de vista de la probabilidad, el número resultante nos interesa antes de que realicemos el experimento. Conocido el resultado, ya no es interesante (al menos, no para la probabilidad). La imagen de esta variable aleatoria es S = { 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 }. Llamando X al resultado del experimento, podemos contemplar el evento de que X sea igual a x, donde x es cualquier elemento de S. Claro que nos resultará muy interesante saber cosas como P(X = x) para los diferentes valores de x en S; por ejemplo, P(X = 6) = 5/36 [esto se lee: ``la probabilidad de que X sea igual a seis es un sexto'']. ¿Puede Ud. mostrar que P(X = 8) = 5/36 ? Siguiendo con el ejemplo de los dos dados, el lanzar dados para ver que número cae no es muy apasionante que digamos, acompañemos los dados con un tablero de oca o de serpientes y escaleras o de turista o de back gamón o algún otro juego interesante. Ya puestos a jugar turista o monopolio, es natural que nos interesen otro tipo de eventos. Podríamos estar interesados en saber si el resultado es menor que 8: P(X < 8) = 21/36 ¿Puede Ud. ver por qué?; que el resultado sea desde 4 hasta menos que 9: P(3 < X < 9) = 23/36 ¿Por qué?; también podemos estar interesados en que X sea distinta de 7: P(X distinto de 7) = 1 - P(X = 7) = 1 - 1/6 = 5/6. Naturalmente esta notación se extiende de manera natural a todo tipo de intervalos y desigualdades. Regresando a donde estábamos, 60 Manual del Alumno A la función: f(x) = P(X = x) se le llama función de probabilidad de X. Esta función es una función ordinaria de las que estudiamos en los cursos de matemáticas; no tiene nada de aleatorio. Dicho de otra forma, una vez determinados los valores de las probabilidades, la función de probabilidad es una función común y corriente, tiene su dominio, su codominio, su gráfica, puede ser inyectiva, etc. Hay algunos hechos importantes respecto a esta función: 1. Para una variable aleatoria discreta los valores posibles son los únicos para los cuales esta probabilidad es diferente de cero. Dicho de otra forma, no nos hace daño ampliar el dominio de la función de probabilidad a todos los reales, pero va a valer cero casi siempre excepto en un conjunto discreto de puntos. 2. El valor de la función de probabilidad depende esencialmente de la variable aleatoria a la que nos referimos, cuando no sea claro a cuál variable nos referimos, es conveniente poner el símbolo de la variable como subíndice para la función: f X(x). Esta costumbre puede causar estragos en la comprensión de los novatos, esté Ud. prevenido. ¿Qué querrá decir f Y(w)? 3. La gráfica de una función como ésta se presenta en el pizarrón. Regresando al ejemplo de los dados, cambiemos el turista por otro juego. En este juego Ud. gana si el resultado es par y pierde si es n ó n; la cantidad que pierde o gana será el doble del resultado. Aquí, su ganancia (positiva si Ud. gana, negativa si pierde) es una variable aleatoria Y, su imagen es S = {-22, -18, -14, -10, -6, 4, 8, 12, 16, 20, 24} >Puede Ud. terminar la tabla de la función de probabilidad de Y?: 61 Manual del Alumno Y -22 -18 -14 -10 -6 4 8 12 16 20 24 f(y) Una vez que haya llenado la tabla anterior, calcule la probabilidad de que gane Ud. más de 8 pesos; la probabilidad de que pierda más de 10 pesos; la probabilidad de que su ganancia esté entre -10 y +16 inclusive; la probabilidad de que su ganancia o pérdida exceda a 9 pesos. Una función de probabilidad de una variable aleatoria discreta, para ser correcta, debe satisfacer dos propiedades f(x) debe ser siempre mayor o igual a 0 la suma de f(x) para todos los valores de x debe dar 1 . Función de Distribución. Cuando la imagen de una variable aleatoria es un intervalo real decimos, según habíamos quedado, que la variable es continua. La matemática que utilizamos para las variables continuas es diferente a la de las discretas Por eso empezamos nuestro estudio con las discretas. Aún no acabamos con las variables discretas, todavía nos faltan por discutir temas muy importantes. Pero antes, hablaremos de una noción que es común a las discretas y a las continuas. Una función muy útil en el cálculo de probabilidades de una v. a. es la función de distribución. Esta función se define de igual forma para continuas y discretas: F (x) = P(X <= x) Vea bien la definición anterior y apréndasela de memoria. Coja una hoja de papel en blanco y escríbala. 62 Manual del Alumno Para no confundirnos con la notación, suele escribirse también así: F (t) = P(X <= t) La función de distribución tiene las siguientes propiedades: 1. F(en menos infinito) = 0 ; F(en más infinito) = 1 2. F es una función no decreciente. 3. F sirve para calcular probabilidades así P( a < X <= b ) = F(b) - F(a) Para que esta última propiedad nos sea de utilidad deberíamos tener la distribución ya calculada. Para muchas variables aleatorias de uso común, las distribuciones ya están calculadas y tabuladas (una hoja de cálculo, como Excel ya incluye prácticamente todas las distribuciones que veremos en este curso). Para las variables aleatorias discretas hay que tener cuidado con el hecho de que la primera desigualdad es estricta y la segunda no. Por ejemplo si la imagen de X son todos los enteros, P(2 < X <= 5) se puede calcular haciendo la resta F(5)-F(2). Pero la probabilidad P(2 < X < 5) se obtiene restando F(5)- F(1) (¿Por qué?). ¿Cómo calcula Ud. P(2 <= X < 5)? Las 4 propiedades que se señalaron arriba definen a una función de distribución, de modo que para saber si una función es una distribución o no, basta ver que las cumpla. Considere el siguiente ejemplo. F (x) = 1 - exp. (- 0.7 x ) para x > 0 Se trata de una variable aleatoria continua, cuya imagen son los números positivos(¿Por qué?). Lo que Ud. tiene que hacer es: Mostrar que es una distribución y 63 Manual del Alumno usarla para calcular P( X >= 1.0), P( 0.7 < X < 1.0), P(X < 0.7), P( X > 1.0 ó X <= 0.4 ). En el pizarrón hacemos ejemplos de cómo es la forma matemática de una función de distribución y de su gráfica. variables Aleatorias Continuas Las variables aleatorias que hemos estudiado hasta ahora tienen la propiedad de que son el resultado de contar; sus valores posibles varían en forma discreta (a saltos). Hay otro tipo de variables aleatorias, las que son el resultado de un proceso de medir; sus valores posibles cubren todo un intervalo en los reales. Cuando la imagen de una variable aleatoria es un intervalo real decimos que la variable es continua. La matemática que utilizamos para las variables continuas es diferente a la de las discretas aunque los conceptos probabilísticos sean los mismos de manera que en nuestro estudio de las continuas utilizaremos este paralelo con las discretas. Densidad de una variable aleatoria continua El primer hecho de importancia es que una v. a. (variable aleatoria) continua tiene probabilidad cero de tomar un valor específico, sólo tiene valores positivos para intervalos: P( X = a ) = 0 para cualquier valor de a Para calcular la probabilidad de que X esté en un intervalo (a,b) o (a,b] o [a,b) o [a,b] debemos hacer uso de una función asociada a la variable 64 Manual del Alumno aleatoria, la función de densidad de X. Las variables aleatorias discretas tienen la función de probabilidad, las continuas tienen función de densidad. Esta función de densidad tiene las siguientes características: f(x) >= 0 la integral de f(x) vale 1 La integral a la que nos referimos es la integral definida sobre toda la imagen de la variable aleatoria. Note que estas características son el análogo continuo de las de la función de probabilidad de una v. a. discreta. Es decir la probabilidad nunca es negativa y la suma de todas las probabilidades es uno. Por este motivo, es frecuente utilizar el nombre de densidad tanto para esta función como para la función de probabilidad de una v. a. discreta. Además, como en el caso discreto, la función de densidad está ligada a la v. a. X de modo que cuando sea necesario aclarar a cuál densidad nos referimos podemos usar la notación fX(x), poniéndole el subíndice X a la f. Cálculo de Probabilidades con la densidad. Para obtener la probabilidad de un intervalo, hacemos la integral de la densidad sobre el intervalo del que queremos calcular la probabilidad. De nuevo, la integral a la que nos referimos es una integral definida cuyos extremos son los del intervalo. Escriba la integral que da la probabilidad de que X esté entre 3 y 44.2 Escriba en forma de integrales las siguientes: P(a < X < a + h), P( 2.2 < X <= 5 ), 65 Manual del Alumno P( X > 8 ), P( X <= 15 ), P( X < 2 ó X > 3) Considere un par de ejemplos que le servirán para apreciar las implicaciones de lo anterior. Como primer ejemplo tome el siguiente. Sea X una v. a. continua cuya densidad es: f(x) = a x para x en [ 3, 7] a es una constante necesaria para que la integral de f(x) definida de 3 a 7, sea igual a uno. Muestre que a = 1/20 = 0.05, además muestre que P( 3 < X <= 5 ) = 0.40 Otro ejemplo más es el siguiente. La densidad es: f(x)= o 0.025x para x en (3,7) o k x2 si x está en [7,10) o 0 en cualquier otra parte muestre que k = 1/438 y muestre también que P(6 <= X <= 8) = 0.3155 Distribución de una variable aleatoria continua Una función muy útil en el cálculo de probabilidades de una v. a. continua es la función de distribución. Esta función se define de igual forma para continuas y discretas: F (x) = P(X <= x) 66 Manual del Alumno Para no confundir la notación, suele escribirse también así: F (t) = P(X <= t) En el caso de una v.a. continua la derivada de la distribución es la densidad: f(x) = F '(x) En los dos ejemplos anteriores calcule las funciones de distribución correspondientes. La función de distribución tiene las siguientes propiedades: 1. F(menos infinito) = 0; F(mas infinito) = 1 2. F es una función no decreciente. 3. F sirve para calcular probabilidades así P( a < X <= b ) = F(b) - F(a) En esta última propiedad, si se trata de una v.a. continua no importa si las desigualdades son estrictas o no. En el caso de la v.a. discreta es muy importante que la primera desigualdad sea estricta y la segunda nó. Estas propiedades se deducen de la definición de la distribución. Estas propiedades caracterizan a la distribución de modo que para saber si una función es una distribución o nó, basta ver que las cumpla. Considere el siguiente ejemplo. F (x) = 1- exp (- 0.7 x ); para x > 0 muestre que es una distribución y úsela para calcular P( X >= 1.0), P( 0.7 < X < 1.0), P(X < 0.7), P( X > 1.0 ó X >= 0.4 ). En el pizarrón hacemos ejemplos de cómo es la forma matemática de una función de distribución y de su gráfica. Valores Esperados. 67 Manual del Alumno Hay un par de cantidades importantes asociadas con cada variable aleatoria: el valor esperado, esperanza matemática o simplemente esperanza o media. la varianza y su raíz cuadrada, la desviación estándar. Ambas cantidades se definen en base a un operador que llamamos el operador esperanza. Matemáticamente la esperanza se define así, para una v.a. discreta E( g(X) ) = suma { g(i) f(i) } donde g(i) es cualquier función y f(i) es la función de probabilidad de la v.a.; f(i) = P(X = i). Por ejemplo, Si la función g es g(t)=52t, E(52X) = suma{52i f(i)} = 52 suma{i f(i)} = 52 E(X) Si la función g es g(t)= (t-4)2, su esperanza es [X - 4]2 suma{i2f(i)} - suma{8if(i)} E( E(X2) ) = + suma{[i-4]2f(i)} = suma{16f(i)} = - 8E(X) + 16 Y si g es g(t)= t/ 28 E( X/ 28) = suma{i/ 28 f(i)} = 1/28 suma{i f(i)} = = (1/ 28) E(X) = E(X)/ 28 Utilizando el operador esperanza, definimos para cualquier v.a. discreta X : 68 Manual del Alumno 1. El valor esperado de X es E(X). 2. La varianza de X es var(X) = E( [X - E(X)]2). Ejemplo. Ejemplos: si X es una v.a. continua cuya función de probabilidad es X 1 2 3 4 5 6 f(x) 1/21 2/21 3/21 4/21 5/21 6/21 E(X) = 13 / 3 (detalles en el pizarrón) y var(X) = 20 / 9 así la desv.est.(X) = 1.4907. Propiedades Aritméticas. Las definiciones matemáticas de valor esperado y varianza, nos dicen cómo calcular estas cantidades. Como operaciones matemáticas, tienen algunas propiedades que vale la pena resaltar, porque a veces simplifican algunas cuentas E(c) = c E(c g(X)) = c E(g(X)) la esperanza de una constante es la misma constante una constante multiplicando se puede sacar de la esperanza. E(g(X) + h(X)) = E(g(X)) + E(h(X)) la esperanza de una suma es la suma de las esperanzas. Las anteriores propiedades son muy parecidas a las de la integral. Ahora tenemos algunas propiedades de la varianza. var(X) = E(X2) - [E(X)]2 esta propiedad es muy útil para calcular, y podemos tomarla como definición de la varianza. var(aX) = a2var(X) una constante multiplicando se saca de la varianza elevándola al cuadrado. var( c ) = 0 la varianza de una constante es cero. 69 Manual del Alumno La varianza de una suma en general no es igual a la suma de las varianzas. Según veremos después, la igualdad se cumple sólo cuando las variables son independientes. Como un ejemplo de estas propiedades, veamos la razón de la fórmula var(X) = E(X2) - [E(X)]2. De acuerdo a la definición var(X) E[X2 = = = E([X-E(X)]2) = E( E( - 2XE(X) X 2) X2) - + E(2XE(X)) 2E(X) E(X) + E(X)2] = E(E(X)2) = E(X)2 = + = E( X2) - E(X)2 haciendo las operaciones y, juntando los dos extremos, se tiene: var(X) = E(X2) - [E(X)]2 SESION 14 DESIGUALDAD DE TCHEBYSHEV Si conocemos la distribución de probabilidad de una variable aleatoria X ( la función de densidad en el caso continuo, la función de probabilidad en el caso discreto ) hemos visto que podemos determinar μ y σ 2 (media y varianza) , si existen. Pero lo reciproco no es cierto es decir, conociendo la media (μ) y la varianza (σ 2)no podemos determinar la distribución de probabilidad de X. Sin embargo se puede dar una cota superior (o inferior) para probabilidad del tipo: P[IX-uI ≥ kσ ], este resultado se conoce con el nombre de la desigualdad de tchebyshev. 70 Manual del Alumno Teorema (De Tchebyshev) Si la variable aleatoria X tiene media (μ) y varianza(σ2) finita, entonces para cualquier K > 1 , se cumple: P[IX-μI ≥ k σ] ≤ 1 k2 La cual indica que la probabilidad que X tome algún valor fuera del intervalo : < μ – k σ , μ + k σ > es a lo más 1 k2 Consecuencias: a) Si ε = k σ se tiene : P[IX-uI ≥ ε ] ≤ b) Puesto que { IX- μ 2 2 I ≥ kσ } y { IX- μ I < kσ } son eventos complementarios, entonces se cumple que: P[ IX- μ I ≥ kσ ] ≥ 1 - 1 k2 Indica que la probabilidad de que X tome valores dentro del intervalo < μ – k σ , μ + k σ >es por lo menos 1 - 1 k2 Ejemplo de Aplicación: Sea X una variable aleatoria con media 33 y varianza 16 . Hallar una cota inferior para : P [ 23 < X < 43 ] Solución: 71 Manual del Alumno P [ 23 < X < 43 ] = P [ 23 - 33 < X - 33 < 43 - 33 ] = P [ - 10 < X – 33 < 10 ] = P [ IX- μ I < 10 ] y σ = 4 , entonces k = 5/2 . Observe que: 10 = kσ Luego: P [ 23 < X < 43 ] = P [ IX- μ I < (5/2) (4) ] ≥ 1 - Por lo tanto: P [ 23 < X < 43 ] ≥ 1 (5 / 2) 2 21 25 Problemas propuestos: 1. Sea X una variable aleatoria con media μ =2 y varianza σ2 = 1. use la desigualdad de tchebyshev para hallar una cota inferior para : P [ IX- 2 I < 4 ] a) b) P [ - 3 < X < 7 ] 2. Sea X una variable aleatoria con media μ = 10 y varianza σ2 = 4 Hallar : a) P [ IX- 10 I ≥ 3 ] b) P [ IX- 10 I < 3 ] c) P [ 5 < X < 15 ] 3. Con los datos del problema anterior determine el valor de “c” tal que: P [ IX- 10 I ≥ c ] ≤ 0.04 72 Manual del Alumno DISTRIBUCIONES DISCRETAS Modelos Especiales. Hay algunas variables aleatorias discretas que se usan muy frecuentemente en una gran cantidad de aplicaciones. Estos modelos reciben nombres especiales, que se utilizan en todo el mundo. Los modelos principales que estudiamos son: el binomial, el hipergeométrico y el de Poisson. Estudiaremos cada una por turno DISTRIBUCIÓN BINOMIAL Se tiene un número fijo de pruebas n. Con las siguientes características: Cada prueba tiene sólo dos posibles resultados: genéricamente los llamamos éxito y fracaso. Los denotamos con 1 (éxito) y 0 (fracaso). El resultado de cada prueba es independiente del resultado de las demás pruebas. La probabilidad de éxito no cambia de una prueba a otra. Nos interesa sólo el número total de éxitos X y no el orden en que hayan ocurrido. Cuando se cumplen las condiciones anteriores X tiene la distribución binomial con parámetros n y p, donde n es el número de intentos y p la probabilidad de obtener un éxito. Los valores posibles son desde cero hasta ene: { 0, 1, 2, ... , n }. La función de probabilidad es: f(k) = P(X=k) = nCk pkq(n-k), para k en {0,1,2,...,n} 73 Manual del Alumno donde me he visto obligado por la tipografía, a usar el símbolo poco usual nCk para denotar las combinaciones de k objetos tomados de un total de n: nCk = [n!] / [k!(n-k)!] además, la letra q representa la probabilidad de fracaso q = 1-p. La media de la binomial es: E(X) = np y la varianza: var(X) = npq. ¿Dónde se aplica el modelo binomial?: 1. ¿En una familia de tres hijos, cuál es la probabilidad de que a lo más 2 sean niñas? La probabilidad de niña es 0.5; el sexo de cada hijo es independiente del de los demás; n=3 y p=0.5. P(X <= = 2) = 0.125 P(X=0) + + P(X=1) 3(0.125) + + P(X=2) 3(0.125) = 0.875 o bien. P(X <= 2) = 1 - P(X=3) = 1 - 0.125 = 0.875 2. Se extraen 4 canicas CON REEMPLAZO de una urna que tiene 5 blancas y 3 negras. ¿Cuál es la probabilidad de que salgan menos de 2 blancas? Como la elección se hace con reemplazo, se cumplen los requisitos de un experimento binomial. X es el número de canicas blancas, n = 4 y p = 5/8 = 0.625. La probabilidad que necesitamos es P(X < 2) y ésta es igual a: P(X = < 2) 0.3754 = P(X=0) + + P(X=1) (4)(0.625)(0.375)3 = 0.1516 3. De un lote con 1,000 artículos de los cuales el 10% son defectuosos, se escogen al azar 10. ¿Cuál es la probabilidad de que haya más de 2 defectuosos? Aunque el muestreo se hace sin 74 Manual del Alumno reemplazo, por la gran cantidad de artículos que hay en el lote comparados con los que se escogen, suponemos que son válidos los supuestos del modelo binomial. X es el número de artículos defectuosos y la probabilidad que se nos pide es: P(X > 2). Como el cálculo de las 8 probabilidades necesarias es muy latoso, notemos que P(X > 2) = 1 - P(X <= 2). Aún así, hagamos esta cuenta consultando la tabla de la binomial adecuada: n = 10, p = 0.10. La tabla dice que P(X <= 2) = 0.9298. Por tanto, la probabilidad buscada es P(X > 2) = 0.0702 [Vea su tabla y descubra este valor]. Claro que también tenemos la posibilidad de calcular P(X <= 2) y restarla de uno. P(X <= = (.9)10 2) = + P(X=0) + (10)(.1)(.9)9 P(X=1) + + P(X=2) (45)(.1)2(.9)8 = 0.9298 Distribución de Bernoulli. Este modelo se llama así en honor del probabilista de este apellido. A la binomial cuando n = 1 se le llama Bernoulli. Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso: Cuando es acierto la variable toma el valor 1 Cuando es fracaso la variable toma el valor 0 Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas) 75 Manual del Alumno Al haber únicamente dos soluciones se trata de sucesos complementarios: A la probabilidad de éxito se le denomina "p" A la probabilidad de fracaso se le denomina "q" Verificándose que: p+q=1 Veamos los ejemplos anteriores : Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire: Probabilidad de que salga cara: p = 0,5 Probabilidad de que no salga cara: q = 0,5 p + q = 0,5 + 0,5 = 1 Ejemplo 2: Probabilidad de ser admitido en la universidad: Probabilidad de ser admitido: p = 0,25 Probabilidad de no ser admitido: q = 0,75 p + q = 0,25 + 0,75 = 1 Ejemplo 3: Probabilidad de acertar una quiniela: Probabilidad de acertar: p = 0,00001 Probabilidad de no acertar: q = 0,99999 p + q = 0,00001 + 0,99999 = 1 Distribución Hipergeométrica 76 Manual del Alumno Se tiene un grupo de N objetos de los cuales k son éxitos y el resto,(N-k), son fracasos. Se seleccionan n de los N, SIN REEMPLAZO. La v.a. X que nos interesa es el número total de éxitos entre los n seleccionados y no el orden en que salieron. En estas condiciones la v.a. X tiene la distribución hipergeométrica. Su imagen es {0,1,...,n}. La función de probabilidad está dada por: P(X=x) = [ kC x (N-k)C(n-x) ] / [ NCn ]; para x en { 0,1,...,n } La media es: E(X) = nk/N y la varianza: var(X) = [N-n]/[N-1] n (1-k/N) k/N ¿Dónde se aplica? 1. En situaciones de muestreo sin reemplazo en que la muestra es un porcentaje considerable de la población. Como ejemplo, de un lote de 40 artículos se seleccionan al azar 4 para probarlos y si fallan la prueba más de 2 se rechaza el lote completo. ¿Cuál es la probabilidad de rechazar un lote que tenga 8 defectuosos? Dado que el muestreo se hace sin reemplazo y la fracción de muestreo es grande (10%) tenemos una v.a. hipergeométrica. Los parámetros son: N=40, k=8, n=4, X es el número de defectuosos en la muestra y queremos la probabilidad P(X > 2) = P(X=3) + P(X=4) = 1792/91390 + 70/91390 = 0.0204 ésta es la probabilidad de rechazar un lote con 25% de defectuosos y es muy baja. Para mejorar el proceso de selección, los ingenieros deciden rechazar el lote cuando haya 2 o más defectuosos. ¿Cuál es la probabilidad de rechazar un lote que tenga 8 defectuosos? Los parámetros permanecen iguales lo que cambia es la probabilidad, ahora es P(X >= 2) = P(X=2) + P(X>2) = 0.1520 + 0.0204 = 0.1724 77 Manual del Alumno Con esta nueva política de rechazar el lote cuando sean 2 o más, ¿cuál es la probabilidad de rechazar un lote con 6 defectuosos? Los parámetros son, ahora, N=40, k=6, n=4 y queremos la probabilidad: P(X = > 10) 1 - = 1 [46376/ 91390 [P(X=0) + + P(X=1)] 35904/ 91390] = 0.0997 2. En el salón de tercer año de una escuela hay 35 alumnos, de los cuales 10 son niñas y 25 niños. Se nombra un comité de 7 alumnos que represente al salón. La selección se hace al azar. ¿Qué probabilidad hay de que en el comité haya mayoría de niñas? En esta situación se cumplen las hipótesis de una hipergeométrica. Los parámetros son: N=35, k=10, n=7, X es el número de niñas en el comité. La probabilidad pedida es: P(X > 3) = P(X=4) + P(X=5) + P(X=6) + P(X=7) = 0.0839 Problemas Propuestos: 1. La probabilidad que en cierto establecimiento industrial el consumo de energía eléctrica sea normal en 24 horas es igual a ¾. Determinar la distribución de probabilidad del número de días de consumo normal de energía eléctrica en un lapso de 6 días; represente en un diagrama esta distribución . determine además cuál es la probabilidad que haya 4 días de consumo normal? 78 Manual del Alumno 2. Se lanza un dado 4 veces cuál es la probabilidad que la suma 9 aparezca exactamente 2 veces. 3. Una máquina produce cierto tipo de piezas , de las cuales un promedio de 5% son defectuosas . En una muestra aleatoria de cinco piezas . ¿cuál es la probabilidad de obtener : a) Exactamente una pieza defectuosa. b) Por lo menos una pieza defectuosa. 4. La probabilidad de fallar durante el vuelo para cada uno de los 6 motores de un avión es 0.0005 . Suponiendo que los 6 motores trabajan independientes, determine la probabilidad que en un vuelo determinado : a) no ocurra ninguna falla de motor. b) No ocurra más de una falla. c) Ocurra exactamente 2 fallas. 5. Suponga que los motores de un avión de cierta marca que operan independientemente , tienen una probabilidad de falla de 0.1 . suponga que un avión efectúa un vuelo exitoso , si al menos la mitad de sus motores operan normalmente , determine cuál avión , una con 4 motores y otro con 6 motores , tiene mayor probabilidad de efectuar un vuelo exitoso. 6. Suponga que la máquina A produce el doble de artículos que la máquina B . Se sabe que el 6% de los artículos que produce la máquina A son defectuosos mientras que el 3% de los artículos que produce la máquina B son defectuosos . Suponga que se junta la producción diaria de estas máquinas 79 Manual del Alumno y se toma una muestra aleatoria de 10 artículos. Cuál es la probabilidad de obtener 3 artículos defectuosos. 7. Un examen consta de 20 preguntas , cada una tiene 5 respuestas, de las cuales sólo una es correcta . Un estudiante que desconoce el curso responde el examen al azar. a) Cuál es la probabilidad que acierte mas de 10 respuestas correctas? b) Cuál es la probabilidad que acierte mas de 15 respuestas correctas? 8. Se sabe que la probabilidad de que germine una sola semilla de cierta clase es 0.9 . un agricultor quiere vender cultivos de esta planta, para lo cuál asevera que cada uno contiene 100 plantas . Si siembra 110 semillas en cada cultivo ( que se suponen germinarán en forma independientes ) ¿cuántas plantas se puede esperar que contenga un cultivo promedio? SESION 15 DISTRIBUCIÓN DE POISSON Este modelo se llama así para honrar la memoria de otro gran probabilista y matemático. La v.a. de Poisson se refiere a sucesos en un intervalo de tiempo o en una área específica. El intervalo de tiempo puede ser de cualquier duración, un minuto, una hora, un día, un año. Algunos ejemplos de situaciones modeladas con el modelo de Poisson son: el número de fallas de una máquina en una semana, el número juegos de algún deporte pospuestos por lluvia en una temporada. 80 Manual del Alumno Cuando se trata de superficies, los ejemplos son: el número de ratas en un terreno, el número de errores de mecanografía por página, el número de defectos por centímetro cuadrado. Para que una v.a. sea de Poisson, se requiere que se satisfagan 3 hipótesis (que suelen llamarse también postulados del proceso de Poisson). En los problemas que resolvemos en este curso, el hecho de que el modelo a utilizar sea el de Poisson, forma parte del enunciado del problema. La v.a. de Poisson tiene un solo parámetro que es mu = lambda.t ;donde t es la longitud del intervalo o la superficie de la región y lambda es la tasa de ocurrencia de eventos por unidad de medida. La imagen de la v.a. de Poisson es {0, 1, 2, . . . } es decir todos los enteros no negativos. La función de probabilidad esta dada por: P(X = k) = exp(-mu)[mu(k) / k!]; k = 0, 1, 2, . . . La media es E(X) = mu y la varianza es var(X) = mu. ¿Dónde de aplica la v.a. de Poisson? 1. Si el promedio de llamadas por día hábil (de ocho horas) que se reciben en un banco es 96. ¿Cuál es la probabilidad de que en una hora se reciban exactamente 14? Aquí, mu = 12 y P(X = 14) = e(-12)[12(14) / 14!] = 0.0905 En la misma situación ¿Cuál es la probabilidad de tener más de 16 llamadas en una hora? Ahora queremos: P(X > 16) = 1 - P(X <= 16) 81 Manual del Alumno esta última probabilidad la leemos en la tabla de Poisson y tenemos: P(X > 16) = 1 - 0.8987 = 0.1013 2. Una aplicación muy importante de la probabilidad de Poisson se da para aproximar la binomial. Esta aproximación funciona bajo las siguientes circunstancias. o La v.a. X cuyas probabilidades se quieren es binomial. o La n es muy grande (n >= 20) y o La p es muy pequeña (p <= 0.05). o De modo que, aproximadamente np < 5 En estas condiciones: P(X = k) aproximadamente es exp(-mu)[mu(k) / k!] donde mu = np Ejemplo. En una cierta comunidad la probabilidad de que una persona infectada por neumonía muera es 0.002. ¿Cuál es la probabilidad de que mueran a lo más 5 de las siguientes 2000 personas infectadas? Aquí se dan las condiciones para la aproximación: n= 2000 y p = 0.002 de modo que mu = 4 y la probabilidad pedida se obtiene de la tabla como P(X >= 5) aproximadamente es 0.7851 3. Un mecanógrafo comete, en promedio, 2 errores por página. ¿Cuál es la probabilidad de que tenga más de 20 errores en un documento de 7 páginas? Aquí mu = 14 que es el número esperado de errores en el documento. La probabilidad buscada, usando la tabla es P(X > 20) = 1 - P(X <= 20) = 0.0479 82 Manual del Alumno Geométrica y Binomial Negativa. El modelo geométrico surge con la misma situación básica de la binomial: Se tiene una serie de pruebas. Con las siguientes características: Cada prueba tiene sólo dos posibles resultados: genéricamente los llamamos éxito y fracaso. Los denotamos con 1 (éxito) y 0 (fracaso). El resultado de cada prueba es independiente del resultado de las demás pruebas. La probabilidad de éxito no cambia de una prueba a otra. Fíjese que ahora no tenemos fijo el número de pruebas, sino que vamos a realizar las pruebas hasta obtener el primer éxito. La variable aleatoria que vamos a observar es el número total de pruebas realizadas. Por ejemplo, si tiramos volados hasta que salga la primera águila, el número total de volados necesarios será la variable aleatoria. Esta v. a. tiene como posibles valores {1, 2, 3, . . . }. La función de probabilidad es: P(X = k) = q(k-1)p; para k en {1,2,3, . . . } La media y la varianza son: E(X) = 1 / p y var(X) = (1-p) / p2. ¿Dónde se aplica el modelo geométrico? 1. En un canal de comunicación, un modem puede equivocar un carácter enviado con una probabilidad p=0.001. ¿Qué probabilidad hay de que transmita 300 caracteres sin error? Se aplica el modelo geométrico. La probabilidad que buscamos es P(X > 300). Para calcular esta probabilidad hay que encontrar el 83 Manual del Alumno valor de la serie suma desde 301 a infinito {q(k-1)p} . Esta serie da q300 = (0.99)300 = 0.049. En el mismo problema ¿Cuál es el promedio de caracteres sin error? La repuesta es E(X) = 1 / 0.001 = 1,000 2. En un proceso de manufactura se sabe que, en promedio, una de cada cien piezas es defectuosa. ¿Cuál es la probabilidad de que la quinta pieza seleccionada al azar sea la primera defectuosa? Aquí aplicamos el modelo geométrico con p=0.01. La probabilidad que requerimos es P(X = 5). De acuerdo a la fórmula ésta es: (0.99)4(0.01)=0.0096 La Binomial Negativa es el modelo que aplicamos cuando, en la misma situación que la geométrica, nos interesa el número de intentos necesarios para obtener el k-ésimo éxito. La imagen de esta variable aleatoria es: {k, k+1, k+2, . . . } La función de probabilidades es: P(X = m) = (m-1)C(k-1)p (k)q(m-k) <B para m en { k, k+1, k+2, . . . } ¿Dónde se aplica? 1. Una persona se entretiene lanzando al aire dos monedas, las recoge y las vuelve a lanzar, siempre lanzando las dos. ¿Cuál es la probabilidad de que las dos monedas caigan águilas ambas por tercera ocasión, en el sexto lanzamiento. Este es un problema binomial negativo (¡también parece un problema de ociosos!) donde éxito es que las dos monedas caigan ambas águilas. La probabilidad de que suceda esto, en un solo 84 Manual del Alumno intento es p = 0.25. Si X es el número de intento en que ambas sean águilas por tercera vez, X es binomial negativa con k=3. La probabilidad que se nos pide es P(X = 6) usando la fórmula, tenemos: 5C2(0.25) 3(0.75)3 = 0.0659 85 Manual del Alumno SESION 16 DISTRIBUCIONES CONTINUAS Modelos Uniforme y Exponencial. En las notas anteriores definimos el modelo exponencial (con media beta) y el modelo uniforme en el intervalo (0, 1). Sólo queda mencionar respecto a ellos sus usos más frecuentes. El modelo exponencial se usa para modelar tiempos de espera. Por ejemplo, el tiempo que un foco dura prendido hasta el momento en que se funde es una variable aleatoria ya que el foco se puede fundir en cualquier momento. La experiencia de las personas que se dedican al mantenimiento indica que este fenómeno se puede modelar bien con la densidad exponencial. Otro ejemplo es el tiempo entre llegadas de llamadas telefónicas a un conmutador. En este caso, la experiencia también indica que se puede modelar razonablemente bien este flujo de llamadas con la exponencial; en un rato del día que el conmutador esté muy ocupado (por ejemplo en las horas hábiles de una oficina), el promedio entre llegadas será pequeño (beta pequeño) mientras que cuando las llamadas están mas espaciadas beta será grande. El modelo uniforme se utiliza para modelar loterías. Si busco un número real entre 3 y 18 y quiero que la probabilidad se reparta por igual entre todos los números, utilizo una variable aleatoria uniforme U que sea 86 Manual del Alumno uniforme en el intervalo (0, 1) y la multiplico por 15 y al resultado le sumo 3; en fórmula: X = U * 15 + 3. Note que como el valor más pequeño para U es el 0, el valor más pequeño para X será 3. En el otro extremo, para U = 1, X será 18. [¿Cómo hace un número uniforme entre -15 y 45?]. Con la uniforme en el (0, 1) también es posible tener números uniformes discretos. Por ejemplo, si quiero un número que valga 1 ó 2 ó 3 con igual probabilidad, tomo un uniforme en el intervalo (0, 1); Si me toca U menor que 1/ 3, entonces toca el 1 Si U sale entre 1/ 3 y 2/ 3, entonces toca el 2 Si U es mayor que 2/ 3, entonces toca el 3. Es claro que con este mecanismo los tres valores: 1, 2 y 3 tienen la misma probabilidad. [¿Cómo hacemos un número que valga 1, 2, 3, . . . , 34 con la misma probabilidad a partir de un uniforme en el (0, 1)?] Las técnicas de simulación por computadora utilizan mucho los números uniformes en el intervalo (0, 1) como elementos básicos para construir modelos de colas en los bancos, procesos industriales, funcionamiento de redes de computadoras, procesos de espera, tráfico en andenes de ferrocarril, movimiento de mercancías en aduanas, etc. 87 Manual del Alumno LA DISTRIBUCION NORMAL. La Normal Estándar El modelo normal estándar es el de una variable aleatoria continua cuya imagen son todos los números reales. La densidad de la normal estándar es: f(z) = (2π)-1/2exp(-z2 / 2) Esta función no tiene una integral elemental de modo que se requiere una tabla especial para conocer los valores de la probabilidad de una variable normal. La tabla da probabilidades para F(t) = P(Z < t) La variable aleatoria normal estándar tiene propiedades importantes: La probabilidad está concentrada cerca de cero. Se puede ver, usando la tabla, que la probabilidad de un intervalo cercano a cero es mayor que la de un intervalo del mismo ancho pero alejado de cero. En el salón hacemos varios ejercicios de cálculo de probabilidades que nos convencen de este hecho. La probabilidad está simétricamente distribuida alrededor del cero. Haciendo cuentas con la misma tabla se ve que la F(a) + F(-a) = 1, para cualquier valor de a. Esto nos lleva a concluir la simetría de la distribución. Para algunos cálculos de probabilidad de una normal es conveniente considerar el eje real partido en cuatro pedazos, 1. antes de -a, 88 Manual del Alumno 2. entre -a y 0, 3. entre 0 y a, 4. después de a. Las probabilidades de (1) y (4) son iguales; las de (2) y (4) son iguales; las de (1) y (2) sumadas dan 0.5; las de (3) y (4) suman 0.5. Use la tabla para calcular: P(Z < 1.45), P(Z > -0.92), P(-0.53 < Z < 1.23). En la tarea tiene Ud. muchos ejercicios más de cálculo de diferentes probabilidades en el modelo normal. Esta variable aleatoria, debido a la forma de la densidad, tiene un valor central (el cero) que ``atrae'' los valores. La unidad de medida de esta variable es el uno. Usos de la normal. La normal no estándar En los casos en que este modelo se usa, generalmente: el valor central o promedio vale mu (distinto de cero) la unidad de medida o desviación estándar es sigma (distinta de uno). Para calcular en este caso no estándar, es preciso hacer una transformación que se llama estandarización. Esta estandarización es un codificación de los valores. La fórmula para estandarizar es: Z = (X - mu) / sigma La forma de usar esta codificación la ejemplificamos en el pizarrón y tiene Ud. abundantes ejercicios en la tarea. 89 Manual del Alumno En esta parte del curso calcularemos probabilidades suponiendo que el promedio y la desviación estándar nos son dados. En un problema real, estos valores se tendrán que obtener mediante observaciones a través del proceso de estimación. Modelos relacionados con la normal Los distribuciones relacionadas con la normal referidas en el objetivo 5.2 del temario: t, ji cuadrada y F, serán vistas posteriormente cuando tengamos necesidad de usarlas. Por el momento es muy importante que haga Ud. abundantes ejercicios con la normal. Ejemplo: Sea X una variable aleatoria N(5, 4) . a) ¿Cuál es la probabilidad de que X tome valores entre 4 y 7? b) ¿ Cuál es la probabilidad de que X tome valores mayores que 10.? Solución: a) P[ 4 < X < 7 ] = P [ 45 X < 2 < 75 ] 2 P[ -1/2 < Z < 1 ] = (1) (1 / 2) = 0.8413 – 0.3085 = 0.5328 b) P[ X > 10 ] = 1 - P[ X ≤ 10 ] =1-P[ X < 10 5 ] 2 = 1 - P[ Z < 5/2 ] = = 1 - ( 2 . 5) = 1 – 0.9938 = 0.0062 90 Manual del Alumno Problemas Propuestos. 1. Sea X una variable aleatoria con N( μ, 25 ) Calcular: P[ І X – μ І > 3 ] 2. Si X es una variable aleatoria con N( 650, 625 ). Hallar la constante “c > 0” tal que: P[ І X – 650 І < c ] = 0.9544 3. En una distribución normal se tienen los siguientes datos: P[ X < 45 ] = 0.31 P[ X > 64 ] = 0.08 Hallar la media y la desviación estándar de la distribución. 4. Una pequeña ciudad es abastecida de agua cada 2 días ; El consumo en volumen de agua para esa pequeña ciudad tiene una distribución normal con media 20000 litros y una desviación de 1000 litros ( se entiende el consumo cada 2 días ) . Se trata de hallar la capacidad de su tanque de agua para que sea de solo 0.01 , la probabilidad que en un periodo de dos días el agua no sea suficiente para toda la demanda. 5. Si la duración de los periodos de duración de los postes telefónicos de madera es tal que el 9.51% tienen un periodo de duración que exceden los 9 años, determine la desviación estándar de los periodos de duración periodos es normal. SESION 17 si se sabe que la distribución de dichos 91 Manual del Alumno TEOREMA CENTRAL DEL LÍMITE La distribución de probabilidad de una estadística Quizá el resultado mas importante para la estadística es el Teorema del Límite Central. Este resultado nos indica que, para la estadística promedio de la muestra el valor esperado es la media de la población. la varianza es igual a la de la población dividida por el número de elementos de la muestra. la distribución de probabilidad es la normal. Este teorema es muy importante porque permite calcular probabilidades acerca de dónde se encuentra el valor del promedio muestral. Es sólo cuestión de usar la tabla normal teniendo cuidado al estandarizar de usar la desviación estándar adecuada que es la de la población dividida por la raíz cuadrada del número de elementos de la muestra. En el salón hacemos en forma detallada, ejemplos de estos cálculos 92 Manual del Alumno En este applet, vemos nuevamente tiradas de dados. Sea X el numero que muestra un dado al ser tirado. El valor medio de los valores posibles de X es 3.5, y la varianza es 35/12 . Si Sn es el la suma de n dados tirados, entonces si n es ``grande'', la variable aleatoria Puede ser aproximada por una normal, luego Sn puede considerarse una normal de media 3.5*n y varianza 35n/12. La curva roja es el grafico de la función de densidad de una normal con esos parámetros. Problemas propuestos: 1. Un examen de tipo test contiene 100 preguntas, cada una con dos posibles respuestas (verdadera-falsa), de las que sólo una es cierta. Hacer uso de la aproximación normal para: a. Calcular la probabilidad de que un alumno consiga acertar 40 preguntas sorteando al azar las 100 respuestas. b. Calcular la probabilidad de que un alumno consiga acertar 70 preguntas cuando sabe la respuesta de 25 preguntas y sortea las respuestas de las otras 75. c. Determinar el número de preguntas que un alumno debe acertar para que el profesor asegure que con una probabilidad de 0.9 el alumno no ha sorteado todas las respuestas. 93 Manual del Alumno 2. En cierta población de animales, el 30% de los individuos tienen menos de un año de edad. Utiliza el Teorema Central del Límite para calcular la probabilidad de que en una muestra de 40 animales haya 10 de menos de un año 3. La variable aleatoria Yn es igual a la suma de los puntos que salen al realizar n lanzamientos independientes de un dado equilibrado. Utilizando el teorema central del límite, escoger n de modo que 4. Se selecciona una muestra de 10000 votantes. Definimos la variable aleatoria: Sea ¿Cuál es la probabilidad de que se diferencie de la proporción p de votantes afirmativos que hay en la población en menos de 0.01? 5. Un jugador va a jugar a cara o cruz 400 partidas, en cada una de las cuales, y con idéntica probabilidad, puede ganar o perder una 94 Manual del Alumno peseta. ¿Cuál es la mínima cantidad que debe llevar para que, supuesto que los pagos o cobros se hacen al final de la serie, tenga una probabilidad de 0.95 de hacer frente a sus posibles pérdidas? 6. Se toman 30 números reales elegidos al azar entre 10 y 20; cada uno de ellos sirve para formar un paralelepípedo de dimensión 30. Calcular el valor de a para que P(Volumen < a)=0.95 7. Supongamos que extraemos una muestra aleatoria simple de una población que se distribuye según una U[0,2]. Encontrar aproximadamente la probabilidad de que la media muestral es encuentre entre 0.8 y 1.1, si el tamaño de la muestra es 48. 8. Sea variables aleatorias independientes e idénticamente distribuidas con media 75 y varianza 225. a. Utilizar la desigualdad de Tchebichev para calcular la probabilidad de que la media muestral no difiera de la media poblacional en más de 6 unidades. b. Utilizar el Teorema Central de Límite para calcular la misma probabilidad. 9. Un individuo posee tres monedas idénticas externamente, pero en las que las probabilidades de obtener cara son diferentes e iguales a 0.8, 0.6 y 0.4. Las tres monedas son lanzadas simultáneamente 95 Manual del Alumno 100 veces.¿Cuál es la probabilidad de obtener más de 175 caras en los 100 lanzamientos? 10. En un cierto juego la probabilidad de ganar es 18/37. Supongamos que en cada juego se puede ganar 1 pts. o perder 1 pts.¿Cuántas veces hay que jugar para ganar al menos 1000 pts. con probabilidad 0.5? Las ganancias diarias de un jugador (en dólares) se distribuyen uniformemente en el intervalo (-40,50). ¿Cuál es la probabilidad de que el jugador gane más de 500 dólares en 60 días? 96 Manual del Alumno SESION 18 PRUEBAS DE HIPÓTESIS Introducción y Suposiciones Una hipótesis es una aseveración sobre algún atributo poblacional. Según Méndez (1973), una hipótesis es "Una suposición teórica que se acepta provisionalmente para explicar ciertos hechos". Aseveraciones sobre parámetros poblacionales conducen a pruebas paramétricas. Estas pruebas se basan en el análisis de muestras con el fin de evaluar algún valor hipotético. Las técnicas paramétricas se basan generalmente en una o varias suposiciones sobre los elementos de la población. Por otra parte, existen hipótesis que se plantean con respecto a un intervalo de valores, es decir, en este caso el interés no es determinar un valor en particular sino construir un intervalo de confianza, es decir, con base a una muestra determinar el valor de P (a< Q < b), la probabilidad de que el parámetro Q se encuentre entre (a,b) y el grado de confiabilidad en esta aseveración. Las suposiciones mas importantes en la mayoría de las pruebas de hipótesis son: 1. Normalidad. Los observaciones deben tener una distribución normal. Estas observaciones se distribuyen alrededor de una media Mu y una varianza sigma2. Yij ~ N(Mu, sigma2). Es decir, la distribución de los errores es normal. En ciertos casos, la distribución puede ser otra, por ejemplo, chi-cuadrada, t-student, exponencial, etc., sin embargo, la mayoría de las pruebas son 97 Manual del Alumno robustas a la normalidad, es decir, relativamente insensible al tipo de distribución, debido al teorema del limite central (la distribución de medias es aproximadamente normal para cualquier distribución siempre y cuando el tamaño de muestra sea grande). Por otra parte, los datos pueden transformarse para cumplir con esta suposición. 2. Independencia. Los datos deben ser independientes. En otras palabras, las observaciones deben ser extraídas al azar y no estar correlacionadas. Cuando los datos están correlacionados, la validez de la prueba disminuye. La independencia se logra mediante muestreo aleatorio o asignación aleatoria de tratamientos a unidades experimentales. Esta es una suposición fundamental en la realización de pruebas de hipótesis. La falta de independencia, debido a la pobre planeación de un experimento, generalmente conduce a la invalidez de los resultados. A diferencia de las otras suposiciones en las cuales es posible realizar transformaciones o cambiar de análisis para cumplir con esas suposiciones, en el caso de falta de independencia lo recomendable es analizar cuidadosamente el experimento para determinar las causas de la falta de independencia y corregir estas fallas (Sokal y Rohlf, 1995). 3. Varianzas homogéneas. La variabilidad de las observaciones entre dos o mas conjuntos de datos debe ser similar: Sigma1 2 = sigma_22 =... = sigmat2. Esto significa que las fuentes de error experimental deben ser similares. Cuando las varianzas no son 98 Manual del Alumno homogéneas puede haber problemas en la detección de diferencias entre medias. En este caso conviene realizar una transformación para hacer las varianzas homogéneas o bien hacer el análisis con subgrupos. Otra alternativa es emplear métodos no paramétricos. Procedimiento General para Formular y Probar Hipótesis Estadísticas La formulación y prueba de hipótesis estadísticas siguen, en general, los siguientes pasos (no necesariamente en este orden): Especificar la población sobre la cual nuestras inferencias son aplicables. Extraer una muestra de la población sobre la cual se pretende probar alguna hipótesis. Esta muestra (o muestras) deben extraerse al azar para que las inferencias tengan validez. El tamaño de muestra depende de la variabilidad de los datos, los costos de procesar la muestra y la confiabilidad en las estimaciones. Establecer la hipótesis nula e hipótesis alternativa. La hipótesis nula (Ho) es la aseveración de que el parámetro es igual a cierto valor, mientras que la hipótesis alternativa (Ha) es la negación de la hipótesis alternativa. Por ejemplo, para determinar la efectividad de algún insecticida, Ho sería: no hay efecto del insecticida sobre la población de insectos plaga de interés. La hipótesis alternativa 99 Manual del Alumno seria que sí existe efecto del plaguicida. El rechazo de Ho significa la "aceptación" de la hipótesis alternativa. La decisión sobre el rechazo o no de la hipótesis nula siempre conlleva un riesgo de error pues la decisión se basa en una muestra que no contiene todos los elementos de la población. Cuando no se rechaza Ho no quiere decir que se acepta Ho. Es decir, la evidencia no significa que la aseveración es cierta; simplemente es que los datos se conforman, hasta ese momento, con Ho. Seleccionar y determinar el valor de la estadística de prueba. La estadística de prueba es la variable que se calcula con base a cierto modelo probabilístico. La estadística de prueba es una variable aleatoria que tiene cierta distribución conocida cuando Ho es cierta. La idea es determinar que tan probable es que el valor de la estadística de prueba calculada ocurra cuando Ho es cierta. Si esta probabilidad es baja, se rechaza Ho, con una probabilidad de equivocarse también baja. Determinar el riesgo de equivocarse cuando se rechaza la hipótesis nula (Error tipo I). Este riesgo generalmente se establece a priori y valores entre 0.10 y 0.001 son generalmente usados. En una sección posterior se discute el empleo de los valores de P (Pvalúes) asociados a la estadística de prueba y empleados para tomar una decisión sobre Ho. Determinar un valor crítico de la estadística de prueba acuerdo al modelo probabilístico que genera dicha estadística y la 100 Manual del Alumno probabilidad de cometer error tipo I. Este valor permite decidir sobre la aceptación o el rechazo de Ho. Alternativamente se puede calcular el valor de P. Establecer un criterio de decisión: Por ejemplo, rechazar Ho si y solo si el valor calculado de la estadística de prueba es mayor o igual que el valor crítico. Comparar el valor calculado contra el valor crítico y tomar una decisión. Esta es la parte final de una prueba de hipótesis, sin embargo, en toda investigación, este proceso es cíclico (Platt, 1964). Alternativamente, el valor de la estadística de prueba puede emplearse para calcular la probabilidad de obtener dicho valor cuando la hipótesis nula es cierta. Si esta probabilidad es reducida, se tienen dos opciones (Méndez, 1973): a) La hipótesis nula es falsa, o b) La hipótesis nula es cierta pero se obtuvo una muestra "rara" o poco probable. En este situación se rechazará la hipótesis nula y queda la incertidumbre (baja) de cometer un error tipo I. Distribuciones de Referencia La mayoría de las pruebas estadísticas hacen uso de una distribución de referencia. Una distribución de referencia es un modelo probabilístico de la estadística de prueba que ocurre cuando Ho es cierta, es decir, cuyo(s) parámetro(s) corresponden a los establecidos en la hipótesis nula. Con esta distribución de referencia podemos calcular las probabilidades de 101 Manual del Alumno obtener el valor observado de dicha estadística. Por ejemplo, suponga que examinamos una muestra de la cual obtuvimos una media muestral =8. Podemos suponer que este valor provino de una distribución N(5,2), es decir, de una distribución de medias distribuidas normalmente, Media ~ N(5, 2). En este caso, estamos suponiendo que la media poblacional µ <= 5, i.e., Ho: µ <= 5, contra Ha: µ > 5. Además, también suponemos que la varianza de las medias es 2. La Figura 1 ilustra la distribución probabilística N(5,2). Fig. 1. Distribución normal N(5, 2). En la Fig. 1 observamos que el valor de nuestra media muestral (8) se encuentra en el extremo de la distribución. En efecto, la probabilidad de 102 Manual del Alumno obtener valores >= 8 cuando Ho µ <=5 y varianza = 2 son bajas. Al calcular la probabilidad exacta obtenemos el siguiente valor: P(Y media >= 8)= 0.067 Observamos que el valor de la media muestral (mayores o iguales a 8) ocurre con una probabilidad muy baja. Es decir, si Ho fuese cierta, la probabilidad de obtener un valor de 8 o mayor es 0.067. Ciertamente, otros valores de µ > 5 podrían generar muestras con Y media = 8 con una mayor probabilidad. Cuando las probabilidades de ocurrencia de la estadística de prueba son bajas (digamos < 0.05) entonces podemos tomar la decisión de rechazar Ho, corriendo el riesgo de cometer un error igual a la probabilidad de obtener valores iguales o mayores de dicha estadística. En este caso, podemos rechazar Ho con un riesgo de error equivalente a P(Ymedia >= 8) = 0.067. El valor de P(Ymedia >= 8) corresponde al P-value. Existen algunas pruebas que hacen uso de una distribución de referencia, en particular, las pruebas de aleatorización y pruebas basadas en "experimentos previos" permiten probar hipótesis sin necesidad de contar con una distribución de referencia . Ejemplos de Formulación de Hipótesis Estadísticas Para una, dos o mas poblaciones. Una población 103 Manual del Alumno 1. Se inspecciona una muestra de pulgones de cierta región y se mide la longitud de cornículo. Por datos obtenidos en otra región, se sabe que la longitud promedio del cornículo es de 0.10 mm. La hipótesis nula se expresa como: Ho : mu= 0.10, la hipótesis alternativa: Ha: mu <> 0.10 mm. En otras palabras, se prueba si la muestra proviene de una población con media 0.1 mm, la hipótesis alternativa es que la media es distinta. 2. Se inspecciona una muestra de plantas de fríjol, se cuenta el número de picudos del ejote por vaina. Se desea saber que tipo de distribución probabilística representa los conteos de insectos. Dos poblaciones 1. Se realiza el siguiente experimento. Se pretende probar si cierto tipo de trampa captura adultos de "salivazos" igualmente del lado norte y del lado sur. Aqui la hipótesis es mu1 = mu2, contra Ha: mu1 <> mu2. mu1 es la media poblacional (número de insectos capturados) en el lado sur, y mu2 es la media poblacional en el lado norte. 2. Se postula que existe una relación lineal entre el numero de chinches del sorgo y el rendimiento del sorgo. El modelo estadístico mas simple es que el rendimiento (Y) es una función lineal del número de chinches (X): Yi = B0 + B1X + ei. Si este modelo es cierto, entonces B1 <> 0, de otra manera no existe relación entre X y Y y el modelo se colapsa a: Yi = B0 + ei. 104 Manual del Alumno B0 representa la media general y B1 la pendiente de una recta. La hipótesis que se desea probar es: Ho: B1 = 0 vs B1 <> 0. Varias poblaciones (> 2 poblaciones) 1. Se evalúan cuatro herbicidas A, B, C, D. Los herbicidas A y B son preemergentes y C, D post-emergentes. Los herbicidas A y C contienen el mismo ingrediente activo y la misma formulación pero son hechos por dos compañías distintas y tienen costo distinto. El herbicida B es una mezcla del ingrediente activo del herbicida A y otro componente. Lo mismo ocurre con el herbicida D. Es decir, el herbicida D es una formulación del herbicida C (ingrediente activo) con otro ingrediente activo. Además de estos herbicidas se tiene un tratamiento testigo (no hay control de malezas) y otro tratamiento que consiste en control manual (machete). Los herbicidas A y B son producidos por la compañía Agroquímicos-1, los herbicidas C y D son producidos por la compañía Agroquímicos-2. Se formulan las siguientes hipótesis: a) Existe diferencia en los tratamientos químicos con respecto al testigo (no control) ? b) Existe diferencia entre los herbicidas preemergentes con respecto a los postemergentes? Observe que experimento estas hipótesis son propuestas antes del 105 Manual del Alumno 2. Se diseña un experimento para determinar la efectividad de dos depredadores: Hippodamia y Coccinella. Se evalúan ambos depredadores tanto en estado larval como adultos. Se prueban las siguientes hipótesis: Existen diferencias en el consumo entre Hippodamia y Coccinella? Existen diferencias en el consumo de pulgones entre larvas y adultos de ambos depredadores? La diferencia en el consumo entre larvas y adultos es el mismo para las dos especies? 3. Se prueban varias variedades de frijol con respecto al ataque de Zabrotes. El objetivo es determinar si existen variedades resistentes al ataque de este insecto, evaluado mediante el efecto de dichas variedades sobre las tasas de desarrollo. Una hipótesis de interes sería: Cual es la variedad mas resistente con respecto al testigo PROBLEMAS PROPUESTOS: 1. Un contador cree que los problemas de flujo de efectivo de una empresa son resultado directo del lento proceso de cobro de las cuentas por cobrar. Dice que al menos el 70% de las actuales cuentas por cobrar tienen más de dos meses. Una muestra de 120 106 Manual del Alumno cuentas por cobrar indica que hay 78 con más de dos meses. Pruebe la afirmación del contador, al nivel de significancia de =0.05. 2. Se tiene la siguiente prueba de hipótesis: Ho: 1 - 2 0 Ha: 1 - 2 > 0 Los resultados siguientes son para dos muestras independientes tomadas de Muestra 1 n1 = 40 dos poblaciones Muestra 2 n2 = 50 = 22.8 = 25.2 S1 = 5.2 S2 = 6.0 a) ¿Cuál es su conclusión de la prueba de hipótesis con = 0.05? b) ¿Cuál es el valor p? 3. Se tiene la siguiente prueba de hipótesis Ho: 1 - 2 = 0 Ha: 1 - 2 0 Los resultados siguientes son para dos muestras independientes tomadas de dos poblaciones Muestra 1 n1 = 80 = 104 Muestra 2 n2 = 70 = 106 107 Manual del Alumno S1 = 8.4 S2 = 7.6 a. ¿Cuál es su conclusión de la prueba de hipótesis con b. ¿Cuál es el valor p? RESPUESTA: a) z = -1.53; b) no = 0.05? rechazar Ho 0.1260 4. Se tiene la siguiente prueba de hipótesis Ho: 1 - 2 = 0 Ha: 1 - 2 Los 0 resultados siguientes corresponden a dos muestras independientes de las dos poblaciones. ¿Cuál es su conclusión de la prueba de hipótesis Muestra 1 Muestra 2 n1 = 8 n2 = 7 = 1.4 = 1.0 S1 = 0.4 S2 = 0.6 con a = 0.05? 5. Los siguientes estadísticos corresponden al ejercicio anterior, en el que con dos muestras independientes de viajeros se calificaron los aeropuertos de Miami y Los Ángeles. 108 Manual del Alumno Aeropuerto Tamaño muestra Miami Los Ángeles 50 50 de la Media de la Desviación muestra estándar de la muestra 6.34 2.163 6.72 2.374 ¿Es la media de la población de calificaciones del aeropuerto de Los Ángeles mayor que la del de Miami? Apoye su conclusión con una prueba estadística que emplee un nivel de significancia de RESPUESTA: 0.84, no =0.05 rechazar Ho 6. El estudio de las tiendas Greyston Department Store de la sección 10.1 produjo los siguientes datos acerca de las edades de los clientes, con dos muestras aleatorias independientes tomadas en dos lugares de la ciudad. Tienda del centro Tienda suburbana n1 = 36 n2 = 49 = 40 años = 35 años S1 = 9 años S2 = 10 años Para a = 0.05, pruebe Ho: 1 - 2 = 0 contra la alternativa Ha: 1 - 2 0. ¿Cuál es su conclusión acerca de las medias de las edades de las poblaciones de los clientes en las dos tiendas? 109 Manual del Alumno 7. El Servicio de Evaluación educativa llevó a cabo un estudio para investigar las diferencias entre las calificaciones de alumnos hombres y mujeres en la Prueba de Aptitud Escolar (PAE). El estudio identificó una muestra aleatoria de 562 alumnos mujeres y 852 alumnos hombres que alcanzaron la misma alta calificación en la parte de matemáticas. Esto es, se consideró que los alumnos, mujeres y hombres, tenían aptitudes semejantes y altas en matemáticas. Las calificaciones de expresión oral del PAE, para las dos muestras, se resumen en la tabla siguiente. Alumnos mujeres = 547 Alumnos hombres = 525 S1 = 83 S2 = 78 Esos datos, ¿respaldan la conclusión que, dada una población de alumnos mujeres y una de alumnos hombres con aptitudes matemáticas altas, los alumnos mujeres tienen una aptitud bastante mayor de expresión oral? Haga la prueba con nivel de significancia de = 0.02. ¿Cuál es su conclusión? RESPUESTA: z = 4.99; rechazar Ho SESION 19 EXAMEN DE LA II UNIDAD FORMATIVA 110 Manual del Alumno SESION 20 EXAMEN SUSTITUTORIO