Teorema de Bayes La estadística bayesiana es un conjunto de herramientas que se utiliza en un tipo especial de inferencia estadística que se aplica en el análisis de datos experimentales en muchas situaciones prácticas de la ciencia y la ingeniería. La regla de Bayes es una de las normas más importantes de la teoría de la probabilidad, ya que es el fundamento de la inferencia bayeisana. Probabilidad total Teorema de la probabilidad total o regla de eliminación: Si los eventos B1, B2, …Bk constituyen una partición del espacio muestral S, tal que P(Bi) diferente de 0 para i= 1,2, …, k, entonces, para cualquier evento A de S, 𝑘 𝑘 𝑃(𝐴) = ∑ 𝑃(𝐵1 ∩ 𝐴) = ∑ 𝑃(𝐵1 ) 𝑃(𝐴⃓𝐵1 ) 𝑖=1 𝑖=1 Prueba: Considere el diagrama de Venn de la figura 2.14. Se observa que el evento A es la unión de los eventos mutuamente excluyentes B1⋂A1, B2⋂A2, …, Bk⋂A; Es decir, A=(B1⋂A) U(B2⋂A) U…U(Bk⋂A) Obtenemos P(A)= P[(B1⋂A) U(B2⋂A) U…U(Bk⋂A)] =P(B1⋂A) +P(B2⋂A) +…+(Bk⋂A) = ∑𝑘𝑖=1 P(B1⋂A) = ∑𝑘𝑖=1 P(Bi)P(AlBi) Regla de Bayes Suponga que en lugar de calcula P(A) mediante la regla de eliminación, consideramos el problema de obtener la probabilidad condicional P(B ilA). En otras palabras, suponga que se selecciona un producto de forma aleatoria y que éste resulta defectuoso. ¿Cuál es la probabilidad de que este producto haya sido ensamblado con la máquina Bi? Las preguntas de este tipo se pueden contestar usando el siguiente teorema, denominado regla de Bayes: (Regla de Bayes) Si dos eventos B1, B2, …, Bk constituyen una partición del espacio muestral S, donde P(Bi) es diferente a 0 para i= 1, 2, …, k, entonces, para cualquier evento A en S, tal que P(A) es diferente de 0, 𝑃(𝐵₁⃓𝐴) = Para i = 1, 2, …, k. 𝑃(𝐵₁⋂𝐴) 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 ) = ∑𝑘𝑖=1 𝑃(𝐵₁ ∩ 𝐴) ∑𝑘𝑖=1 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 ) Prueba: Mediante la definición de Probabilidad condicional, P(BrlA)= P(Br⋂A), P(A) Y después usando el teorema de probabilidad total en el denominador, obtenemos 𝑃(𝐵₁⃓𝐴) = 𝑃(𝐵₁⋂𝐴) 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 ) = ∑𝑘𝑖=1 𝑃(𝐵₁ ∩ 𝐴) ∑𝑘𝑖=1 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 ) Para i = 1, 2, …, k. que completa la demostración. Ejercicios 1.- Tres máquinas de cierta planta de ensamble, B1, B2 y B3, montan 30%, 45% y 25% de los productos, respectivamente. Se sabe por experiencia que 2%, 3% y 2% de los productos ensamblados por cada máquina, respectivamente, tienen defectos. Ahora bien, suponga que se selecciona de manera aleatoria un producto defectuoso. ¿Cuál es la probabilidad de que haya sido ensamblado con la máquina B3? Solución: podemos utilizar la regla de Bayes para escribir P(B3lA) = 𝑃(𝐵3)𝑃(𝐴⃓𝐵3) 𝑃(𝐴) = (0.25)(0.02) (0.0245) = 0.20408 = 20.4% 2.- La caja I contiene 3 canicas rojas y 2 azules, mientras que la caja II contiene 2 canicas rojas y 8 azules. Se lanza una moneda balanceada. Si se obtiene cara, se saca una canica de la caja I; si se obtienen sello, se saca una canica de la caja II. Suponga que quien lanza la moneda no revela si obtiene cara o sello (de manera que tampoco se sabe de cuál caja sacó la canica), pero sí dice que sacó una canica roja. ¿Cuál es la probabilidad de que haya escogido la caja I (es decir de que la moneda sea cara)? Solución: Busquemos la probabilidad de que la caja I haya sido escogida dado que sabemos que la persona sacó una canica roja. Usando el teorema de la regla de bayes con n=2, la probabilidad está dada por: 1 3 (2) (3 + 2) 𝑃(𝐼)𝑃(𝑅⃓𝐼) 3 𝑃(𝐼⃓𝑅) = = = 𝑃(𝐼)𝑃(𝑅⃓𝐼) + 𝑃(𝐼𝐼)𝑃(𝑅⃓𝐼𝐼) (1) ( 3 ) + (1) ( 2 ) 4 2 3+2 2 2+8 Donde R= canica roja. 3.- Sean A, B eventos de algún S. Se conoce que: P(B)= 0.4 P(AlB)= 0.3 P(AlBc)= 0.8 Encuentre: a) P(A), b) P(AlB), c) P(BlAc) Respuesta: Para facilitar la interpretación de este problema colocamos los datos en un diagrama de árbol y con un diagrama de Venn visualizamos los eventos. Los datos los escribimos con negro. Los valores faltantes los completamos en azul. Los eventos B y Bc constituyen una partición y determinan la realización del evento A. Con los valores indicados en el diagrama y las fórmulas de Probabilidad Total y el teorema de Bayes se obtienen las respuestas. a) P(A) = P(B)P(AlB) + P(Bc)P(AlBc) = (0.4)(.03) + (0.6)(0.8) = 0.6 b) P(BlA) = P(B⋂A)/P(A) = P(B)P(AlB)/P(A) = (0.4)(0.3)/0.6 = 0.2 c) P(BlAc) = P(B⋂Ac)/P(Ac) = P(B)P(AclB)/P(Ac) = (0.4)(0.7)/0.4 = 0.7 4.- Una fábrica tiene 3 máquinas M1, M2 y M3 para la producción de sus artículos. El siguiente cuadro describe el porcentaje de producción diaria de cada una y la frecuencia de artículos defectuosos que producen cada una. Suponga que se elige al azar un artículo de la producción total de un día y que resulte defectuoso. Determine la probabilidad de que haya sido producido en la máquina M1. Solución: 𝑃(𝐵1 ⃓𝐴) = 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 ) (0.5)(0.04) = = 0.625 = 62.5% 𝑃(𝐴) 0.032 5.- En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24 meses. Un pediatra que ingresa a la sala selecciona un infante al azar. a. Determine el valor de la probabilidad de que sea menor de 24 meses. b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea una niña. SOLUCIÓN: Se definen los sucesos: Suceso H: seleccionar una niña. Suceso V: seleccionar un niño. Suceso M: infante menor de 24 meses. En los ejercicios de probabilidad total y teorema de bayes, es importante identificar los sucesos que forman la población y cuál es la característica que tienen en común dichos sucesos. Estos serán los sucesos condicionados. a. En este caso, la población es de los infantes. Y la característica en común es que sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será: b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes, hay que partir de reconocer esta es una probabilidad condicionada y que la característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la probabilidad de que sea niña una infanta menor de 24 meses será: 6.- Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías correctivas. Se sabe, además, que son de género masculino el 25% de los que se realizan correcciones faciales, 15% implantes mamarios y 40% otras cirugías correctivas. Si se selecciona un paciente al azar, determine: a. Determine la probabilidad de que sea de género masculino b. Si resulta que es de género masculino, determine la probabilidad que se haya realizado una cirugía de implantes mamarios. SOLUCIÓN: Se definen los sucesos: Suceso F: pacientes que se realizan cirugías faciales Suceso M: pacientes que se realizan implantes mamarios Suceso O: pacientes que se realizan otras cirugías correctivas Suceso H: pacientes de género masculino a. La probabilidad de que sea de género masculino se refiere a un problema de probabilidad total, ya que es el suceso condicionado y las cirugías los condicionantes. Dicho valor será: b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de bayes, luego, el valor de la probabilidad será: 7.- Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso que le da a cada equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades de error de 1%, 2% y 3% respectivamente. Un paciente busca el resultado de una ecografía y observa que tiene un error. Determine la probabilidad de que se ha usado el primer aparato. SOLUCIÓN: Se definen los sucesos: Suceso P: seleccionar el primer aparato Suceso S: seleccionar el segundo aparato Suceso T: seleccionar el tercer aparato Suceso E: seleccionar un resultado con error Se puede observar que la pregunta es sobre determinar la probabilidad de que un examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto, debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo tanto: 8.- La probabilidad de que haya un accidente en una fábrica que dispone de alarma es 0.1. La probabilidad de que suene esta sí se ha producido algún incidente es de 0.97 y la probabilidad de que suene si no ha sucedido ningún incidente es 0.02. En el supuesto de que haya funcionado la alarma, ¿cuál es la probabilidad de que no haya habido ningún incidente? Sean los sucesos: I = Producirse incidente. A = Sonar la alarma. 9.- Tres máquinas A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%, 4% y 5%. A) Tomamos al azar una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la máquina B. B) ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza defectuosa? SOLUCIÓN: A) Debemos calcular P(BlD). Por el teorema de Bayes. B) Calculamos P(AlD) y P(ClD), comparándolas con el valor de P(BlD) ya calculado. 10.- Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y una negra y C con dos bolas rojas y 3 negras. Escogemos una al azar y extraemos una bola. Si la bola ha sido roja, ¿Cuál es la probabilidad de haber sido extraída de la urna A? SOLUCIÓN: Llamamos R= “sacar bola roja” y N= “sacar bola negra”. La probabilidad pedida es P(AlR). Utilizando el teorema de Bayes tenemos: 11.- Dos tratamientos A y B curan una determinada enfermedad en un 20% y en un 30% de los casos, respectivamente. Suponiendo que ambos actúan de modo independiente, ¿cuál de las dos estrategias siguientes es mejor? a) Aplicar ambos tratamientos a la vez. b) Aplicar primero el tratamiento B, y si no surte efecto aplicar el tratamiento A. SOLUCIÓN. Sean los sucesos: A = {el tratamiento A cura una determinada enfermedad}, B = {el tratamiento B cura la misma enfermedad}. Por hipótesis sabemos que P(A) = 0.2 y P(B) = 0.3. a) Consideramos en primer lugar la estrategia de aplicar ambos tratamientos a la vez. La probabilidad que tiene dicha estrategia de curar la enfermedad viene dada por P(A∪B) = P(A) +P(B)−P(A∩B), pues al aplicar ambos tratamientos a la vez, o bien actúa uno, o bien el otro, o bien los dos al mismo tiempo. Ahora bien, se supone que los tratamientos actúan de manera independiente, por lo que P(A∩B) = P(A)·P(B) = 0.2 · 0.3 = 0.06, y entonces P(A∪B) = 0.2+0.3−0.06 = 0.44. Luego, los dos tratamientos aplicados a la vez curan la enfermedad en un 44% de los casos. b) Si aplicamos primero el tratamiento B, puede ocurrir que éste cure la enfermedad o no. Si cura la enfermedad, esta estrategia tiene probabilidad P(B) = 0.3. Si el tratamiento B no surte efecto entonces aplicamos el tratamiento A, cuya probabilidad de curación es P(A) = 0.2. Por tanto, esta estrategia tiene una probabilidad de curar la enfermedad de máx {P(A),P(B)} = max´ {0.2,0.3} = 0.3. En conclusión, podemos afirmar que la primera estrategia es mejor que la segunda, con un 14% más de éxitos. 12.- Se estima que el 15% de la población adulta padece de hipertensión, pero que el 75% de todos los adultos creen no tener este problema. Se estima también que el 6% de la población tiene hipertensión, aunque no es consciente de padecerla. Si un paciente adulto opina que no tiene hipertensión, ¿cuál es la probabilidad de que realmente sea hipertenso? SOLUCIÓN. Consideramos los sucesos: A1 = {el paciente tiene hipertensión}, A2 = {el paciente no tiene hipertensión}, los cuales forman un sistema completo. Por hipótesis P(A1) = 0.15, luego P(A2) = 0.85. Por otra parte, consideramos los sucesos: B1 = {el paciente es consciente de padecer hipertensión}, B2 = {el paciente no es consciente de padecer hipertensión}. Conjugando los datos del problema con el hecho de que B1 y B2 son complementarios encontramos que P(B1) = 0.25 y P(B2) = 0.75. Por hipótesis se tiene que P(B2/A1) = 0.06. La probabilidad de que un paciente adulto sea realmente hipertenso cuando opina que no tiene hipertensión (esto es, no es consciente de padecerla) viene dada por P(A1/B2). En virtud del Teorema de Bayes, esta probabilidad a posteriori puede ser calculada como: Podemos concluir entonces que un 1.2% de los pacientes que opinan que no padecen de hipertensión son realmente hipertensos. 13.- Cierta enfermedad puede ser producida por tres tipos de virus A, B, C. En un laboratorio se tienen tres tubos con el virus A, dos con el B y cinco con el C. La probabilidad de que el virus A produzca la enfermedad es 1/3, que la produzca B es 2/3 y que la produzca C es 1/7. a) Si se inocula algún virus a un animal, ¿cuál es la probabilidad de que éste contraiga la enfermedad? b) Si se inocula un virus a un animal y contrae la enfermedad, ¿cuál es la probabilidad de que el virus inyectado fuera C? SOLUCIÓN. Estamos considerando el experimento de inocular alguno de los tres virus disponibles en el laboratorio a un determinado animal. Los posibles resultados del experimento son dos: que el animal contraiga la enfermedad, o que no la contraiga. Sean los sucesos: A = {el animal es inoculado con virus del tipo A}, B = {el animal es inoculado con virus del tipo B}, C = {el animal es inoculado con virus del tipo C}. Al tener una muestra de 10 tubos y ser equiprobable la elección de éstos, las probabilidades de los sucesos anteriores vienen dadas por: a) Consideramos ahora el suceso E = {el animal contrae la enfermedad}. Como consecuencia del Teorema de la Probabilidad Total y del hecho de que A, B y C forman un sistema completo de sucesos, se tiene: pues por hipótesis la probabilidad de que el virus A produzca la enfermedad es P(E/A) = 1/3, de que la produzca B, P(E/B) = 2/3 y de que la produzca C, P(E/C) = 1/7. b) Por otra parte, si sabemos que el animal contrae la enfermedad, en virtud del Teorema de Bayes la probabilidad a posteriori P(C/E) de que el animal haya sido infectado por el virus C viene dada por: Podemos concluir, por tanto, que en el 23.4% de los casos en que un animal haya contraído la enfermedad, ésta ha sido producida por el virus C. 14.- Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera de tres hoteles de la ciudad; Palacio del sol, Sicomoros o Fiesta Inn, en una proporción de 18.5%, 32% y 49.5% respectivamente, de los cuales se ha tenido información de que se les ha dado un mal servicio en un 2.8%, 1% y 4% respectivamente, si se selecciona un visitante al azar ¿Cuál es la probabilidad de que no se le haya dado un mal servicio? SOLUCIÓN: Haciendo un diagrama de árbol. NQ= evento de que un visitante no se queje del servicio PS= evento de que un visitante haya sido hospedado en el hotel Palacio del Sol S= evento de que un visitante haya sido hospedado en el hotel Sicomoro FI= evento de que un visitante haya sido hospedado en el hotel Fiesta Inn 15.- Un test detecta la presencia de cierto tipo T de bacterias en el agua con probabilidad 0.9, en caso de haberlas. Si no las hay, detecta la ausencia con probabilidad de 0.8. Sabiendo que la probabilidad de que una muestra de agua contenga bacterias del tipo T es 0.2, calcular la probabilidad de que: a) Realmente haya presencia de bacterias cuando el test ha dado resultado positivo. b) Realmente haya presencia de bacterias cuando el test ha dado resultado negativo. c) Haya bacterias y además el test dé positivo. d) O haya bacterias, o el test dé positivo. SOLUCIÓN. Consideramos los sucesos: A1 = {la muestra contiene bacterias tipo T}, A2 = {la muestra no contiene bacterias tipo T}. Nótese que ambos sucesos A1 y A2 forman un sistema completo, es decir, son complementarios en el espacio muestral del experimento que estamos considerando. Por hipótesis P(A1) = 0.2, obligando a que P(A2) = P (A c 1) = 1−0.2 = 0.8. Por otra parte, sean los sucesos: T + = {el test detecta la presencia de bacterias}, T − = {el test no detecta la presencia de bacterias}. De acuerdo con los datos disponibles, sabemos que P (T +/A1) = 0.9 y P (T −/A2) = 0.8, de modo que las siguientes probabilidades, correspondientes a los sucesos condicionados complementarios, vienen dadas por: P (T −/A1) = 0.1 y P (T +/A2) = 0.2. a) En virtud del Teorema de Bayes, la probabilidad P (A1/T +) de que realmente haya presencia de bacterias cuando el resultado del test ha sido positivo viene dada por b) De igual manera, la probabilidad de que realmente haya presencia de bacterias cuando el test ha resultado negativo es c) La probabilidad de que haya bacterias y además el test dé positivo es: P (A1 ∩T +) = P(A1) ·P (T +/A1) = 0.2 · 0.9 = 0.18. Nótese que, como P (T +) = 0.34, también tenemos P (A1 ∩T +) = P (T +) ·P (A1/T +) = 0.34 · 0.53 ' 0.18. d) Finalmente, la probabilidad de que o bien haya bacterias en el agua o el test dé positivo viene dada por: P (A1 ∪T +) = P(A1) +P (T +) −P (A1 ∩T +) = 0.2+0.34−0.18 = 0.36. Bibliografía Murray, R. S. (2003). Probabilidad y Estadística. México: McGrawHill. Wapole, R. M. (2012). Probabilidad y estadística para ingeniería y ciencias (novena ed.). México: Pearson.