UNIDAD IV PROBABILIDAD “Teorema de Bayes” M. en C. Mario Arturo Vilchis Rodríguez TEOREMA DE BAYES El reverendo Thomas Bayes (1702 – 1761) desarrolló un concepto útil al calcular ciertas probabilidades. Se asume que Dunham Manufacturing utiliza dos máquinas para producir su producto. La máquina A produce el 60% de la producción total, y la maquina B produce el restante 40%. El 2% de las unidades por A son defectuosas, mientras que B tiene una tasa de defectos del 4%. Esto se muestra en el diagrama de árbol que acompaña la siguiente figura. Se asume que una unidad de producción se selecciona aleatoriamente. El primer conjunto de “ramas” en el árbol que indica cuál máquina produjo la unidad, muestra que la probabilidad de que provenga de la máquina A es P(A) = 0.60 y que la probabilidad de que provenga de la maquina B es P(B) = 0.40. El segundo grupo de ramas que indica la calidad de la unidad dice que si provino de la máquina A puede ser defectuosa o no defectuosa. Estas probabilidades condicionales demuestran que la probabilidad de que no sea defectuosa dado ̅ |𝐴) = 0.98 y la probabilidad de que sea que provino de la máquina A es 𝑃(𝐷 defectuosa dado que proviene de A es 𝑃(𝐷 |𝐴) = 0.02. Las probabilidades condicionales para B revelan que la probabilidad de que no sea defectuosa ̅ |𝐵) = 0.96 y la probabilidad de que sea dado que provino de B es 𝑃(𝐷 defectuosa con base en la condición de que provino de B es 𝑃(𝐷 |𝐵) =0.04. Figura Diagrama de árbol para Dunham Manufacturing 1 Finalmente, se observa que hay cuatro posibles resultados para el experimento de seleccionar una unidad de producción La probabilidad de cada uno se calcula multiplicando las probabilidades sobre cada una de las ramas que conllevan a ella. Para ilustrarlo, el primer posible resultado es que la unidad ̅ ). Utilizando la regla de la provenga de A y que no sea defectuosa, 𝑃(𝐴 ∩ 𝐷 multiplicación, ̅ ) = 𝑃(𝐴) ∙ 𝑃(𝐷 ̅ |𝐴) 𝑃(𝐴 ∩ 𝐷 = (0.60)(0.98) = 0.588. Las probabilidades de los tres resultados restantes pueden determinarse de forma similar. Se puede observar directamente en la figura anterior que 𝑃(𝐴) = 0.60. Suponiendo que la unidad es defectuosa, se desea saber la probabilidad de que la unidad provino de la máquina A. Con esta información adicional, se puede revisar la probabilidad de que la unidad fue producida por la máquina A. Ahora se desea determinar 𝑃(𝐴 |𝐷), no sólo 𝑃(𝐴). Vale la pena recordar la regla de la probabilidad condicional: 𝑃(𝐴 |𝐷) = 𝑃(𝐴 ∩ 𝐷) 𝑃(𝐴) ∙ 𝑃(𝐷|𝐴) = 𝑃(𝐷) 𝑃(𝐷) Sin embargo, 𝑃(𝐷) no es discernible de inmediato. Aquí es donde participa el teorema de Bayes. Existen dos formas en las cuales la unidad puede ser defectuosa. Puede provenir de la máquina A y ser defectuosa, o puede provenir de la máquina B y ser defectuosa. Utilizando la regla de la adición, 𝑃(𝐷) = 𝑃(𝐴 ∩ 𝐷) + 𝑃(𝐵 ∩ 𝐷) 𝑃(𝐷) = 𝑃(𝐴) ∙ 𝑃(𝐷|𝐴) + 𝑃(𝐵) ∙ 𝑃(𝐷|𝐵) Cuando se hace la sustitución en el denominador de la fórmula de la probabilidad condicional anterior para 𝑃(𝐷), el teorema de Bayes dice 2 𝑃(𝐴 |𝐷) = 𝑃(𝐴 ∩ 𝐷) 𝑃(𝐴 ∩ 𝐷) + 𝑃(𝐵 ∩ 𝐷) Teorema de Bayes 𝑃(𝐴 |𝐷) = 𝑃(𝐴) ∙ 𝑃(𝐷|𝐴) 𝑃(𝐴) ∙ 𝑃(𝐷|𝐴) + 𝑃(𝐵) ∙ 𝑃(𝐷|𝐵) Ahora se puede hallar 𝑃(𝐴|𝐷) 𝑃(𝐴 |𝐷) = 𝑃(𝐴 |𝐷) = 𝑃(𝐴 ∩ 𝐷) 𝑃(𝐷) 𝑃(𝐴 ∩ 𝐷) 𝑃(𝐴 ∩ 𝐷) + 𝑃(𝐵 ∩ 𝐷) 𝑃(𝐴 |𝐷) = 0.012 (0.012) + (0.016) 𝑃(𝐴 |𝐷) = 0.429 Mientras que 𝑃(𝐴) = 0.60, 𝑃(𝐴 |𝐷) = 0.429. Se nota que 𝑃(𝐴 |𝐷) < 𝑃(𝐴) debido a que la máquina A produce un porcentaje menor de defectos que la máquina B. Ejemplo del Teorema de Bayes. El departamento de personal de una empresa grande ha descubierto que sólo el 60% de los candidatos entrevistados están realmente calificados (Q) para asumir un cargo en la compañía. Una revisión de los registros de la firma muestra que quienes estaban calificados, el 67% tuvo un entrenamiento previo en estadística (T), mientras que el 20% de quienes no estaban calificados habían recibido instrucción estadística mucho antes. Es decir, 3 𝑃(𝑄) = 0.60 𝑃(𝑇|𝑄) = 0.67 ̅) = 0.20 𝑃(𝑇|𝑄 El director de personal puede ver claramente que dado que usted está calificado, es más probable que usted tenga algo de capacitación en estadística que si no está calificado (0.67 > 0.20). Se perdió mucho tiempo entrevistando a los candidatos que resultaron no calificados; sin embargo, el director está considerando conceder entrevista sólo a aquellos candidatos que tengan capacitación en estadística. Él espera incrementar la probabilidad de encontrar candidatos calificados para ocupar el cargo. La pregunta entonces sería, ¿es más probable que usted esté calificado dado que ha tenido capacitación: 𝑃(𝑄|𝑇)? Si es así, el departamento de personal podría evitar demoras y costos innecesarios restringiendo las entrevistas sólo a aquellos candidatos que tengan capacitación en análisis estadístico Solución Utilizando la regla de probabilidad condicional 𝑃(𝑄 |𝑇) = 𝑃(𝑄 ∩ 𝑇) 𝑃(𝑄) ∙ 𝑃(𝑇|𝑄) (0.60)(0.67) = = 𝑃(𝑇) 𝑃(𝑇) 𝑃(𝑇) Debido a que los registros de la compañía no proporcionan 𝑃(𝑇), se debe utilizar el teorema de Bayes para hallar el denominador. Existen dos formas en las que un candidato puede tener entrenamiento previo: (1) el candidato puede estar calificado y tener capacitación, 𝑃(𝑄 ∩ 𝑇), y (2) el candidato puede no estar calificado y tener entrenamiento 𝑃(𝑄 ∩ 𝑇). Por tanto, 𝑃(𝑇) = 𝑃(𝑄 ∩ 𝑇) + 𝑃(𝑄̅ ∩ 𝑇) 𝑃(𝑇) = 𝑃(𝑄) ∙ 𝑃(𝑇|𝑄) + 𝑃(𝑄̅ ) ∙ 𝑃(𝑇|𝑄̅ ) 𝑃(𝑇) = (0.60)(0.67) + (0.40)(0.20) 𝑃(𝑇) = 0.482 4 Entonces 𝑃(𝑄 |𝑇) = (0.60)(0.67) 0.482 𝑃(𝑄 |𝑇) = 0.834 Puesto que 𝑃(𝑄) = 0.60, 𝑃(𝑄|𝑇) = 0.834 Interpretación. Para aumentar la probabilidad de entrevistar sólo candidatos calificados, el departamento de personal debería entrevistar solamente a los candidatos que tienen capacitación en análisis estadístico. Fuentes de información Webster, Allen L., (2000)., Estadística aplicada a los negocios y la economía., Editorial McGraw-Hill., Colombia. 5