Subido por Diego Y. Reyes

Teorema de Bayes

Anuncio
Teorema de Bayes
La estadística bayesiana es un conjunto de herramientas que se utiliza en un tipo
especial de inferencia estadística que se aplica en el análisis de datos
experimentales en muchas situaciones prácticas de la ciencia y la ingeniería. La
regla de Bayes es una de las normas más importantes de la teoría de la
probabilidad, ya que es el fundamento de la inferencia bayeisana.
Probabilidad total
Teorema de la probabilidad total o regla de eliminación:
Si los eventos B1, B2, …Bk constituyen una partición del espacio muestral S,
tal que P(Bi) diferente de 0 para i= 1,2, …, k, entonces, para cualquier evento A de
S,
𝑘
𝑘
𝑃(𝐴) = ∑ 𝑃(𝐵1 ∩ 𝐴) = ∑ 𝑃(𝐵1 ) 𝑃(𝐴⃓𝐵1 )
𝑖=1
𝑖=1
Prueba: Considere el diagrama de Venn de la figura 2.14. Se observa que el
evento A es la unión de los eventos mutuamente excluyentes
B1⋂A1, B2⋂A2, …, Bk⋂A;
Es decir,
A=(B1⋂A) U(B2⋂A) U…U(Bk⋂A)
Obtenemos
P(A)= P[(B1⋂A) U(B2⋂A) U…U(Bk⋂A)]
=P(B1⋂A) +P(B2⋂A) +…+(Bk⋂A)
= ∑𝑘𝑖=1 P(B1⋂A)
= ∑𝑘𝑖=1 P(Bi)P(AlBi)
Regla de Bayes
Suponga que en lugar de calcula P(A) mediante la regla de eliminación,
consideramos el problema de obtener la probabilidad condicional P(B ilA). En otras
palabras, suponga que se selecciona un producto de forma aleatoria y que éste
resulta defectuoso. ¿Cuál es la probabilidad de que este producto haya sido
ensamblado con la máquina Bi? Las preguntas de este tipo se pueden contestar
usando el siguiente teorema, denominado regla de Bayes:
(Regla de Bayes) Si dos eventos B1, B2, …, Bk constituyen una partición del espacio
muestral S, donde P(Bi) es diferente a 0 para i= 1, 2, …, k, entonces, para cualquier
evento A en S, tal que P(A) es diferente de 0,
𝑃(𝐵₁⃓𝐴) =
Para i = 1, 2, …, k.
𝑃(𝐵₁⋂𝐴)
𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 )
=
∑𝑘𝑖=1 𝑃(𝐵₁ ∩ 𝐴)
∑𝑘𝑖=1 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 )
Prueba: Mediante la definición de Probabilidad condicional,
P(BrlA)= P(Br⋂A),
P(A)
Y después usando el teorema de probabilidad total en el denominador, obtenemos
𝑃(𝐵₁⃓𝐴) =
𝑃(𝐵₁⋂𝐴)
𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 )
=
∑𝑘𝑖=1 𝑃(𝐵₁ ∩ 𝐴)
∑𝑘𝑖=1 𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 )
Para i = 1, 2, …, k.
que completa la demostración.
Ejercicios
1.- Tres máquinas de cierta planta de ensamble, B1, B2 y B3, montan 30%, 45% y
25% de los productos, respectivamente. Se sabe por experiencia que 2%, 3% y 2%
de los productos ensamblados por cada máquina, respectivamente, tienen defectos.
Ahora bien, suponga que se selecciona de manera aleatoria un producto
defectuoso. ¿Cuál es la probabilidad de que haya sido ensamblado con la máquina
B3?
Solución: podemos utilizar la regla de Bayes para escribir
P(B3lA) =
𝑃(𝐵3)𝑃(𝐴⃓𝐵3)
𝑃(𝐴)
=
(0.25)(0.02)
(0.0245)
= 0.20408 = 20.4%
2.- La caja I contiene 3 canicas rojas y 2 azules, mientras que la caja II contiene 2
canicas rojas y 8 azules. Se lanza una moneda balanceada. Si se obtiene cara, se
saca una canica de la caja I; si se obtienen sello, se saca una canica de la caja II.
Suponga que quien lanza la moneda no revela si obtiene cara o sello (de manera
que tampoco se sabe de cuál caja sacó la canica), pero sí dice que sacó una canica
roja. ¿Cuál es la probabilidad de que haya escogido la caja I (es decir de que la
moneda sea cara)?
Solución: Busquemos la probabilidad de que la caja I haya sido escogida dado que
sabemos que la persona sacó una canica roja. Usando el teorema de la regla de
bayes con n=2, la probabilidad está dada por:
1
3
(2) (3 + 2)
𝑃(𝐼)𝑃(𝑅⃓𝐼)
3
𝑃(𝐼⃓𝑅) =
=
=
𝑃(𝐼)𝑃(𝑅⃓𝐼) + 𝑃(𝐼𝐼)𝑃(𝑅⃓𝐼𝐼) (1) ( 3 ) + (1) ( 2 )
4
2 3+2
2 2+8
Donde R= canica roja.
3.- Sean A, B eventos de algún S. Se conoce que:
P(B)= 0.4
P(AlB)= 0.3
P(AlBc)= 0.8
Encuentre: a) P(A), b) P(AlB), c) P(BlAc)
Respuesta:
Para facilitar la interpretación de este problema colocamos los datos en un diagrama
de árbol y con un diagrama de Venn visualizamos los eventos.
Los datos los escribimos con negro. Los valores faltantes los completamos en azul.
Los eventos B y Bc constituyen una partición y determinan la realización del evento
A.
Con los valores indicados en el diagrama y las fórmulas de Probabilidad Total y el
teorema de Bayes se obtienen las respuestas.
a) P(A) = P(B)P(AlB) + P(Bc)P(AlBc) = (0.4)(.03) + (0.6)(0.8) = 0.6
b) P(BlA) = P(B⋂A)/P(A) = P(B)P(AlB)/P(A) = (0.4)(0.3)/0.6 = 0.2
c) P(BlAc) = P(B⋂Ac)/P(Ac) = P(B)P(AclB)/P(Ac) = (0.4)(0.7)/0.4 = 0.7
4.- Una fábrica tiene 3 máquinas M1, M2 y M3 para la producción de sus artículos.
El siguiente cuadro describe el porcentaje de producción diaria de cada una y la
frecuencia de artículos defectuosos que producen cada una.
Suponga que se elige al azar un artículo de la producción total de un día y que
resulte defectuoso. Determine la probabilidad de que haya sido producido en la
máquina M1.
Solución:
𝑃(𝐵1 ⃓𝐴) =
𝑃(𝐵1 )𝑃(𝐴⃓𝐵1 )
(0.5)(0.04)
=
= 0.625 = 62.5%
𝑃(𝐴)
0.032
5.- En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los
niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24
meses. Un pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea
una niña.
SOLUCIÓN:
Se definen los sucesos:
Suceso H: seleccionar una niña.
Suceso V: seleccionar un niño.
Suceso M: infante menor de 24 meses.
En los ejercicios de probabilidad total y teorema de bayes, es importante identificar
los sucesos que forman la población y cuál es la característica que tienen en común
dichos sucesos. Estos serán los sucesos condicionados.
a. En este caso, la población es de los infantes. Y la característica en común es que
sean menores de 24 meses. Por lo tanto, la probabilidad de seleccionar un infante
menor de 24 meses es un ejemplo de probabilidad total. Su probabilidad será:
b. Para identificar cuando en un ejercicio se hace referencia al teorema de bayes,
hay que partir de reconocer esta es una probabilidad condicionada y que la
característica común de los sucesos condicionantes ya ha ocurrido. Entonces, la
probabilidad de que sea niña una infanta menor de 24 meses será:
6.- Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el 20% se
realizan correcciones faciales, un 35% implantes mamarios y el restante en otras cirugías
correctivas. Se sabe, además, que son de género masculino el 25% de los que se realizan
correcciones faciales, 15% implantes mamarios y 40% otras cirugías correctivas. Si se
selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, determine la probabilidad que se haya
realizado una cirugía de implantes mamarios.
SOLUCIÓN:
Se definen los sucesos:
Suceso F: pacientes que se realizan cirugías faciales
Suceso M: pacientes que se realizan implantes mamarios
Suceso O: pacientes que se realizan otras cirugías correctivas
Suceso H: pacientes de género masculino
a. La probabilidad de que sea de género masculino se refiere a un problema de
probabilidad total, ya que es el suceso condicionado y las cirugías los
condicionantes. Dicho valor será:
b. Como el suceso condicionado ha ocurrido entonces se aplica el teorema de
bayes, luego, el valor de la probabilidad será:
7.- Un Doctor dispone de tres equipos electrónicos para realizar ecosonogramas. El uso
que le da a cada equipo es de 25% al primero, 35% el segundo en y 40% el tercero. Se
sabe que los aparatos tienen probabilidades de error de 1%, 2% y 3% respectivamente. Un
paciente busca el resultado de una ecografía y observa que tiene un error. Determine la
probabilidad de que se ha usado el primer aparato.
SOLUCIÓN:
Se definen los sucesos:
Suceso P: seleccionar el primer aparato
Suceso S: seleccionar el segundo aparato
Suceso T: seleccionar el tercer aparato
Suceso E: seleccionar un resultado con error
Se puede observar que la pregunta es sobre determinar la probabilidad de que un
examen errado sea del primer aparato, es decir, ya ha ocurrido el error. Por lo tanto,
debemos recurrir al teorema de bayes. Claro está, que es necesario de igual forma
obtener la probabilidad de que los aparatos produzcan un resultado erróneo, por lo
tanto:
8.- La probabilidad de que haya un accidente en una fábrica que dispone de alarma
es 0.1. La probabilidad de que suene esta sí se ha producido algún incidente es de
0.97 y la probabilidad de que suene si no ha sucedido ningún incidente es 0.02.
En el supuesto de que haya funcionado la alarma, ¿cuál es la probabilidad de que
no haya habido ningún incidente?
Sean los sucesos:
I = Producirse incidente.
A = Sonar la alarma.
9.- Tres máquinas A, B y C, producen el 45%, 30% y 25%, respectivamente, del
total de las piezas producidas en una fábrica. Los porcentajes de producción
defectuosa de estas máquinas son del 3%, 4% y 5%. A) Tomamos al azar una pieza
y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la
máquina B. B) ¿Qué máquina tiene la mayor probabilidad de haber producido la
citada pieza defectuosa?
SOLUCIÓN:
A) Debemos calcular P(BlD). Por el teorema de Bayes.
B) Calculamos P(AlD) y P(ClD), comparándolas con el valor de P(BlD) ya
calculado.
10.- Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y una
negra y C con dos bolas rojas y 3 negras. Escogemos una al azar y extraemos una
bola. Si la bola ha sido roja, ¿Cuál es la probabilidad de haber sido extraída de la
urna A?
SOLUCIÓN:
Llamamos R= “sacar bola roja” y N= “sacar bola negra”. La probabilidad pedida es
P(AlR). Utilizando el teorema de Bayes tenemos:
11.- Dos tratamientos A y B curan una determinada enfermedad en un 20% y en un
30% de los casos, respectivamente. Suponiendo que ambos actúan de modo
independiente, ¿cuál de las dos estrategias siguientes es mejor?
a) Aplicar ambos tratamientos a la vez.
b) Aplicar primero el tratamiento B, y si no surte efecto aplicar el tratamiento A.
SOLUCIÓN. Sean los sucesos:
A = {el tratamiento A cura una determinada enfermedad},
B = {el tratamiento B cura la misma enfermedad}.
Por hipótesis sabemos que P(A) = 0.2 y P(B) = 0.3.
a) Consideramos en primer lugar la estrategia de aplicar ambos tratamientos a
la vez. La probabilidad que tiene dicha estrategia de curar la enfermedad
viene dada por
P(A∪B) = P(A) +P(B)−P(A∩B),
pues al aplicar ambos tratamientos a la vez, o bien actúa uno, o bien el otro, o bien
los dos al mismo tiempo.
Ahora bien, se supone que los tratamientos actúan de manera independiente, por
lo que
P(A∩B) = P(A)·P(B) = 0.2 · 0.3 = 0.06,
y entonces
P(A∪B) = 0.2+0.3−0.06 = 0.44.
Luego, los dos tratamientos aplicados a la vez curan la enfermedad en un 44% de
los casos.
b) Si aplicamos primero el tratamiento B, puede ocurrir que éste cure la
enfermedad o no. Si cura la enfermedad, esta estrategia tiene probabilidad
P(B) = 0.3. Si el tratamiento B no surte efecto entonces aplicamos el
tratamiento A, cuya probabilidad de curación es P(A) = 0.2. Por tanto, esta
estrategia tiene una probabilidad de curar la enfermedad de
máx {P(A),P(B)} = max´ {0.2,0.3} = 0.3.
En conclusión, podemos afirmar que la primera estrategia es mejor que la segunda,
con un 14% más de éxitos.
12.- Se estima que el 15% de la población adulta padece de hipertensión, pero que
el 75% de todos los adultos creen no tener este problema. Se estima también que
el 6% de la población tiene hipertensión, aunque no es consciente de padecerla. Si
un paciente adulto opina que no tiene hipertensión, ¿cuál es la probabilidad de que
realmente sea hipertenso?
SOLUCIÓN. Consideramos los sucesos:
A1 = {el paciente tiene hipertensión},
A2 = {el paciente no tiene hipertensión},
los cuales forman un sistema completo. Por hipótesis P(A1) = 0.15, luego P(A2) =
0.85.
Por otra parte, consideramos los sucesos:
B1 = {el paciente es consciente de padecer hipertensión},
B2 = {el paciente no es consciente de padecer hipertensión}.
Conjugando los datos del problema con el hecho de que B1 y B2 son
complementarios encontramos que
P(B1) = 0.25 y P(B2) = 0.75.
Por hipótesis se tiene que P(B2/A1) = 0.06. La probabilidad de que un paciente
adulto sea realmente hipertenso cuando opina que no tiene hipertensión (esto es,
no es consciente de padecerla) viene dada por P(A1/B2). En virtud del Teorema de
Bayes, esta probabilidad a posteriori puede ser calculada como:
Podemos concluir entonces que un 1.2% de los pacientes que opinan que no
padecen de hipertensión son realmente hipertensos.
13.- Cierta enfermedad puede ser producida por tres tipos de virus A, B, C. En un
laboratorio se tienen tres tubos con el virus A, dos con el B y cinco con el C. La
probabilidad de que el virus A produzca la enfermedad es 1/3, que la produzca B es
2/3 y que la produzca C es 1/7.
a) Si se inocula algún virus a un animal, ¿cuál es la probabilidad de que éste
contraiga la enfermedad?
b) Si se inocula un virus a un animal y contrae la enfermedad, ¿cuál es la
probabilidad de que el virus inyectado fuera C?
SOLUCIÓN. Estamos considerando el experimento de inocular alguno de los tres
virus disponibles en el laboratorio a un determinado animal. Los posibles resultados
del experimento son dos: que el animal contraiga la enfermedad, o que no la
contraiga.
Sean los sucesos:
A = {el animal es inoculado con virus del tipo A},
B = {el animal es inoculado con virus del tipo B},
C = {el animal es inoculado con virus del tipo C}.
Al tener una muestra de 10 tubos y ser equiprobable la elección de éstos, las
probabilidades de los sucesos anteriores vienen dadas por:
a) Consideramos ahora el suceso
E = {el animal contrae la enfermedad}.
Como consecuencia del Teorema de la Probabilidad Total y del hecho de que A,
B y C forman un sistema completo de sucesos, se tiene:
pues por hipótesis la probabilidad de que el virus A produzca la enfermedad es
P(E/A) = 1/3, de que la produzca B, P(E/B) = 2/3 y de que la produzca C, P(E/C)
= 1/7.
b) Por otra parte, si sabemos que el animal contrae la enfermedad, en virtud del
Teorema de Bayes la probabilidad a posteriori P(C/E) de que el animal haya
sido infectado por el virus C viene dada por:
Podemos concluir, por tanto, que en el 23.4% de los casos en que un animal
haya contraído la enfermedad, ésta ha sido producida por el virus C.
14.- Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera
de tres hoteles de la ciudad; Palacio del sol, Sicomoros o Fiesta Inn, en una
proporción de 18.5%, 32% y 49.5% respectivamente, de los cuales se ha tenido
información de que se les ha dado un mal servicio en un 2.8%, 1% y 4%
respectivamente, si se selecciona un visitante al azar ¿Cuál es la probabilidad de
que no se le haya dado un mal servicio?
SOLUCIÓN: Haciendo un diagrama de árbol.
NQ= evento de que un visitante no se queje del servicio
PS= evento de que un visitante haya sido hospedado en el hotel Palacio del Sol
S= evento de que un visitante haya sido hospedado en el hotel Sicomoro
FI= evento de que un visitante haya sido hospedado en el hotel Fiesta Inn
15.- Un test detecta la presencia de cierto tipo T de bacterias en el agua con
probabilidad 0.9, en caso de haberlas. Si no las hay, detecta la ausencia con
probabilidad de 0.8. Sabiendo que la probabilidad de que una muestra de agua
contenga bacterias del tipo T es 0.2, calcular la probabilidad de que:
a) Realmente haya presencia de bacterias cuando el test ha dado resultado positivo.
b) Realmente haya presencia de bacterias cuando el test ha dado resultado
negativo.
c) Haya bacterias y además el test dé positivo.
d) O haya bacterias, o el test dé positivo.
SOLUCIÓN. Consideramos los sucesos:
A1 = {la muestra contiene bacterias tipo T},
A2 = {la muestra no contiene bacterias tipo T}.
Nótese que ambos sucesos A1 y A2 forman un sistema completo, es decir, son
complementarios en el espacio muestral del experimento que estamos
considerando. Por hipótesis P(A1) = 0.2, obligando a que
P(A2) = P (A c 1) = 1−0.2 = 0.8.
Por otra parte, sean los sucesos:
T + = {el test detecta la presencia de bacterias},
T − = {el test no detecta la presencia de bacterias}.
De acuerdo con los datos disponibles, sabemos que
P (T +/A1) = 0.9 y P (T −/A2) = 0.8,
de modo que las siguientes probabilidades, correspondientes a los sucesos
condicionados complementarios, vienen dadas por:
P (T −/A1) = 0.1 y P (T +/A2) = 0.2.
a) En virtud del Teorema de Bayes, la probabilidad P (A1/T +) de que realmente
haya presencia de bacterias cuando el resultado del test ha sido positivo
viene dada por
b) De igual manera, la probabilidad de que realmente haya presencia de
bacterias cuando el test ha resultado negativo es
c) La probabilidad de que haya bacterias y además el test dé positivo es:
P (A1 ∩T +) = P(A1) ·P (T +/A1) = 0.2 · 0.9 = 0.18.
Nótese que, como P (T +) = 0.34, también tenemos
P (A1 ∩T +) = P (T +) ·P (A1/T +) = 0.34 · 0.53 ' 0.18.
d) Finalmente, la probabilidad de que o bien haya bacterias en el agua o el test
dé positivo viene dada por:
P (A1 ∪T +) = P(A1) +P (T +) −P (A1 ∩T +) = 0.2+0.34−0.18 = 0.36.
Bibliografía
Murray, R. S. (2003). Probabilidad y Estadística. México: McGrawHill.
Wapole, R. M. (2012). Probabilidad y estadística para ingeniería y ciencias (novena ed.). México:
Pearson.
Descargar