efbgackdhefbgackdh

Anuncio
Asignatura: Técnicas Avanzadas de Razonamiento
Carrera: Ingeniería en Informática (UNED)
Febrero de 2005, 2ª semana
Tenemos una red bayesiana formada por nueve variables binarias y los siguientes
enlaces: A → B, A → D, B → E, B → F, C → F, C → G, D → G, D → H, F → K y G
→ K. Dada la evidencia {A=1 y K=0}, indique detalladamente los pasos necesarios
para calcular la probabilidad a posteriori de B mediante el método del árbol de
unión.
[Se supone que conocemos las tablas de probabilidades condicionadas que
definen la red: P(a), P(b | a), etc., pero no las damos en el enunciado porque sólo
queremos que el alumno explique los pasos que hay que dar, sin que realice
cálculos numéricos.]
SOLUCIÓN
El grafo asociado a la red bayesiana del enunciado es el siguiente:
A
C
B
E
D
H
G
F
K
• En primer lugar hay que moralizar el grafo dirigido de la figura. Para ello
primeramente se añade una arista entre cada par de nodos con algún hijo común. En
el caso del grafo de la figura, hay que añadir las aristas:
{B  C, C  D, F  G}
El grafo moral resultante es el siguiente:
A
C
B
E
D
G
F
H
K
• A continuación hay que triangular el grafo no dirigido anterior. Para ello se puede
llevar a cabo una triangulación de máxima cardinalidad eligiendo A, por ejemplo,
como nodo inicial:
−
Inicialmente la lista L’ de aristas nuevas está vacía: L’ = ∅.
−
Realizaremos una numeración α de máxima cardinalidad del grafo no dirigido.
Por tanto, α(1) = A.
−
Los candidatos para la asignación de α(2) son: {B, D}. Elegimos arbitrariamente
α(2) = B. Como los vecinos de B previamente numerados, {A}, forman un
conjunto completo, no se añade ninguna arista y la numeración continúa.
−
Los candidatos para la asignación de α(3) son: {C, D, E, F}. Elegimos
arbitrariamente α(3) = D. Como los vecinos de D previamente numerados, {A},
forman un conjunto completo, no se añade ninguna arista y la numeración
continúa. En la figura siguiente aparece el estado actual del proceso de
numeración:
1
2
C
B
E
A
D
3
H
G
F
K
−
La única posibilidad es que α(4) = C. Como los vecinos de C previamente
numerados, {B, D}, no forman un conjunto completo, se añade la arista {B  D}
a L’ y la numeración se reinicia.
1
2
E
A
C
B
D
4
G
F
3
H
K
−
Repitiendo las mismas acciones que en la numeración parcial anterior, α(1) = A,
α(2) = B, α(3) = D, α(4) = C y α(5) = F. El siguiente nodo que hay que numerar
es G, pero sus vecinos ya numerados {D, F} no forman un conjunto completo,
por lo que hay que añadir la arista {F  D}.
−
En el siguiente proceso de numeración se consigue numerar todos los nodos tal
como se indica en la siguiente figura:
1
2
E
8
A
C
B
6
K
3
H
G
F
5
D
4
9
7
Por tanto, hemos obtenido una numeración perfecta del grafo no dirigido; en
consecuencia, dicho grafo es triangulado.
• Seguidamente hay que generar una cadena de conglomerados (sucesión de
conglomerados que satisface la propiedad de intersección dinámica) a partir del
grafo triangulado anterior. Los conglomerados de dicho grafo son:
{{B, E}, {D, H}, {A, B, D}, {F, G, K}, {B, C, D, F}, {C, D, F, G}}
Si asignamos a cada conglomerado el máximo de los números de sus nodos en la
numeración perfecta:
BE ⇐ 8
DH ⇐ 9
ABD ⇐ 3
FGK ⇐ 7
BCDF ⇐ 5
CDFG ⇐ 6
podemos ordenar los conglomerados en una cadena del siguiente modo:
C1 = {ABD}, C2 = {BCDF}, C3 = {CDFG}, C4 = {FGK}, C5 = {BE} y C6 = {DH}.
• Finalmente, generamos un árbol de unión a partir de la cadena de conglomerados
anterior. Para ello, para cada conglomerado Ci escogemos un conglomerado de entre
{C1, ..., Ci−1} con el máximo número de nodos comunes y añadimos una arista entre
dichos nodos:
− Al principio, el conjunto de aristas del árbol de unión está vacío: L’ = ∅.
− C2: añadimos C1  C2 a L’, con lo que L’ = { C1  C2}.
ABD
BCDF
− C3: añadimos C2  C3 a L’, con lo que L’={ C1  C2, C2  C3 }.
ABD
BCDF
CDFG
− C4: añadimos C3  C4 a L’, con lo que L’={ C1  C2, C2  C3, C3  C4 }.
C1
ABD
C2 B C D F
C3 C D F G
C4
FGK
− C5: añadimos C2  C5 a L’, con lo que L’={ C1  C2, C2  C3, C3  C4, C2 
C5 }.
− C6: añadimos C2  C6 a L’, con lo que L’={ C1  C2, C2  C3, C3  C4, C2 
C5, C2  C6 }.
En la figura siguiente, además de dibujar los conjuntos separadores, hemos
asociado cada familia de nodos a un conglomerado que la contenga. El potencial de
cada conglomerado se obtiene multiplicando las probabilidades pertenecientes a sus
familias asociadas:
DH
D
Ψ6(d, h) = p(h | d)
ABD
Ψ1(a, b, d) = p(a) ⋅ p(b | a) ⋅ p(d | a)
BD
Ψ2(b, c, d, f) = p(f | b, c) ⋅ p(c)
BCDF
CDF
B
BE
Ψ5(b, e) = p(e | b)
CDFG Ψ3(c, d, f, g) = p(g | c, d)
FG
FGK
Ψ4(f, g, k) = p(k | f, g)
• A continuación hay que calcular los mensajes entre conglomerados vecinos del árbol
de unión, una vez que se ha sustituido la evidencia, {a = 1, k = 0}, en los potenciales
de los conglomerados (en este caso, sólo en Ψ1 y Ψ4). Como sólo estamos
interesados en calcular la probabilidad a posteriori de B, elegimos el segundo
conglomerado y calculamos los mensajes M12, M62, M52, M32 y M43:
− M12(b, d) = Ψ1(a = 1, b, d).
− M62(d) = Σh Ψ6(d, h).
− M52(b) = Σe Ψ5(b, e).
− M43(f, g) = Ψ4(f, g, k = 0).
− M32(c, d, f) = Σg Ψ3(c, d, f, g) ⋅ M43(f, g).
• Una vez calculados los mensajes, se puede hallar la función de probabilidad del
segundo conglomerado:
P(C2) = P(b, c, d, f) = α ⋅ Ψ2(b, c, d, f) ⋅ M12(b, d) ⋅ M62(d) ⋅ M52(b) ⋅ M32(c, d, f)
donde α es una constante de normalización.
• Finalmente, marginalizando P(C2) sobre C, D y F obtenemos la probabilidad a
posteori de B dada la evidencia:
P(B | a = 1, k = 0) = Σc, d, f P(C2)
Un determinado país A tiene que decidir si invadir otro país B. El coste de la invasión se
ha estimado en 100.000 unidades, aunque la explotación a largo plazo por parte de A de
los recursos naturales de B, una vez invadido, está valorada en 1.000.000 unidades. El país
A ha estudiado cuál podría ser el grado de apoyo en la invasión que podría lograr de
países terceros amigos en caso de decidir que la invasión se realice. Dicho estudio ha
arrojado el siguiente resultado: apoyo nulo con probabilidad 0.05, apoyo medio con
probabilidad 0.8 y apoyo alto con probabilidad 0.15. En caso de obtener un apoyo medio,
el país A vería reducido el coste de la invasión en 50.000 unidades y la obtención de
recursos por explotación (hay más países a repartir...) se reduciría en 200.000 unidades
para A. En caso de obtener un apoyo alto, el país A vería reducido el coste de la invasión
en 60.000 unidades y la obtención de recursos por explotación se reduciría en 500.000
unidades.
La invasión de B influirá en la posterior estabilidad social en dicho país. En caso de
invasión, los servicios de inteligencia de A han realizado la siguiente estimación: una
probabilidad de 0.9 de inestabilidad social alta en B y una probabilidad de 0.1 de
inestabilidad social media en B. Hay que tener en cuenta que una inestabilidad social alta
en B daría lugar a atentados de la resistencia local contra A, que originarían unas
pérdidas estimadas de 100.000 unidades para A. Una inestabilidad social media en B
originaría un coste para A de 10.000 unidades. Otro parámetro importante que estudia A
es la inestabilidad política que puede aparecer en su propio país como consecuencia de la
decisión de invasión, la inestabilidad social en B y en función del grado de apoyo de sus
aliados. En caso de decidir la invasión, los consejeros políticos del presidente del país A
han establecido la siguiente tabla de probabilidades de aparición de inestabilidad política
en su país:
Inestabilidad social alta
en B
Inestabilidad social media
en B
Inestabilidad social nula
en B
Apoyo nulo de aliados
Apoyo medio de aliados
Apoyo alto de aliados
0.95
0.75
0.55
0.75
0.45
0.25
0.25
0.15
0.05
La aparición de inestabilidad política en el propio país A terminaría con la retirada
anticipada de las tropas en B, lo cual reduciría los recursos obtenidos por explotación en
900.000 unidades.
Se pide modelar el dominio anterior mediante un diagrama de influencia y evaluar
dicho diagrama usando el método de eliminación de nodos sugerido por Olmsted. ¿Cuál es
la utilidad esperada en este problema?
SOLUCIÓN
La estructura de diagrama de influencia que se corresponde con el conocimiento que aparece en
el enunciado es:
I
ISB
IPA
GAA
U
El nodo I representa la decisión de realizar o no la invasión (+i o ¬i, respectivamente). El
nodo ISB hace referencia a la situación de inestabilidad social en B como consecuencia de la
invasión (nula, media o alta). IPA se corresponde con la situación de inestabilidad política en A
(presente o ausente). Finalmente, GAA representa el grado de apoyo que ofrecerían los aliados a
una posible invasión (nulo, medio o alto).
Las tablas de probabilidades condicionadas asociadas a ISB, IPA y GAA son:
P(ISB | I)
nula
media
alta
+i
0
0.1
0.9
¬i
1
0
0
P(IPA=presente | ISB, GAA)
ISB=nula
ISB=media
ISB=alta
GAA=nulo
0.25
0.75
0.95
GAA=medio
0.15
0.45
0.75
GAA=alto
0.05
0.25
0.55
P(GAA)
nulo
0.05
medio
0.15
alto
0.8
La segunda tabla corresponde al caso en que se ha decidido llevar a cabo la invasión. La tabla
asociada al nodo utilidad en función de las condiciones expresadas en el enunciado del
problema es:
I
ISB
IPA
GAA
U(I, ISB, IPA, GAA)
¬i
presente
nula
ausente
presente
+i media
ausente
presente
alta
ausente
nulo
medio
alto
nulo
medio
alto
nulo
medio
alto
nulo
medio
alto
nulo
medio
alto
nulo
medio
alto
−100.000 + 1.000.000 − 900.000
−100.000 + 1.000.000 + 50.000 − 200.000 − 900.000
−100.000 + 1.000.000 + 60.000 − 500.000 − 900.000
−100.000 + 1.000.000
−100.000 + 1.000.000 + 50.000 − 200.000
−100.000 + 1.000.000 + 60.000 − 500.000
−100.000 + 1.000.000 − 10.000 − 900.000
−100.000 + 1.000.000 + 50.000 − 200.000 − 10.000 − 900.000
−100.000 + 1.000.000 + 60.000 − 500.000 − 10.000 − 900.000
−100.000 + 1.000.000 − 10.000
−100.000 + 1.000.000 + 50.000 − 200.000 − 10.000
−100.000 + 1.000.000 + 60.000 − 500.000 − 10.000
−100.000 + 1.000.000 − 100.000 − 900.000
−100.000 + 1.000.000 + 50.000 − 200.000 − 100.000 − 900.000
−100.000 + 1.000.000 + 60.000 − 500.000 − 100.000 − 900.000
−100.000 + 1.000.000 − 100.000
−100.000 + 1.000.000 + 50.000 − 200.000 − 100.000
−100.000 + 1.000.000 + 60.000 − 500.000 − 100.000
0
0
−150.000
−440.000
900.000
750.000
460.000
−10.000
−160.000
−450.000
890.000
740.000
450.000
−100.000
−250.000
−540.000
800.000
650.000
360.000
A continuación iniciamos el proceso de evaluación del diagrama de influencia anterior.
• En primer lugar, no hay nodos sumidero que eliminar.
• Existe un nodo aleatorio que puede ser eliminado: IPA. El nuevo diagrama de influencia
tras la eliminación sería:
I
ISB
U
GAA
La nueva tabla asociada al nodo utilidad se calcula a partir de la ecuación de la
página 211 del texto “Fundamentos de los Sistemas de Ayuda a la Decisión”:
I
ISB
GAA
U(I, ISB, GAA)
¬i
nulo
nula medio
alto
nulo
+i media medio
alto
nulo
alta medio
alto
0 ⋅ 0.25 + 900.000 ⋅ 0.75
−150.000 ⋅ 0.15 + 750.000 ⋅ 0.85
−440.000 ⋅ 0.05 + 460.000 ⋅ 0.95
−10.000 ⋅ 0.75 + 890.000 ⋅ 0.25
−160.000 ⋅ 0.45 + 740.000 ⋅ 0.55
−450.000 ⋅ 0.25 + 450.000 ⋅ 0.75
−100.000 ⋅ 0.95 + 800.000 ⋅ 0.05
−250.000 ⋅ 0.75 + 650.000 ⋅ 0.25
−540.000 ⋅ 0.55 + 360.000 ⋅ 0.45
0
675.000
615.000
415.000
215.000
335.000
225.000
−55.000
−25.000
−135.000
En las operaciones realizadas en la última columna de esta tabla se han tenido en cuenta
las probabilidades P(IPA | ISB, GAA).
• A continuación se puede eliminar el nodo aleatorio GAA, teniendo en cuenta P(GAA).
I
ISB
U
I
ISB
U(I, ISB)
¬i
nula
+i media
alta
0.05 ⋅ 675.000 + 0.15 ⋅ 615.000 + 0.8 ⋅ 415.000
0.05 ⋅ 215.000 + 0.15 ⋅ 335.000 + 0.8 ⋅ 225.000
0.05 ⋅ (−55.000) + 0.15 ⋅ (−25.000) + 0.8 ⋅ (−135.000)
0
458.000
241.000
−114.500
• Seguidamente se puede eliminar el nodo aleatorio ISB, a partir de P(ISB | I):
I
U
I
¬i
+i
U(I)
458.000 ⋅ 0 + 241.000 ⋅ 0.1 − 114.500 ⋅ 0.9
0
−78.950
• Finalmente, eliminaríamos el nodo I eligiendo aquella alternativa que conduce a un valor
de utilidad mayor, en este caso I = ¬i.
Por tanto, la utilidad esperada para A sería 0, ya que la estrategia óptima consiste en no invadir
el país B. (Una mente perversa podría dedicarse a estudiar cómo habría que cambiar los
parámetros del diagrama de influencia para que interesara realizar la invasión...)
Descargar