Asignatura: Técnicas Avanzadas de Razonamiento Carrera: Ingeniería en Informática (UNED) Febrero de 2005, 2ª semana Tenemos una red bayesiana formada por nueve variables binarias y los siguientes enlaces: A → B, A → D, B → E, B → F, C → F, C → G, D → G, D → H, F → K y G → K. Dada la evidencia {A=1 y K=0}, indique detalladamente los pasos necesarios para calcular la probabilidad a posteriori de B mediante el método del árbol de unión. [Se supone que conocemos las tablas de probabilidades condicionadas que definen la red: P(a), P(b | a), etc., pero no las damos en el enunciado porque sólo queremos que el alumno explique los pasos que hay que dar, sin que realice cálculos numéricos.] SOLUCIÓN El grafo asociado a la red bayesiana del enunciado es el siguiente: A C B E D H G F K • En primer lugar hay que moralizar el grafo dirigido de la figura. Para ello primeramente se añade una arista entre cada par de nodos con algún hijo común. En el caso del grafo de la figura, hay que añadir las aristas: {B C, C D, F G} El grafo moral resultante es el siguiente: A C B E D G F H K • A continuación hay que triangular el grafo no dirigido anterior. Para ello se puede llevar a cabo una triangulación de máxima cardinalidad eligiendo A, por ejemplo, como nodo inicial: − Inicialmente la lista L’ de aristas nuevas está vacía: L’ = ∅. − Realizaremos una numeración α de máxima cardinalidad del grafo no dirigido. Por tanto, α(1) = A. − Los candidatos para la asignación de α(2) son: {B, D}. Elegimos arbitrariamente α(2) = B. Como los vecinos de B previamente numerados, {A}, forman un conjunto completo, no se añade ninguna arista y la numeración continúa. − Los candidatos para la asignación de α(3) son: {C, D, E, F}. Elegimos arbitrariamente α(3) = D. Como los vecinos de D previamente numerados, {A}, forman un conjunto completo, no se añade ninguna arista y la numeración continúa. En la figura siguiente aparece el estado actual del proceso de numeración: 1 2 C B E A D 3 H G F K − La única posibilidad es que α(4) = C. Como los vecinos de C previamente numerados, {B, D}, no forman un conjunto completo, se añade la arista {B D} a L’ y la numeración se reinicia. 1 2 E A C B D 4 G F 3 H K − Repitiendo las mismas acciones que en la numeración parcial anterior, α(1) = A, α(2) = B, α(3) = D, α(4) = C y α(5) = F. El siguiente nodo que hay que numerar es G, pero sus vecinos ya numerados {D, F} no forman un conjunto completo, por lo que hay que añadir la arista {F D}. − En el siguiente proceso de numeración se consigue numerar todos los nodos tal como se indica en la siguiente figura: 1 2 E 8 A C B 6 K 3 H G F 5 D 4 9 7 Por tanto, hemos obtenido una numeración perfecta del grafo no dirigido; en consecuencia, dicho grafo es triangulado. • Seguidamente hay que generar una cadena de conglomerados (sucesión de conglomerados que satisface la propiedad de intersección dinámica) a partir del grafo triangulado anterior. Los conglomerados de dicho grafo son: {{B, E}, {D, H}, {A, B, D}, {F, G, K}, {B, C, D, F}, {C, D, F, G}} Si asignamos a cada conglomerado el máximo de los números de sus nodos en la numeración perfecta: BE ⇐ 8 DH ⇐ 9 ABD ⇐ 3 FGK ⇐ 7 BCDF ⇐ 5 CDFG ⇐ 6 podemos ordenar los conglomerados en una cadena del siguiente modo: C1 = {ABD}, C2 = {BCDF}, C3 = {CDFG}, C4 = {FGK}, C5 = {BE} y C6 = {DH}. • Finalmente, generamos un árbol de unión a partir de la cadena de conglomerados anterior. Para ello, para cada conglomerado Ci escogemos un conglomerado de entre {C1, ..., Ci−1} con el máximo número de nodos comunes y añadimos una arista entre dichos nodos: − Al principio, el conjunto de aristas del árbol de unión está vacío: L’ = ∅. − C2: añadimos C1 C2 a L’, con lo que L’ = { C1 C2}. ABD BCDF − C3: añadimos C2 C3 a L’, con lo que L’={ C1 C2, C2 C3 }. ABD BCDF CDFG − C4: añadimos C3 C4 a L’, con lo que L’={ C1 C2, C2 C3, C3 C4 }. C1 ABD C2 B C D F C3 C D F G C4 FGK − C5: añadimos C2 C5 a L’, con lo que L’={ C1 C2, C2 C3, C3 C4, C2 C5 }. − C6: añadimos C2 C6 a L’, con lo que L’={ C1 C2, C2 C3, C3 C4, C2 C5, C2 C6 }. En la figura siguiente, además de dibujar los conjuntos separadores, hemos asociado cada familia de nodos a un conglomerado que la contenga. El potencial de cada conglomerado se obtiene multiplicando las probabilidades pertenecientes a sus familias asociadas: DH D Ψ6(d, h) = p(h | d) ABD Ψ1(a, b, d) = p(a) ⋅ p(b | a) ⋅ p(d | a) BD Ψ2(b, c, d, f) = p(f | b, c) ⋅ p(c) BCDF CDF B BE Ψ5(b, e) = p(e | b) CDFG Ψ3(c, d, f, g) = p(g | c, d) FG FGK Ψ4(f, g, k) = p(k | f, g) • A continuación hay que calcular los mensajes entre conglomerados vecinos del árbol de unión, una vez que se ha sustituido la evidencia, {a = 1, k = 0}, en los potenciales de los conglomerados (en este caso, sólo en Ψ1 y Ψ4). Como sólo estamos interesados en calcular la probabilidad a posteriori de B, elegimos el segundo conglomerado y calculamos los mensajes M12, M62, M52, M32 y M43: − M12(b, d) = Ψ1(a = 1, b, d). − M62(d) = Σh Ψ6(d, h). − M52(b) = Σe Ψ5(b, e). − M43(f, g) = Ψ4(f, g, k = 0). − M32(c, d, f) = Σg Ψ3(c, d, f, g) ⋅ M43(f, g). • Una vez calculados los mensajes, se puede hallar la función de probabilidad del segundo conglomerado: P(C2) = P(b, c, d, f) = α ⋅ Ψ2(b, c, d, f) ⋅ M12(b, d) ⋅ M62(d) ⋅ M52(b) ⋅ M32(c, d, f) donde α es una constante de normalización. • Finalmente, marginalizando P(C2) sobre C, D y F obtenemos la probabilidad a posteori de B dada la evidencia: P(B | a = 1, k = 0) = Σc, d, f P(C2) Un determinado país A tiene que decidir si invadir otro país B. El coste de la invasión se ha estimado en 100.000 unidades, aunque la explotación a largo plazo por parte de A de los recursos naturales de B, una vez invadido, está valorada en 1.000.000 unidades. El país A ha estudiado cuál podría ser el grado de apoyo en la invasión que podría lograr de países terceros amigos en caso de decidir que la invasión se realice. Dicho estudio ha arrojado el siguiente resultado: apoyo nulo con probabilidad 0.05, apoyo medio con probabilidad 0.8 y apoyo alto con probabilidad 0.15. En caso de obtener un apoyo medio, el país A vería reducido el coste de la invasión en 50.000 unidades y la obtención de recursos por explotación (hay más países a repartir...) se reduciría en 200.000 unidades para A. En caso de obtener un apoyo alto, el país A vería reducido el coste de la invasión en 60.000 unidades y la obtención de recursos por explotación se reduciría en 500.000 unidades. La invasión de B influirá en la posterior estabilidad social en dicho país. En caso de invasión, los servicios de inteligencia de A han realizado la siguiente estimación: una probabilidad de 0.9 de inestabilidad social alta en B y una probabilidad de 0.1 de inestabilidad social media en B. Hay que tener en cuenta que una inestabilidad social alta en B daría lugar a atentados de la resistencia local contra A, que originarían unas pérdidas estimadas de 100.000 unidades para A. Una inestabilidad social media en B originaría un coste para A de 10.000 unidades. Otro parámetro importante que estudia A es la inestabilidad política que puede aparecer en su propio país como consecuencia de la decisión de invasión, la inestabilidad social en B y en función del grado de apoyo de sus aliados. En caso de decidir la invasión, los consejeros políticos del presidente del país A han establecido la siguiente tabla de probabilidades de aparición de inestabilidad política en su país: Inestabilidad social alta en B Inestabilidad social media en B Inestabilidad social nula en B Apoyo nulo de aliados Apoyo medio de aliados Apoyo alto de aliados 0.95 0.75 0.55 0.75 0.45 0.25 0.25 0.15 0.05 La aparición de inestabilidad política en el propio país A terminaría con la retirada anticipada de las tropas en B, lo cual reduciría los recursos obtenidos por explotación en 900.000 unidades. Se pide modelar el dominio anterior mediante un diagrama de influencia y evaluar dicho diagrama usando el método de eliminación de nodos sugerido por Olmsted. ¿Cuál es la utilidad esperada en este problema? SOLUCIÓN La estructura de diagrama de influencia que se corresponde con el conocimiento que aparece en el enunciado es: I ISB IPA GAA U El nodo I representa la decisión de realizar o no la invasión (+i o ¬i, respectivamente). El nodo ISB hace referencia a la situación de inestabilidad social en B como consecuencia de la invasión (nula, media o alta). IPA se corresponde con la situación de inestabilidad política en A (presente o ausente). Finalmente, GAA representa el grado de apoyo que ofrecerían los aliados a una posible invasión (nulo, medio o alto). Las tablas de probabilidades condicionadas asociadas a ISB, IPA y GAA son: P(ISB | I) nula media alta +i 0 0.1 0.9 ¬i 1 0 0 P(IPA=presente | ISB, GAA) ISB=nula ISB=media ISB=alta GAA=nulo 0.25 0.75 0.95 GAA=medio 0.15 0.45 0.75 GAA=alto 0.05 0.25 0.55 P(GAA) nulo 0.05 medio 0.15 alto 0.8 La segunda tabla corresponde al caso en que se ha decidido llevar a cabo la invasión. La tabla asociada al nodo utilidad en función de las condiciones expresadas en el enunciado del problema es: I ISB IPA GAA U(I, ISB, IPA, GAA) ¬i presente nula ausente presente +i media ausente presente alta ausente nulo medio alto nulo medio alto nulo medio alto nulo medio alto nulo medio alto nulo medio alto −100.000 + 1.000.000 − 900.000 −100.000 + 1.000.000 + 50.000 − 200.000 − 900.000 −100.000 + 1.000.000 + 60.000 − 500.000 − 900.000 −100.000 + 1.000.000 −100.000 + 1.000.000 + 50.000 − 200.000 −100.000 + 1.000.000 + 60.000 − 500.000 −100.000 + 1.000.000 − 10.000 − 900.000 −100.000 + 1.000.000 + 50.000 − 200.000 − 10.000 − 900.000 −100.000 + 1.000.000 + 60.000 − 500.000 − 10.000 − 900.000 −100.000 + 1.000.000 − 10.000 −100.000 + 1.000.000 + 50.000 − 200.000 − 10.000 −100.000 + 1.000.000 + 60.000 − 500.000 − 10.000 −100.000 + 1.000.000 − 100.000 − 900.000 −100.000 + 1.000.000 + 50.000 − 200.000 − 100.000 − 900.000 −100.000 + 1.000.000 + 60.000 − 500.000 − 100.000 − 900.000 −100.000 + 1.000.000 − 100.000 −100.000 + 1.000.000 + 50.000 − 200.000 − 100.000 −100.000 + 1.000.000 + 60.000 − 500.000 − 100.000 0 0 −150.000 −440.000 900.000 750.000 460.000 −10.000 −160.000 −450.000 890.000 740.000 450.000 −100.000 −250.000 −540.000 800.000 650.000 360.000 A continuación iniciamos el proceso de evaluación del diagrama de influencia anterior. • En primer lugar, no hay nodos sumidero que eliminar. • Existe un nodo aleatorio que puede ser eliminado: IPA. El nuevo diagrama de influencia tras la eliminación sería: I ISB U GAA La nueva tabla asociada al nodo utilidad se calcula a partir de la ecuación de la página 211 del texto “Fundamentos de los Sistemas de Ayuda a la Decisión”: I ISB GAA U(I, ISB, GAA) ¬i nulo nula medio alto nulo +i media medio alto nulo alta medio alto 0 ⋅ 0.25 + 900.000 ⋅ 0.75 −150.000 ⋅ 0.15 + 750.000 ⋅ 0.85 −440.000 ⋅ 0.05 + 460.000 ⋅ 0.95 −10.000 ⋅ 0.75 + 890.000 ⋅ 0.25 −160.000 ⋅ 0.45 + 740.000 ⋅ 0.55 −450.000 ⋅ 0.25 + 450.000 ⋅ 0.75 −100.000 ⋅ 0.95 + 800.000 ⋅ 0.05 −250.000 ⋅ 0.75 + 650.000 ⋅ 0.25 −540.000 ⋅ 0.55 + 360.000 ⋅ 0.45 0 675.000 615.000 415.000 215.000 335.000 225.000 −55.000 −25.000 −135.000 En las operaciones realizadas en la última columna de esta tabla se han tenido en cuenta las probabilidades P(IPA | ISB, GAA). • A continuación se puede eliminar el nodo aleatorio GAA, teniendo en cuenta P(GAA). I ISB U I ISB U(I, ISB) ¬i nula +i media alta 0.05 ⋅ 675.000 + 0.15 ⋅ 615.000 + 0.8 ⋅ 415.000 0.05 ⋅ 215.000 + 0.15 ⋅ 335.000 + 0.8 ⋅ 225.000 0.05 ⋅ (−55.000) + 0.15 ⋅ (−25.000) + 0.8 ⋅ (−135.000) 0 458.000 241.000 −114.500 • Seguidamente se puede eliminar el nodo aleatorio ISB, a partir de P(ISB | I): I U I ¬i +i U(I) 458.000 ⋅ 0 + 241.000 ⋅ 0.1 − 114.500 ⋅ 0.9 0 −78.950 • Finalmente, eliminaríamos el nodo I eligiendo aquella alternativa que conduce a un valor de utilidad mayor, en este caso I = ¬i. Por tanto, la utilidad esperada para A sería 0, ya que la estrategia óptima consiste en no invadir el país B. (Una mente perversa podría dedicarse a estudiar cómo habría que cambiar los parámetros del diagrama de influencia para que interesara realizar la invasión...)