Tema 6 Razonamiento aproximado Ampliación de Ingeniería del Conocimiento Eva Millán 1 Esquema del tema 6.1. Introducción al razonamiento aproximado 6.2. El modelo de factores de certeza 6.3. Conjuntos difusos 6.4. Redes bayesianas TEORÍA 6.5. El lenguaje Fuzzy Clips y la herramienta HUGIN 6.6 Aplicaciones al diagnóstico y el control PRÁCTICA 2 6.1. Introducción al razonamiento aproximado Necesidad de razonamiento aproximado Apuntes históricos • • 3 Necesidad de razonamiento aproximado (I) El modelo ideal del razonamiento (humano o mecánico) es el razonamiento exacto. En mundo real se suele razonar con información que es: – – 4 incierta imprecisa Necesidad de razonamiento aproximado (II) Clasificación de las fuentes de incertidumbre: – – – Deficiencias de la información, Características del mundo real, Deficiencias del modelo. 5 Necesidad de razonamiento aproximado (III) Ejemplos: 6 Falta historial Falta memoria Engaño – Información incompleta Pruebas caras – Información errónea Descripción incorrecta – Información imprecisa – Mundo real no determinista – Modelo incompleto desconocidas – Modelo inexacto Dificultad cuantificar Historial incorrecto Falsos positivos Aleatoriedad Enfermedades Estimaciones subjetivas parámetros Excepciones Desacuerdos Imposibilidad Problemas mecanismos razonamiento Necesidad de razonamiento aproximado (IV) Todas estas fuentes de incertidumbre se dan en: – – – – – ciencias naturales, ingeniería, derecho, humanidades problemas típicos de AI: reconocimiento del lenguaje natural (hablado/escrito), aprendizaje, visión artificial, robótica, recuperación de información, juegos complejos sistemas adaptativos 7 Necesidad de razonamiento aproximado (V) En resumen, el tratamiento de la incertidumbre es, junto con la representación del conocimiento y el aprendizaje, uno de los problemas fundamentales de la Inteligencia Artificial En este tema nos centraremos en los llamados métodos numéricos 8 Apuntes históricos (I) 1. Método probabilista clásico – – – En el siglo XVIII, Bayes y Laplace propusieron la probabilidad como una medida de la creencia personal. Con el método probabilístico clásico se construyeron los primeros sistemas de diagnóstico médico Inconvenientes principales: gran cantidad de parámetros (probabilidades) gran complejidad computacional poca verosimilitud de las hipótesis simplificadoras 9 Apuntes históricos (II) 2. Programación basada en reglas (años 60-70) – Dendral utiliza con éxito la programación basada en reglas – Los creadores de MYCIN buscaban un método de computación eficiente que pudiera adaptarse al razonamiento mediante encadenamiento de reglas. – Desarrollan un método propio, consistente en asignar a cada regla un factor de certeza. – Aunque el sistema obtiene excelentes resultados, éstos se deben más a la potencia del conjunto de reglas que al modelo de factores de certeza en sí, que hoy en día sabemos que tiene graves deficiencias. 10 Apuntes históricos: redes bayesianas 3. A principio de los años 80, Judea Pearl retoma el modelo probabilístico creando las redes bayesianas – – – – – – Este acontecimiento cambia completamente el escenario Modelo probabilista inspirado en la causalidad El modelo probabilístico tiene asociado un modelo gráfico, cuyos nodos representan variables y cuyos arcos representan mecanismos causales Extraordinario desarrollo experimentado por las redes bayesianas en las dos últimas décadas Se han construido modelos de diagnóstico y algoritmos eficientes para problemas con miles de variables Las universidades más importantes y las empresas punteras de informática tienen grupos de investigación dedicados a este tema 11 Características principales de las redes bayesianas La incertidumbre se representa basándose en teoría de la probabilidad La información se estructura en variables y relaciones de influencia causal entre ellas Relaciones de independencia condicional Parámetros: probabilidades condicionadas de cada variable dados sus padres Inferencias de tipo abductivo y predictivo 12 Ejemplos de empresas que utilizan redes bayesianas: – – – – – – – Digital, Hewlett Packard, diagnóstico de problemas de impresión IBM, Intel, Siemens Nokia Microsoft (Windows 95/98, Office 97/2000) 13 Apuntes históricos: lógica difusa 4. En 1965, Lofti Zadeh sienta las bases de la lógica difusa – – – – 14 Motivación inicial: estudio de la vaguedad Relación vaguedad ↔ incertidumbre Paradoja del céntimo de euro Solución: definir conjuntos con grados de pertenencia Éxito de la lógica difusa : Desde el punto de vista práctico: miles de aplicaciones, la mayoría en sistemas de control Desde el punto de vista teórico: muchas áreas de las matemáticas, lógica, económicas, etc. se han “difuminado” desde entonces. Características principales de la lógica difusa Se intenta representar la vaguedad e imprecisión inherentes en el lenguaje natural Utiliza varios elementos: conjuntos difusos, variables difusas, relaciones difusas, reglas difusas Dichos elementos se combinan entre sí en el proceso de inferencias El proceso de inferencias incluye pasos que pasan la información nítida a difusa y viceversa 15 Un poco de publicidad... OLYMPUS ERGONÓMICA SRL 28-120 (2995 dólares) Poderoso lente zoom de 4.3x, 28-120 con elementos de lentes de cristal ED Sistema de flash doble incorporado. Ajuste de Exposición Automática programada Sistema de Medición TTL: Fuzzy logic ESP, Promedio Balanceado al Centro AEG Lavamat 64600 (429 euros) Carga: 5kg Revoluciones: 1400 rpm Características energéticas: A+,A,B Multi-Display Fuzzy Logic Programas especiales: Lavado a mano, Seda, Lana 16 Resumen: principales diferencias entre la lógica difusa y redes bayesianas Lógica difusa Información Estructurada como… Aplicación mayoritaria Incierta (grados pertenencia) Reglas SI….entonces Control Imprecisa Redes Relaciones Diagnóstico bayesianas (probabilidades) influencia causal 17 Resumen Métodos numéricos de tratamiento de la incertidumbre más importantes: – – – – 18 Método probabilístico clásico Factores de certeza * reglas SI...ENTONCES Lógica difusa * Redes bayesianas * relaciones causa-efecto