Fundamentos de Matemática Difusa Daniel Reina Director: Leonardo Jiménez Moscovitz Matemático Especialista en Informática y Ciencias de la Computación Fundación Universitaria Konrad Lorenz Facultad de Matemáticas 10 de junio de 2008 Resumen Este trabajo presenta la base fundamental de la matemática difusa, dentro del desarrollo de un proyecto de investigación en la Universidad. Se tratan los conjuntos difusos, la lógica difusa y la aritmética difusa y las operaciones lógicas, conjuntistas o aritméticas que se pueden realizar 1 con estos objetos, así como sus propiedades. El tema se ha desarrollado buscando en lo posible una presentación preferiblemente axiomática 2 Índice Introducción 4 1. Preliminares 1.1. Desarrollo Intuitivo de la Matemática Difusa . . . . . . . . . . . 6 6 2. Fundamentación de la Matemática Difusa 2.1. Conjuntos Difusos y Lógica Difusa . . . . . . 2.2. La Función de Pertenencia . . . . . . . . . . . 2.3. Números Difusos . . . . . . . . . . . . . . . . 2.4. Variables Lingüísticas . . . . . . . . . . . . . 2.5. Proposiciones y Conectivos . . . . . . . . . . 2.6. Cuantificadores Difusos . . . . . . . . . . . . 2.6.1. Cuantificadores Difusos Absolutos . . 2.6.2. Cuantificadores Difusos Relativos . . . 2.7. Modificadores Lingüísticos (Linguistic Hedge) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 10 13 21 25 26 29 30 31 33 3. Operaciones Difusas 3.1. Operaciones entre Conjuntos Difusos . . . . . 3.1.1. Complementos Difusos . . . . . . . . . 3.1.2. Intersecciones Difusas (T-normas) . . 3.1.3. Uniones Difusas (T-conormas) . . . . 3.2. Operaciones Aritméticas en Intervalos Difusos 3.3. Operaciones Aritmeticas en Números Difusos 3.4. Reticula de Números Difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 34 35 37 39 40 43 48 4. Inferencia Difusa 4.1. Inferencia para Proposiciones Difusas Condicionales . . . . . . 4.1.1. Modus Ponens Generalizado . . . . . . . . . . . . . . . . 4.1.2. Modus Tollens Generalizado . . . . . . . . . . . . . . . . 4.1.3. Silogismo Hipotético Generalizado . . . . . . . . . . . . 4.2. Inferencia para Proposiciones Difusas Condicionales Calificadas 4.3. Inferencia de Proposiciones Cuantificadas . . . . . . . . . . . . . . . . . . 55 55 57 58 59 60 63 5. Conclusiones 67 Referencias 69 Introducción Este trabajo forma parte del desarrollo del proyecto de investigación del Grupo Promente de la Fundación Universitaria Konrad Lorenz, en el proyecto denominado Desarrollo de un Producto de Software para aplicación de la Lógica Difusa a los problemas de Regresión y Clasificación, dentro de la línea de Sistemas Computacionales Bioinspirados Dentro de los intereses del Grupo de Investigación Promente, se encuentra por supuesto el de la investigación sobre la fundamentación matemática. Este trabajo pretende introducir justamente los formalismos matemáticos, desde un punto de vista puramente teórico, aunque se introducen algunos ejemplos con el fin de aclarar los conceptos. Sin embargo, el alcance de este trabajo no pretende conecta la teoría con los sistemas prácticos, tema que se desarrolla por otros integrantes del grupo de investigación. Dentro de la literatura que se consigue en el área de los sistemas difusos, es proporcionalmente escasa la que se puede conseguir en idioma español, y más escasa aún la que trata de los temas matemáticos que se encuentran en los propios fundamentos de los sistemas difusos. Dentro del exámen bibliográfico que se realizó, aún en idioma inglés, pocos son los libros que tratan esta fundamentación teórica con la suficiente profundidad. Se examinó particularmente el libro de Ross [Ros04], que contiene abundante información tanto a nivel teórico como aplicado, así como el libro de George Klir y Bo Yuan, Fuzzy Sets and Fuzzy Logic [Gky95] que tiene también una excelente profundidad y tratamiento matemático. El presente trabajo se basa fuertemente en el libro de Klir & Yuan, del cual se toman varios ejemplos y desarrollos. Se hizo de esta manera para ir proporcionando, tanto al grupo de investigación como a quien consulte el libro de Klir & Yuan, de un punto de entrada al mismo y al excelente tratamiento y temática que el cobija. El tratamiento que aquí se hace de los temas abordados no es exhaustivo, dado que por limitaciones de tiempo y por los propios intereses del grupo, se ha centrado en solo algunos de los temas más relevantes alli tratados. Se espera con esto contribuir en algo a la literatura en idioma español sobre esta temática, así como familiarizar al lector con los temas que trata el libro de Klir & Yuan. En el capítulo 1 se hace una presentación intuitiva del concepto de matemática difusa, presentando un ejemplo simple. Alli se hace una presentación inicial de los conceptos de conjunto difuso y función de pertenencia, entre otros. En el capítulo 2, se presenta la fundamentación axiomática básica de la matemática difusa y una definición más formal de la función de pertenencia y sus propiedades. Con base en esto, se introduce el concepto de número difuso, llevando así el concepto de conjunto difuso al campo de los números reales o un subconjunto de ellos. Por otra parte, se presentan las variables lingüísticas y los llamados modificadores lingüísticos, que facilitan la conexión de la teoría estudiada con las expresiones más usuales del lenguaje natural que utiliza el ser humano en su comunicación habitual. Se expone también la teoría más general sobre los cuantificadores difusos, mencionando solo dos de los más importantes. 4 En el capítulo3 se presentan las operaciones difusas. Por una parte, se exponen las operaciones con conjuntos difusos, tales como complemento, unión e intersección, para pasar luego a las operaciones aritméticas tanto con números como con intervalos difusos. Se exponen las retículas de números difusos, que permiten introducir el concepto de orden en ellos. En el capítulo 4 se exponen los principales conceptos relacionados con la inferencia difusa, así como algunos de sus principales esquemas. Dentro de los temas que no se tocan en este trabajo, está el de los mecanismos de inferencia prácticos (que corresponden a otros integrantes del grupo de investigación). Por supuesto que tampoco se toca la mecánica práctica que utilizan. No se aborda por ejemplo el tema de las relaciones difusas, por cuanto no era relevante en esta etapa del proyecto de investigación. El trabajo se ha desarrollado en LaTex siguiendo muy de cerca las normas AMS (American Mathematical Association) para la presentación de trabajos en matemáticas. 5 1. Preliminares El concepto intuitivo de conjunto clásico corresponde al de una colección de objetos, reunidos usualmente mediante la referencia a alguna propiedad que los caracteriza. En teoría de conjuntos clásica, un conjunto esta bien definido si se puede determinar de manera absoluta si determinado elemento pertenece o no al conjunto sin ninguna ambigüedad. Las operaciones que se pueden realizar con los conjuntos clásicos, tales como la unión, intersección, complemento, diferencia se definen mediante axiomas sencillos que, como se verá en el desarrollo del trabajo, corresponden a casos particulares de la matemática difusa, en particular de los conjuntos difusos. La lógica clásica igualmente se puede considerar como un caso particular de la lógica difusa. Por tanto, es conveniente tener presente tanto los fundamentos de la misma, las operaciones que se pueden realizar con los objetos de la lógica, y las principales propiedades.que poseen dichas operaciones. La idea de la matemática difusa nació en un artículo de Lotfi A. Zadeh publicado en 1965, que tenía por título "Fuzzy Sets.en la cual se permite representar de forma matemática conceptos difusos, borrosos o imprecisos. La matemática difusa tiene en cuenta que solo en pocas ocasiones el concepto de blanco/negro o verdadero/falso es absoluto. Por el contrario, existen infinitos tonos de gris o valores de verdad en muchos de los aspectos de la realidad. Tras la publicación de la obra de Lotfi A. Zadeh, la lógica difusa comenzó a tener auge y se desarrollaron rápidamenta aplicaciones con base en ella. 1.1. Desarrollo Intuitivo de la Matemática Difusa Un conjunto clásico es definido de tal manera que divide los individuos en grupos: miembros y no miembros. Esta división es bien definida, no ambigüa, y se da de manera abrupta, y puede ser suficientemente válida para algunos conceptos y conjuntos, como por ejemplo la pertenencia de un número a N, o de una letra determinada al conjunto de las vocales en el idioma español. Siendo así, una función de pertenencia para un conjunto clásico A se puede definir como: 0 si el elemento no pertenece a A vA = (1) 1 si el elemento pertenece a A Sin embargo, muchos conceptos de clasificación presentan otra característica. Por ejemplo el conjunto de las personas altas o de los autos veloces, no tienen una frontera clara de clasificación, la cual se caracteriza más bien por ser poco precisa, de manera que se puede considerar la transición gradual desde la no pertenencia hasta la pertenencia total al conjunto. Para definir un conjunto difuso, se debe establecer una función de pertenencia (o también llamada función de membresía en algunos textos) que permita asignar a cada elemento, un valor real que indica que tanto pertenece al conjunto, generalmente en el intervalo unitario [0, 1] .Los valores más grandes denotan superior grado de pertenencia al conjunto, mientras que los valores pequeños denotan poca pertenencia. En los extremos, se tiene que el valor 0 denota ninguna 6 pertenencia mientras que el valor 1 denota pertenencia total..Usualmente se utiliza cualquiera de las siguientes notaciones para hacer referencia a esta función: κA : X → [0, 1] A : X → [0, 1] (2) (3) donde el símbolo A denota tanto al conjunto como a la función de pertenencia asociada. Se utilizará esta última notación, de la cual se puede verificar que no genera ninguna ambigüedad. En el campo aplicativo, la lógica difusa ha llegado a ser importante por cuanto permite al científico e ingeniero explotar la tolerancia a la imprecisión que se da en situaciones y problemas reales. La lógica difusa es de gran valor principalmente en los siguentes casos: Situaciones complejas donde es prácticamente imposible tener un modelo matemático que la represente adecuadamente. Esto puede deberse en parte a la complejidad del problema, y en parte a que no se tiene suficiente información sobre el mismo. Situaciones complejas donde intentar obtener una alta precisión puede llegar a ser muy costoso. Situaciones donde obtener una alta precisión puede requerir demasiado tiempo. Situaciones donde la solución encontrada por los métodos clásicos requiere simplificar excesivamente el problema real. En otras palabras, mediante los métodos clásicos se obtendría un modelo que no representa con adecuada fidelidad la situación de interés. Así, la lógica difusa tiene un gran potencial para entender sistemas que son esquivos a desarrollos analíticos por su complejidad [Ros04]. Este tipo de problemas no está circunscrito a ser de un determinado tipo; por ejemplo, pueden ser de tipo lineal o no lineal. En casos donde se presenta esta incertidumbre, es conveniente utilizar aproximadores universales, esto es, sistemas que describen en cierta manera el comportamiento de sistemas complejos, usualmente no lineales. Los sistemas difusos pueden verse como aproximadores universales, esto es, sistemas que describen en cierta manera el comportamiento de sistemas complejos, usualmente no lineales. Esta condición de aproximador universal ha sido demostrado en varios trabajos [Kos94]. En ellos se llegó a establecer un isomorfismo entre el álgebra abstracta y lineal y la estructura de un sistema difuso. Dicho isomorfismo se basa en esencia, en que el desarrollo de los sistemas difusos se basan en el teorema de aproximación de Stone-Weierstrass, que establece que toda función real contínua cuyo dominio es un intervalo compacto, esto es cerrado y acotado, puede ser aproximado uniformemente por polinomios. 7 Por otra parte, es común que al abordar inicialmente el tema de la lógica difusa asocie erradamente este término con la probabilidad como tal. Sin embargo [Ros04] hace una clara distinción entre estos dos términos: "difuso"hace referencia a una falta de distinción de un evento, mientras que la probabilidad describe la incertidumbre en la ocurrencia de dicho evento. Los conjuntos difusos representan conceptos lingüísticos como bajo, medio y alto, que se emplea a menudo para definir los estados de una variable. Tal variable normalmente se llama variable difusa. En Fig.1(a), por ejemplo, la temperatura dentro de un rango [T1 , T2 ] se caracteriza como una variable difusa, y se contrasta en la fig.1(b). Los estados de la variable difusa allí indicados son conjuntos difusos que representan cinco conceptos lingüísticos: muy bajo, bajo, medio, alto, muy alto. Todos ellos estan definidos por las funciones de pertenencia que se pueden expresar de la siguente forma: [T1 , T2 ] − > [0, 1]. Figura 1: Comparación entre conjuntos difusos y clásicos. La importancia de las variables difusas es que ellas facilitan las transiciones graduales entre los estados y por consiguiente, poseen una capacidad natural para expresar y tratar con observación e incertidumbre en la medida. Una medida suminstrada al sistema representado en la fig.1(a) es clasificada en algún estado según la frontera que la cobije mayormente.La incertidumbre en cuanto 8 al estado alcanza el valor máximo en cada frontera donde trapecios adyacentes se intersectan. En ese punto, una medida debe considerarse como evidencia para cualquiera de los dos estados en la frontera. Al tratar con las variables clásicas, fig. 1(b), el caso es muy diferente, ya que la incertidumbre incluso se ignora en este caso extremo; la medida se considera como evidencia exclusiva para uno de los estados en la frontera, dependiendo de cual estado contiene al punto fronterizo en la definición matemática. Dado que las variables borrosas capturan las incertidumbres de la medida como la parte de datos experimentales, ellos se armonizan más a la realidad que las variables clasicas. Es una paradoja interesante que las bases de datos alimentadas con variables borrosas nos proporcionan, de hecho, evidencia más exacta y más real de los fenómenos que la base de datos alimentadas con las variables clásicas. Aunque la matemática basada en los conjuntos difusos tiene mejor capacidad expresiva que la matemática basada en los conjuntos clásicos, su utilidad depende críticamente de la capacidad que se tenga para construir las funciones de pertenencia apropiadas para diferentes conceptos den diferentes contextos. Ejemplo 1.1 (Conjunto Difuso) Se considerarán [Gky95] ahora tres conjuntos difusos que representan los conceptos de persona joven, de mediana edad y vieja.Se puede obtener una expresión razonable de estos conceptos si se utilizan Mediana Edad A Edadx Figura 2: Función de pertenencia trapezoidal.(ejemplo tomado de [Gky95]). funciones de pertenencia trapezoidales A1 , A2 , A3 tal se muestra en Fig.2. Estas funciones se pueden definir en el intervalo [0, 80] como sigue: 9 A1 (x) = A2 (x) = A3 (x) = 1 cuando x ≤ 20 (35−x) 15 cuando 20 < x < 35 0 cuando x ≥ 35 0 cuando x < 20 o x > 60 (x−20) cuando 20 < x < 35 15 (60−x) 15 cuando 45 < x < 60 1 0 (x−45) 15 (4) (5) cuando x ≥ 60 cuando x ≤ 4520 cuando 45 < x < 60 1 (6) cuando x ≥ 60 Es necesario en algún momento realizar una de las posibles aproximaciones discretas de los valores difusos. Las aproximaciones son importantes porque, como se verá posteriormente, son necesarias en las representaciones y en el cálculo de conjuntos difusos. Por ejemplo, se puede tomar la función A2 , que se muestra en la ec. 5 y la fig.2 y definir la aproximación discreta como sigue: Es importante notar la simetría implícita en la definición de la aproximación discreta. 2. 2.1. Fundamentación de la Matemática Difusa Conjuntos Difusos y Lógica Difusa El alfabeto utilizado en la lógica difusa es en gran parte similar a la lógica clásica. Por una parte, se requieren proposiciones, conectivos, y en general, de un lenguaje mediante el cual se pueda expresar de manera clara. Por una parte, se verá más adelante que la lógica difusa se puede ver como una extensión de la lógica tradicional en muchos aspectos. Como tal. toma parte de sus elementos de ella. La matemática difusa se basa en una fundamentación axiomática similar a la teoría de probabilidades, con la cual comparte la mayoría de los axiomas. Este constructo requiere la definición de una retícula que consiste de los siguientes nodos: 1. X que es el universo del discurso. 2. T que es un elemento maximal. 3. F que es un elemento minimal. 10 D 2x x x ∉ 22, 24, . . . , 58 0. 00 x ∈ 22, 58 x ∈ 24, 56 0. 13 x ∈ 26, 54 x ∈ 28, 52 0. 40 x ∈ 30, 50 0. 67 x ∈ 32, 48 0. 80 x ∈ 34, 46 0. 93 0. 27 0. 53 x ∈ 36, 38, . . . , 44 1. 00 Figura 3: Aproximación Discreta de la función de pertenencia A2 mediante la función D2 de la forma: D2 : {0, 2, 4, ..., 80} → [0, 1] . [Gky95]. 4. ∧ la conjunción. 5. ∨ la disyunción. La retícula se puede denotar por L (X, T, F, ∧, ∨) .Las letras x, y, z denotan elementos de X dentro de la retícula. Los axiomas presentan inicialmente, la definición de la retícula: Axioma 2.1 (Idempotencia) Para todo x ∈ L, se tiene que: x∧x=x∨x=x (7) Axioma 2.2 (Conmutatividad) Para todo x, y ∈ L, se tiene que: x∨y x∧y = y∨x = y∧x (8) (9) Axioma 2.3 (Asociatividad) Para todo x, y, z ∈ L, se tiene que: x ∨ (y ∨ z) = (x ∨ y) ∨ z (10) Axioma 2.4 (Absorción) Para todo x, y ∈ L, se tiene que: x ∨ (x ∧ y) = x x ∧ (x ∨ y) = x 11 (11) (12) Axioma 2.5 (Elemento Maximal y Minimal) Para todo x ∈ L se tiene que: x∨T = T y x∧T =x (13) Axioma 2.6 (Relación de Órden) Para todo x, y ∈ L se tiene que: x ≤ y si existe z ∈ L tal que y = x ∨ z (14) A cada elemento de la retícula se le puede aplicar una función de valuación, que indicará su valor de verdad en el intervalo [0, 1] . La función de valuación de denotará por p : L → [0, 1] (15) y está sujeta a las siguientes condiciones: Axioma 2.7 p(F ) = 0 y p(T ) = 1 Axioma 2.8 Para todo x, y ∈ L, si x ≤ y entonces p(x) ≤ p(y) (16) Axioma 2.9 (Aditividad) Para todo x, y ∈ L, p(x ∧ y) + p(x ∨ y) = p(x) + p(y) (17) donde p(x ∧ y) ≤ mı́n(p(x), p(y)) ≤ máx(p(X), p(y)) ≤ p(x ∨ y) Axioma 2.10 (Equivalencia o Congruencia) Para todo x, y ∈ L, x ↔ y si p(x ∧ y) = p(x ∨ y) (18) Los10 axiomas anteriores son comunes a prácticamente la totalidad de las lógicas. Axioma 2.11 (Distancia) Para todo x, y ∈ L, d(x, y) = p(x ∨ y) − p(x ∧ y) (19) donde d(x, y) cumple que 0 = d(x, x) ≤ d(x, y) ≤ 1 Axioma 2.12 (Medida de Equivalencia) Para todo x, y ∈ L, se tiene: p(x ↔ y) = 1 − d(x, y) = 1 − p(x ∨ y) + p(x ∧ y) (20) Axioma 2.13 (Medida de la Fuerza de la Implicación.) Para todo x, y ∈ L, se tiene: p(x → y) = p(x ↔ x ∧ y) = 1 − d(x, x ∧ y) = 1 − p(x) − p(x ∧ y) = 1 + p(y) − p(x ∨ y) = 1 − d(x, x ∨ y) 12 (21) Axioma 2.14 (Negación) Para todo x ∈ L, se cumple p(x̄) = p(x ↔ F ) = 1 − p(x) = 1 − d(x, F ) (22) Axioma 2.15 (Distributividad) Para todo x, y, z ∈ L, se tiene que x ∧ (y ∨ z) = (x ∧ y) ∨ (x ∧ z) (23) Axioma 2.16 (Implicación Estricta) Para todo x, y ∈ L, se tiene que {p(x → y) = 1 ∨ p(y → x) = 1} (24) La versión debilitada del axioma es tomada usualmente por la lógica difusa: p((x → y) ∨ p(y → x)) = 1 (25) La función de valuación (ec. 15) es equivalente a la ec. 3, cuyas propiedades y características se explican en la sección 2.2. 2.2. La Función de Pertenencia La función de pertenencia describe toda la información contenida en un conjunto difuso. Tal como se mencionó en la sección 1.1, se espera que esta función sea contínua, cerrada y acotada, y que posea algunas propiedades que la hagan interesante. Definición 2.1 (Propiedades de Función de Pertenencia) Dado un conjunto difuso A, se espera que su función de pertenencia cumpla con las siguientes propiedades: 1. Propiedad de Normalidad: debe existir x ∈ A tal que A(x) = 1. Si se tiene que A(x) < 1 para todo x ∈ A, al conjunto difuso se le llama subnormal. 2. Propiedad de Monotonicidad: si x1 es más próximo a x que el valor x2 , entonces A(x1 ) > A(x2 ) 3. Propiedad de Simetría: Si x1 y x2 son equidistantes de x, entonces A(x1 ) = A(x2 ) Algunas funciones de pertenencia de uso común, que cumplen con las propiedades mencionadas, se muestran en la fig. 4. Uno de los conceptos más importantes de conjuntos difusos es el concepto de corte α y su variante el corte estricto, que se exponen en la siguiente definición. 13 1 1 A1 (x) .5 A1 (x) .5 0 0 1 3 2 4 x 0 0 1 1 A 1 (x) .5 A 1 (x) .5 0 0 1 3 2 4 x 0 0 1 2 3 4 x 1 2 3 4 x Figura 4: Algunas funciones de transferencia comunes. Definición 2.2 (Corte Alfa) Dado un conjunto difuso A definido en X y cualquier número α ∈ [0, 1], el corte α, denotado por α A, y el corte estricto,α+ A, son los conjuntos tradicionales o clásicos de la forma: α α+ A = {x/A(x) ≥ α} A = {x/A(x) > α}. (26) (27) Esto es, son los conjuntos clásicos α A y α+ A donde están contenidos todos los elementos x del conjunto referencial X cuyo grado de pertenencia es mayor que o igual al valor específico de α. Una propiedad importante de corte α y corte α estricto que siguen inmediatamente de sus definiciones, es que la clasificación total de valores de α en el intervalo [0, 1] es inversa en la forma que conserva la inclusión de los cortes α correspondientes, y de manera análoga para los cortes α estrictos. Es decir, para cualquier conjunto difuso A y para α1 , α2 ∈ [0, 1] de distinto valor tal que α1 < α2 , se tiene: α1 A ⊇α2 Ayα1 + A ⊇α2 + A. (28) Esta propiedad también puede expresarse por las ecuaciones α1 A ∩α2 A =α2 A,α1 A ∪α2 A =α1 A, 14 (29) y α1 + A ∩α2 + A =α2 + A,α1 + A ∪α2 + A =α1 + A (30) Una consecuencia obvia de esta propiedad es que todos los cortes α y todos los cortes α estrictos de cualquier conjunto difuso forman dos familias distintas de conjuntos clásicos anidados. Por ejemplo, los intervalos que representan los cortes α y los cortes α estrictos de los conjuntos difusos A1 , A2 , y A3 en la fig. 2 cortan con el α creciente. Desde que los conjuntos de nivel A1 , A2 , y A3 son todos [0, 1], claramente, las familias de todos los cortes α y todos los cortes α estrictos son en este caso infinitos para cada uno de los conjuntos. En este punto conviene conocer la forma general de una función de pertenencia, y conocer los nombres asignados a algunas de sus partes. Definición 2.3 (Núcleo - core) El centro (core) de una función de pertenencia para un conjunto difuso A se define como la región del universo que se caracteriza por la completa y total pertenencia de sus elementos al conjunto A. Esto es, es el conjunto clásico definido como: centro de A = {x | A(x) = 1} (31) Luego el centro de A se puede definir como el corte 1 A. Definición 2.4 (Soporte - support) El soporte (support) de una función de pertenencia para un conjunto difuso A se define como la región del universo que se caracteriza por tener un grado de pertenencia al conjunto A, que sea mayor que 0 Esto es, es el conjunto clásico definido como: soporte de A = {x | A(x) > 0} Luego el soporte de A se puede definir como el corte estricto (32) 0+ A Definición 2.5 (Frontera - boundary) La frontera (boundary) de una función de pertenencia para un conjunto difuso A se define como la región del universo que se caracteriza por tener un grado de pertenencia al conjunto A, que sea mayor que 0, pero menor que 1 Esto es, es el conjunto clásico definido como: frontera de A = {x | 0 < A(x) < 1} (33) Luego la frontera de A se puede definir como 0+ A −1 A. Definición 2.6 (Altura) La altura h(A) de un conjunto difuso A es el mayor grado de pertenencia obtenido por cualquier elemento en ese conjunto. Formalmente: h(A) = sup A(x). (34) x∈X donde si el conjunto difuso cumple la propiedad de normalidad,se tiene que h(A) = 1. 15 Ejemplo 2.1 Con base en el ejemplo 1.1, se puede tener una caracterización completa de todos cortes α y los cortes estrictos α para los Paconjuntos difusos A1 , A2 , A3 según la fig. 2. Para todo α ∈ (0, 1] 0 A1 A1 α A2 α A3 α+ A1 α+ A2 α+ A3 1+ A1 α = = = = = = = = 0 A2 =0 A3 = [0, 80] = X [0, (35 − 15α)] [(15α + 20) , (60 − 15α)] [(15α + 45) , 80] (0, (35 − 15α)) ((15α + 20) , (60 − 15α)) ((15α + 45) , 80) 1+ A2 =1+ A3 = ∅ Definición 2.7 (Conjunto Nivel) El conjunto de todos los valores α ∈ [0, 1] para un conjunto difuso dado A es llamado un conjunto nivel de A. Formalmente, Λ(A) = {α/A(x) = α para algún x ∈ X} donde Λ denota el nivel del conjunto difuso A definido en X. Ejemplo 2.2 Para el ejemplo 1.1 se tienen los siguientes conjuntos nivel: Λ(A1 ) = Λ(A2 ) = Λ(A3 ) = [0, 1] Λ(D2 ) = {0, 0,13, 0,27, 0,4, 0,53, 0,61, 0,8, 0,93, 1} Teorema 2.1 (Conjunto difuso convexo) Un conjunto difuso A en es convexo si y solo si A(λx1 + (1 − λ)x2 ) ≥ mı́n[A(x1 ), A(x2 )] para todo x1 , x2 ∈ y todo λ ∈ [0, 1], donde mı́n denota al operador mínimo. Demostración. Es similiar a la demostración para conjuntos clásicos. 1. Se asume que A es convexo y sea α = A(x1 ) < A(x2 ).Entonces, x1 , x2 ∈α A y λx1 + (1 − λ)x2 ∈α A para algun λ ∈ [0, 1] por la convexidad de A. Luego A(λx1 + (1 − λ)x2 ) ≥ α = A(x1 ) = min [A(x1 ), A(x2 )] . 2. Se supone que A satisface A(λx1 + (1 − λ)x2 ) ≥ min[A(x1 ), A(x2 )], se necesita demostrar que para cualquier α ∈ (0, 1],α A es convexo. 16 Se tiene que cualquier x1 , x2 ∈α A. (esto es, A(x1 ) ≥ α, A(x2 ) ≥ α), para cada λ ∈ [0, 1], Por A(λx1 + (1 − λ)x2 ) ≥ min[A(x1 ), A(x2 )] A(λx1 + (1 − λ)x2 ) ≥ min [A(x1 ), A(x2 )] ≥ mı́n(α, α) = α; es decir λx1 + (1 − λ)x2 ∈α A, α A es convexo para cualquier α ∈ (0, 1]. Luego A es convexo. Las tres operaciones básicas en conjuntos clásicos que son complemento, intersección y unión, pueden generalizarse a los conjuntos difusos en más de una manera. Sin embargo, una generalización particular que es de interés es la que produce las llamadas operaciones difusas estándar, que sonlas que se tendrán en cuenta de ahora en adelante, y se definen a continuación. Definición 2.8 (Complemento) El complemento normal Ā, de un conjunto difuso A con respecto al conjunto universo X es definido para todo x ∈ X por la ecuación Ā(x) = 1 − A(x) (35) Los elementos de X para los que Ā(x) = A(x) se llaman puntos de equilibrio de A. Para el complemento normal, es claro que el grado de función de pertenencia de los puntos de equilibrio es de 0,5. por ejemplo, el punto de equilibrio de A2 en Fig.2 es de 27,5 y 52,5. Definición 2.9 (Unión) Dado dos conjuntos difusos, A y B, la unión normal, A ∪ B, se define para todo x ∈ X por las ecuaciones (A ∪ B)(x) = max[A(x), B(x)] (36) Definición 2.10 (Intersección) Dado dos conjuntos difusos, A y B su intersección normal, A ∩ B, se define para todox ∈ X por las ecuaciones (A ∩ B)(x) = min[A(x), B(x)] (37) Donde el min y max denotan al operador mínimo y al operador máximo, respectivamente. Debido al asociatividad de min y max, estas definiciones pueden extenderse a cualquier numero finito de conjuntos difusos. Con base en el ejemplo 1.1, se tiene que la operaciones de unión (A1 ∪ A3 ) se puede definir gráficamente como se observa en la fig 5. Mientras que un ejemplo de las operaciones de intersección y el complemento se observan en la fig. 6 Cualquier conjunto potencia difuso, denotado por F (X) puede verse como una retícula, en la cual la intersección difusa normal y la unión difusa normal 17 A2 1 x A 3(x) x A 3 ) (x) x Figura 5: Unión difusa: A1 ∩ A3 según el ejemplo 1.1. 18 B(x) 1 x C (x) 1 x (B C)(x) x (B C)(x) 1 x 19 Figura 6: Operaciones difusas.para el ejemplo [Gky95] juegan los papeles de ínfimo y supremo respectivamente. Esto satisface todas las propiedades de la retícula Booleana definidas en la sec. ??, exceptuando la ley de contradicción y la ley de medio excluido. Tal retícula es a menudo llamada un Retícula de De Morgan o un Álgebra de De Morgan. La retícula de De Morgan también puede definirse como el par (F (X), ⊆), donde el ⊆ denota la inclusión difusa, gracias a la cual los elementos de F (X) están parcialmente ordenados. Entonces, si se tienen dos conjuntos difusos A, B ∈ F (X), A es un subconjunto de B, y se denota (A ⊆ B) si, A(x) B(x) para todo x ∈ X. Se puede verificar que con las operaciones difusas estándar, A ⊆ B si A ∩ B = A y A ∪ B = B para cualquierA, B ∈ F (X). Si bien muchas propiedades de la lógica clásica y la lógica difusa se comparten entre ellas, es necesario tener precaución porque no sucede con todas las leyes. Este es el caso de la Ley de Contradicción. Si esta ley se cumpliera en lógica difusa, se debería tener siempre que min[A(x), 1 − A(x)] = 0. Esto se puede traducir afirmando que o bien un valor de verdad o bien su contrario debe ser totalmente falso (valor 0). Sin embargo, es fácil verificar que esta igualdad no se cumple para cualquier valor A(x) ∈ (0, 1) y sólo se cumple para A(x) ∈ {0, 1}, que corresponde al caso particular de los conjuntos clásicos. Definición 2.11 (Cardinalidad Escalar) Para cualquier conjunto difuso A definido en un conjunto universal finito X, se define la cardinalidad escalar, |A| mediante la expresión |A| = A(x) (38) x∈X Es usual encontrar que a |A| se le llama cuenta sigma de A. Ejemplo 2.3 Según esta definción, la cardinalidad escalar del conjunto difuso D2 definido en el ejemplo 1.1 es |D2 | = 2(0,13 + 0,27 + 0,4 + 0,53 + 0,67 + 0,8 + 0,93) + 5 = 12,46 Al igual que un elemento tiene un grado de pertenencia a un conjunto difuso, se puede realizar una consideración análoga respecto de la inclusión de un conjunto en otro conjunto difuso. Para este último caso, se habla del grado de inclusión como una medida análoga al grado de pertenencia. Definición 2.12 (Grado de Inclusión) Sean A, B un par cualquiera de subconjuntos difusos definidos en un conjunto universal finito X. El grado de inclusión de A en B, denotado por S(A, B), se define mediante la expresión 1 S (A, B) = |A| |A| − x∈X 20 max[0, A(x) − B(x)] (39) la cual se puede expresar de manera más resumid, mediante algunas transformaciones, de la forma S(A, B) = |A ∩ B| |A| (40) En esta definición, la describe la suma de los grados a que la desigualdad del subconjunto A(x) B(x) se viola. La diferencia describe la falta de estas violaciones, y la cardinalidad |A| en el denominador permite normalizar la expresión en el rango 0 ≤ S(A, B) ≤ 1 como es de esperarse. 2.3. Números Difusos Entre los diversos tipos de conjuntos difusos, de importancia especial son los conjuntos difusos que se definen en el conjunto R de números reales. Como dicho conjunto es infinito, el conjunto difuso tendrá infinitos miembros. Además, como en todo conjunto difuso, a cada número real se corresponde un valor de pertenencia que es asignado por una función de pertenencia. Las funciones de pertenencia de estos conjuntos tienen la forma A : R− > [0,1] (41) Esta función tiene claramente un significado cuantitativo y bajo ciertas condiciones, se puede ver a A como un número difuso o intervalo difuso. En general, un número difuso se puede definir de manera breve tal como se expone a continuación. Definición 2.13 (Número Difuso) Se define un número difuso como un conjunto normalizado y convexo A ⊆ R, cuya función de pertenencia es al menos, contínua a trazos y tiene el valor funcional A(x) = 1 justo para un elemento. Analizando la anterior definición, se tiene que el conjunto difuso se puede ver intuitivamente como el conjunto de números cercanos a un valor r en A, tal como muestra la fig. 7. El conjunto A debe ser normal, y bajo esta concepción el grado de pertenencia de r en cualquier conjunto difuso debe ser 1, o en otras palabras, A(r) = 1. El soporte de un número difuso y todos sus cortes α, para α = 0, debe ser un intervalo cerrado, para permitir la definicion del significado de operaciones aritméticas en números difusos en cuanto a las operaciones aritméticas ordinarias en los intervalos cerrados, que son bien establecidas en términos del análisis clásico de intervalos [Gky95]. Definición 2.14 (Intervalo Difuso) Se define un intervalo difuso como un conjunto indeterminado normalizado y convexo A ⊆ R que posee un intervalo intermedio cuya función de pertenencia es como mínimo, contínua a trazos y tiene el valor funcional A(x) = 1 justo para todo x del intervalo intermedio. 21 Intuitivamente, los números o intervalos difusos se pueden ver como números o intervalos aproximados, como "los números cercanos a un número real " o "los números reales que estan alrededor de un intervalo de números reales"[Gky95] Ya que un corte α de cualquier número difuso requiere estar dentro de un intervalo cerrado para todo α ∈ (0,1], cada número difuso es un conjunto difuso convexo. Lo inverso, sin embargo, no necesariamente es verdad, ya que cortes α de algunos conjuntos difusos convexos, quizá sean abiertos o intervalos abiertos por la mitad. Ejemplo 2.4 (Números e Intervalos Difusos) La fig. 7 muestra los siguientes casos: 1. El número real ordinario 1,3 2. El intervalo ordinario [1,25, 1,35]. 3. Un número difuso que expresa la proposición "cerca de 1.3". 4. Un intrervalo difuso que expresa la proposición "cerca del intervalo [1.28,1.32]". 1 0 0 Figura 7: Número e Intervalo Difuso. 22 Las formas de la función de pertenencia más usuales para los números difusos son precisamente las mostradas en la fig. 7, aunque el tipo de aplicación y la necesidad pueden determinar el uso de otras formas, incluso asimétricas, tal como se observa en la fig. 8. La función de pertenencia asimétrica de la fig.8(c) aumenta hasta llegar a cierto valor, mientras que la función de pertenencia de la fig. 8(d) disminuye después de cierto valor, lo que también satisface los requisitos de los números difusos en el sentido que captan nuestra concepción de un número grande y número pequeño respectivamente, en el contexto de una aplicación particular. Aún cuando estas funciones tampoco cumplen la condición de simetría, su importancia y utilidad es clara. 1 1 A B 0 0 a (b) 1 1 D C 0 0 (d) (c) Figura 8: Funciones de Pertenencia Asimétricas. Teorema 2.2 (Representación de número difuso) Sea A ∈ F (R). Entonces, A es un número difuso.si en A existe un intervalo cerrado [a, b] = ∅ de tal manera que 1 para x ∈ [a, b] l(x) para x ∈ (−∞, a) A(x) = (42) r(x) para x ∈ (b, ∞), 23 Donde la función l es una función monótona creciente, contínua a la derecha definida como: l : (−∞, a) → [0,1] (43) de tal manera que l(x) = 0 para x ∈ (−∞, w1 ). La función r es una función monótona decreciente, contínua a la izquierda definida como: r : (b, ∞) → [0, 1] (44) de tal manera que r(x) = 0 para x ∈ (w2 , ∞). La implicación del teorema 2.2 es que cada número difuso puede ser representado de forma fragmentada, tal como se expone en la gráfica 9. A 1 D 0 a b Figura 9: Representación fragmentada de un número difuso. Ejemplo 2.5 Se definen los cuatro números difusos en el fig.7 asi: 1. w1 = a = b = w2 = 1,3, ,l(x) = 0 para todo x ∈ (−∞, 1, 3), r(x) = 0 para todo x ∈ (1,3, ∞). 2. w1 = a = 1,25, b = w2 = 1,35, ,l(x) = 0 para todo x ∈ (−∞, 1,25), r(x) = 0 para todo x ∈ (1,35, ∞). 24 3. a = b = 1,3, w1 = 1,2, w2 = 1,4, 0 para x ∈ (−∞, 1,2) l(x) = 10(x − 1,3) + 1 para x ∈ (1,2, 1,3] 0 para x ∈ (1,4, ∞) r(x) = 10(1,3 − x) + 1 para x ∈ (1,3, 1,4] 4. a = 1,28, b = 1,32, w1 = 1,2, w2 = 1,4, 0 para x ∈ (−∞, 1,2) l(x) = 12,5(x − 1,28) + 1 para x ∈ [1,2, 1,28) 0 para x ∈ (1,4,∞) r(x) = 12,5(1,32 − x) + 1 para x ∈ (1,32, 1,4] Usando los números difusos, se puede definir el concepto de cardinalidad difusa para conjuntos difusos que están definidos en conjuntos universales finitos. Definición 2.15 (Cardinalidad Difusa) Sea A un conjunto difuso definido en un conjunto universo finito X. La cardinalidad difusa de A, denotada por |A|, es un número difuso definido en N mediante la fórmula α Ā (| A|) = α para todo α ∈ Λ(A). Ejemplo 2.6 El cardinal difuso para el conjunto D2 definido en la fig. 3 cuyo corte α esta en la fig. 2, es 0,13 0,27 0,4 0,53 0,67 0,8 0,93 1 D = + + + + + + + = 0,572 82 19 17 15 13 11 9 7 5 2.4. Variables Lingüísticas Las variables difusas cuantitativas se formulan con ayuda del concepto de número difuso, que permite representar el estado de dicha variable. Pero los números difusos se utilizan para representar conceptos lingüísticos (tales como peqeño, mediano, grande, etc), que pueden ser interpretados en un contexto particular, se generan estructuras llamadas variables lingüísticas [Gky95]. Cada variable lingüística cuyo estado se expresa mediante terminos lingüísticos interpretados como números difusos específicos es definido en terminos de una variable base, cuyos valores son números reales dentro de un rango específico. Una variable base es una variable en el sentido clásico (por ejemplo la temperatura, la presión, la velocidad, el voltaje, la humedad, etc.) así como cualquier otra variable numérica, (por ejemplo, envejecer, actuación, sueldo, cantidad de sangre, probabilidad, fiabilidad, etc.). En una variable lingüística se representan valores aproximados de terminos linguisticos de una variable base, pertinente a una aplicación particular, capturados por los números difusos apropiados. 25 Definición 2.16 (Variable Lingüística) Una variable lingüística se caracteriza totalmente por un quíntuplo (v, T (x), X, g, m) en donde v es el nombre de la variable lingüística, X es el conjunto universo T es el conjunto de terminos lingüísticos de v que se refiere a una variable base.de quien el rango de valores es un conjunto X, g es una regla sintáctica (una gramática) por lo general los términos lingüísticos en T , y m es una regla semántica que asigna a cada término lingüístico t ∈ T su significado m(t) que es un conjunto difuso en X. Es decir m : T → F (X). Para hacer claridad en estos conceptos conviene introducir aquí un ejemplo, tomado de [Gky95]. Ejemplo 2.7 Un ejemplo de una variable lingüística se muestra en la fig.10. El nombre de la variable lingüística es .a ctuación"(performance). Esta variable expresa la actuación (variable base en este ejemplo) de la entidad meta-orientada (una persona, la máquina, la organización, el método, etc.) en un contexto dado por cinco terminos lingüísticos básicos, que son: muy pequeño, pequeño, mediano, grande, muy grande, vistos como condiciones lingüísticas generadas por una regla sintáctica (no explícitamente mostrado en la fig.10), como no muy pequeño, grande o muy grande, muy muy pequeño, y asi sucesivamente. A cada uno de los términos lingüísticos básicos es asignado uno de los cinco números difusos según una regla semántica, como mostrado en la figura [Gky95]. Los números difusos cuyas funciones de pertenencia tienen la forma trapezoidal usual, se han definido en el intervalo [0, 100]. 2.5. Proposiciones y Conectivos Las proposiciones difusas se diferencian de las proposiciones clásicas por el rango de sus valores de verdad, ya que el grado de verdad de una proposicion difusa se expresa por un numero en el intervalo de la unidad [0, 1] , mientras que el grado de verdad de una proposición clásica se encuentra únicamente en los extremos de dicho intervalo, esto es {0, 1} Las proposiciones difusas que se puedan encontrar en los textos son expresadas generalmente en cuatro tipos: 1. Las proposiciones incondicionales e inhabiles. 2. Las proposiciones incondicionales y calificadas. 3. El condicional y las proposiciones inhabiles. 4. El condicional y las proposiciones calificadas. 26 Variable Linguistica Valores Linguisticos PEQUEÑO MEDIANO MUY ALTO Regla Semantica Restricción Difusa Variable Base Figura 10: Ejemplo de variable lingüística (tomado de [Gky95]). Definición 2.17 (Proposiciones Incondicionales No-Calificadas) Una proposición incondicional no-calificada es una expresión p de la forma p : V es F (45) donde V es una variable que toma valores v de algun conjunto universal de valuaciones V , y F es un conjunto difuso en V que representa un predicado difuso. Si T (p) es el grado de verdad de la proposición p, y v es un valor particular de V, entonces v ∈ F con grado de pertenencia F (v), y se cumple que T (p) = F (v) (46) La expresión se puede generalizar si V es asignada según un determinado conjunto índice I, de tal manera que V : I → V, donde si i ∈ I, y V es el conjunto de valores que puede eventualmente tomar V (i) , la expresión de la ec. toma la forma más general p : V (i) es F donde i ∈ I T (p) = F (V (i)) (47) (48) El papel que cumple la ec.46 es de vital importancia, ya que provee un puente de conexión entre la teoría de conjuntos y las proposiciones difusas, tal como se verá en el ejemplo 2.8. 27 Ejemplo 2.8 Sea V una variable que representa la temperatura. Sea "altaün predicado, donde "alta"∈ F. Sea p una proposición difusa que espresa: p : La temperatura (V) es alta (F ) De acuerdo con la definición, el grado de verdad T (p) depende tanto del valor real de la temperatura como de la definición de .a lta". Suponga ahora que se tiene la función de pertenencia definida en la fig. 11 Figura 11: Ejemplo de la Temperatura (tomado de [Gky95]). Se sabe que V toma valores particulares de acuerdo v con la temperatura. Si se tiene como caso particular que V = v = 85 grados, tal como se indica en la gráfica, el grado de pertenencia que le corresponde es de F (v) = F (0,85) = 0,75. Y de acuerdo con la ec 46, y tal como se observa en la fig. 12, T (p) = F (v) = 0,75. Ejemplo 2.9 Sea I un conjunto de personas, cada persona se caracteriza por su edad, y dado un conjunto difuso expresado por el predicado "joven", la forma general p : V (i) es F sera p : edad(i) es joven. El grado de verdad de esta proposicion T (p) es determinado para cada persona i, luego T (p) = Joven(edad(i)). Definición 2.18 (Proposiciones Condicionales No-Calificadas) Una proposición condicional no-calificada es una expresión p de la forma: p : si V es F, entonces W es G (49) donde V, W son variables que toman valores respectivos v ∈ V, w ∈ W, donde V, W son universos de valuaciones, y F, G son conjuntos difusos en V, W que representa un predicado difuso. 28 Figura 12: Ejemplo de conexión entre Teoría de Conjuntos Diusos y Proposiciones Difusas. Estas proposiciones también pueden verse como las proposiciones de la forma {V, W} es R, (50) donde R es un conjunto difuso en el producto cartesiano V × W que es determinado para cada v ∈ V y cada w ∈ W de la forma R(v, w) = j [V(v), W(w)] (51) donde j denota un operacion binaria en [0, 1], representando la implicación difusa conveniente de acuerdo con la necesidad. 2.6. Cuantificadores Difusos Se puede extender el alcance de los predicados difusos mediante el uso de cuantificadores difusos. Los cuantificadores difusos son números difusos que toman parte en las proposiciones difusas, con algunas especificaciones que se introducen en esta sección. Los cuantificadores difusos pueden ser de de dos tipos: los absolutos, definidos en R y los relativos, definidos en [0, 1]. 29 2.6.1. Cuantificadores Difusos Absolutos Los cuantificadores difusos absolutos están definidos en R y se caracterizan mediante determinados términos lingüísticos que lo evidencian: "casi 10 ", "mucho más de 1500 ", "aproximadamente 270 ", por ejemplo. Las expresiones de este tipo se pueden representar formalmente de tres maneras equivalentes: p : Hay Q i s en I tales que V(i) es F p : Hay Q E s donde E(i) = F (V(i)) p : X es Q (52) (53) (54) donde p es la expresión más analítica, p es la expresión resumida, y p es una expresión equivalente aún más resumida y más habitual en el lenguaje natural, que pueden representar todas el mismo concepto como se verá en el ejemplo. Se tiene en estas expresiones que Q es un número difuso en R, V es una variable que asume el valor V(i) para el individuo i ∈ I, y F es un conjunto difuso constituido por todos los posibles valores de V. En la ec. 54 se tiene que X es una variable que toma valores en R que representa la cardinalidad del escalar del conjunto difuso, esto es, W = |E| , donde |E| = i∈I E(i) = i∈I F (V(i)).Además, se puede verificar que T (p) = T (p ) = T (p ) = Q (|E|) . (55) Ejemplo 2.10 Se tiene que p ="Hay alrededor de 57 trabajadores que tienen buen rendimiento en ventas en la empresa". Donde I es el conjunto de trabajadores, Q es el número difuso real .a lrededor de 57", V(i) es el grado de rendimiento del vendedor i, y F es el conjunto difuso definido con los posibles valores de V que representan al término lingüístico "buen". Se puede tener una expresión para p ="Hay alrededor de 57 trabajadores buenos-vendedores en la empresa". Ejemplo 2.11 Sea la proposición p : "Hay aproximadamente tres estudiantes del curso cuya facilidad en inglés es alta". Sea I conformado por los integrantes del curso, es decir I = {Andres, Blanca, Carlos, Diego, Viviana} Sea V es una variable con los valores en el intervalo [0, 100] grados que expresan la facilidad para el inglés, V(i) es la facilidad en inglés del integrante i. F es el conjunto difuso conformado por todos los posibles valores de V. Comparando la proposición p con p : "Hay Q i’s en I tal ese V (i) es F ,se puede ver que Q, en este caso,es el cuantificador difuso .aproximadamente 3, y F es un conjunto difuso que toma valores en [0, 100], y captura numéricamente el término lingüístico ”facilidad-alta”. Q y F se definen en la fig. 13 Se asume que: 30 V (Andres) = 35, V (Blanca) = 20, V (Carlos) = 80, V (Diego) = 95, V (Esteban) = 70. El valor de verdad de la proposición es: 0 Andres E= 0 Blanca + + ,75 Carlos + 1 Diego ,5 Esteban . + Luego, se calcula el cardinal de E: |E| = E(i) = 2,25. i∈I Finalmente, se usa T (p) = T (p´) = Q (|E|) para obtener el valor de verdad de nuestra proposición: T (p) = 2(2,25) = 0,625. Asumiendo, por otro lado, que las cuentas de los estudiantes no son conocidas, no se construye E. La proposición proporciona, en este caso, con la información sobre los grados de posibilidad de varios valores del cardinal de E. por ejemplo, Q(3) = 1, la posibilidad de |E| = 3 es 1; esto es imposible porque |E| = 5, y así sucesivamente. 1 1 0.75 Q(E) 0.625 F(a) 0.5 0 1 3 2 2.25 Q: 4 5 0 6 (E) cerca de 3 50 Brenda Andres F: 100 a Carlos David Fluidez Figura 13: Gráfica para el ejemplo 2.11 (tomado de [Gky95]) 2.6.2. Cuantificadores Difusos Relativos Los cuantificadores difusos del segundo tipo se definen en [0, 1] y se caracterizan por terminos lingüísticos que lo evidencian: "casi todos", "la mayoría", "poco más de la mitad", por ejemplo. Se puede observar la representación gráfica de un cuantificador de este tipo en la fig 14. 31 Aprox mitad Medio 1 Casi Todo 0.4 0 1 0.63 Figura 14: Cuantificador difuso definido en [0, 1] . Las proposiciones difusas con los cuantificadores del segundo tipo tienen la forma general p : Entre los i s en I tales que V (i) es F1 hay Qi s en I tales que V2 (i) es(56) F2 p : Q E1 s son E2 s (57) p : X es Q (58) donde Q es un número difuso en [0, 1], y el significado de los símbolos restantes es el mismo como previamente se definieron, y E1 , E2 son los conjuntos difusos: E1 (i) = F1 (V1 (i)) E2 (i) = F2 (V2 (i)), ∀i ∈ I (59) (60) Ejemplo 2.12 Un ejemplo de una proposición de este formulario es la proposición ”Entre los estudiantes en una clase dada que es joven, casi todos tienen la facilidad en inglés y nivel alto” Se puede modificar como sigue: ”Casi todo joven los estudiantes en una clase dada son estudiantes cuya la facilidad en inglés es alta.” 32 También se llaman cuantificadores del primer tipo los cuantificadores absolutos, mientras los cuantificadores del segundo tipo se llama los cuantificadores relativos. Esta terminología tiene el sentido cuando se comparan las definiciones de la variable W para los cuantificadores del primer tipo y segundo tipo, dado por las ecuaciones correspondientes. 2.7. Modificadores Lingüísticos (Linguistic Hedge) Los modificadores lingüísticos son términos lingüísticos especiales que modifican otros términos lingüísticos. Algunos de ellos son, por ejemplo, mismo, más o menos, justamente, ligeramente, algo o sumamente Los modificadores difusos se pueden usar para modificar tanto los predicados difusos, como el valor de los grados de verdad difusa y las probabilidades difusas. Ejemplo 2.13 una expresión con uso de modificador (en negrilla) es "x es una persona ligeramente gorda". Otra proposición, tal como .es joven" que se asume significa ”x es joven es verdad”, puede afectarse por los modificadores de las siguiente maneras: ”es verdad que x es muy joven”, ”es muy cierto que x es joven”. En general, dada una proposición difusa p, se puede modificar ésta mediante un modificador lingüístico H, quedando formalmente así: p : x es F Hp : x es HF, (61) (62) donde HF denota el predicado difuso obtenido aplicando el modificador H a los datos del predicado F . Las modificaciones adicionales pueden ser obtenidas aplicando el cerco al valor de verdad difuso o a la probabilidad difusa empleada en la proposición dada. Dado un predicado difusoF en X, y un modificador h definido como una operación unaria asociada un modificador lingüístico H [Gky95], el predicado difuso modificado HF es determinado para cada x ∈ X en la ecuación HF (x) = h(F (x)) (63) Esto significa que las propiedades de los modificadores lingüísticos pueden ser estudiadas observando las propiedades de los modificadores asociados. Cualquier modificador h es un biyeccion creciente. Si h(a) < a para todo a ∈ [0, 1], el modificador se llama fuerte; si h(a) > a para todo a ∈ [0, 1], el modificador se llama débil. El modificador especial vacio para el que h(a) = a se llama un modificador identidad. Definición 2.19 (Modificador Lingüístico Fuerte y Débil) Un modificador fuerte fortalece un predicado difuso al que es aplicado, reduciendo el valor de verdad de la proposición asociada. Un modificador débil debilita el predicado y el valor de verdad aumenta en la proposición. 33 Por ejemplo, considere tres proposiciones difusas: p1 : John es joven, p2 : John es muy joven, p3 : John es bastante joven, Matemáticamente se permite√que los modificadores lingüísticos h se represente por a2 si es fuerte, y por a si es débil. Si se asume que John tiene 26 años y, según el conjunto difuso JOVEN representando el predicado difuso joven, JOVEN (26) = 0,8. Entonces, MUY JOVEN (26) = 0,82 = 0,64 y BASTANTE JOVEN (26) = (0,8) = 0,89. De, T (P1 ) = 0,8, T (p2 ) = 0,64, y T (p3 ) = 0,89. Estos valores están de acuerdo con nuestra intuición: entre más fuerte la aserción es menor su valor de verdad y viceversa. Teorema 2.3 (Propiedades del Modificador Lingüístico h) Es fácil demostrar que cada modificador h satisface las siguientes condiciones: 1. h(0) = 0 and h(l) = 1; 2. h es una función continua; 3. si h es fuerte, entonces h−1 es débil y viceversa; 4. dado algun modificador g, las composiciones de g con h y h con g también son modificadores y, si h y g son fuertes (o débiles), entonces son compuestas. 3. Operaciones Difusas En este capítulo se introducen o amplían los operaciones difusas ya vistas, tanto para los conjuntos como para los números e intervalos difusos. 3.1. Operaciones entre Conjuntos Difusos En esta sección se redefinen las funciones como complemento, intersección, y unión, desde la persepectiva de los conjuntos difusos. Para el complemento: Ā(x) = 1 − A(x) (64) Para la intersección: (A ∩ B)(x) = min[A(x), B(x)], (65) (A ∪ B)(x) = max[A(x), B(x)], (66) Para la intersección: para todo x ∈ X. Estos son las operaciones difusas normales. Se puede ver fácilmente, que las operaciones difusas normales se realizan como las operaciones correspondientes para los conjuntos clásicos o tradicionales 34 cuando el rango de la funcion de pertenencia se restringe al conjunto {0, 1}. Es decir, las operaciones difusas normales son generalizaciones de las operaciones de conjuntos clásicos. Se entiende ahora bien, sin embargo, que ellos no son las únicas posibles generalizaciones. Para las tres operaciones, existe una clase amplia de funciones cuyos miembros también califican como las generalizaciones difusas de las operaciones clásicas. Estas tres clases de funciones se examinan en las secciones siguientes, donde cada una se caracteriza por los axiomas descritos. Funciones que califican como las intersecciones difusas y las uniones difusas normalmente se divulgan en la literatura como las t-normas y t-conormas, respectivamente. Desde que el complemento, la intersección y la unión difusa no son las únicas operaciones, contrariamente a sus análogos para la lógica clásica, diferentes funciones pueden ser definidas y funcionar apropiadamente para representar estas operaciones en diferentes contextos. Entre la gran variedad de complementos, intersecciones y uniones difusas la propiedad de las operaciones difusas poseen ciertas propiedades que les dan una importancia especial. Por ejemplo, la intersección difusa normal (operador min) produce el conjunto mas grande entre aquéllos producidos por todas las posibles intersecciones difusas (t-normas). La unión difusa normal (operador max) produce, al contrario, el conjunto difuso más pequeño entre los conjuntos difusos producidos por todas las posibles uniones difusas (t-conormas). Un rasgo deseable de los operaciones difusos normales es su prevención inherente del componente de errores de los operadores. Si cualquier error ε es asociado con la funcion de grados de pertenencia A(x) y B(x), entonces el error máximo asociado con la funcion de pertenencia x en Ā, A ∩ B, y A ∪ B sigue siendo ε. La mayoría de las operaciones de los conjunto difusos alternativos carecen esta característica. Las intersecciones difusas (t-normas) y las uniones difusas (t-conorms) no cubren todos los operaciones porque pueden agregarse los conjuntos difusos, pero cubren todos agregando operaciones que sean asociativas [Gky95]. 3.1.1. Complementos Difusos Sea A un conjunto difuso en X. por la definición, A(x) se interpreta como el grado en el que x pertenece a A. donde cA denota un complemento difuso de A de tipo c. Entonces, cA(x) puede ser no sólo interpretado como el grado a que x pertenece a cA, sino también como el grado a que x no pertenece a A. Similarmente, A(x) también puede interpretarse como el grado a que x no pertenece a cA. Como una convención de notacion, el complemento cA se define por la función c : [0, 1] → [0, 1] (67) que asigna un valor c(A(x)) a cada grado de pertenencia A(x) para cualquier conjunto difuso A. El valor c(A(x)) se interpreta como el valor de cA(x). Es decir, 35 c(A(x)) = cA(x) (68) para todo x ∈ X por definición. Dado un conjunto difuso A, se obtiene cA aplicando la función c a los valores A(x) para todo x ∈ X. Se debe tener en cuenta que esta función c es totalmente independiente de los elementos x que valoran al A(x) asignado; sólo depende de los propios valores. En la investigación siguiente de su las propiedades formales, se puede ignorar x y se asume que el argumento de c es un número arbitrario a ∈ [0, 1]. Sin embargo, para usar la función pora determinar un complemento de un conjunto difuso A, se tiene que guardar huella de elementos x para hacer la conexión entre A(x) y cA(x) expresado por la ec. 68. La función c debe ser también válida intuitivamente, como los complementos significativos de conjuntos difusos. Para caracterizar la funcion c que produce los complementos difusos significativos, se pueden declarar intuitivamente las propiedades justificables por lo que se refiere a los requisitos axiomáticos. Luego se puede determinar la clase de funciones que satisfacen estos requisitos. Para producir los complementos difusos significantes, la función c debe satisfacer por lo menos los axiomas definidos a continuación. Axioma 3.1 (Límite Condicional para Complementos) Si c representa al complemento difuso, entonces c(0) = 1 c(1) = 0 (69) Axioma 3.2 (Monotonía para Complementos) Sea c el complemento difuso. Para todo a, b ∈ [0, 1], se cumple que a ≤ b → c(a) ≥ (b). (70) Axioma 3.3 (Continuidad del Complemento) Si c el complemento difuso, c es una función contínua. Axioma 3.4 (Propiedad Involutiva del Complemento) Si c el complemento difuso, c es involutivo esto es, que para cada a ∈ [0, 1] c(c(a)) = a Según el Axioma 3.1, la función c debe producir los complementos correctos para los conjuntos clásicos. Según el Axioma 3.2, se exige ser monotonamente decreciente: cuando su grado de pertenencia en A aumenta (cambiando x), la 36 calidad del número de miembros correspondiente en cA no debe aumentar: puede disminuir o, por lo menos, permanecer igual. Hay muchas funciones que satisfacen los Axiomas 1 y 2. Para cualquier conjunto difuso A, conjuntos difusos diferentes cA constituyen su complemento, cada uno se produce por una función distinta c. toda funcion que satisface los axiomas forman la clase más general de complementos difusos. Es bastante obvio que la exclusión o debilidad de estos axiomas agregarían algunas funciones totalmente inaceptable como los complementos. Una violación del Axioma 3.1 incluiría funciones que no conforman al complemento normal para los conjuntos clasicos. El axioma 3.2 es esencial, se espera intuitivamente que un aumento en el grado de pertenencia en un conjunto difuso deba producir una disminución o en el caso extremo, ningún cambio en el grado de pertenencia de su complemento. Los Axiomas 3.2 y 3.2 son llamados el esqueleto axiomático para los complementos difusos. En la mayoría de los casos de importancia práctica, es deseable considerar adicionar varios requisitos para los complementos difusos. Cada uno de ellos reduce la clase general de los complementos difusos a un subclase especial. Dos de los requisitos más deseables que normalmente se listan en la literatura entre los axiomas de complementos difusos están especificados en los axiomas 3.3 y 3.4. 3.1.2. Intersecciones Difusas (T-normas) La intersección de dos conjuntos difusos A y B se especifica en general por una operacion binaria en el intervalo unitario; es decir, una función de la forma i : [0, 1] × [0, 1] → [0, 1]. (71) Para cada elemento x del conjunto universal, esta función toma como su argumento el par que consiste en grado de pertenencia en los conjuntos A y B, y retorna el grado de pertenencia de sus elementos que constituyen la intersección de A y B, asi, (A ∩ B)(x) = i[A(x), B(x)] (72) para todo x ∈ X. Un orden para cualquier función i de esta forma para calificar una intersección difusa, debe tener propiedades apropiadas que aseguren que conjuntos difusos producidos por i son intuitivamente aceptables como las intersecciones difusas de cualquier par de conjuntos difusos. Esta funcion es conocida como t-norma. De hecho, las t-normas son generalmente aceptadas como el equivalente a la clase de intersecciones difusas. Se puede usar el termino t-normas o intersecciones difusas. 37 Dada una t-norma y los conjuntos difusos A y B, se tiene que aplicar la ec. 72 para cada x ∈ X para determinar la intersección de A y B basada en i. Sin embargo, la función i es totalmente independiente de x; sólo depende de los valores A(x) y B(x). Se puede ignorar x y asumir que los argumentos de i son los números arbitrarios a, b ∈ [0, 1] en las propiedades formales de t-normas que se examinan a continuación. Una interseccion difusa o t-norma i es una operacion binaria en el intervalo unitario que satisface al menos los siguientes axiomas para todo a, b, d ∈ [0, 1]: Axioma 3.5 (Límite Condicional) i(a, 1) = a Axioma 3.6 (Monotonía para Intersección) b ≤ d implica i(a, b) ≤ i(a, d) Axioma 3.7 (Conmutatividad para Intersección) i(a, b) = i(b, a) Axioma 3.8 (Asociatividad para Intersección) i(a, i(b, d)) = i(i(a, b), d) Estos axiomas conforman el esqueleto axiomático para las intersecciones o t-normas difusas. Es fácil ver que los primeros tres axiomas aseguran que la intersección difusa definida por la ec 72 se vuelve la intersección clásica cuando A y B son clasicos: el i(0, 1) = 0 y i(1, 1) = 1 se sigue directamente del axioma del límite condicional; i(1, 0) = 0 se deriva entonces del axioma de commutatividad, mientras que i(0, 0) = 0 del axioma monotonia. Cuando un argumento de i es 1 la condición del límite y commutatividad también aseguran,como nuestra concepción intuitiva de los requerimientos intersección difusa, que la calidad del número de miembros en la intersección es igual al otro argumento en la expresión. Monotonicidad y commutatividad expresan el requisito natural que una disminución en el el grado de número de miembros en conjuntos A o B no puede producir un aumento en el grado de pertenencia en la intersección. Commutatividad asegura que la intersección difusa simétrica, que es indiferente al orden en que se consideran los conjuntos a ser combinados. El último axioma, la asociatividad, asegura que se puede tomar la intersección de cualquier número de conjuntos en cualquier orden con parejas arbitrarias; este axioma permite extender el funcionamiento de intersección difusa a más de dos conjuntos. En muchas ocasiones es deseable restringir la clase de intersecciones difusas (t-normas) considerando varios requisitos adicionales. Tres de las restricciones más importantes se expresan por los axiomas siguientes, dadas las especificaciones para i, a, b dadas anteriormente: Axioma 3.9 (Continuidad para Intersección) i es una función continua Axioma 3.10 (Subidempotencia para Intersección) i(a, a) < a Axioma 3.11 (Monotonía Estricta para Intersección) a1 < a2 y b1 < b2 implica i(a1 , b1 ) < i(a2 , b2 ) 38 El axioma de continuidad previene una situación en que un pequeño cambio en el grado de pertenencia de cualquier conjunto difuso A o B produzca una discontinuidad en el grado de pertenencia A ∩ B. El axioma de subidempotencia trata un caso especial, en que el grado de pertenencia en A y B (para algún x) tiene el mismo de valor de a. El axioma expresa el requisito que el grado de la funcion de pertenencia A ∩ B en este caso especial no debe exceder a. Este requisito es más débil que el de idempotencia, el requisito i(a, a) = a, es llamado el subidempotencia. Finalmente, el axioma de monotonía estricta expresa una forma más fuerte que el de monotonicidad. 3.1.3. Uniones Difusas (T-conormas) La discusión de uniones difusas es estrechamente paralela de intersecciones difusas. Como la intersección difusaa, la unión difusa general de dos conjuntos difusos A y B se especifica por una función u : [0, 1] × [0, 1] − [0, 1]. (73) El argumento a esta función es el par que consiste en el grado de pertenencia de algunos elementos x en el conjunto difuso A y el grado de pertenencia de ese mismo elemento en el conjunto difuso B. La función devuelve el grado de pertenencia para los elemento en el conjunto difuso A ∪ B. De aqui, (A ∪ B)(x) = u[A(x), B(x)] (74) para todo el x ∈ X. Las propiedades que una función u debe satisfacer para ser intuitivamente aceptable como una unión difusa está exactamente igual que las propiedades de funciones como que son conocido en la literatura como t-conormas. Se puede usar los términos t-conormas o uniones difusas indistintamente. Un union difusa o t-conorma u es una operacion binaria en el intervalo unitario que satisface por lo menos los axiomas que se enuncian a continuación. Para todo a, b, d ∈ [0, 1]: Axioma 3.12 (Límite Condicional para Unión) u(a, 0) = a Axioma 3.13 (Monotonicidad para Unión) b ≤ d implica u(a, b) ≤ u(a, d) Axioma 3.14 (Conmutativida para Unión) u(a, b) = u(b, a) Axioma 3.15 (Asociatividad para Unión) u(a, u(b, d)) = u(u(a, b), d) 39 Estos axiomas son el esqueleto axiomátioco esencial para las uniones difusas o t-conormas. Se puede hacer un análisis análogo al caso del complemento e intersección y verificar que las propiedades se cumplen para los conjuntos clásicos y que son suficientemente válidas de manera intuitiva. Análogamente al caso de la intersección, se pueden establecer restricciones axiomáticas para lograr algunos resultados esperados. Axioma 3.16 (Continuidad para Unión) u es una función contínua Axioma 3.17 (Superidempotencia para Unicón) u(a, a) > a Axioma 3.18 (Monotonía Estricta para Unión) a1 < a2 y b1 < b2 implica u(a1 , b1 ) < u(a2 , b2 ) 3.2. Operaciones Aritméticas en Intervalos Difusos La aritmética difusa esta basado en dos propiedades de números difusos [Gky95]: 1. Cada conjunto difuso, y cada número difuso, puede representarse totalmente y singularmente por cortes α 2. Los cortes α de cada número difuso son intervalos cerrados de números reales para todo α ∈ (0, 1]. Estas propiedades permiten definir las operaciones aritméticas en los números difusos en terminos de operaciones aritméticas en sus cortes α, es decir, operaciones aritméticas en intervalos cerrados. Estas operaciones son un asunto de análisis de intervalos, una área bien fundamentada de la matemática clásica. Notese que un número real r ∈ R también puede considerarse como un intervalo especial degenerado [r, r]. Si denota cualquiera de las cuatro operaciones aritméticas más comunes en los intervalos cerrados: +.−, ·, (suma, resta, multiplicación, división). Entonces, [a, b][d, e] = {f g | a ≤ f ≤ b, d ≤ g ≤ e) (75) es una propiedad general de todos las operaciones aritméticas en los inter[a,b] , que no se define valos cerrados, teniendo en cuenta la excepción del caso [d,e] cuando 0 ∈ [d, e]. Es decir, el resultado de una operacion aritmética en un intervalo cerrado es de nuevo un intervalo cerrado. Definición 3.1 (Operaciones Aritméticas Básicas) Las cuatro operaciones aritméticas básicas definidas en intervalos cerrados se definen como sigue: [a, b] + [d, e] [a, b] − [d, e] [a, b] · [d, e] [a, b] [d, e] = [a + d, b + e] (76) = [a − d, b − d] (77) = [mı́n(ad, ae, bd, be), máx(ad, ae, bd, be)] (78) a a b b a a b b = [mı́n( , , , ), máx( , , , )] siempre que 0 ∈ / [d, e] (79) d e d e d e d e 40 Cuando uno de los intervalos descritos en las ecuaciones de la definición 3.1 es el intervalo degenerado, se obtienen las operaciones especiales; cuando dos de los intervalos se degeneran, se obtiene la aritmética normal de números reales, como sería de esperarse. Ejemplo 3.1 Se deben verificar cuidadosamente las siguientes expresiones, constatando con la definición 3.1: [2, 5] + [1, 3] = [3, 8] [0, 1] + [−6, 5] = [−6, 6] [2, 5] − [1, 3] = [−1, 4] [0, 1] − [−6, 5] = [−5, 7] [−1, 1] · [−2, −0,5] = [−2, 2] [3, 4] · [2, 2] = [6, 8] [−1,1] [−2,−0,5] [4,10] [1,2] = [−2, 2] = [2, 10]. Las operaciones aritméticas en los intervalos cerrados satisfacen algunas propiedades útiles, que se describen a continuación. Teorema 3.1 (Propiedades de las Operaciones Aritméticas) Sean A = [a1 , a2 ], B = [b1 , b2 ], C = [c1 , c2 ], 0 = [0, 0], 1 = [1, 1]. Las propiedades de las operaciones aritméticas difusas se definen como sigue: 1. Conmutatividad: A + B = B + A, A·B =B·A 2. Asociatividad: (A + B) + C = A + (B + C) (A · B) · C = A · (B · C) 3. Identidad: A =0+A =A+0 A =1·A= A·1 41 4. Subdistributiva: A · (B + C) ⊆ A · B + A · C 5. Distributiva: si b · c ≥ 0 para cadab ∈ B y c ∈ .C, entonces A · (B + C) = A · B + A · C . Si A = [a, a], entonces a · (B + C) = a · B + a · C 6. 0 ∈ A − A y 1 ∈ A A. 7. si A ⊆ E y B ⊆ F , entonces: A+B A−B A·B A B ⊆ E +F ⊆ E −F ⊆ E ·F E ⊆ F (80) (81) (82) (83) Demostración. La mayoría de estas propiedades sigue directamente de ecuaciones descritas en la def. 3.1 Se demuestran las propiedades menos obvias de subdistributividadty y distributividad 1. Primero, se tiene que: A · (B + C) = = ⊆ = {a · (b + c) | a ∈ A, b ∈ B, c ∈ C] {a · b + a · c | a ∈ A, b ∈ B, c ∈ C) {a · b + a · c | a ∈ A, b ∈ B, c ∈ C) A · B + A · C. (84) (85) (86) (87) Luego A · (B + C) ⊆ A · B + A · C. 2. Se asume ahora, sin pérdida de generalidad, que b1 ≥ 0 y c1 ≥ 0. Entonces, se tienen que considerar los siguientes tres casos: si a1 ≥ 0, entonces, si a1 < 0ya2 ≤ 0, entonces −a2 ≥ 0, (−A) = [−a2 , −a1 ], y si a1 < 0 y a2 > 0, entonces A · (B + C) = [a1 · (b2 + c2 ), a2 (b2 + c2 )] = [a1 · b2 , a2 · b2 ] + [a1 · c2 , a2 · c2 ] = A · B + A · C. (88) (89) (90) Esta distributividad no es general. Para verificarlo, sea A = [0, 1], B = [1, 2], C = [−2, −1], entonces, A·B = [0, 2], A·C = [−2, 0], B+C = [−1, 1], y A · (B + C) = [−1, 1] ⊂ [−2, 2] = A · B + A · C. 42 3.3. Operaciones Aritmeticas en Números Difusos A continuación se presentan dos métodos para desarrollar la aritmética difusa. Un método es basado en la aritmética de intervalos. El otro método es el principio de extensión por medio del cual se extienden operaciones en los números reales a las operaciones en los números difusos. Para ello se asumirá que los números difusos son representados por funciones de pertenencia continuas. Definición 3.2 Sean A y B números difusos y sea que denota cualquiera de las cuatro operaciones aritméticas básicas. Entonces, se define un conjunto difuso en R, A ∗ B, por definicion en corte α, α (AB), como α (AB) =α Aα B (91) para algun α ∈ (0, 1]. (Cuando = /, claramente, se requiere que 0 ∈ /α B para todos α ∈ (0, 1].) Se puede demostrar [Gky95] que AB puede expresarse como AB = ∪ α α∈[0,1] (AB) (92) donde α (AB) es un intervalo cerrado para cada α ∈ (0, 1] y A, B son números difusos, AB es también un número difuso. Ejemplo 3.2 Considere dos numeros difusos de forma triangular A, B definidos: o x+1 2 para x ≤ −1yx > 3 para − 1 < x ≤ 1 para 1 < x ≤ 3 3−x 2 o para x ≤ 1y x > 5 x−1 para 1 < x ≤ 3 B(x) = 2 5−x para 3 < x ≤ 5 2 A(x) = Sus cortes α son: α α A = [2α − 1, 3 − 2α] B = [2α + 1, 5 − 2α]. Con base en la definición de operación difusa en intervalos, se tiene α (A + B) − [4a, 8 − 4a] para α ∈ (0, 1], α (A − B) = [4a − 6, 2 − 4a] para α ∈ (0, 1], 43 α (A, B) = αA B [−4a2 + 12α − 5, 4α2 − 16α + 15] para α ∈ (0, ,5] [4a2 − 1, 4a2 − 16α + 15] para α ∈ (,5, 1] 2α−1 3−2α , para α ∈ (0, ,5] 2α+1 2α+1 = 2α−1 3−2α para α ∈ (,5, −1] 5−2α , 2α+1 los numeros difusos resultantes son entonces: 0 para x ≤ 0 y x > 8 x para 0 < x ≤ 4 (A + B)(x) = 4 8−x para 4 < x ≤ 8 4 (A − B)(x) = (A · B)(x) = A )(x) = (B 0 para − 6 < x ≤ −2 para − 2 < x ≤ 2 0 para x < −5 y x ≥ 15 √ 3− 2 4−x para − 5 ≤ x < 0 2 0 x+6 4 2−x 4 para x ≤ −6 y x > 2 √ 2 1+x 2 √ 4− 2 1+x 2 x+1 2−2x para 0 ≤ x < 3 para 3 ≤ x < 15 para x < −1 y x ≥ 3 5x+1 2x+2 3−x 2x+2 para − 1 ≤ x < 0 para 0 ≤ x < para 1 3 1 3 ≤x<3 Esto se representa gráficamente según muestra la fig. 15. El segundo método esta basado en el principio de extensión. Empleando este principio, se extienden operaciones aritméticas normales en los números reales a los números difusos. Sea cualquiera de las cuatro operaciones aritméticas básicas y sean A, B numeros difusos. Entonces, se define un conjunto difuso en R, AB, por la ecuación, (AB)(z) = sup mı́n[A(x), B(y)], z=x∗y para todo z ∈ R. Especificando para todo z ∈ R, se define: 44 (93) Figura 15: Operaciones aritméticas con números difusos. 45 (A + B)(z) = sup mı́n[A(x), B(y)], (94) z=x+y (A − B)(z) = sup mı́n[A(x), B(y)], (95) (A · B)(z) = sup mı́n[A(x), B(y)], (96) z=x−y z=x·y A B (z) = sup mı́n[A(x), B(y)], z= x y (97) Aunque A ∗ B definido por Ec 93 es un conjunto difuso en R, se tiene que mostrar que es un numero difuso para cada ∈ {+, −, ·, /}. Teorema 3.2 (Operación difusa contínua) Sea ∈ {+, −, ·, /}, y sean A, B números difusos contínuos. Entonces, el conjunto difuso AB definido por (ec. 93): (AB)(z) = sup mı́n[A(x), B(y)], (98) z=x∗y es un número difuso contínuo. Demostración. Primero, hay que demostrar Ec.?? mostrando que α (AB) es un intervalo cerrado para α ∈ (0, 1]. Para cualquier z ∈α Aα B, existe algún x0 ∈α A y y0 ∈α B tal que z = x0 y0 . Así, (AB)(z) = sup mı́n [A(x), B(y)] (99) z=x∗y ≥ mı́n [A(x0 ), B(y0 )] ≥ α. (100) (101) De aqui, z ∈α (AB) y, por consiguiente, α Aα B ⊆α (AB). Para cualquier z ∈α (AB), se tiene (AB)(z) = sup mı́n[A(x), B(y)] ≥ z=x∗y α. más, para cualquier n > [ a1 ] + 1, donde [ a1 ] denota el entero más grande que es igual a a1 , exista xn y yn tal que z = xn yn y min[A(xn ), B(yn )] > a − Es decir, xn ∈ a−1 n A, yn ∈ a−1 n 1 . n B y se pueden considerar dos sucesiones, {xn } 46 y {yn }, siempre que 1 1 ≤a− , n n+1 a− y se tiene a−1 n+1 A⊆ a−1 n a−1 A, n+1 B ⊆ De aqui, {xn } y {yn } entre en algunos a−1 n a−1 n Ay B. a−1 n B, respectivamente. Desde el último son intervalos cerrados, {xn } y {yn } se limita las sucesiones. Así, existe una sucesion convergente {xn,i } tal que xn,i → x0 . Para la correspondiente secuencia {yn,i, }, también existe una subsequencia convergente {yn,i,j ) tal que yn,i,j → y0 . Si se toma la correspondiente subsecuencia, {xn,i,j } desde {xn,j }, entoncesxn,i,j → x0 . Así, se tienen dos sucesiones, {xn,i,j } y{yn,i,j }, tal que xn,i,j → x0 y yn,i,j → y0 y xn,i,j yn,i,j = z. Ahora, desde que es contínuo, z = lim xn,i,j yn,i,j = j→∞ lim xn,i,j j→∞ También, desde A(xn,i,j ) > a − 1 ni,j lim yn,i,j j→∞ y B(yn,i,j ) > a − 1 ni,j = x0 y0 . , 1 )=a j→∞ j→∞ j→∞ ni,j 1 B(x0 ) = B lim yn,i,j = lim B(yn,i,j ) ≥ lim (a − )=a j→∞ j→∞ j→∞ ni,j A(x0 ) = A a lim xn,i,j = lim A(xn,i,j ) ≥ lim (a − Por consiguiente, existe x0 ∈ a A, y0 ∈ a B tal que z = x0 y0 . Es decir, z ∈ A a B . Así, a (AB) ⊆a Aa B, luego, a (AB) =a Aa B. Ahora se demuestra que AB debe ser continuo. Se puede demostrar que la función de pertenencia de AB debe ser de la forma general. Se asume AB no es contínua en z0 ; es decir, lim (AB)(z) < (AB)(z0 ) = sup min[A(x), B(y)]. z→z0− z0 =x∗y Entonces, debe existir x0 y y0 tal que z0 = x0 y0 y lim (AB)(z) < min[A(x0 ), B(y0 )]. z→z0− 47 (102) Dado que la operacion ∈ (+, −, ·, /} es monótona con respecto al primero y segundo argumentos respectivamente, siempre se pueden encontrar dos sucesiones {xn } y {yn } tal que xn → x0 , yn → y0 , ya que n → ∞, y xn ∗ yn < z0 para cualquier n. Sea zn = xn yn ; entonces zn → z0 ya.que n → ∞. Así. lim (AB)(z) = lim (AB)(zn ) z→z0− n→∞ = lim sup min[A(x), B(y)] n→∞z0 =x∗y ≥ lim min[A(x0 ), B(y0 )] n→∞ = min[A( lim xn ), B( lim yn )] n→∞ n→∞ = min[A(x0 ), B(y0 )]. (103) Esto contradice la ec. 102 y, por consiguiente, AB debe ser un número difuso continuo. 3.4. Reticula de Números Difusos Como es bien conocido, el conjunto R de números reales es ordenado linealmente. Para cada par de numeros reales, x y y, se tiene x ≤ y o y ≤ x. El par (R,≤) es una retícula que puede ser expresada por lo que se refiere a dos operaciones: x si x ≤ y min(x, y) = (104) y si y ≤ x y si x ≤ y max(x, y) = (105) x si y ≤ x para cada par x, y ∈ R. El orden lineal de los números reales no se extiende a los numeros difusos. Para introducir un orden significante de números difusos, primero se extendiende la operacion de la retícula min y max en los numeros reales, como se define por Ec.104 y 105, para definir las operaciones correspondientes en los números difusos que se denotarán por MIN y M AX. Definición 3.3 (Orden en números difusos) Para cualquier dos números difusos A y B, esto se define como: MIN(A, B)(z) = sup mı́n[A(x).B(y)] (106) mı́n[A(x), B(y)] (107) z=mı́n(x,y) MAX(A, B)(z) = sup z=mı́n(x,y) para todo z ∈ R. 48 1 B A -2 -1 0 1 2 1 3 B A -2 4 min -1 0 1 2 1 3 4 B A -2 -1 0 1 2 3 4 -2 -1 0 1 2 3 4 Figura 16: Comparación de las operaciones MIN, min, MAX, max. 49 Observe que los símbolos MIN y MAX que denotan las operaciones introducidas en números difusos, debe distinguirse para los símbolos min y max, que denotan la operacion usual de mínimo y máximo en los números reales, respectivamente. Tanto min y max son operaciones continuas, de Ec.106, ??, y del Teorema 4.2 tanto MIN (A, B) y MAX (A, B) son números difusos. Es importante comprender que las operaciones MIN y MAX son totalmente diferentes de la intersección y la union difusa normal, min y max. Esta diferencia se ilustra en la fig ??, donde 0 para x < −2 y x > 4 x+2 para -2 ≤ x ≤ 1 A(x) = 3 4−x para 1 ≤ x ≤ 4 3 0 parax < 1 y x > 3 x − 1 para 1 ≤ x ≤ 2 B(x) = 3 − x para 2 ≤ x ≤ 3 0 para x < −2 y x > 3 x+2 para − 2 ≤ x ≤ 1 3 M IN(A, B)(x) = 4−x para 1 ≤ x ≤ 2,5 3 3 − x para 2,5 < x < 3 0 para x < 1 y x > 4 x − 1 para 1 ≤ x ≤ 2 MAX(A, B)(x) = 3 − x para 2 ≤ x ≤ 2,5 4−x para 2,5 < x ≤ 4 3 Si se tiene que R que denota el conjunto de números difusos. Entonces, operaciones MIN y M AX son claramente funciones de la forma R × R → R. El teorema siguiente que establece las propiedades básicas de estas operaciones, asegura que la tripleta (, MIN, M AX) es una retícula distributiva en donde MIN y M AX representan la reunión y unión, respectivamente. Teorema 3.3 Sea MIN y M AX las operaciones binarias en R definidas en la ec. 106 y ??. Entonces: M IN (A, B)(z) = sup mı́n[A(x).B(y)] (108) mı́n[A(x), B(y)] (109) z=mı́n(x,y) MAX(A, B)(z) = sup z=mı́n(x,y) Y además, para cualquier A, B, C ∈ R, se cumplen las siguientes propiedades: 1. Propiedad conmutativa: M IN(A, B) = M IN(B, A), M AX(A, B) = M AX(B, A). 50 2. Propiedad asociativa: M IN [MIN (A, B), C] = MIN [A, M IN (B, C)], M AX[MAX(A, B), C] = M AX[A, MAX(B, C)]. 3. Propiedad de idempotencia: M IN (A, A) = A, M AX(A, A) = A. 4. Propiedad de absorción: M IN [A, MAX(A, B)] = A, M AX[A, MIN (A, B)] = A. 5. Propiedad distributiva: M IN [A, MAX(B, C)] = MAX[MIN(A, B), M IN(A, C)], M AX[A, MIN (B, C)] = MIN [M AX(A, B), M ÁXIM O(A, C)]. Demostración. Se desarrollará la demostración de las propiedades asociativa, de absorción y distributiva, ya que las propiedades conmutativa y de idempotencia son triviales. Por ejemplo, para demostrar la propiedad asociativa se tiene que, para todo z ∈ R, M IN [A, M IN(B, C)](z) = sup min[A(x), M IN (B, C)(y)] z=mı́n(x,y) = sup min[A(x), z=mı́n(x,y) = sup min[B(u), C(v)]] y=mı́n(u,v) sup sup min[A(x), B(u), C(v)] z=mı́n(x,y) y=mı́n(u,v) = sup min[A(x), B{u), C(v)] z=mı́n(x,u,v) = sup sup min[A(x), B(u), C(v)] z=mı́n(s,v) s=mı́n(x,u) = sup min[ z=mı́n(x,v) = sup sup min [A(x), B(u)] , C(v)] s=mı́n(x,u) min[MIN (A, B)(s), C(v)] z=mı́n(s,v) = MIN [M IN (A, B), C](z). La prueba de la asociatividad de M AX se realiza de manera análoga. Para probar la propiedad de absorción se tiene que para todo z ∈ R, MIN [A, M AX(A, B)](z) = sup min[A(x), MAX(A, B)(y)] z=mı́n(x,y) = sup min[A(x), z=mı́n(x,y) = sup min[A(u), B(v)]] min[A(x), A(u), B(v)]. z=mı́n(x,máx(u,v)) 51 sup z=máx(x,y) Se utilizará M para denotar el lado derecho de la última ecuación. Desde que B sea un número difuso, existe v0 ∈ , tal que B(v0 ) = 1. Por z = min[z, max(z, v0 )], se tiene M ≥ min[A(z), A(z), B(v0 )] = A(z). Por otro lado, desde que z = min[x, max(u, v)], se tiene min(x, u) ≤ z ≤ x ≤ max(x, u). Por la convexidad de números difusos [Gky95]. A(z) ≥ min[A[min(x, u)], A[max(x, u)]] = min[A(x), A(u)] ≥ min[A(x), A(u), B(v)] (110) Así, M = A(z) y, por consiguiente, M IN [A, MAX(B, C)] = A. La prueba de la propiedad de absorción es similar. Para demostrar la propiedad distributiva se toma z ∈ R, y se ve claramente que: M IN [A, M AX(B, C)](z) = sup min[A(x), B(u), C(v)], (111) z=mı́n[x,máx(u,v)] M AX[MIN (A, B), MIN (A, C)](Z) = supmin[A(m), B(n), A(s), C(t)] (112) z mı́n(m, n), mı́n(s, t) Para demostrar que Ec.111 y 112 son iguales, se muestra primero que E ⊆ F donde donde x = máx E F = {min[A(x), B(u), C(v)]/min[x, max(u, v)] = z} = {min[A(m), B(n), A(s), C(t)]/max[min(m, n), min(s, t)] = z} Para cada a = min[A(x), B(u), C(v)] tal que min[x, max(u, v) = z (es decir, a ∈ E), donde existe m = s = x, n = u, y t = v tal que, max[min(m, n), min(s, t)] = max[min(x, u), min(x, v)] = min[x, max(u, v)] = z donde a = min[A(x), B(u), A(x), C(v)] = min[A(m), B(n), A(s), C(t)]. Es decir, a ∈ F y, por consiguiente, E ⊆ F . Esto significa que la ec.112 es mayor que o igual a la ec.111. Ahora, se muestra que estas dos funciones son iguales mostrando que para cualquier número b en F , existe un número a en E tal que b ≤ a. 52 Para cualquier b ∈ F , existe m, n, s, y t tales que max[min(m, n), min(s, t)] = z, b = min[A(m), B(n), A(s), C(t)] de donde, z = min[max(s, m), max(s, n), max(t, m), max(t, n)]. Sea x = min[max(s, m), max(s, n), max(t, m)], u = n, y v = t. Entonces, z = min[x, max(u, v)]. Por otro lado, es fácil ver que min(s, m) ≤ x ≤ max(s, m). Por la convexidad de A, A(x) ≥ min[A(min(s, m)), A(max(s, m))] = min[A(s), A(m)] De allí, existe a = min[A(x), B(u), C(v)] con min[x, max(u, v)] = z (es decir, a ∈ F ), y a = min[A(x), B(u), C(ti)] ≥ min[A(s), A(m), B(n), C(t)] = b Es decir, para cualquier b ∈ F , existe a ∈ F , tal que b ≤ a. Esto implica que supF ≤ supE. Esta desigualdad, junto con el resultado anterior, asegura que (111) y (112) son iguales. Esto concluye la prueba de la primera ley distributiva. La prueba de la segunda ley distributiva se realiza de manera análoga. La reticula (R, M IN, M AX) también puede expresarse como el par (R, ≤), donde ≤ es una clasificación parcial definida como: A ≤ B si M IN(A, B) = A ó A ≤ B si M AX(A, B) = B para cualquier A, B ∈ R. También se puede definir la clasificación parcial por lo que se refiere a los cortes α pertinentes: A ≤ B si min(α A,a B) =a A ó A ≤ B si max(a A,a B) =a B para cualquier A, B ∈ R y a ∈ (0, 1], donde a A y a B son los intervalos cerrados a A = [a1 , a2 ], a B = [b1 , b2 ]. Entonces, min(a A,a B) = [min(a1 , b1 ), min(a2 , b2 )] max(a A,a B) = [max(a1 , b1 ), max(a2 , b2 )] 53 Si se define la clasificación parcial de intervalos cerrados de la manera usual, eso es, [a1 , a2 ] ≤ [b1 , b2 ] si a1 ≤ b1 y a2 ≤ b2 , entonces para cualquier A, B ∈ R, se tiene A B si a A ≤a B para todo α ∈ (0, 1]. Esto significa por ejemplo, que los dos números difusos A y B en la fig. ??, no son comparables. Sin embargo, los valores de las variables lingüísticas en la mayoría de las aplicaciones son definidos por números difusos que son comparables. Por ejemplo, los valores de la variable lingüística la .a ctuación" definido anteriormente forma una cadena de la forma: "muy pequeñopequeñomedianograndemuy grande". Aunque el conjunto R no es de orden lineal, hay algunos subconjuntos que se comportan como tal, y son subconjuntos muy importnates en las aplicaciones comunes de la teoría difusa. 54 4. Inferencia Difusa Las reglas de la inferencia dentro del armazón de lógica difusa son usadas para facilitar el razonamiento aproximado. Ellas pueden describir generalizaciones de tres inferencias clásicas, que son: las reglas modus ponens, modus tolens, y el silogismo hipotético. Estas generalizaciones se basan en la regla composicional que se llama inferencia. 4.1. Inferencia para Proposiciones Difusas Condicionales Considerense las variables χ y γ que toman valores de los conjuntos X y Y , respectivamente, y asumase que para todo x ∈ X y todo y ∈ Y las variables estan relacionadas por una función y = f (x). Entonces, dado X = x, se puede inferir que y = f (x). Igualmente, sabiendo que el valor de X está en un conjunto dado A, se infiere que el valor de V está en el conjunto B = {y ∈ Y /y = f(x), x ∈ A}. Se asume ahora que las variables están relacionadas por una relación arbitraria en X × Y , no necesariamente una función. Entonces, dado X = u y una relación R, se infiere que y ∈ B donde B = {y ∈ Y/(x, y) ∈ R}, como se ilustra en la fig.17(a). Igualmente, se sabe que X ∈ A, se puede inferir que γ ∈ B, donde B = {y ∈ Y | (x, y) ∈ R, x ∈ A}, como se ilustra en la fig.17(b). Observese que esta inferencia puede expresarse igualmente bien por lo que se refiere a las funciones características χA , χB , χR de conjuntos A, B, R respectivamente, por la ecuación χB (y) = sup n[χA (x), χR (x, y)] (113) x∈X para todo y ∈ Y. Se asume que R es una relación difusa en X × Y , y A, B son conjuntos difusos en X y Y , respectivamente. Entonces, si R y A son dados, se puede obtener B por la ecuación B(y) = sup min [A(x), R(x, y)] (114) x∈X para todo y ∈ Y . Lo anterior es una generalización de la ec 113 obtenida reemplazando la función característica en ec. 113 con las funciones de pertenencia correspondientes. Esta ecuación también puede escribirse en forma matricial como: B = A ◦ R y es llamada la Regla de Inferencia Composicional. Esta regla se ilustra en Fig.18 55 Y R B X u (a) Y R B A X (b) Figura 17: Regla de Inferencia Composicional [Gky95]. 56 Y B 0 1 Relación Difusa R X 0 A 1 Figura 18: Regla de inferencia composicional La relación difusa que se empleó en la ec. 114 normalmente no es usada directamente, pero si es usada de otras formas, se considera el caso de proposición difusa condicional. 4.1.1. Modus Ponens Generalizado Como se explico anteriormente, la relación R que se usado en una proposición difusa condicional p de la forma p : Si χ es A, entonces γ es B es determinado para todo x ∈ X y todo y ∈ Y mediante la expresión R(x, y) = j[A(x), B(y)], (115) donde j denota una implicación difusa .Usando la relación R obtenida de la proposición dada p en Ec.115, y dado otra proposición q de la forma q : χ es A 57 se puede concluir que γ es B por la regla de inferencia composicional de la ec. 114. Este procedimiento se llama un modus ponens generalizado. La proposición p es una regla y la proposición q como un hecho, el modus ponens generalizado se expresa por el esquema siguiente: Regla si X es A, entoncesY es B Factor .......................... X es A ___________________________ Conclusion ...... Y es B (116) En este esquema B es calculado por la ec. 114, y R en esta determinado por la ec. 115. Se observa que ec.116 se vuelve el modus ponens clásico cuando los conjuntos son los clásicos y A = A, B = B. Ejemplo 4.1 Los conjuntos de valores de variables X y Y son X = {x1 , x2 , x3 } y Y = {y1 , y2 ), respectivamente. Se asume una proposición ”si X es A, entonces Y es B”, donde A = x,51 + x12 + x,63 y B = y11 + y,42 . Entonces, dado un hecho expresado por la proposición ”x es A” donde A = x,61 + x,92 + x,73 , usar el modus ponens generalizado, ec. ?? para derivar una conclusión de la forma "y es B ". Por ejemplo, usando la implicación de Lukasiewicz [Gky95]se obtiene R = x11 , y1 + x,92 , y2 + x12 , y1 + x,42 , y2 + x13 , y1 + x,83 , y2 por ec. 115. Entonces, por la regla de inferencia composicional ec. 114, se tiene B(y1 ) = sup min [A(x), R(x, y1 )] x∈X = max [min(,6, 1), min(,9, 1), min(,7, 1)] = ,9 B(y2 ) = sup min[A(x), R(x, y2 )] x∈X = max[min(,6, ,9), min(,9, ,4), min(,7, ,8)] = ,7 Ejemplo 4.2 se concluye que Y es B, donde B = 4.1.2. ,9 y1 + ,7 y2 . Modus Tollens Generalizado Otra regla de inferencia en lógica difusa es el modus tollens generalizado y se expresa: Regla: Si χ es A, entonces γ es B Hecho: γ es B ____________________________________ Conclusión: χ es A En este caso, la regla de inferencia composicional tiene la forma A(x) = supmin[.B(y), R(x, y)], y∈Y 58 (117) y R en esta ecuación es determinado mediante la ec. 115. Ejemplo 4.3 Sean X, Y, j, A, B y R definidas en las líneas aneriores. Asuma ahora que se da un hecho que se expresó por la proposición que ”y es B’ ” ,donde B = y,91 + y,72 . Entonces, por ec. 117, A(x1 ) = supmin [B(y), R(x1 , y)] y∈Y = max[min(,9, 1), min(,7, ,9)] = ,9, A(x2 ) = supmin[B(y), R(x2 , y)] y∈Y = max[min(,9, 1), min(,7, ,4)] = ,9, A(x3 ) = supmin[B(y), R(x3 , y)]. y∈Y = max[min(,9, 1), min(,7, ,8)] = ,9. se concluye que X es A donde A = 4.1.3. ,9 x1 + ,9 x2 + ,9 x3 . Silogismo Hipotético Generalizado Finalmente, una generalización de silogismo hipotético que es basado en dos proposiciones difusas condicionales. El silogismo hipotético generalizado se expresa por el esquema siguiente: Regla1 : Regla2 : Conclusión : Si χ esA, entonces γ es B Si γ es B, entonces z es C Si χ es A, entonces z es C (118) (119) (120) En este caso, χ, γ, z son variables que toman los valores en los conjuntos X, Y, Z, respectivamente, y A, B, C son los conjuntos difusos en los conjuntos X, Y, Z, respectivamente. Para cada proposición difusa condicional en ec. 118, hay una relación difusa determinada por ec. 115, estas relaciones son determinadas para cada x ∈ X,y ∈ Y , y z ∈ Z por las ecuaciones: R1 (x, y) = j[A(x), B(y)] R2 (y, z) = j[B(y), C(z)] R3 (y, z) = j[A(y), C(z)] (121) Una vez obtenidas R1 , R2 , R3 ,mdiante estas ecuaciones, se tiene la regla de silogismo hipotetico generalizado asi: 59 R3 (x, z) = sup mı́n [R1 (x, y), R2 (y, z)] , (122) y∈Y que de nuevo expresa la regla de inferencia composicional. Esta ecuación también puede escribirse en forma matricial como: R3 = R1 ◦ R2 . (123) Ejemplo 4.4 Sea X, Y como se han definido en las líneas anteriores , y sea Z = {z1 , z2 }. Además, sea A = ,5 x1 + l x2 + ,6 x3 , B= l y1 + ,4 y2 , C= ,2 z1 + 1 z2 , y j(a.b) = {1 si a ≤ b, b si a > b} Entonces se puede verificar fácilmente que 1 0,4 R1 = 1 0,4 1 0,4 0,2 1 R2 = 0,2 1 0,2 1 R3 = 0,2 1 0,2 1 Y por tanto el silogismo hipotético generalizado se ha verificado en esete caso, ya que R1 ◦ R2 = R3 . 4.2. Inferencia para Proposiciones Difusas Condicionales Calificadas La regla de inferencia permite involucrar las proposiciones difusas condicionales con los calificadores de verdad difusos. Dado un condicional y la proposición difusa calificada p de la forma p : Si X es A, entonces Y es B es S, (124) donde S es un calificador de verdad difuso, y a partir de un hecho de la forma ”X es A”’, se quiere hacer una inferencia de la forma ”Y es B”. Un método desarrollado para este propósito, se llama método de restricciones de valores de verdad, método que se basa en la manipulación de valores de verdad lingüísticos. El método involucra cuatro pasos, que se describen a continuación. 60 Paso 1 Calcule el valor de verdad difuso relativo de A con respecto a A, denotado por RT (A/A), que es un conjunto difuso en el intervalo unitario definido por: RT (A/A)(a) = sup A(x), (125) x:A(x)=a para todo a ∈ [0, 1]. El valor de verdad de la relacion difusa RT (A/A) expresa el grado en que la proposición difusa ec. 124 es verdad dado el hecho ”X es A ”. Paso 2 Seleccione una implicación j difusa conveniente para la proposición difusa de la ec. 124. Esto es similar a la selección de implicación difusa cuyo propósito es para expresar un condicional. Paso 3 Calcule el valor de verdad difuso relativo RT (B/B) mediante la expresión RT (B/B)(b) = sup mı́n[RT (A/A)(a), S(j(a, b))] (126) a∈[0,1] para todo a ∈ [0, 1], donde S es el calificador difuso de la ec. 124. Claramente, el papel del calificador S es modificar el valor de verdad de j(a, b). Se nota que cuando S es verdadero (es decir, S(a) = a) para todo a ∈ [0, 1], entonces S(j(a, b)) = j(a, b). El valor de verdad difuso relativo RT (B/B) expresa el grado en que la conclusión de la proposición difusa ec.124 es verdadera. Paso 4 Calcule el conjunto B relacionado en la inferencia ”γes B ” mediante la ecuación B(y) = RT (B/B)(B(y)) para todo y ∈ Y . Ejemplo 4.5 Se supone un condicional difuso y la proposición calificada, p : "Si X es A, entonces Y es B es muy cierto" donde A = 1 x1 + ,5 x2 + ,7 x3 , B= ,6 y1 + 1 y2 , y S es muy cierto; sea S(a) = a2 para todo a ∈ [0, 1]. Dado un hecho ”X es A”’, donde A = ,9 x1 + ,6 x2 + concluye que ”Y es B”, donde B es calculado por los pasos siguientes. Paso 1. Se calcula RT (A/A) por ec. 125: RT (A/A)(1) = A(x1 ) = ,9, RT (A/A)(,5) = A(x2) = ,6, RT (A/A)(,7) = A(x3 ) = ,7, RT (A/A)(a) = 0 para todo a ∈ [0, 1] - {,5, ,7, 1). Paso 2. Se selecciona la implicación difusa j. Paso 3. Se calcula RT (B/B): 61 ,7 x3 , se 1 0.9 2 0.8 0.7 ( 0.3 +x ) 2 0.6 0.5 2 0.4 0.3 0.2 0.1 0 0.1 0.2 0.3 0.4 0.5 0.375 0.6 0.537 0.375 0.7 0.8 0.9 1 0.737 0.849 Figura 19: Funcion RT (B/B) RT (B/B)(b) = max {min[,9, S(j(,9, b))], min[,6, S(j(,6, b))], min[,7, S(j(,7, b))]} (0,4 + B)2 para b ∈ [0, 0,375) ,6 para b ∈ [0,375, 0,475) (0,3 + b)2 para b ∈ [0,475, 0,537) = 0,7 para b ∈ [0,537, 0,737) (0,1 + b)2 para b ∈ [0,737, 0. − 849) 0,9 para b ∈ [0,849, 1] Un gráfico de esta función RT (B/B) se muestra en Fig.??. Paso 4. Se calcula B por Ec ??: B(y1 ) = RT (B/B)(B(y1 )) = RT (B/B)(,6) = ,7, B(y2 ) = RT (B/B)(B(y2 )) = RT (B/B)(1) = ,9 Donde, se infiere ”γ es B ” , B = ,7 y1 62 + ,9 y2 . Cuando S en la ec. 124 es la función de identidad, el método de las restricciones del verdad-valor es equivalente al modus pones generalizado bajo una condicion particular, expuesta en el teorema siguiente. Teorema 4.1 Sea S una proposición difusa de la forma descrita en la ec. 124, donde S es la función identidad (es decir, S posiciones para verdadero), y supóngase que se tiene un hecho de la forma ”X es A”’, donde sup A(x) = A(x0 ) para todo a ∈ [0, 1] y algún x0 tal que A(x0 ) = a. Entonces, la inferencia ”V es B ” obtenido por el método de restricciones del valor de verdad es igual al obtenido por el modus generalizado. Para la demostración se pueden consultar varios textos, en particular [Gky95]. 4.3. Inferencia de Proposiciones Cuantificadas Todos los cuantificadores pueden expresar las proposiciones difusas de la forma p : W es Q, donde W es una variable cuyos valores son |E|, cuando Q es |E1 ∩E2 | 2 cuando Q es un cuantificador un cuantificador absoluto, o es P ro( E E2 ) = |E1 | relativo. En general, el problema de inferencia de las proposiciones difusas cuantificadas puede declararse como se describe a continuación. Si se tienen n proposiciones difusas cuantificadas de la forma pi : Wi es Qi (i ∈ Nn ), (127) donde Qi es un cuantificador absoluto o un cuantificador relativo, y Wi es una variable compatible con el cuantificador Qi para cada i ∈ Nn , se puede inferir de estas proposiciones un posible principio que es conocido en la literatura como el principio de extensión de cuantificador. Para discutir este principio, se asume que la probable inferencia se expresa por lo que se refiere a una proposición difusa cuantificada de la forma p : W es Q. (128) El principio declara que si existe una función f : Rn → R (129) W = f (W1 , W2 , ...., Wn ) Q = f (Q1 , Q2 , ....Qn ) (130) (131) y tal que 63 donde el significado de f (Q1 , Q2 , ....Qn ) se define mediante el principio de la extensión. Entonces se puede concluir p de la forma p1 , p2 , ..., pn . Una alternativa más general para formular el principio se puede establecer, afirmando que si existen dos funciones f g : Rn → R : Rn → R (132) (133) tales que f(W1 , W2 , ...., Wn ) ≤ W ≤ g(W1 , W2 , ...., Wn ) (134) entonces se puede concluir que p es de la forma p1 , p2 , ..., pn , donde Q en la proposición p es un cuantificador especial denotado por Q = [≥ f(Q1 , Q2 , ....Qn )] ∩ [≤ g(Q1 , Q2 , ....Qn )] (135) que quiere decir ”por lo menos f (Q1 , Q2 , ....Qn ) y a lo sumo g(Q1 , Q2 , ....Qn )”. Los conjuntos difusos f(Q1 , Q2 , ....Qn ) y g(Q1 , Q2 , ....Qn ) se obtienen de nuevo por el principio de la extensión. Ejemplo 4.6 Suponga que se tienen las siguientes proposiciones cuantificadas difusas [Gky95]: p1 : Hay aproximadamente 10 personas en el cuarto. p2 : La mitad de las personas en el cuarto son mujeres. Si se quiere hacer una inferencia a la proposición p : Hay Q mujeres en el cuarto, Sean Q1 , Q2 los cuantificadores ”aproximadamente 10” y ”sobre la mitad” respectivamente. Sean E, F el conjunto de personas y el conjunto de mujeres en el cuarto. Usando estos símbolos, se pueden dar las proposiciones de la forma p1 : W1 es Q1 p2 : W 2 es Q2 p : W es Q, | donde W, W1 , W2 son las variables con los valores |E|, |E∩F |E| , |F |, respectivamente. Existe una función f : R2 − > R tal que f(W1 , W2 ) = W para las variables definiddas. Es la función del producto, f (a, b) = ab : f (W1 , W2 ) = W1 W2 = |E| |E ∩ F | = |E ∩ F | = |F | = W |E| Por el principio de extensión de cuantificador, si Q = Q1 · Q2 es el cuantificador en la proposición p, donde Q1 · Q2 es el producto aritmético de numeros difusos Q1 y Q2 empleados en las proposiciones dadas. Entonces p es una inferencia correcta de la forma p1 y p2 . 64 El principio de extensión de cuantificador puede usarse para derivar varias reglas de inferencia para las proposiciones borrosas cuantificadas. Dos de las reglas derivadas son: Definición 4.1 (Inferencia del Silogismo Intersección - Producto) Esta regla se expresa mediante el esquema p1 : Q1 Es son F s p2 : Q2 (E ∧ F )s son Gs, p : (Q1 · Q2 ) Es son (F ∧ G)s (136) donde E, F, G son los conjuntos difusos del conjunto universal X, Q1 y Q2 son los cuantificadores relativos (números difusos en [0, 1]), y Q1 ∗ Q2 es el producto aritmético de los cuantificadores. Como se explicó previamente, proposiciones p1 , p2 y p pueden expresarse de la forma: p1 : W1 es Q1 , p2 : W 2 es Q2 , p : W es Q, G ∩G F ), W2 = P ro( E∩F ), y W = P ro( F E ). y donde W1 = P ro( E para probar que el esquema de la inferencia indicada en la ec.136 es válido, se tiene que demostrar (según el cuantificador del principio de la extensión) que ”W = W1 · W2 ”. Esta demostración es como sigue: W1 · W2 G F ) ∗ P ro( ) E E∩F |E ∩ F | |E ∩ F ∩ G| ∗ |E| |E ∩ F | |E ∩ F ∩ G| |E| F ∩G ) P rop( E W. = Pr op( = = = = Luego el esquema de inferencia de la ec. 136 es válido. Ejemplo 4.7 Considerense las proposiciones borrosas cuantificadas siguientes: p1 : La mayoría de los estudiantes es joven. p2 : la mitad de estudiantes jóvenes son hombres. Mediante silogismo del interseccion producto en 136, se infiere la proposición p : Q de estudiantes son jóvenes y hombres, donde Q es un cuantificador obtenido tomando el producto aritmético de números difusos que representa los cuantificadores la mayoría y sobre la mitad. Definición 4.2 (Silogismo de la Conjunción Consecuente) Es una regla de infernecia que se expresa mediante el esquema 65 p1 : Q1 E’s son F ’s p2 : Q2 E’s son G’s p : QE’s son (F y G)’s donde E, F, G son los conjuntos difusos en algún conjunto universal X, Q1 , Q2 son los cuantificadores relativos, y Q es un cuantificador relativo dado por Q = [≥ MAX(0, Q1 + Q2 − 1)] ∩ [≤ M IN (Q1 , Q2 )] es decir, Q es por lo menos MAX(0, Q1 + Q2 − 1) y a lo sumo M IN(Q1 , Q2 ). Se tiene que M IN y M AX son extensiones de las operaciones min y max de los números reales a los números difusos. 66 5. Conclusiones Los desarrollos matemáticos, en particular del análisis han permitido ofrecer una sólida fundamentación matemática a los sistemas difusos, aunque su concepción filosófica ha sido criticada por algunos, afirmando, como W. Kahn, que afirmaron que .E l peligro de la lógica borrosa es que da alas a esa suerte de pensamiento impreciso que nos ha traído tantos problemas". Sin embargo, uno de los aspectos más importantes que se perciben en el trabajo con matemática difusa, es la importancia de replantear los conceptos clásicos de verdad y falsedad, y pertenencia y no-pertenencia, para involucrar en nuestras concepciones, de una manera formal, el concepto de borrosidad o vaguedad [Kos94], en la cual los conceptos clásicos de la lógica bi-valuada son tan solo un caso extremo. y particular. Incluso principios tal universalmente aceptados como el principio del tercio excluido y el de no contradicción pierden granparte de su validez, y pasan igualmente a ser comportamientos en casos particulares. La matemática difusa nos permite entender y manipular matemáticamente conceptos que son a la vez parcialmente verdaderos y parcialmente falsos en la mayoría de las veces, o conceptos de no están definidos de manera precisa en el lenguaje y trabajo habitual (tales como alto, pesado, etc). Permite, (de manera útil además), asignar valores de verdad a las proposiciones, en el intervalo unitario, y operar matemáticamente con ellos. Permite luego introducir "borrosidades.en las propias proposiciones (las variables y los modificadores lingüísticos). Estos aspectos, simples en apariencia, abren nuevas perspectivas sobre conceptos aparentemente "trillados"basados en la lógica y teoría de conjuntos clásicos. Las reglas de inferencia toman gracias a esto una nueva dimensión, más cercana al razonamiento humano. En este trabajo se introdujeron temas relativos a las operaciones con conjuntos, números e intervalos difusos. Se examinaron algunas reglas de inferencia difusas, que aunque no abarcan la totalidad de las reglas que se pueden encontrar, son las más importantes desde un punto de vista teórico: modus ponens, modus tollens y el silogismo hipotético generalizados. Dentro de las muchas líneas posibles en las que conviene reforzar los temas presentados, y que no se incluyeron por limitaciones de tiempo y espacio, se encuentran: Las relaciones difusas, Los procedimientos de diseño de funciones de pertenencia adecuadas. El buen diseño de una función de pertenencia es vital para el correcto modelamiento de un sistema difuso, y adaptarlo a las necesidades. Las funciones de pertenencia se pueden diseñar mediante asignación directa, mediante una función propuesta por el diseñador del sistema, o bien mediante procesos probabilísticos y estadísticos que sufieren un modelo determinado. 67 Los sistemas de inferencia utilizados en la práctica. Son los mecanismos que permiten la toma de decisiones por parte del sistema. Un proceso práctico de inferencia difusa involucra la funciónde pertenencia, los operadores lógicos difusos y un conjunto de reglas si-entonces. Los sistemas de inferencia difusa tienen asociados una cantidad de nombres, debido a que sonutilizaods de manera interdisciplinaria: sistemas expertos difusos, sistemas expertos basados en reglas difusas, modelamiento difuso, controladores lógicos difusos, entre otros. Dentro de estos sistemas de inferencia sobresalen dos, que son prácticamente los más utilizados: el Sistema de Inferencia Difusa de Mamdani y el Sistema de Inferencia Difusa de Sugeno. El primero de ellos, tal vez el más común, fue desarrollado en 1975 por E. Mamdani basado en los trabajos de L. Zadeh. El trabajo con sistemas difusos aplicados tales como Mamdani o Sugeno requieren de la aplicación precisa de gran parte de los conceptos aquí tratados. Este tema se puede profundizar y llevar a la práctica de manera bastante ágil utilizando el Toolbox de Lógica Difusa de Matlab. 68 Referencias [Ros04] T. Ross, Fuzzy Logic with Engineering Applications. NJ, USA: John Wilwy and Sons (2004) [Gky95] G. Klir, B. Yuan, Fuzzy Sets and Fuzzy Logic. NJ, USA: Prentice Hall (1995) [Got01] S. Gottwald, A Treatise on Many Valued Logics. England: Research Studies Press (2001) [Bbs02] B. Martin, A, Sans, Redes Neuronales y Sistemas Difusos. México: Alfaomega (2002) [Kos94] B. Kosko, Pensamiento Borroso. Barcelona: Ed. grijalbo (1992) [Kos92] B. Kosko, Neural Networks and Fuzzy Logic. NewJersey: Prentice-Hall (1992) 69