DIFERENTES ENFOQUES EN LA CONSTRUCCIÓN DE FUNCIONES DE MEMBRESÍA DE LOS CONJUNTOS BORROSOS. APLICACIÓN POTENCIAL EN BIOINFORMÁTICA Evento: I Congreso Internacional de Tecnologías y Contenidos Multimedia en Ambientes digitales. Temática: Bioinformática y otras aplicaciones de la ciencia. Autores: Pedro Yobanis Piñero Pérez, María del Carmen Chávez Cárdenas, Leticia Arco García, Maria M. García Lorenzo, Rafael Bello Pérez. Ponentes: Pedro Yobanis Piñero Pérez Institución: Universidad Central “Marta Abreu” de Las Villas. Facultad de Matemática Física y Computación. Centro de Estudios de Informática Dirección: Carretera a Camajuaní Km 71/2, Santa Clara Villa Clara, CUBA. Código postal: 54830 Teléfonos: (53)(42) 281109 281515 Fax: 53-42-281608 E-mails: ppp@uclv.edu.cu, mchavez@uclv.edu.cu, leticiaa@uclv.edu.cu, mmgarcia@uclv.edu.cu Resumen La Bioinformática se describe como un campo interdisciplinario que se encuentra en la intersección entre las Ciencias de la Vida y de la Información, comprende la investigación y el desarrollo de herramientas útiles para llegar a entender el flujo de información desde los genes a las estructuras moleculares. Muchos problemas de la bioinformática son eminentemente borrosos dada la naturaleza de los mismos. Para la aplicación de los conjuntos borrosos en la solución de determinados problemas la determinación de las funciones de membresía adecuadas juega un papel fundamental. En este trabajo se hace un análisis del estado del arte en la construcción de funciones de membresía; se analizan enfoques basados en la teoría de la posibilidad, la Inteligencia artificial, la estadística y el cálculo. Se muestran diferentes modelos matemáticos lineales utilizados en la representación de funciones de membresía tales como campanas, triángulos, trapecios etc. Se discute la importancia del uso de las funciones de membresía en el marco de los conjuntos borrosos y su uso potencial en la bioinformática. Keywords funciones de membresía, bioinformática; máquinas de aprendizaje. 1 1- Introducción La teoría de conjuntos clásica plantea que un elemento pertenece o no pertenece a un conjunto, es miembro de A o no es miembro de A . Se trata del viejo principio lógico según el cual una cosa es, o, de lo contrario, no es: " p o bien no p ", principio llamado del tercio excluso. Sin embargo en la práctica con frecuencia encontramos una "verdad a medias", volviéndose imposible que algo sea o no sea, que sea totalmente verdadero o totalmente falso. Ante la necesidad de resolver estos problemas surge la lógica polivalente. La lógica polivalente es la base de la lógica borrosa, de ella Katsushige Mita, presidente de Hitachi y de LIFE (Laboratory for International Fuzzy Engineering Research) expresó, "la teoría de la borrosidad se presenta como una teoría adecuada para la representación de la incertidumbre que hay en el significado de todas las palabras". La borrosidad está presente en muchas esferas de la vida y sobre todo en las ciencias de la vida; muchos de los problemas que se presentan en la bioinformática son eminentemente borrosos. La bioinformática se describe como un campo interdisciplinario que se encuentra en la intersección entre las ciencias de la vida y de la información. Informaciones de pacientes tomadas a partir de señales electrofisiológicas, compuestos químicos o simplemente determinados fármacos o moléculas se pueden comportar como variables lingüísticas, por tanto se torna indispensable la obtención de las funciones de membresía y conjuntos borrosos en la solución de estos problemas. En la sección 2 de este trabajo se definen diferentes enfoques interpretativos y modelos matemáticos utilizados en la representación de las funciones de membresía. En la sección 3 se describen algunos métodos utilizados en la construcción automática de las funciones de membresía y por último en la sección 4 se muestra el uso potencial en bioinformática a través de ejemplos resueltos. 2- Diferentes enfoques y representaciones de funciones de membresía 2.1 Definición Un conjunto borroso está determinado por funciones de membresía asociadas a él. Si X es una colección de objetos denotados genéricamente por x , entonces un conjunto borroso A en X se define como un conjunto de pares ordenados [ZAD78]: A {( x, A ( x)) x X } Donde A (x) es llamada la función de membresía para el conjunto A . La función de membresía asigna a cada elemento de X un grado de membresía en el intervalo [0,1]. A X se llama 2 universo de discurso y puede ser un espacio discreto o continuo. El conjunto de pares ordenados puede ser también denotado como A ( x1 ) / x1 A ( x2 ) / x2 A ( xn ) / xn . Interpretaciones y representaciones de funciones de membresía Existen numerosas formas de representar las funciones de membresía, la forma de representación guarda una estrecha relación con los distintos enfoques que se siguen en la construcción de las funciones de membresía y con la naturaleza del problema que ellas representan. La función de membresía más simple es la construida por un experto en forma de pares (element, MemberShipValue), donde element es un posible valor del dominio y el membershipvalue indica el grado de pertenencia del elemento a determinado conjunto. Varios autores han desarrollado diferentes enfoques de la representación de funciones de membresía: o Zadeh [ZAD78] plantea que las distribuciones de posibilidad del universo de atributos es conceptualmente distinta de las distribuciones de probabilidad. o Giles [GIL82] [GIL88] y Ruspini [RUS69] por su parte han operado con interpretaciones probabilísticas de los grados de membresía. Giles identifica los grados de membresía con probabilidades sujetivas determinadas en cada situación. Ruspini [RUS69], en su trabajo de algoritmos de clusterización fuzzy, dice explícitamente que él usa una interpretación probabilística de los grados de membresía. Además establece una fórmula en la cuál los grados de membresía de un objeto en las diferentes clases o clusters suman 1. 2.3 Representaciones de funciones de membresía basadas en modelos matemáticos lineales. Por las características de las funciones de membresía numerosos modelos matemáticos lineales se han utilizado para su representación. Las curvas S (Sigmoid / Logistic) por ejemplo, son curvas monótonas crecientes o decrecientes. La ecuación correspondiente a este tipo de curva está x 0 descrita por la siguiente ecuación: 2 x x donde indica el valor donde el grado de membresía es 2 valor donde se alcanza el mayor valor de membre cero, S ( x; ; ; ) 2 sía y es el punto de inflexión, este es el punto para el x 1 2 x cual el valor de membresía es 0.5. 1 x Funciones campana: En general, existen tres clases importantes de curvas “campana” – las campanas PI, las campanas Beta y las campanas gaussianas. La diferencia entre los tres tipos de curvas está dada por la pendiente de la curva así como por los valores de los puntos finales de la curva. [COX98] Una curva PI provee un gradiente descendiente suave desde el valor central hasta los puntos de membresía cero a lo largo del dominio. La curva PI es simétrica y centrada en un único va- 3 lor del dominio, tiene como parámetros el ancho de la base de la curva ( ) y el punto central (), como se muestra a continuación: S ( x; , / 2, ) x x; ; x 1 S ( x; ; / 2, ) 1 Otras de las características interesantes que hacen atractivas a las curvas PI es que el valor de membresía se hace cero en algún momento en un punto discreto y específico; además no son funciones asintóticas. 0.5 0 Punto de inflexión Dominio 0 Figura I Curva PI La curva Beta [COX98] es una curva con forma de campana más estrecha que la curva PI. Al igual que la curva PI, está definida por dos pará metros, el punto central del dominio ( ) y un valor que indica la mitad del ancho de la curva en el punto de inflexión ( ). Fig II. 1 0.5 B( x; , ) 0 Punto de inflexión Figura II Esquema de la curva Beta 1 x 1 2 A diferencia de la curva PI los grados de membresía obtenidos a partir de esta curva nunca llegan a ser cero al ser la curva asintótica al eje de las abcisas. La curva Gaussiana o exponencial es uno de los modelos de campanas menos populares en la representación de funciones de membresía. La curva Gaussiana es definida, como la curva PI, con dos pará1 metros: el valor único del dominio alrededor del cual la curva es construida ( ) y un valor que indica la anchura 0 K Dominio Figura III Curva Gausiana de la forma de la campana de la curva ( k ). La ecuación de esta curva es: G( x; k , ) k ( x ) 2 La curva producida desde su fórmula se parece a la curva Beta con la diferencia de que la pendiente de la curva obliga a que esta descienda rápidamente hasta el valor 0. 4 Hay que tener en cuenta que la curva Gaussiana tiene alguna de las propiedades de las curvas PI. Naturalmente el parámetro de anchura ( K ) juega un role crítico en la forma y alcance del conjunto borroso. Mientras mayores son los de K la curva se hace más ancha y viceversa. La inhabilidad de predecir exactamente la forma completa de la curva campana resultante para un valor particular de K hace que se dificulte el uso de esta función. Muchos otros modelos de campanas podrían ser utilizados en la descripción de funciones de membresía como por ejemplo: Cam panax; a; b; c 1 1 xc a 2b donde a es la amplitud, c es el centro y b es un factor que influye en la pendiente de la curva. Funciones triangulares y trapecios Generalmente los controles borrosos están definidos por funciones de membresía triangulares dada la simplicidad de estos modelos. Las funciones de membresía triangulares pueden o no ser simétricas y están determinadas por tres parámetros como se muestra a continuación [COX98]: 1 a c b Figura IV Función triángulo 0 x a b a Triángulo( x, a, b, c) c x c b 0 xa a xb bxc cx Las aristas del triángulo indican un descenso lineal del grado de membresía a partir del punto b y hasta que el grado de membresía llega a ser cero. Por su parte las funciones de membresía trapezoidales guardan una estrecha relación con las funciones de membresía triangulares, estas pueden verse como triángulos truncados donde se forma una meseta. Los elementos de la meseta se corresponden con los elementos del universo donde se alcanza el máximo grado de membresía. La ecuación y el gráfico correspondientes a las curvas trapezoidales se muestra a continuación: 1 0 a b c d Figura V Función trapecio 0 xa b a Trapecio( x, a, b, c, d ) 1 d x d c 0 xa a xb bxc cxd xd Los valores del domino de las funciones de membresía basadas en modelos matemáticos lineales pertenecen a los reales; por tanto en aquellos problemas en los que intervengan casos 5 que sean descritos por atributos simbólicos como el color, la aplicación de los modelos matemáticos lineales no es recomendada. En la resolución de esta problemática otros modelos matemáticos, basados en la estadística y la teoría de la medida podrían ser utilizados. 2.4 Representaciones de funciones de membresía basados en la teoría de la posibilidad y la estadística. En la construcción de reglas borrosas y funciones de membresía simbólicas se proponen diferentes enfoques: o Un primer enfoque donde intervenga la probabilidad de aparición del I-ésimo término (termI) en los casos analizados. Pterm K if x term K Sym b( x) Com plem ent Value if x term K donde el valor de la probabilidad P[termI] podría estar determinado, a partir del análisis de la base de casos usada para construir las reglas borrosas y el ComplementValue se determine por alguno de los métodos que se muestran a continuación: 1. ComplementValue 1 PtermK 1 w 2. Complemeto de Yager ComplementValuetermK 1 PtermK w 3. Complemento de Sugeno ComplementValue donde w > 0 1 PtermK 1 Factor.PtermK donde Factor es un número natural que cumple: Factor Factor 1 . . o Un segundo enfoque como se plantea en [NAU00], determina el grado de membresía por medio de un proceso de normalización de las frecuencias de aparición de los términos. PtermK o frectermK i frectermi Un tercer enfoque plantea la construcción de tantas funciones de membresía para un atributo como consecuentes diferentes existan en la base de casos a analizar como muestra la ecuación: Pterm1 / Con sec uentr if x term1 Pterm2 / Con sec uents if x term2 Sym b( x) Pterm N / Con sec uentb if x term N En esta función el grado de membresía del término K-ésimo (termK) se determina como la probabilidad condicional de aparición del término Késimo (termK) dado que tuvo lugar determinado consecuente (consecuentj.). 6 3- Construcción automática de funciones de membresía. Los métodos más comunes empleados en la construcción de funciones de membresía son: Evaluación subjetiva y construcción a partir de expertos: los conjuntos difusos pueden determinarse a partir de procedimientos de extracción simples o complejos, dado que usualmente modelan el estado cognoscitivo de las personas. Los expertos en el dominio de aplicación simplemente dibujan o especifican diferentes curvas de membresía de las cuales eligen una. En algunos casos, la elección puede estar determinada mediante métodos que tienen su base en la psicología. Frecuencias convertidas o probabilidades: algunas veces, la información tomada a partir de histogramas de frecuencia u otras curvas de probabilidad se emplea como base para construir la función de membresía. Existe una gran variedad de métodos de conversión posibles y cada uno posee sus propias fortalezas y debilidades, tanto matemáticas como metodológicas. Sin embargo, es necesario recordar que las funciones de membresía no son necesariamente probabilidades. Medición física: muchas aplicaciones de lógica difusa usan la medición física, pero casi ninguna mide el grado de membresía directamente. En su lugar, la función de membresía se obtiene mediante otro método y los grados de membresía individuales se calculan a partir de ella. Aprendizaje y adaptación: la aplicación de las técnicas de aprendizaje automatizado posibilitan construir de forma automática a partir de datos numéricos y simbólicos las funciones de membresía, generalmente las funciones de membresía construida por esta vía son representadas como modelos matemáticos. Con frecuencia, una vez construidas, se les ajusta para mejorar su efectividad por medio de técnicas que posibilitan su adaptación. 3.1 Método de interpolación Como premisa para la aplicación de este método es necesario conocer la membresía para un conjunto finito de puntos, información que podría ser suministrada por un experto. Luego por alguna forma de interpolación podría determinarse la membresía de un elemento no suministrado previamente por el experto [CHE95]. Dadas las características de las funciones de membresía aplicando métodos de interpolación basados en los mínimos cuadrados y los spline no siempre se logra construir buenas funciones de membresía, de ahí que se piense en una interpolación más avanzada que preserve la monotonía local y la convexidad. Cualquiera que sea el método de interpolación usado, es necesario que las funciones de membresía cumplan que: : 0,1 tal que: 7 1. x 0,1 x . 2. es diferenciable. 3. xi i para un conjunto de pares conocidos 4. Si el conjunto de pares conocidos x1 ,1 ,...,xn ,n . x1 , y1 ,...,xn , yn es un conjunto borroso convexo, entonces es borroso convexo también. Para obtener una función de membresía con las características deseadas [CHE95] propone realizar la interpolación utilizando polinomios de Bernstein. El polinomio de Bernstein cumple las siguientes propiedades: ~ 1. B2 g xi g xi i , B2 g ti g ti u i 2. B'2 g xi g' xi , B'2 g ti g' ti 3. Si g es monótona en xi ,ti , entonces B2 g es monótona en xi ,ti 4. Si g es convexa (cóncava) en xi ,ti , entonces B2 g es convexa (cóncava) en xi ,ti Estas propiedades forman las bases por lo cual el algoritmo que utiliza la interpolación por el polinomio de Bernstein preserva las propiedades de las funciones de membresía. Como premisa para el uso correcto de los polinomios de Bernstein es necesario conocer un conjunto de puntos iniciales y dar un punto adicional que satisfaga las propiedades de las funciones de membresía. 3.2 Centros de gravedad. Narazaki y Ralescu [NAR94] proponen un método basados en la determinación de los centros de gravedad de los términos lingüísticos de una variable lingüística. En estos centros de gravedad la función de membresía asociada alcanza el máximo valor de membresía. Para determinar el grado de membresía de un nuevo elemento se define la siguiente función: d (e, C ) m em(e, c) 1 c d (e, C j ) j 1 donde 1 1 es el número de categorías o términos lingüísticos diferentes, d e, Ci es la distancia entre el elemento e y el centro de gravedad Ci . C es el centro de gravedad del término lingüístico del que se calcula la certidumbre de pertenencia del elemento e. 3.3 Algoritmo de Hong En [HON98] se propone un método de aprendizaje para derivar automáticamente reglas borrosas y funciones de membresía desde un conjunto dado de casos de entrenamiento facilitando la adquisición de conocimiento. Los pasos del algoritmo hasta encontrar las funciones de membresía se describen a continuación: 8 Paso 1: clusterizar y fuzzificar los datos de salida; Paso 2: construcción inicial de las funciones de membresía para atributos de entrada; Paso 3: construcción de la tabla de decisión inicial; Paso 4: simplificar la tabla de decisión inicial, aplicando reglas de simplificación; Paso 5: reconstrucción de las funciones de membresía en el proceso de simplificación; Las principales desventajas de este algoritmo son: Requiere que los valores del rasgo objetivo sean ordenables, solo admite datos numéricos y permite construir funciones de membresía triangulares solamente. La construcción de estas funciones de membresía implica la obtención de unas funciones de membresía iniciales donde se van a obtener muchas regiones iniciales. Si la diferencia entre dos valores adyacentes del conjunto de entrenamiento es muy pequeña, entonces la cantidad de regiones, que a su vez es la cantidad de funciones de membresía iniciales, es muy grande, lo que hace a este proceso complejo. Véase figura VI. Valores borrosos 1 R1 R2 Rn-1 R3 Rn ... 0 a1 a2 a3 a4 an-1 an Datos de entrada Figura VI Funciones iniciales Como ventaja fundamental se señala que este algoritmo construye de forma automática las funciones de membresía a partir de los casos. 3.4 Algoritmos Genéticos. Los Algoritmos Genéticos (AG) surgen como herramientas para la solución de complejos problemas de búsqueda y optimización, producto del análisis de los sistemas adaptativos en la naturaleza, y como resultado de abstraer la esencia de su funcionamiento. Los AG han ganado popularidad en los últimos años debido a la posibilidad de aplicarlos en una gran gama de campos y a las pocas exigencias que imponen al problema a resolver. Los AG trabajan a partir de una población inicial de estructuras artificiales, llamados cromosomas, que se modifican repetidamente con la aplicación de los operadores genéticos: Selección o Darwiniano, Cruzamiento o Mendeliano y Mutación etc. [HOL73][HOL75]. En la construcción de funciones de membresía, utilizando AG, el problema de determinar los parámetros que describen cada función se transforma en un problema de optimización donde se pretende minimizar el error que se produce con la selección de diferentes valores de los parámetros. 9 Los cromosomas son arreglos lineales donde en cada escaque hay un parámetro de la función en cuestión, la función de evaluación es una función de error que depende de los parámetros que describen a la función de membresía y que están representados en el cromosoma; el criterio de parada por su parte es generalmente determinado número de generaciones [PIÑ00]. En la sección 4 de este documento se muestra un ejemplo de la aplicación de esta técnica en la construcción de funciones de membresía. Como principal desventaja del uso de los AG se señala que no siempre convergen a un óptimo global sino a un elemento cuazi óptimo. 3.5 Métodos numéricos y técnicas del análisis matemático En ocasiones las funciones de membresía que se quieren obtener son funciones con propiedades deseables para el análisis, por ejemplo continuas, derivables etc. En estos casos generalmente es factible aplicar métodos numéricos clásicos o simples análisis matemáticos que permitan determinar los parámetros de las funciones de membresía. La aplicación de estos métodos depende de las características de las funciones de membresía y de la naturaleza del problema en cuestión. 4- Aplicación potencial en Bioinformática En la ultima década del siglo XX y lo que va del presente siglo, el uso intensivo de herramientas estadístico-matemáticas, la aplicación de técnicas computacionales y las nuevas tecnologías de la información en la recopilación, exploración e interpretación de datos biológicos han posibilitado el desarrollo de la bioinformática. 4.1 Cálculo de la dosis letal de una molécula Uno de los problemas de la bioinformática es el cálculo de la dosis letal de moléculas, en este problema intervienen alrededor de 30 descriptores de moléculas que por su naturaleza obligan que la resolución del problema sea eminentemente borrosa. En la resolución de este problema se siguieron los siguientes pasos: 1. Fuzificar los descriptores del problema. 2. Construir la base de casos con términos linguísticos en los n-1 descriptores de dominio en la base de casos original. 3. Construir las funciones de comparación. El primer paso al “fuzificar” los n-1 descriptores de dominio real, cada descriptor se trata como una variable lingüística, donde los términos lingüísticos usados para todos los descriptores fueron: BAJO, MEDIO BAJO, NORMAL, MEDIO ALTO, ALTO Para cada descriptor se construyen las funciones de pertenencia o membresía: 10 bajo(x), medio bajo(x), normal(x), medio alto(x), alto(x) los cuales no son necesariamente iguales para todos los descriptores. Para construir las funciones de pertenencia se usa el procedimiento siguiente: 1. Discretizar los valores de cada descriptor en cinco valores discretos. 2. Hacer corresponder cada valor discreto con cada término lingüístico según el orden lógico establecido. 3. Usando los límites establecidos para el valor discreto calcular los parámetros que definen la función de membresía del término lingüístico correspondiente. Para construir las funciones de pertenencia se usan las expresiones siguientes: Término bajo y Término alto se representan por la Curva S cuya expresión se muestra en la sección 2.3, lo que en el primero la curva es monótona decreciente y en el segundo monótona creciente. Términos medio bajo, normal y medio alto se representan por la curva Campana Cam panax; a; b; c 1 xc 1 a 2b donde a es la amplitud, c es el centro y b es un factor que influye en la pendiente de la curva. En la obtención de las funciones de membresía propuestas para la resolución de este problema se utilizaron los métodos construcción a partir de expertos y usando los algoritmos genéticos [PIÑ00]. 4.2 Caracterización de riesgos de la cardiopatía isquémica Otro ejemplo concreto de la bioinformática que puede ser resuelto por medio de la aplicación de técnicas de la lógica borrosa es la caracterización de riesgos de la cardiopatía isquémica, problema de epidemiología donde de cada individuo se toman determinadas características muchas de las cuales son eminentemente borrosas, por ejemplo las referidas al nivel de estrés cuyos valores pueden ser (en alguna medida, poco, mucho, bastante). En este problema es necesario construir funciones de membresía para cada uno de los términos lingüísticos que identifican a las características; tomando como base los valores reales de los casos [CHA99]. Las funciones de membresía a utilizar en la descripción de los términos lingüísticos son funciones trapezoidales o campanas beta en dependencia de la naturaleza de las características y siguiendo criterios de expertos. La determinación de los parámetros de las funciones de membresía escogidas se logra utilizando algoritmos genéticos en el caso de las funciones trapezoidales [PIÑ00] y utilizando técnicas del análisis matemático y la matemática elemental en el caso de las funciones de membresía campanas Beta [ARC01]. 11 5- Conclusiones Analizamos en este trabajo diferentes enfoques representativos de funciones de membresía y modelos matemáticos lineales frecuentemente utilizados en el diseño de estas funciones para la representación de datos continuos. En problemas reales con frecuencia aparecen datos simbólicos por lo que se analizaron distintas formas de representar funciones de membresía para el tratamiento de datos simbólicos, basadas en la teoría de la posibilidad. Se discutieron diversos métodos para la construcción de funciones de membresía en la resolución de problemas concretos, métodos basados en técnicas del álgebra, la estadística, el análisis matemático y la Inteligencia Artificial. Se describió la resolución de dos problemas de la bioinformática utilizando las técnicas de la lógica borrosa y se mostró el uso potencial de las técnicas de la inteligencia artificial en la resolución de problemas de la Bioinformática. Referencias Bibliográficas ARC01 Arco García, Leticia. Caballero Mota, Yailé. “Algoritmos para la generación de reglas borrosas”. Trabajo de Diploma. Universidad Central “Marta Abreu” de Las Villas.Cuba. 2001 ARS01 Arslan, Ahmet, Kaya, Mehmet. Determination of fuzzy logic membership functions using genetic algorithms. Fuzzy Sets and Systems 118. pp. 297306. 2001. BAL98 Baldwin, J. F. Lawry, J. Martin, T. P. The application of generalised fuzzy rules to machine learning and automated knowledge discovery. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems. Vol. 6, No. 5. pp. 459-487. 1998. BER99 Berthold, M. Huber, K. Constructing Fuzzy Graphs from Examples. Int. J. Intelligent Data Analysis. 1999. http://www.elsevier.com/locate/ida BIL97 Bilgic, Taner. Türksen, Burhan. Measurement of Membership Functions: Theoretical an Empirical Work. Handbook of Fuzzy Sets and Systems. Vol 1. Foundations. 1997. BOY99 Boyen, X. Wehenkel, L. Automatic Induction of Fuzzy Decisión Trees and its Application to Power System Security Assessment. Fuzzy Sets and Systems 102. pp 3-19. 1999. COX98 Cox, Earl. Taber, Rodman. O’Hagan, Michael. O’Hagen, Michael. The Fuzzy Systems Handbook. AP Professional, Paperback, 2nd Bk&Cd edition. 1998. CHA00 Chang, Ping-Teng. Huang Liang-Chih. Lin, Horng-Jiun. The fuzzy Delphi method via fuzzy statistics and membership function fitting and an application to the human resources. Fuzzy Sets and systems 112. pp. 511520. 2000. 12 CHA99 Chávez, María del Carmen. Sistemas de Inferencia probabilística, Tesis de Maestría. Universidad Central “Marta Abreu” de Las Villas. Cuba. 1999. CHE00a Chen, Y. H. Wang, Wen-June, Chiu, Chih-Hui. New estimation method for the membership values in fuzzy sets. Fuzzy Sets and Systems 112. pp. 521525. 2000. CHE00b Chen, Oihao. Kawase, Shin. On fuzzy-valued fuzzy reasoning. Fuzzy Sets and Systems 113. pp 237-251. 2000. CHE00c Chen, Shyi-Ming. Hsiao, Wen-Hoar. Bidirectional approximate reasoning for rule-based systems using interval-valued fuzzy sets. Fuzzy Sets and Systems 113. pp 185 – 203. 2000. CHE95 Chen, Joseph E. Otto, Kevin N. Constructing membership functions using interpolation and measurement theory. Fuzzy Sets and systems 73. pp. 313-327. 1995. CHU79 Chu, A. T. Kalaba, R. E. Spingarn, K. Comparison of Two Methods for Determining the Weights of Belonging to Fuzzy Sets. Journal of Optimization Theory and Applications. Vol. 27, No. 4. pp. 531-538. 1979. DUB88 Dubois, Didier. Prade, Henri. Possibilitty Theory. An Approach to Computerized Processing of Uncertainty. The Language of Science Plenum Publishing Corporation. pp. 1-29. 1988. FAB00 Fabri, José Augusto. Vilardi Rissoli, Vandor Roberto. Desenvolvimiento de um sistema especialista fuzzy aplicado a domínios genéricos do conhecimento. 2000. http://www.dc.ufscar.br/~fabri GAI78 Gaines, B. R. Fuzzy and Probability Uncertainty Logics. Information and Control 38. pp. 154-169. 1978. GEN97 Genther, Harald. Glesner, Manfred. Advanced data preprocessing using fuzzy clustering techniques. Fuzzy Sets and Systems 85. pp 155 – 164. 1997. GIL82 Giles, R. Sementics for Fuzzy Reasoning. Man-Machine Studies 17. pp. 401415. 1982. GIL88 Giles, R. The Concept of Grade of Membership. Fuzzy Sets and Systems 25. 1988. HON98 Hong, Tzung-Pei. Lee, Chai-Ying. Learning Fuzzy Knowledge from Training Examples. CIKM. pp 161-166. 1998. http://dblp.uni-trier.de/db/indices/atree/h/hong@Tzung=Pei.html HUA01 Huang, Yo-Ping, Chen, Hong-Jin, Chu, Hung-Chi. Identifying a fuzzy model by using the bipartite membership functions. Fuzzy Sets and systems 118. pp. 199-214. 2001. KAN78 Kandel, A. Fuzzy Sets, fuzzy Algebra and Fuzzy Statistics. Proc. IEEE 66. pp. 1619-1639. 1978. KLA95 Klawonn, F. Kruse, R. Derivation of Fuzzy Classification Rules from 13 Multidimensional Data. In: G.E. Lasker, X. Liu (eds.): Advances in Intelligent Data Analysis. The International Institute for Advanced Studies in Systems Research and Cybernetics, Windsor, Ontario. pp 90-94. 1995. LAM92 Lambert, Joseph M. The fuzzy set membership problem using the hierarchy decision metod. Fuzzy Sets and Systems 48. pp. 323-330. 1992. LIU97 Liu, Weijie. Sugeno, Michio. Inducing a membership function of a category in a fuzzy-set-based attribute space. International Journal of Uncertainty, Fuzziness and Kwnoledge-Based Systems. Vol. 5, No. 2. pp. 147-162. 1997. NAR94 Narazaki, Hiroshi. Ralescu, Anca. Interative induction of a category membership function. International Journal of Uncertainty, Fuzziness and Kwnoledge-Based Systems. Vol. 2, No. 1. pp. 91-100. 1994. NAU00 Nauck, Detlef. Data Analysis with Neuro – Fuzzy Methods. Habilitationsschrift zur Erlangung des akademischen Grades doctor rerum naturalium habilitatus (Dr.rer.nat.habil.), Magdeburg, February, 2000. http://fuzzy.cs.uni-magdeburg.de/papers.html OTT93a Otto, Kevin N. Lewis, Andrew D. Membership Induced on Manifolds by Vector Fields and Flows. 1993 OTT93b Otto, Kevin N. Lewis, Andrew D. Determining Optimal Points of Membership with Dependent Variables. 1993. PIÑ00 Piñero Pérez, Pedro. ”GACom: Biblioteca de componentes para el trabajo con Algoritmos Genéticos”. Trabajo de Diploma. Universidad Central “Marta Abreu” de Las Villas. Cuba 2000. RUS69 Ruspini, E. A New Approach to Clustering, Information and Control 8. pp. 338353. 1969. XIZ98 Xizhao, Wang. Hong, Jiarong. On the handling of fuzziness for continuous valued attributes in decision tree generation. Fuzzy Sets and Systems 99. pp 283-290. 1998. YUA01 Yuan, Wuehai. Shen, Zhengwei. Notes on “Fuzzy plane geometry I, II”. Fuzzy Sets and Systems 121. pp. 545-547. 2001. ZAD78 Zadeh, L. A. Fuzzy Sets as a Basis for a Theory of Possibility. Fuzzy Sets and systems 1. pp 3-28. 1978. 14