Bases de Datos Relacionales Difusas

Anuncio
Bases de Datos Relacionales Difusas.
Ing. Marco Antonio Castro Liera
Instituto Tecnológico de La Paz
mcastro@marinos.itlp.edu.mx
“Dependiendo de la tarea que se le asigne, una misma
palabra puede designar un objeto o una persona, una
pasión, un deseo o un misterio; pero también puede
torcer su rumbo, oscurecerse, volverse hermética y
aludir a algo muy distinto de su significación original”
-German Dehesa
Introducción:
Una de las características del lenguaje natural, que hace difícil su utilización en
sistemas computacionales es su imprecisión. Por ejemplo conceptos como alto o
caro, tienen significados diferentes de acuerdo al contexto en el que se estén
utilizando, e incluso dentro del mismo contexto, pueden significar cosas diferentes
para diferentes individuos.
La teoría de los conjuntos difusos desarrollada por Zadeh [1], provee una
poderosa herramienta para la representación y manejo de la imprecisión por lo
que actualmente esta siendo utilizada en varios campos para el diseño de
sistemas basados en reglas difusas.
La teoría de conjuntos difusos [2], extiende la teoría clásica de conjuntos al
permitir que el grado de pertenencia de un objeto a un conjunto sea representada
como un número real entre 0 y 1 en vez del concepto clásico en el que solo se
tiene la posibilidad de pertenecer a un conjunto o no pertenecer al mismo; en
otras palabras, el grado de pertenencia a un conjunto en la teoría clásica tiene
solo dos valores posibles: 0 y 1.
En el sentido mas amplio, un sistema basado en reglas difusas es un sistema
basado en reglas donde la lógica difusa es utilizada como una herramienta para
representar diferentes formas de conocimiento acerca del problema a resolver, así
como para modelar las interacciones y relaciones que existen entre sus
variables[3]. Debido a estas propiedades, los sistemas basados en reglas difusas
han sido aplicados de forma exitosa en varios dominios en los que la información
vaga o imprecisa emerge en diferentes formas.
Actualmente, el modelo relacional no permiten el procesamiento de consultas del
tipo “Encontrar a todos los gerentes cuyo sueldo no sea muy alto” dado que ni el
cálculo ni el álgebra relacional, que establecen el resultado de cualquier consulta
como una nueva relación, tienen la capacidad de permitir consultas de una
manera difusa.
En los últimos años, algunos investigadores han lidiado con el problema de relajar
el modelo relacional para permitirle admitir algunas imprecisiones; esto conduce a
sistemas de bases de datos que encajan en el campo de la Inteligencia Artificial,
ya que permiten el manejo de información con una terminología que es muy
similar a la del lenguaje natural. [4] Una solución que aparece recurrentemente en
los trabajos de investigación actuales en esta área es la fusión de los sistemas
manejadores de bases de datos relacionales con la lógica difusa, lo que da lugar a
lo que se conoce como sistemas manejadores de bases de datos difusas o
FRDBMS (por sus siglas en inglés, Fuzzy Relational Database Management
System).
El problema de la implementación de los sistemas manejadores de bases de
datos difusas ha sido tratado en dos vertientes principales:
1. Iniciar con un sistema manejador de bases de datos relacionales con
información precisa y desarrollar una sintaxis que permita formular
consultas imprecisas, lo cual
da origen a extensiones SQL con
capacidades de manejar la imprecisión.
2. Construir un FRDBMS prototipo que implemente un modelo concreto de
base de datos relacional difusa en el que la información imprecisa pueda
ser almacenada. Dentro de esta vertiente existen dos grandes ramas: Los
modelos a través de unificación por relaciones de similaridad y los modelos
relacionales basados en distribuciones de probabilidades.
En el presente documento, se trata la representación de datos difusos en bases
de datos relacionales, la forma en que pueden tratarse las dependencias
funcionales difusas y las extensiones para lenguajes de consultas difusas.
Particularmente me enfocaré a los trabajos desarrollados en la Universidad de
Granada, España por un grupo de investigadores que se encuentran trabajando
en esta rama actualmente.
Tipos de datos:
Para poder almacenar información imprecisa en bases de datos relacionales, es
necesario agregar a los tipos de datos manejados por las mismas, nuevos tipos
que permitan el manejo de datos difusos.
Algunos tipos de datos propuestos por Medina et al. [5] Para la construcción de un
modelo generalizado difuso de manejador de bases de datos relacionales son:
1. Escalar simple
Un valor lingüístico para un atributo donde el campo contiene un grado de
pertenencia 1 al conjunto asociado con ese valor. Por ejemplo: el campo
comportamiento podría ser instanciado con el valor bueno, donde esto se
representa por la distribución de probabilidades {1/bueno}.
2. Numérico simple
Por ejemplo edad = 28 representa la distribución de probabilidades {1/28}.
3. Conjunto de escalares posibles mutuamente excluyentes
Por ejemplo: comportamiento = {bueno, malo} representaría la distribución de
probabilidades {1/bueno, 1/malo}, lo cual implica que el valor del atributo
instanciado con este tipo, puede pertenecer a uno y solo uno de los conjuntos
bueno o malo.
4. Conjunto de Posibles Asignaciones Numéricas
Por ejemplo: edad = {20, 21} representaría la distribución de probabilidades
{1/20, 1/21}.
5. Distribución de Probabilidad en un Dominio Escalar
Por ejemplo comportamiento = {0.4/bueno, 0.7/regular, 0.9/malo} donde se
representa como un número real entre 0 y 1 el grado de pertenencia a cada
conjunto de la tupla instanciada con este valor. O dicho de otra manera, el
grado en el que comportamiento contiene a cada uno de los atributos
representados en dicho campo.
6. Distribución de Probabilidad en un Dominio Numérico
Por ejemplo edad = {0.3/23, 1/24, 0.8/25} lo que nos da la posibilidad de
manejar indistintamente números difusos o valores lingüísticos.
7. Un número real entre 0 y 1 (referido al grado de pertenencia)
Por ejemplo: Calidad_Buena = 0.9
8. El valor Desconocido (unknown)
unknown = {1/u : u ∈ U}. Que sería cuando no puede determinarse por un solo
valor para el atributo, por lo que este podría ser cualquiera de los posibles
valores del universo de discusión.
9. El valor no Definido (undefined)
undefined = {0/u : u ∈ U}. Que sería cuando el valor no puede asignarse a
ninguno de los valores del universo de discusión.
10. El valor Nulo (Null)
Dado por Null = {1/unknown, 1/undefined}
Estructura de Datos
En GEFRED, (el modelo de base de datos relacional difusa de medina et al) la
información esta organizada para su manejo de la siguiente forma:
•
El dominio DG subyacente en atributo de una relación contiene algunos de
los datos mencionados en el punto anterior.
•
Los datos están relacionados mediante una relación RFG, dada por:
RFG ∈ ( DG1 , C1 ),×,...,×( DGN , Cn )
Donde cada DGj es un dominio del tipo previamente descrito, Cj es un
“atributo de compatibilidad” que toma sus valores en [0,1]. Cada atributo es
asociado a un “atributo de compatibilidad”. En relaciones base, el “atributo
de compatibilidad” no aparece. Estas relaciones representan la información
inicial así como a la que resulta de las operaciones de álgebra difusa sobre
la misma. El manejo de estas relaciones a través del álgebra relacional
difusa podría modificar, para cada tupla, los valores de los “atributos de
compatibilidad”
Manipulación de los Datos
El álgebra difusa utilizado en estos modelos es una extensión del álgebra clásica;
en esta extensión se utilizan operadores específicos de comparación para
manejar la información difusa. Las consultas difusas son objeto de un manejo
especial, basado en los siguientes puntos:
•
Se define como “Selección atómica” a una consulta, sobre un tipo de
relación RFG, en la que se busca satisfacer una sola condición simple.
•
Cuando un atributo, un operador y una constante difusa están involucrados
en una “Selección Atómica”, dicha condición será satisfecha en un grado
para cada valor de atributo, este grado de satisfacción estará en el rango
[0,1].
•
En una “Selección Atómica” se puede establecer un grado de satisfacción
mínimo conocido como umbral para la condición. Esto eliminará del
resultado aquellas tuplas que no satisfacen al menos en dicho grado
mínimo la condición difusa.
•
El resultado de una “Selección Atómica” con umbral es una relación del tipo
RFG. En dicha relación el grado de satisfacción de la condición aparece en
el “Atributo de Compatibilidad”.
•
Las condiciones compuestas son aquellas obtenidas mediante la
combinación de condiciones simples a través de operadores lógicos
(conjunción, disyunción y negación). Las condiciones compuestas se
resuelven de la siguiente forma:
o De cada condición Simple se obtiene la relación difusa resultante
aplicando la “selección atómica” con el umbral particular de dicha
condición.
o De las condiciones simples conectadas con operadores conjuntivos,
se hace una intersección de las relaciones obtenidas de cada
condición. Posteriormente, los valores de los “Atributos de
compatibilidad” asociados a cada atributo involucrado en la
condición simple son recalculados. Dicho cálculo consiste en que el
“Atributo de Compatibilidad” de las tuplas de la nueva relación será
igual al mínimo “Atributo de Compatibilidad” presente en las
relaciones simples que la originaron.
o Para las condiciones simples conectadas por un operador disjuntivo,
se hace la unión de las relaciones obtenidas y se recalculan los
valores de los “Atributos de Compatibilidad” tomando el máximo de
las relaciones simples que originaron la consulta compuesta.
o Una condición simple negada, se calcula modificando en “Atributo de
Compatibilidad” con su complemento a 1 para cada valor presente
en la tupla (Esto es 1 menos el valor del mismo)
Representación de la Información Difusa
Los elementos relacionados con la manipulación de información difusa pueden
tener representaciones diferentes. Por ejemplo, una distribución normalizada de
probabilidades puede ser representada por diferentes tipos de funciones
(trapezoidal, triangular, intervalar, etc.). Lo mas usual, es que se usen funciones
de tipo trapezoidal. Los mismo puede decirse de la forma en la que se modelan
los operadores relacionales difusos así como los demás elementos difusos que
aparezcan en el sistema.
El criterio empleado para seleccionar la forma de representación de los múltiples
elementos difusos del sistema manejador de base de datos, puede afectar de
manera determinante la funcionalidad y desempeño de la base de datos, por lo
que debería ser uno de los puntos centrales en los que el experto ajuste la
arquitectura del FRDBMS al problema específico a tratar mediante el mismo.
Puede decirse entonces que este criterio de selección y ajuste constituye un paso
entre la formulación de una base de datos relacional difusa y la implementación
de un sistema basado en la misma.
La información que se puede manejar en una base de datos difusa puede dividirse
en dos tipos principales:
•
Datos Precisos:
Manejados usualmente mediante la representación provista por la base de
datos relacional huésped.
•
Datos Imprecisos:
Los modelos usualmente consideran dos tipos de representación para los
datos imprecisos además de la información desconocida o indeterminada que
se maneja mediante los tipos unknown, undefined y null:
o Datos imprecisos sobre dominios subyacentes ordenados
Este grupo de datos contiene distribuciones de probabilidad definidas en
dominios continuos o discretos, pero ordenados.
En su trabajo sobre representación de conocimiento difuso en bases de
datos relacionales [4] Medina et al. utilizan la siguiente representación para
este tipo de datos:
o Datos con analogías sobre dominios discretos
Este grupo de datos se construye sobre dominios discretos en los que
existen definidas relaciones de proximidad entre sus valores.
En este caso se deberá almacenar la representación de los datos además
de la representación de las relaciones de proximidad definidas para los
valores en el dominio.
Los tipos de datos incluidos en este conjuntos son los escalares simples y
las distribuciones de probabilidad sobre dominios discretos.
Los escalares simples se representan mediante el esquema del RDBMS
huésped y solo se tienen que agregar para ellos la información necesaria
para el manejo de las relaciones de proximidad definidas en su dominio
subyacente.
Por otra parte, las distribuciones de probabilidad sobre dominios discretos
se asocian con una representación en la que los valores que constituyen el
dominio son descritos de manera conjunta con su valores respectivos de
probabilidad. ((p1,d1),…, (pndn)).
o Tipo de dato Indefinido (undefined)
Cuando un atributo toma el valor undefined, esto refleja el hecho de que
ninguno de su dominio son permitidos. Esto significa que ninguno de los
valores es posible. Por lo tanto, la distribución de probabilidades asociada
es {0/u : u ∈ U}, donde U es el dominio subyacente.
o Tipo de dato desconocido (unknown)
Los datos de este tipo expresan nuestra ignorancia sobre el valor que el
atributo toma, sin embargo expresa también que conocemos de hecho que
puede tomar uno de los valores del dominio. Esto significa que es posible
que atributo tome cualquiera de estos valores. Por lo tanto, la distribución
de probabilidades asociada a este tipo de dato es {1/u : u ∈U} donde U es
el conjunto de valores que forman el dominio subyacente para el dato.
o Tipo de dato nulo (null)
Cuando un atributo toma el valor nulo, esto significa que no tenemos
información sobre el ya sea por que no conocemos su valor o porque es
imposible asignarle un valor del dominio. La distribución de probabilidades
en este caso es {1/unknown, 1/undefined}
Relaciones de proximidad:
Las relaciones de proximidad se utilizan para modelar la imprecisión derivada de
la probabilidad de igualdad entre dos valores en el dominio de discurso.
Lo mas usual es que las relaciones de proximidad se utilicen solamente en
universos de discurso finitos. De tal forma que dichas relaciones puedan
representarse de manera matricial.
Operadores relacionales difusos:
Los diferentes operadores de comparación que se utilizan para representar
relaciones en la base de datos son los operadores relacionales. Para que estos
funcionen sobre información imprecisa es necesario extender estos operadores.
La representación adoptada por Medina et al en su modelo de FRDBMS se basa
en el trabajo previo de Zadeh [6] y es la siguiente:
•
Igual a:
Este operador modela el concepto de igualdad para datos imprecisos. Desde
el punto de vista formal a través de la función de membresía dada por:
µigual (d~, d~ ' ' ) =
sup
min( p(d , d ´),π d~ (d ), π d~ ´(d´))
(d , d ' ) ∈ D × D
Donde p(d , d´) es una relación de proximidad y π d~ (d ), π d~ ´(d ´) son las
distribuciones de probabilidad definidas sobre el dominio de discurso D. A
continuación se muestra la representación gráfica de esta relación:
Cabe señalar que para datos definidos en base a dominios ordenados, se
sustituye la relación de proximidad p (d , d ´) por δ (d , d ´) , donde δ es una delta
de Dirac. Mientras que, para datos con analogías en un dominio discreto,
p (d , d ´) es la representación matricial de la relación de proximidad definida
para el dominio de discurso D.
•
Aproximadamente igual:
Este operador define el grado en el que dos valores numéricos (no difusos)
son aproximadamente iguales de acuerdo a si la diferencia de sus valores se
encuentra dentro de un límite preestablecido. Y se calcula mediante la
siguiente expresión:
µ aproxigual
0


=
1 − x − y
 m arg en
si x − y ≤ m arg en
si x − y ≤ m arg en
A continuación se muestra la representación grafica para este operador:
•
Mayor o igual:
Este operador se define para dominios ordenados, su función de membresía
esta dado por la relación difusa:
µ≥ ( A, B) =
sup
min(≥ ( x, y ), π A ( x), π B ( y ))
( x, y ) ∈ X × Y
Donde A y B son datos imprecisos sobre dominios ordenados o datos
numéricos no difusos (crisp), π A ( x), π B ( y ) son sus representaciones de
probabilidades respectivas y ≥ es el operador clásico de mayor o igual, dado
por:
0
≥ ( x, y ) = 
1
si
si x < y
x > y∪x = y
Este operador puede resolver comparaciones como:
•
•
•
•
El grado en el que un numero no difuso es mayor o igual que una
distribución de probabilidades.
El grado en el que una distribución de probabilidades es mayor o igual
que un número no difuso
El grado en el que una distribución de probabilidades es mayor o igual
que otra distribución de probabilidades
Menor o igual:
Este operador se define para dominios ordenados, su función de membresía
esta dado por la relación difusa:
µ≤ ( A, B) =
sup
min(≤ ( x, y ), π A ( x), π B ( y ))
( x, y ) ∈ X × Y
Donde A y B son datos imprecisos sobre dominios ordenados o datos
numéricos no difusos (crisp), π A ( x), π B ( y ) son sus representaciones de
probabilidades respectivas y ≤ es el operador clásico de menor o igual, dado
por:
0
≤ ( x, y ) = 
1
si
si x > y
x < y∪x = y
Este operador puede resolver los mismos tipos de comparaciones que mayor
o igual.
•
Mayor que:
Este operador puede definirse como el complemento del operador menor o
igual donde:
µ > ( A, B) = 1 − µ≤ ( A, B)
• Menor que:
Este operador puede definirse como el complemento del operador mayor o
igual donde:
µ< ( A, B) = 1 − µ≥ ( A, B)
En la figura de la siguiente página tomada del trabajo sobre representación de
conocimiento difuso en bases de datos relacionales [4] de Medina et al. se
muestra el comportamiento de estos operadores, donde:
a) muestra tres distribuciones de probabilidad A, B y C sobre las que
operaremos
b) Muestra la función de membresía del operador ≥ aplicado a B
c) Muestra los grados en los que A y C son mayores o iguales que B
d) Muestra la función de membresía de ≤ aplicado a B
e) Los grados en los que A y C son menores o iguales que B
f) La función de membresía del operador > aplicado sobre B
g) El grado en el que A y C son mayores que B
h) La función de membresía del operador < aplicado sobre B
i) El grado en que A y C son menores que B
Comportamiento de operadores relacionales difusos
Umbrales de consulta (cualificadores):
Al hacer consultas sobre una base de datos imprecisos estamos imponiendo
algunas condiciones que las tuplas resultantes deben de satisfacer, pero dada la
naturaleza imprecisa de los datos y los operadores, también existe un grado de
satisfacción para cualquier condición involucrada en una búsqueda. Este grado de
satisfacción se encuentra en el intervalo [0,1]. Utilizando un umbral de consulta
mínimo, nosotros podemos controlar la precisión con la que queremos que las
condiciones de la consulta sean satisfechas.
En general a la acción de establecer un umbral para una condición atómica de
una consulta se le conoce como cualificación de la condición.
El umbral para la consulta entonces es llamado un cualificador. Este cualificador
será un valor entre 0 y 1 que puede ser representado por medio de un valor
lingüístico, por ejemplo si decimos que el grado en el que queremos que una
consulta se cumpla sea “alto” podríamos hacer que esto significara que vamos a
aceptar tuplas con un grado de satisfacción de las condiciones de 0.8 o mayor.
Esto quiere decir que podemos asociar etiquetas lingüísticas con los
cualificadores. Los valores de umbral asociados con cada etiqueta lingüística
deberán ser almacenados en el sistema y tendrán un significado subjetivo al igual
que estas.
Cuantificadores difusos de una consulta:
Normalmente se definen dos cuantificadores en el modelo relacional clásico. El
cuantificador de existencia ∃ que se lee como “existe al menos un” y el
cuantificador universal ∀ que se lee como “para todo”. Con el primero obtenemos
una respuesta verdadera (TRUE) cuando al menos una tupla satisface las
condiciones de la consulta, mientras que con el segundo la respuesta verdadera
se obtiene cuando todas las tuplas de la base de datos cumplen con esa
condición. Sin embrago, en el caso difusa existe un rango mas amplio de
cuantificadores entre los previamente mencionados que pueden ser descritos de
manera lingüística como “casi ninguno”, “algunos”, “muchos” y “casi todos”. Estos
valores lingüísticos son la representación en términos de distribuciones de
probabilidad del un dominio Dq definido como:
ns 

DQ = d : d = 
nc 

Donde ns representa el número de tuplas que satisfacen la condición mientras
que nc representa el número de tuplas consultadas.
Implementación de la Información Imprecisa
Esta es llevada a cabo en tres niveles:
1) Al nivel de la Base de Datos.- La Base de Datos esta compuesta por todos los
elementos permanentes que describen alguna parte del Universo. Es evidente
que al hablar de la representación de datos imprecisos, debemos determinar la
forma de almacenarlos. De tal suerte que la representación de estos datos
debe extenderse para poder lidiar con esta clase de información.
2) El nivel de la meta-base de conocimiento.- Las bases de datos relacionales
clásicas deben tener un componente con toda la información que el sistema
debe saber acerca de los datos que se tienen almacenados esto es “datos
acerca de los datos” lo cual se conoce como meta-datos. Usualmente esta
información se encuentra representada a través de tablas de relaciones
organizadas en el llamado Diccionario de Datos. El FRDMS deberá contener
información acerca de cuales son los elementos en la base de datos con
información imprecisas así como sobre su naturaleza y representación. En lo
sucesivo llamaremos a esta parte del sistema Meta-Base de Conocimiento. La
cual puede verse como una extensión de la Meta-base de conocimiento que
captura toda la información necesaria sobre información imprecisa
almacenada en la base de datos.
3) Al nivel del FRDBMS.- El sistema posee conocimiento sobre el tratamiento de
los operadores difusos disponibles.
Implementación de información imprecisa en la Base de Datos:
Los atributos que pueden ser tratados de manera imprecisa pueden ser
clasificados en tres tipos de acuerdo a su dominio subyacente:
1. Atributos con datos no difusos, que tengan etiquetas lingüísticas definidas
en ellos. La representación de estos atributos es similar a la de los datos
precisos. Adicionalmente se deberá almacenar la información sobre los
valores correspondientes a las etiquetas y el tipo de los atributos en la
meta-base de conocimiento.
2. Atributos con datos imprecisos sobre dominios ordenados. A continuación
se muestra una tabla con los tipos permitidos, asi como la información
adicional que se requiere almacenar para cada uno de forma adicional en
la meta-base de conocimiento.
Tipo de Dato
Código
Campo1
UNKNOWN
UNDEFINED
NULL
CRISP
LABEL
INTERVAL[A,B]
APROX(d)
FUZZY
0
1
2
3
4
5
6
7
NULL
NULL
NULL
d
FUZZY_ID
A
d-Margen
α
Campo2 Campo3 Campo4
NULL
NULL
NULL
NULL
NULL
0
Margen
β −α
NULL
NULL
NULL
NULL
NULL
0
Margenγ −δ
NULL
NULL
NULL
NULL
NULL
B
d+Margen
γ
3. Atributos con dominios discretos con analogías. Estos atributos se utilizan
para representar escalares o distribuciones de probabilidades sobre
dominios escalares. Para almacenar estos atributos, el tipo y
representación asociados con cada dato así como la definición de las
relaciones de proximidad asociadas con el dominio subyacente.
Tipo de Dato Código
UNKNOWN
UNDEFINED
NULL
SIMPLE
POS.DISTR
0
1
2
3
4
P1
NULL
NULL
NULL
1
p1
Campo1
NULL
NULL
NULL
d
d1
P2
NULL
NULL
NULL
NULL
p2
Campo2
NULL
NULL
NULL
NULL
d2
P3
NULL
NULL
NULL
NULL
p3
Campo3 ...
NULL
NULL
NULL
NULL
d3
La Meta-base de Conocimiento:
Como hemos visto en las secciones previas, existe información acerca de los
atributos descritas que debe ser almacenada en una forma accesible en el
sistema. La meta-base de conocimiento organiza toda la información concerniente
a la naturaleza imprecisa de estos atributos. Consideraremos a la meta-base de
conocimiento como una extensión del catálogo del sistema de tal forma que se
pueda organizar esta información utilizando tablas y relaciones. Los elementos
almacenados en la meta-base de conocimiento son los siguientes:
•
•
•
•
Una relación de los atributos de la base de datos con tratamiento
impreciso.
El tipo de estos atributos (1, 2 o 3)
Los elementos definidos en el ámbito de la base de datos, por ejemplo los
cuantificadores difusos
Los objetos difusos definidos para cada atributo:
o Bordes Lingüísticos
o Valores Aproximados
o Relaciones de Proximidad
o Calificadores de Consultas. (umbrales de aceptación de consultas).
En [4] se brinda un ejemplo de las tablas necesarias para implementar la
meta-base de conocimientos (pp. 18 -22).
Dependencias Funcionales Difusas
Adicionalmente a lo tratado en los puntos anteriores, existe la necesidad de
extender el concepto de dependencia funcional utilizado en el modelo clásico de
Codd [7]. Para tratar las dependencias funcionales entre atributos de esquemas
relacionales que contengan información imprecisa, un extenso tratamiento de este
tema puede encontrarse en el trabajo de Cubero y Vila [8].
...
...
...
...
...
Conclusiones
La lógica difusa ha sido aplicada en la actualidad con gran éxito en muchos
campos, el mas conocido de estos es el de los sistemas de control e
identificación, sin embargo podemos darnos cuenta que otras áreas
aparentemente tan alejadas como las bases de dato, también pueden beneficiarse
de la capacidad que brinda esta extensión de la lógica formal para tratar con la
imprecisión, en algunos casos proveniente de la inexactitud de las mediciones o
en otros de la vaguedad introducida por el uso del lenguaje natural en los
sistemas.
Aunque en el presente trabajo me he enfocado con especial atención a el trabajo
que actualmente esta realizando un grupo de investigadores en la Universidad de
Granada, existen muchos otros grupos dedicados en la actualidad a investigar las
formas en las que pueden hacerse extensiones mediante la lógica difusa a las
bases de datos relacionales para permitirles lidiar con la imprecisión de los datos.
El modelo propuesto por Medina, Vila, Cubero y Pons, nos ha servido para
analizar el tipo de componentes que es necesario agregar a un RDBMS para
incorporar estas funciones.
Referencias:
1.
2.
3.
4.
5.
6.
7.
8.
Zadeh, L.A., Fuzzy Sets as a Basis for a Theory of
Posibility. Information Sciences, 1978. 3: p. 177-200.
V.Kartalopoulos, S., Understanding Neural Networks and
Fuzzy Logic. 1996: IEEE Press. 205.
Cordon, O., Genetic fuzzy systems : evolutionary tuning
and learning of fuzzy knowledge bases. 2001, Singapore:
World Scientific. xxv, 462.
Medina, J.M., et al., Fuzzy Knowledge Representation in
Relational Databases. 1994, Universidad de Granada:
Granada, España. p. 27.
Medina, J.M., M.A. Vila, and O. Pons, GEFRED. A
Generalized Model of Fuzzy Relational Data Bases Ver
1.1. 1994, Universidad de Granada: Granada, España. p.
23.
Zadeh, L.A., Similarity Relations and Fuzzy Ordering.
Information Sciences, 1971. 3: p. 177-200.
Codd, E.F., A Relational Model of Data for Large Shared
Data Banks. Comunications of the ACM, 1970. 6(13): p.
337-387.
Cubero, J.C. and M.A. Vila, A New Definition of Fuzzy
Functional Dependency in Fuzzy Relational Databases.
1992, Universidad de Granada, Campus de Fuentenueva:
Granada, España. p. 9.
Descargar