formato para la evaluacion del informe final

Anuncio
INFORME FINAL DE PROYECTO DE INVESTIGACIÓN
Titulo del Proyecto: Modelo de Evolución de Ontologías para la Gestión del
Conocimiento Empresarial
Investigador Principal: Alexandra Pomares Quimbaya
Otros investigadores en el Proyecto: Miguel Eduardo Torres Moreno
Grupo de investigación ( si aplica): SIDRE
Facultad: Ingeniería
Departamento / Instituto: Ingeniería de Sistemas
1. Indique cuáles fueron los objetivos de la investigación y qué tanto se
lograron.
El objetivo principal de la investigación fue “Diseñar un modelo de evolución de
ontologías como parte de la plataforma de gestión de conocimiento
empresarial”, este proyecto se cumplió a cabalidad. Para su cumplimiento se
desarrollaron tres objetivos específicos que serán descritos a continuación.
a. Caracterizar las problemáticas en torno a la integración y evolución
de ontologías en ambientes empresariales
El resultado de esta caracterización puede observarse en el estado
del arte consignado en el anexo 1, en esta caracterización se
identificaron los proyectos de gestión de conocimiento que han
aplicado ontologías como uno de sus componentes y se hizo una
extensa evaluación de los procesos alrededor de las ontologías, se
hizo especial énfasis en el proceso de integración entre ontologías
por ser el de mayor relevancia para garantizar evolución. La tabla 1
ilustra la relación entre los procesos de gestión de conocimiento y los
procesos de ontologías resultado del análisis realizado durante esta
etapa del proyecto.
Proceso
de
administración
del
conocimiento
Generación
y
adquisición
Participación
Ontológica
Procesos
ontológicos Tipo
ontología
relacionados
Elementos
del Creación
Ontológica
conocimiento
automática
y
Categorización
y semiautomática.
enriquecimiento
Búsqueda sobre la ontología
semántico.
Extracción
y
Ontología
Dominio.
Ontología
Aplicación.
de
de
de
Representación
Almacenamiento
Transferir
Integrar
adquisición
del
conocimiento
Creación del mapa Integración de la ontología.
de conocimiento.
Recuperación
de
elementos
del
conocimiento
Persistencia
de Persistencia de la ontología.
Metadata
Expansión
y
personalización del
Query de usuario
Integrar
el
conocimiento.
Compartir
el
conocimiento.
Monitoreo
del
conocimiento.
Mantenimiento del
conocimiento.
Búsqueda
ontología.
sobre
Ontología
Dominio.
Ontología
Dominio.
Ontología
Aplicación.
la Ontología
Aplicación.
Integración de la ontología. Ontología
Creación del mapa de Dominio.
ontología.
Ontología
Aplicación.
Evaluar
Logs de uso de la ontología. Ontología
Aplicación
Evolución de la ontología.
Ontología
Mantener
Dominio.
Ontología
Aplicación.
Table 1. Relación Procesos Gestión de Conocimiento - Procesos Ontologías
Teniendo como punto de partida esta caracterización se inició la
segunda fase que se describirá en el segundo objetivo.
b. Definición del modelo de evolución de ontologías a nivel empresarial
Este modelo fue definido en términos de requerimientos como se
puede observar en el anexo 2 y a nivel de arquitectura como se
puede observar en el anexo 3. Fue definido y diseñado partiendo del
hallazgo durante el estado del arte de que la principal problemática
en los sistemas de gestión de conocimiento es la ausencia de un
lenguaje común que permita describir la información y
posteriormente realizar consultas que den lugar a nuevo
conocimiento. A partir de allí, se identificaron los procesos clave
donde se debían incorporar ontologías y cómo estas deberían
evolucionar de forma semiautomática a partir de la extracción de
conocimiento y la integración del mismo en lo que se denominó
Mapa de Conocimiento Empresarial que está materializado en una
ontología de dominio que evoluciona con el tiempo a partir de los
nuevos tipos de elementos de conocimiento que ingresen, los
nuevos elementos de conocimiento y las consultas que realizan los
usuarios.
De acuerdo a la definición de requerimientos se definió la estructura
conceptual del sistema que permite la evolución de ontologías como
de
de
de
de
de
de
de
de
de
parte del sistema de gestión de conocimiento. Esta estructura puede
visualizarse en la figura 1, en donde se encuentran los recursos de
los cuales se extrae el conocimiento, el componente de extracción de
conocimiento y el mapa de conocimiento conformado evolutivamente
a través de la integración de las ontologías derivadas de la extracción
y sobre el cual se ejecutan las consultas del sistema de gestión de
conocimiento.
Figure 1 Estructura Conceptual de Evolución de Ontologías en Sistema de Gestión de
Conocimiento
Para finalizar el cumplimiento de este objetivo se concluyó realizando el diseño
detallado del sistema de evolución de ontologías para la gestión del conocimiento.
La figura 2 ilustra la vista de los componentes del sistema que están definidos en
detalle en el anexo 3. Es importante aclarar que el análisis y diseño del modelo se
realizaron siguiendo un enfoque iterativo que garantizaran un diseño correcto.
Figure 2 Diagrama de Componentes
c. Prueba del modelo a través de una caso de estudio teórico
Por último se desarrollaron las actividades correspondientes a este
último objetivo en donde se determinó en primera instancia la manera
de evaluar la arquitectura definida a través de la técnica para
evaluación de atributos de calidad de la arquitectura ilustrada en [1],
es de anotar que aunque inicialmente estaba planeado realizar las
pruebas en un caso de estudio teórico, durante el proceso de
investigación se encontró que la manera correcta de hacer la
validación de un modelo arquitectural es a través de una metodología
que mida el cumplimiento de los requerimientos funcionales y no
funcionales.
Esta evaluación puede observarse en el anexo 3 en donde se
realizaron pruebas de trazabilidad que garantizaran que el modelo
cumpliera con los requerimientos identificados en la actividad de
análisis. Durante su realización fueron detectados requerimientos no
funcionales que no estaban siendo tenidos en cuenta en la
arquitectura, lo cual dio lugar a sucesivas refinaciones del modelo de
diseño.
2. ¿Qué metodología empleó? , ¿Se ajusta a lo propuesto?
Como estaba planeado por ser el resultado esperado del proyecto de índole
técnico, se usó principalmente el enfoque científico en donde los pasos que se
siguieron fueron los siguientes:
• Selección de material bibliográfico para alimentar el estado del arte: Esta
selección se hizo dividiendo el análisis en dos temáticas: la gestión de
conocimiento y las ontologías. A partir de allí se identificaron los autores y
los grupos de investigación claves en cada una de ellas. Cabe aclarar que
en la temática de gestión de conocimiento nos centramos en los sistemas
de gestión de conocimiento y no en los aspectos socio culturales pues
estos se salían del alcance del proyecto.
• Lectura y Análisis del estado del arte: La lectura de los dos enfoques se
hizo en paralelo. Al realizarla fue evidente que ya existen varios proyectos
terminados y en ejecución en donde es empleada la tecnología de
ontologías en proyectos de gestión de conocimiento. Esto sirvió para
diseñar un modelo que tome lo valioso de las propuestas ya existentes pero
incorporando el uso de ontologías en procesos adicionales de la gestión de
conocimiento que no se explotaban en las propuestas estudiadas.
• Formalización del estado del arte a través de documento escrito: Para
concretar el análisis de estado del arte se desarrolló un documento que
recopila los hallazgos encontrados. Hicimos un valioso aporte en la
identificación de los procesos alrededor de las ontologías relevantes en su
incorporación de esta tecnología en sistemas de gestión de conocimiento y
en la presentación de la aplicación de ontologías en diversas propuestas de
gestión de conocimiento.
• Definición de requerimientos del modelo: para realizar esta actividad se
aplicaron las técnicas de la ingeniería de requerimientos, definida como “la
disciplina para desarrollar una especificación completa, consistente y no
ambigua, que servirá como base para acuerdos comunes entre todas las
partes involucradas y en dónde se describen las funciones que realizará el
sistema"[3]. Esto implicó la realización de las siguientes sub actividades:
o Recolección: Para la definición de estos requerimientos se tomó un
caso de estudio teórico del manejo de la investigación en la
Universidad Javeriana que permitiera identificar los requerimientos
necesarios para gestionar el conocimiento en esta área y así poder
hacer un ejercicio de generalización. Durante esta fase se hicieron
entrevistas con expertos del negocio (personal de la oficina de
fomento a la investigación y a investigadores del departamento de
ingeniería)
o Análisis: Se hizo el análisis de la información obtenida en la actividad
de recolección y de las herramientas de gestión de conocimiento y
de administración de ontologías ya existentes
o Especificación: Para la especificación formal se utilizó el estándar
IEEE Recommended Practice for Software Requirements
Specifications [2] a través del cual se definieron los requerimientos
funcionales y no funcionales del sistema, y fueron documentados
usando la plantilla Volere [10].
o Verificación: El documento de especificación pasó por tres
iteraciones en donde fueron validados cada uno de los
requerimientos.
• Diseño del modelo de evolución de ontologías, al igual que la definición de
requerimientos, este modelo se diseñó de forma iterativa, partiendo de una
estructura de modelo conceptual y llevándolo a términos de componentes y
clases. Estos modelos podrán ser analizados en el anexo 3. Teniendo en
cuenta que los algoritmos más importantes dentro del modelo son los
relacionados con la extracción de conocimiento (de elementos
estructurados, no estructurados y semiestructurados) y con la integración
de ontologías, se hizo la definición detallada de estos para iniciar su
desarrollo durante el segundo periodo del presente año.
• Validación y Evaluación del diseño del modelo aplicando la metodología de
evaluación de atributos de calidad que hicieron posible medir la trazabilidad
de cada uno de los requerimientos planteados a los componentes de la
arquitectura diseñada. La elección de esta metodología se hizo a partir del
análisis de metodologías existentes para este fin como se puede observar
en [11].
Es importante aclarar que como se definió en la propuesta, las pruebas no
son conducentes a estadísticas de confiabilidad, su objetivo era probar la
viabilidad de continuar con el modelo para llevarlo al campo de la realidad
de las empresas. Esto quiere decir que este proyecto no fue probado en
una empresa.
3. Presente con claridad y precisión los resultados
Además de los resultados no tangibles como el conocimiento y la experiencia
adquirida por el investigador principal y el coinvestigador en la temática de
ontologías y gestión de conocimiento que han servido de insumo para aplicar en
su trabajo como investigadores y docentes. Los resultados tangibles del proyecto
fueron:
1. Estado del arte: El estado del arte en torno a los procesos de ontologías y a
la aplicación de ontologías en la gestión del conocimiento. Que fueron
considerados un trabajo que muy probablemente será referenciado en el
ámbito de ontologías y gestión de conocimiento por un experto del tema1
2. Análisis de Requerimientos: De acuerdo al estado de arte se definieron los
requerimientos necesarios para un sistema de evolución de ontologías que
pudiera materializar un sistema de gestión de conocimiento empresarial.
3. Diseño del modelo de evolución de ontologías: A partir del análisis riguroso
se realizó el diseño de cada uno de los componentes llegando al detalle de
1
De acuerdo a la evaluación de pares del artículo presentado e World Congress in Computer
Science, Computer Engineering, and Applied Computing 2007
cada uno de cada uno de ellos que hará viable el desarrollo a nivel de
implementación.
Además de los documentos formales del proyecto de investigación se obtuvo
como resultado dos papers que ya fueron aceptados en dos conferencias
internacionales como será presentando en el punto 10.
Es importante resaltar que como este proyecto hace parte de un programa de
investigación, en este momento ya se encuentra un grupo de estudiantes
trabajando en la implementación del componente de extracción y otro en el
componente de integración y consulta.
4. Discuta los resultados en términos de qué aportes nuevos hacen al
conocimiento, a la solución del problema planteado y a la pregunta de
investigación. Indique cuál fue la hipótesis planteada y si los resultados
la validan.
Hay una variedad de tecnologías que han sido aplicadas en los sistemas de
gestión del conocimiento como apoyo a los procesos que hacen parte de ellos, por
ejemplo: bodegas de datos, bases de datos, software de apoyo a la toma de
decisiones, Intranets y Extranets, sistemas expertos, agentes inteligentes, minería
de los datos. Las ontologías también se encuentran dentro de este listado al haber
sido incorporadas para la definición de un lenguaje común entre los integrantes de
una organización. La hipótesis de este proyecto fue “Es posible incorporar la
tecnología de ontologías como mecanismo que permita evolucionar el
conocimiento organizacional” esta hipótesis fue validada y el aporte de nuestro
proyecto es la utilización de la tecnología de ontologías como la espina dorsal de
la gestión de conocimiento aprovechando sus bondades en expresividad y la
facilidad de reutilización del conocimiento. Para hacerlo fue necesario garantizar el
uso de ontologías no sólo en el proceso de representación de conocimiento, que
es donde se ha utilizado en los proyectos estudiados, sino también en todos los
demás procesos asociados necesarios en la gestión de conocimiento como se
ilustra en la tabla 1.
Para construir un panorama general del conocimiento de la organización y no
manejar conocimiento aislado que es difícilmente accesible nuestra propuesta
incorpora lo que denominamos mapa virtual de conocimiento que es la unión de
los conceptos de tipos de elementos, sus atributos y los valores que toman dichos
atributos, es decir la integración de ontologías de aplicación. Al agruparse se
conforma la ontología de dominio que representa la visión del mundo sobre la cual
es posible realizar las consultas requeridas por un usuario.
El modelo planteado además proporciona mecanismos para que este se pueda
escalar fácilmente a medida que el conocimiento empresarial evoluciona. Esta
característica diferenciadora la logramos a través de la incorporación de kernels
de extracción de acuerdo a los tipos de elementos nuevos que surjan en la
organización y al componente de integración de conocimiento que adiciona las
nuevas ontologías generadas por el kernel de extracción al mapa de conocimiento.
5. Discuta, además de enumerar, los resultados de las pruebas estadísticas.
Como se mencionó anteriormente, la metodología utilizada tiene una fase de
validación que tiene por objetivo validar el modelo propuesto. Por lo tanto en
este proyecto estas fueron las únicas pruebas que se llevaron a cabo, no se
realizaron pruebas estadísticas.
6. Discuta los resultados a la luz de los siguientes aspectos: Concordancia
de los resultados con lo esperado y con hallazgos previos en la literatura.
Si hay divergencia con hallazgos previos en la literatura, discuta y
explique.
Los resultados obtenidos de este proyecto concuerdan con lo planeado
inicialmente: un modelo que permitiera validar la hipótesis al encontrar la manera
de incorporar la tecnología de ontologías como mecanismo de evolución del
conocimiento de las organizaciones. Esta prueba de hipótesis partió del análisis de
la literatura de proyectos de gestión de conocimiento que emplearon esta
tecnología, para validar si era viable su incorporación.
Los hallazgos en la literatura estuvieron principalmente dirigidos a encontrar los
usos de ontologías y se encontró que dichos usos están concentrados en la
definición de términos y relaciones empresariales como en el proyecto
Organizational Memory System[4], SME Knowledge Community Support System
[5] y Corporate Organizational Memory [6]. Y proyectos que realizan anotación
semiautomática de documentos a partir de ontologías de dominio como el
proyecto OKMS (Ontology-based Knowledge Management System)[7], FRODO (a
Framework for Distributed Organizational Memories) [8] y CoMMA (Corporate
Memory Management through Agents)[9]. El estudio de estos proyectos permitió
corroborar la viabilidad del uso de ontologías e identificar de qué otras maneras
era posible apoyar la gestión de conocimiento con ontologías, ubicando las
falencias de cada uno de ellos, pero también retomando sus bondades como fue
el caso de FRODO que representó una buena alternativa para identificar la
necesidad de extracción de conocimiento de fuentes de datos.
Dentro de los hallazgos relacionados específicamente con técnicas de extracción
de conocimiento a partir de diferentes tipos de elementos, el estudio de la
literatura arrojó que se centran en producir asociaciones de antecedenteconsecuente y no en la generación de ontologías que puedan ir conformando
conocimiento más exhaustivo. Por esta razón, nuestra propuesta de extracción,
utiliza técnicas para generar relaciones de carácter ontológico en donde puede
caber una relación de tipo antecedente-consecuente así como cualquier otro tipo
de relación.
7. Resuma las conclusiones derivadas de los hallazgos de esta
investigación teniendo en cuenta la hipótesis, los objetivos, la muestra y
la metodología.
La tecnología de ontologías puede ser empleada como parte de la estrategia de
ejecución de cada uno de los procesos de gestión de conocimiento dentro de las
organizaciones. Durante la generación y adquisición, representación,
almacenamiento, transferencia, integración, evaluación y mantenimiento del
conocimiento es posible aplicar el paradigma de ontologías para que sean el eje
de integración y explotación de conocimiento organizacional.
Las ontologías de aplicación y las ontologías de dominio representan las
ontologías de áreas específicas de la organización y la ontología general de la
organización respectivamente. Se propone, a través del modelo, que su creación y
evolución se realice de forma semiautomática para garantizar su viabilidad en el
tiempo al garantizar su evolución en términos de incorporación de cambios y
nuevos elementos de conocimiento. Así mismo, la ontología de dominio generada,
y ahora denominada, mapa virtual de conocimiento, permite la explotación y
consulta sobre los elementos de conocimiento mucho más rica, al tener en cuenta
no sólo la sintaxis sino la semántica de lo que busca el usuario final del sistema.
Las técnicas de extracción de conocimiento que arrojan reglas de tipo
antecedente–consecuente (por lo general usando minería de datos) sólo pueden
ser aplicadas en ciertos casos por lo general para la definición reglas de negocio.
En el ámbito de la gestión de conocimiento, este tipo de reglas no son las
adecuadas teniendo en cuenta que están ausentes de semántica que relacione
conceptos del mundo diferentes a los que hacen parte de la cláusula. La
propuesta de kernels de extracción permite la extracción de un conjunto de
[conceptos relación concepto] que garanticen la definición de un modelo ontológico
que describa el mundo que se representa de manera completa. Adicionalmente, la
flexibilidad para incorporar nuevos kernels de extracción de acuerdo al tipo de
elemento hace posible proporcionar nuevas maneras de obtener conocimiento de
acuerdo a la riqueza del elemento origen.
8. Indique si los resultados tendrían alguna posible aplicación.
Como se mencionó en la propuesta, al tratarse de un proyecto de investigación
enmarcado dentro de un programa de investigación, todos los resultados del
mismo serán integrados al programa y servirán de insumo para los proyectos
posteriores. De hecho, actualmente ya se está trabajando en el desarrollo de
dos de los componentes del modelo: el de extracción y el de integración y
consulta. Se espera continuar con el desarrollo de los otros componentes para
lograr aplicar todo el modelo.
Al desarrollar el modelo resultado de este proyecto se espera poder
incorporarlo en un conjunto de PyMEs colombianas que han visto en el área de
Gestión de Conocimiento una oportunidad de innovación. Es claro que este
proyecto fue pensado para poder ser aplicado en una empresa real como parte
de su plataforma de Gestión de conocimiento.
9. Indique si considera que los resultados podrían tener algún impacto
sobre políticas.
En cuanto a las políticas se piensa que no se tiene impacto, sin embargo,
teniendo en cuenta que la Universidad se encuentra desarrollando un proyecto
de gestión de conocimiento, se espera que el resultado de nuestro proyecto
sea utilizado como parte de la estrategia para permitir que el conocimiento
evolucione y sea explotable.
El desarrollo de este proyecto permitirá apropiarse de conocimientos y
herramientas que harán más competitivo el Departamento de Ingeniería de
Sistemas para cumplir su misión social, tanto en el ámbito educativo, como en
el de generación de conocimiento útil para la sociedad.
10. Teniendo en cuenta lo comprometido en la propuesta, cuáles son sus
planes de publicación.
Como resultado de este proyecto ya fueron entregados y aceptados dos
papers en conferencias internacionales. El primero de ellos se titula
Ontologies as the Backbone of Knowledge Management Processes” y fue
“O
aceptado en “World Congress in Computer Science Computer Engineering,
and Applied Computing 2007” en la conferencia “International Conference on eLearning, e-Business, Enterprise Information Systems, and e-Government”.
Este artículo presenta una visión completa y general del modelo propuesto
soportada en un riguroso estado del arte.
El segundo de ellos titulado “Ontologies automatic extraction to improve
knowledge management systems” fue aceptado en la 23rd ISPE International
Conference on CAD/CAM, ROBOTICS & Factories of the Future”. En este
paper se detalla sobre uno de los módulos más importantes que es el de
extracción de conocimiento a partir de fuentes estructuradas y semiestructuradas.
Se tiene la meta de socializar los resultados del proyecto en una publicación en
revista indexada de carácter nacional.
11. Tiene otros planes de socialización.
Además se incluirán los documentos y resultados de este proyecto en la
página web del proyecto en la URL.
http://sophia.javeriana.edu.co/~metorres/Materias/Ontologias/descripcion.html
12. Si lo considera pertinente, el investigador podrá informar sobre
problemas tanto externos como internos, de orden administrativo,
logístico y técnico que hubieran podido afectar el desarrollo del proyecto
y así mismo plantear alternativas para su solución.
La ejecución de la validación del modelo propuesta inicialmente (una aplicación
a un caso de estudio teórico), fue modificada teniendo en cuenta que la
validación de una arquitectura se lleva a cabo a nivel técnico y por medio de la
comprobación de componentes y de los requerimientos asociados a ellos.
Referencias
[1] Losavio F, Chirinos L., Lévy N, Ramdane-Cherif A, Quality Characteristics for
Software Architecture, Journal of Objet Technology, vol2, No2, Marzo - Abril 2003
[2] IEEE Recommended Practice for Software Requirements Specifications -IEEESTD-830-1998: ESPECIFICACIONES DE LOS REQUERIMIENTOS DEL
SOFTWARE, Junio 27 2001
[3] BOEHM, Barry. Software Engineering Economics. New Jersey: Prentice Hall,
1981
[4] Vasconcelos J., Kimble C., Gouveia FR., 2000, A design for a Group Memory
System using Ontologies, In Proceedings of 5th UKAIS Conference, University of
Wales Institute, Cardiff, McGraw Hill, April 2000, pp 246 – 255
[5] Lucas, A.,, Moreira da Silva, M., Simões, D., 2006, Selecting and Structuring
Semantic Resources to Support SMEs Knowledge Communities., International
Conference on Enterprise Information systems ICEIS (2) 2006, pp. 270-277
[6] Abecker A., et. al., 1998, Toward a Technology for Organizational Memories.
IEEE Intelligent Systems 13(3): 40-48 (1998)
[7] Maedche, A., et. al., 2003, Ontologies for Enterprise Knowledge Management.
IEEE Intelligent Systems 18(2): 26-33
[8] van Elst, L. et. al., 2004, An Agent-based Framework for Distributed
Organizational Memories. In Coordination and Agent Technology in Value
Networks, Multikonferenz Wirtschaftsinformatik (MKWI 2004)
[9] Perez P., et al., 2000, Corporate Memory Management through Agents,
CoMMA consortium comma-it@atos-group.com
[10]
Volere
Requeriments
Specification
Template,
www.volere.co.uk/template.htm (Ultima Consulta Marzo de 2007)
disponible
[11] Mugurel T. Ionita, Dieter K. Hammer and Henk Obbink, Scenario-Based
Software Architecture Evaluation Methods: An Overview, Workshop on Methods
and Techniques for Software Architecture Review and Assessment at the
International Conference on Software Engineering, Orlando, Florida, USA, May
2002.
en:
Descargar