INFORME FINAL DE PROYECTO DE INVESTIGACIÓN Titulo del Proyecto: Modelo de Evolución de Ontologías para la Gestión del Conocimiento Empresarial Investigador Principal: Alexandra Pomares Quimbaya Otros investigadores en el Proyecto: Miguel Eduardo Torres Moreno Grupo de investigación ( si aplica): SIDRE Facultad: Ingeniería Departamento / Instituto: Ingeniería de Sistemas 1. Indique cuáles fueron los objetivos de la investigación y qué tanto se lograron. El objetivo principal de la investigación fue “Diseñar un modelo de evolución de ontologías como parte de la plataforma de gestión de conocimiento empresarial”, este proyecto se cumplió a cabalidad. Para su cumplimiento se desarrollaron tres objetivos específicos que serán descritos a continuación. a. Caracterizar las problemáticas en torno a la integración y evolución de ontologías en ambientes empresariales El resultado de esta caracterización puede observarse en el estado del arte consignado en el anexo 1, en esta caracterización se identificaron los proyectos de gestión de conocimiento que han aplicado ontologías como uno de sus componentes y se hizo una extensa evaluación de los procesos alrededor de las ontologías, se hizo especial énfasis en el proceso de integración entre ontologías por ser el de mayor relevancia para garantizar evolución. La tabla 1 ilustra la relación entre los procesos de gestión de conocimiento y los procesos de ontologías resultado del análisis realizado durante esta etapa del proyecto. Proceso de administración del conocimiento Generación y adquisición Participación Ontológica Procesos ontológicos Tipo ontología relacionados Elementos del Creación Ontológica conocimiento automática y Categorización y semiautomática. enriquecimiento Búsqueda sobre la ontología semántico. Extracción y Ontología Dominio. Ontología Aplicación. de de de Representación Almacenamiento Transferir Integrar adquisición del conocimiento Creación del mapa Integración de la ontología. de conocimiento. Recuperación de elementos del conocimiento Persistencia de Persistencia de la ontología. Metadata Expansión y personalización del Query de usuario Integrar el conocimiento. Compartir el conocimiento. Monitoreo del conocimiento. Mantenimiento del conocimiento. Búsqueda ontología. sobre Ontología Dominio. Ontología Dominio. Ontología Aplicación. la Ontología Aplicación. Integración de la ontología. Ontología Creación del mapa de Dominio. ontología. Ontología Aplicación. Evaluar Logs de uso de la ontología. Ontología Aplicación Evolución de la ontología. Ontología Mantener Dominio. Ontología Aplicación. Table 1. Relación Procesos Gestión de Conocimiento - Procesos Ontologías Teniendo como punto de partida esta caracterización se inició la segunda fase que se describirá en el segundo objetivo. b. Definición del modelo de evolución de ontologías a nivel empresarial Este modelo fue definido en términos de requerimientos como se puede observar en el anexo 2 y a nivel de arquitectura como se puede observar en el anexo 3. Fue definido y diseñado partiendo del hallazgo durante el estado del arte de que la principal problemática en los sistemas de gestión de conocimiento es la ausencia de un lenguaje común que permita describir la información y posteriormente realizar consultas que den lugar a nuevo conocimiento. A partir de allí, se identificaron los procesos clave donde se debían incorporar ontologías y cómo estas deberían evolucionar de forma semiautomática a partir de la extracción de conocimiento y la integración del mismo en lo que se denominó Mapa de Conocimiento Empresarial que está materializado en una ontología de dominio que evoluciona con el tiempo a partir de los nuevos tipos de elementos de conocimiento que ingresen, los nuevos elementos de conocimiento y las consultas que realizan los usuarios. De acuerdo a la definición de requerimientos se definió la estructura conceptual del sistema que permite la evolución de ontologías como de de de de de de de de de parte del sistema de gestión de conocimiento. Esta estructura puede visualizarse en la figura 1, en donde se encuentran los recursos de los cuales se extrae el conocimiento, el componente de extracción de conocimiento y el mapa de conocimiento conformado evolutivamente a través de la integración de las ontologías derivadas de la extracción y sobre el cual se ejecutan las consultas del sistema de gestión de conocimiento. Figure 1 Estructura Conceptual de Evolución de Ontologías en Sistema de Gestión de Conocimiento Para finalizar el cumplimiento de este objetivo se concluyó realizando el diseño detallado del sistema de evolución de ontologías para la gestión del conocimiento. La figura 2 ilustra la vista de los componentes del sistema que están definidos en detalle en el anexo 3. Es importante aclarar que el análisis y diseño del modelo se realizaron siguiendo un enfoque iterativo que garantizaran un diseño correcto. Figure 2 Diagrama de Componentes c. Prueba del modelo a través de una caso de estudio teórico Por último se desarrollaron las actividades correspondientes a este último objetivo en donde se determinó en primera instancia la manera de evaluar la arquitectura definida a través de la técnica para evaluación de atributos de calidad de la arquitectura ilustrada en [1], es de anotar que aunque inicialmente estaba planeado realizar las pruebas en un caso de estudio teórico, durante el proceso de investigación se encontró que la manera correcta de hacer la validación de un modelo arquitectural es a través de una metodología que mida el cumplimiento de los requerimientos funcionales y no funcionales. Esta evaluación puede observarse en el anexo 3 en donde se realizaron pruebas de trazabilidad que garantizaran que el modelo cumpliera con los requerimientos identificados en la actividad de análisis. Durante su realización fueron detectados requerimientos no funcionales que no estaban siendo tenidos en cuenta en la arquitectura, lo cual dio lugar a sucesivas refinaciones del modelo de diseño. 2. ¿Qué metodología empleó? , ¿Se ajusta a lo propuesto? Como estaba planeado por ser el resultado esperado del proyecto de índole técnico, se usó principalmente el enfoque científico en donde los pasos que se siguieron fueron los siguientes: • Selección de material bibliográfico para alimentar el estado del arte: Esta selección se hizo dividiendo el análisis en dos temáticas: la gestión de conocimiento y las ontologías. A partir de allí se identificaron los autores y los grupos de investigación claves en cada una de ellas. Cabe aclarar que en la temática de gestión de conocimiento nos centramos en los sistemas de gestión de conocimiento y no en los aspectos socio culturales pues estos se salían del alcance del proyecto. • Lectura y Análisis del estado del arte: La lectura de los dos enfoques se hizo en paralelo. Al realizarla fue evidente que ya existen varios proyectos terminados y en ejecución en donde es empleada la tecnología de ontologías en proyectos de gestión de conocimiento. Esto sirvió para diseñar un modelo que tome lo valioso de las propuestas ya existentes pero incorporando el uso de ontologías en procesos adicionales de la gestión de conocimiento que no se explotaban en las propuestas estudiadas. • Formalización del estado del arte a través de documento escrito: Para concretar el análisis de estado del arte se desarrolló un documento que recopila los hallazgos encontrados. Hicimos un valioso aporte en la identificación de los procesos alrededor de las ontologías relevantes en su incorporación de esta tecnología en sistemas de gestión de conocimiento y en la presentación de la aplicación de ontologías en diversas propuestas de gestión de conocimiento. • Definición de requerimientos del modelo: para realizar esta actividad se aplicaron las técnicas de la ingeniería de requerimientos, definida como “la disciplina para desarrollar una especificación completa, consistente y no ambigua, que servirá como base para acuerdos comunes entre todas las partes involucradas y en dónde se describen las funciones que realizará el sistema"[3]. Esto implicó la realización de las siguientes sub actividades: o Recolección: Para la definición de estos requerimientos se tomó un caso de estudio teórico del manejo de la investigación en la Universidad Javeriana que permitiera identificar los requerimientos necesarios para gestionar el conocimiento en esta área y así poder hacer un ejercicio de generalización. Durante esta fase se hicieron entrevistas con expertos del negocio (personal de la oficina de fomento a la investigación y a investigadores del departamento de ingeniería) o Análisis: Se hizo el análisis de la información obtenida en la actividad de recolección y de las herramientas de gestión de conocimiento y de administración de ontologías ya existentes o Especificación: Para la especificación formal se utilizó el estándar IEEE Recommended Practice for Software Requirements Specifications [2] a través del cual se definieron los requerimientos funcionales y no funcionales del sistema, y fueron documentados usando la plantilla Volere [10]. o Verificación: El documento de especificación pasó por tres iteraciones en donde fueron validados cada uno de los requerimientos. • Diseño del modelo de evolución de ontologías, al igual que la definición de requerimientos, este modelo se diseñó de forma iterativa, partiendo de una estructura de modelo conceptual y llevándolo a términos de componentes y clases. Estos modelos podrán ser analizados en el anexo 3. Teniendo en cuenta que los algoritmos más importantes dentro del modelo son los relacionados con la extracción de conocimiento (de elementos estructurados, no estructurados y semiestructurados) y con la integración de ontologías, se hizo la definición detallada de estos para iniciar su desarrollo durante el segundo periodo del presente año. • Validación y Evaluación del diseño del modelo aplicando la metodología de evaluación de atributos de calidad que hicieron posible medir la trazabilidad de cada uno de los requerimientos planteados a los componentes de la arquitectura diseñada. La elección de esta metodología se hizo a partir del análisis de metodologías existentes para este fin como se puede observar en [11]. Es importante aclarar que como se definió en la propuesta, las pruebas no son conducentes a estadísticas de confiabilidad, su objetivo era probar la viabilidad de continuar con el modelo para llevarlo al campo de la realidad de las empresas. Esto quiere decir que este proyecto no fue probado en una empresa. 3. Presente con claridad y precisión los resultados Además de los resultados no tangibles como el conocimiento y la experiencia adquirida por el investigador principal y el coinvestigador en la temática de ontologías y gestión de conocimiento que han servido de insumo para aplicar en su trabajo como investigadores y docentes. Los resultados tangibles del proyecto fueron: 1. Estado del arte: El estado del arte en torno a los procesos de ontologías y a la aplicación de ontologías en la gestión del conocimiento. Que fueron considerados un trabajo que muy probablemente será referenciado en el ámbito de ontologías y gestión de conocimiento por un experto del tema1 2. Análisis de Requerimientos: De acuerdo al estado de arte se definieron los requerimientos necesarios para un sistema de evolución de ontologías que pudiera materializar un sistema de gestión de conocimiento empresarial. 3. Diseño del modelo de evolución de ontologías: A partir del análisis riguroso se realizó el diseño de cada uno de los componentes llegando al detalle de 1 De acuerdo a la evaluación de pares del artículo presentado e World Congress in Computer Science, Computer Engineering, and Applied Computing 2007 cada uno de cada uno de ellos que hará viable el desarrollo a nivel de implementación. Además de los documentos formales del proyecto de investigación se obtuvo como resultado dos papers que ya fueron aceptados en dos conferencias internacionales como será presentando en el punto 10. Es importante resaltar que como este proyecto hace parte de un programa de investigación, en este momento ya se encuentra un grupo de estudiantes trabajando en la implementación del componente de extracción y otro en el componente de integración y consulta. 4. Discuta los resultados en términos de qué aportes nuevos hacen al conocimiento, a la solución del problema planteado y a la pregunta de investigación. Indique cuál fue la hipótesis planteada y si los resultados la validan. Hay una variedad de tecnologías que han sido aplicadas en los sistemas de gestión del conocimiento como apoyo a los procesos que hacen parte de ellos, por ejemplo: bodegas de datos, bases de datos, software de apoyo a la toma de decisiones, Intranets y Extranets, sistemas expertos, agentes inteligentes, minería de los datos. Las ontologías también se encuentran dentro de este listado al haber sido incorporadas para la definición de un lenguaje común entre los integrantes de una organización. La hipótesis de este proyecto fue “Es posible incorporar la tecnología de ontologías como mecanismo que permita evolucionar el conocimiento organizacional” esta hipótesis fue validada y el aporte de nuestro proyecto es la utilización de la tecnología de ontologías como la espina dorsal de la gestión de conocimiento aprovechando sus bondades en expresividad y la facilidad de reutilización del conocimiento. Para hacerlo fue necesario garantizar el uso de ontologías no sólo en el proceso de representación de conocimiento, que es donde se ha utilizado en los proyectos estudiados, sino también en todos los demás procesos asociados necesarios en la gestión de conocimiento como se ilustra en la tabla 1. Para construir un panorama general del conocimiento de la organización y no manejar conocimiento aislado que es difícilmente accesible nuestra propuesta incorpora lo que denominamos mapa virtual de conocimiento que es la unión de los conceptos de tipos de elementos, sus atributos y los valores que toman dichos atributos, es decir la integración de ontologías de aplicación. Al agruparse se conforma la ontología de dominio que representa la visión del mundo sobre la cual es posible realizar las consultas requeridas por un usuario. El modelo planteado además proporciona mecanismos para que este se pueda escalar fácilmente a medida que el conocimiento empresarial evoluciona. Esta característica diferenciadora la logramos a través de la incorporación de kernels de extracción de acuerdo a los tipos de elementos nuevos que surjan en la organización y al componente de integración de conocimiento que adiciona las nuevas ontologías generadas por el kernel de extracción al mapa de conocimiento. 5. Discuta, además de enumerar, los resultados de las pruebas estadísticas. Como se mencionó anteriormente, la metodología utilizada tiene una fase de validación que tiene por objetivo validar el modelo propuesto. Por lo tanto en este proyecto estas fueron las únicas pruebas que se llevaron a cabo, no se realizaron pruebas estadísticas. 6. Discuta los resultados a la luz de los siguientes aspectos: Concordancia de los resultados con lo esperado y con hallazgos previos en la literatura. Si hay divergencia con hallazgos previos en la literatura, discuta y explique. Los resultados obtenidos de este proyecto concuerdan con lo planeado inicialmente: un modelo que permitiera validar la hipótesis al encontrar la manera de incorporar la tecnología de ontologías como mecanismo de evolución del conocimiento de las organizaciones. Esta prueba de hipótesis partió del análisis de la literatura de proyectos de gestión de conocimiento que emplearon esta tecnología, para validar si era viable su incorporación. Los hallazgos en la literatura estuvieron principalmente dirigidos a encontrar los usos de ontologías y se encontró que dichos usos están concentrados en la definición de términos y relaciones empresariales como en el proyecto Organizational Memory System[4], SME Knowledge Community Support System [5] y Corporate Organizational Memory [6]. Y proyectos que realizan anotación semiautomática de documentos a partir de ontologías de dominio como el proyecto OKMS (Ontology-based Knowledge Management System)[7], FRODO (a Framework for Distributed Organizational Memories) [8] y CoMMA (Corporate Memory Management through Agents)[9]. El estudio de estos proyectos permitió corroborar la viabilidad del uso de ontologías e identificar de qué otras maneras era posible apoyar la gestión de conocimiento con ontologías, ubicando las falencias de cada uno de ellos, pero también retomando sus bondades como fue el caso de FRODO que representó una buena alternativa para identificar la necesidad de extracción de conocimiento de fuentes de datos. Dentro de los hallazgos relacionados específicamente con técnicas de extracción de conocimiento a partir de diferentes tipos de elementos, el estudio de la literatura arrojó que se centran en producir asociaciones de antecedenteconsecuente y no en la generación de ontologías que puedan ir conformando conocimiento más exhaustivo. Por esta razón, nuestra propuesta de extracción, utiliza técnicas para generar relaciones de carácter ontológico en donde puede caber una relación de tipo antecedente-consecuente así como cualquier otro tipo de relación. 7. Resuma las conclusiones derivadas de los hallazgos de esta investigación teniendo en cuenta la hipótesis, los objetivos, la muestra y la metodología. La tecnología de ontologías puede ser empleada como parte de la estrategia de ejecución de cada uno de los procesos de gestión de conocimiento dentro de las organizaciones. Durante la generación y adquisición, representación, almacenamiento, transferencia, integración, evaluación y mantenimiento del conocimiento es posible aplicar el paradigma de ontologías para que sean el eje de integración y explotación de conocimiento organizacional. Las ontologías de aplicación y las ontologías de dominio representan las ontologías de áreas específicas de la organización y la ontología general de la organización respectivamente. Se propone, a través del modelo, que su creación y evolución se realice de forma semiautomática para garantizar su viabilidad en el tiempo al garantizar su evolución en términos de incorporación de cambios y nuevos elementos de conocimiento. Así mismo, la ontología de dominio generada, y ahora denominada, mapa virtual de conocimiento, permite la explotación y consulta sobre los elementos de conocimiento mucho más rica, al tener en cuenta no sólo la sintaxis sino la semántica de lo que busca el usuario final del sistema. Las técnicas de extracción de conocimiento que arrojan reglas de tipo antecedente–consecuente (por lo general usando minería de datos) sólo pueden ser aplicadas en ciertos casos por lo general para la definición reglas de negocio. En el ámbito de la gestión de conocimiento, este tipo de reglas no son las adecuadas teniendo en cuenta que están ausentes de semántica que relacione conceptos del mundo diferentes a los que hacen parte de la cláusula. La propuesta de kernels de extracción permite la extracción de un conjunto de [conceptos relación concepto] que garanticen la definición de un modelo ontológico que describa el mundo que se representa de manera completa. Adicionalmente, la flexibilidad para incorporar nuevos kernels de extracción de acuerdo al tipo de elemento hace posible proporcionar nuevas maneras de obtener conocimiento de acuerdo a la riqueza del elemento origen. 8. Indique si los resultados tendrían alguna posible aplicación. Como se mencionó en la propuesta, al tratarse de un proyecto de investigación enmarcado dentro de un programa de investigación, todos los resultados del mismo serán integrados al programa y servirán de insumo para los proyectos posteriores. De hecho, actualmente ya se está trabajando en el desarrollo de dos de los componentes del modelo: el de extracción y el de integración y consulta. Se espera continuar con el desarrollo de los otros componentes para lograr aplicar todo el modelo. Al desarrollar el modelo resultado de este proyecto se espera poder incorporarlo en un conjunto de PyMEs colombianas que han visto en el área de Gestión de Conocimiento una oportunidad de innovación. Es claro que este proyecto fue pensado para poder ser aplicado en una empresa real como parte de su plataforma de Gestión de conocimiento. 9. Indique si considera que los resultados podrían tener algún impacto sobre políticas. En cuanto a las políticas se piensa que no se tiene impacto, sin embargo, teniendo en cuenta que la Universidad se encuentra desarrollando un proyecto de gestión de conocimiento, se espera que el resultado de nuestro proyecto sea utilizado como parte de la estrategia para permitir que el conocimiento evolucione y sea explotable. El desarrollo de este proyecto permitirá apropiarse de conocimientos y herramientas que harán más competitivo el Departamento de Ingeniería de Sistemas para cumplir su misión social, tanto en el ámbito educativo, como en el de generación de conocimiento útil para la sociedad. 10. Teniendo en cuenta lo comprometido en la propuesta, cuáles son sus planes de publicación. Como resultado de este proyecto ya fueron entregados y aceptados dos papers en conferencias internacionales. El primero de ellos se titula Ontologies as the Backbone of Knowledge Management Processes” y fue “O aceptado en “World Congress in Computer Science Computer Engineering, and Applied Computing 2007” en la conferencia “International Conference on eLearning, e-Business, Enterprise Information Systems, and e-Government”. Este artículo presenta una visión completa y general del modelo propuesto soportada en un riguroso estado del arte. El segundo de ellos titulado “Ontologies automatic extraction to improve knowledge management systems” fue aceptado en la 23rd ISPE International Conference on CAD/CAM, ROBOTICS & Factories of the Future”. En este paper se detalla sobre uno de los módulos más importantes que es el de extracción de conocimiento a partir de fuentes estructuradas y semiestructuradas. Se tiene la meta de socializar los resultados del proyecto en una publicación en revista indexada de carácter nacional. 11. Tiene otros planes de socialización. Además se incluirán los documentos y resultados de este proyecto en la página web del proyecto en la URL. http://sophia.javeriana.edu.co/~metorres/Materias/Ontologias/descripcion.html 12. Si lo considera pertinente, el investigador podrá informar sobre problemas tanto externos como internos, de orden administrativo, logístico y técnico que hubieran podido afectar el desarrollo del proyecto y así mismo plantear alternativas para su solución. La ejecución de la validación del modelo propuesta inicialmente (una aplicación a un caso de estudio teórico), fue modificada teniendo en cuenta que la validación de una arquitectura se lleva a cabo a nivel técnico y por medio de la comprobación de componentes y de los requerimientos asociados a ellos. Referencias [1] Losavio F, Chirinos L., Lévy N, Ramdane-Cherif A, Quality Characteristics for Software Architecture, Journal of Objet Technology, vol2, No2, Marzo - Abril 2003 [2] IEEE Recommended Practice for Software Requirements Specifications -IEEESTD-830-1998: ESPECIFICACIONES DE LOS REQUERIMIENTOS DEL SOFTWARE, Junio 27 2001 [3] BOEHM, Barry. Software Engineering Economics. New Jersey: Prentice Hall, 1981 [4] Vasconcelos J., Kimble C., Gouveia FR., 2000, A design for a Group Memory System using Ontologies, In Proceedings of 5th UKAIS Conference, University of Wales Institute, Cardiff, McGraw Hill, April 2000, pp 246 – 255 [5] Lucas, A.,, Moreira da Silva, M., Simões, D., 2006, Selecting and Structuring Semantic Resources to Support SMEs Knowledge Communities., International Conference on Enterprise Information systems ICEIS (2) 2006, pp. 270-277 [6] Abecker A., et. al., 1998, Toward a Technology for Organizational Memories. IEEE Intelligent Systems 13(3): 40-48 (1998) [7] Maedche, A., et. al., 2003, Ontologies for Enterprise Knowledge Management. IEEE Intelligent Systems 18(2): 26-33 [8] van Elst, L. et. al., 2004, An Agent-based Framework for Distributed Organizational Memories. In Coordination and Agent Technology in Value Networks, Multikonferenz Wirtschaftsinformatik (MKWI 2004) [9] Perez P., et al., 2000, Corporate Memory Management through Agents, CoMMA consortium comma-it@atos-group.com [10] Volere Requeriments Specification Template, www.volere.co.uk/template.htm (Ultima Consulta Marzo de 2007) disponible [11] Mugurel T. Ionita, Dieter K. Hammer and Henk Obbink, Scenario-Based Software Architecture Evaluation Methods: An Overview, Workshop on Methods and Techniques for Software Architecture Review and Assessment at the International Conference on Software Engineering, Orlando, Florida, USA, May 2002. en: