Tema 2: La Web semántica Máster en Gestión de Contenidos UB - UPF Mari Vallez Àrea de Coneixement de Biblioteconomia i Documentació Universitat Pompeu Fabra mari.vallez@upf.edu Contenido 1. Problemas de la Web actual 2. La Web semántica 3. Tecnologías de la Web semántica: ○ Lenguajes de descripción ○ Ontologías ○ Agentes de usuario 4. 5. 6. 7. Web actual vs. Web semántica Problemas de la Web semántica Conclusiones Referencias Fundamentos en Edición electrónica - Curso 2012/2013 Problemas de la Web actual ● La Web es un sistema descentralizado y heterogéneo. ● La Web carece de un modelo bien definido para la representación de la información. El método de marcado de la información, HTML, combina elementos de contenido con otros de presentación. ○ ¿Cómo podemos solucionarlos? … Fundamentos en Edición electrónica - Curso 2012/2013 La Web Semántica ● 2001: Tim Berners-Lee enuncia la Web Semántica. ○ “El contenido de la Web será expresado de manera que los ordenadores puedan entenderlo”. Para ello: ● La información tiene que estar marcada. ● Son necesarias herramientas que permitan interpretar, comparar y fusionar datos e informaciones. > Estas herramientas son las Ontologías. Fundamentos en Edición electrónica - Curso 2012/2013 La Web Semántica Dotar a los documentos de información y estructura semántica de forma explícita (Berners-Lee, 01). Fundamentos en Edición electrónica - Curso 2012/2013 Tecnologías de la Web Semántica ● Desarrollo de lenguajes de marcado con carga semántica: ○ ○ ○ ○ XML RDF SKOS Core OWL ● Agentes de usuario Fundamentos en Edición electrónica - Curso 2012/2013 XML ● XML ● ● RDF ● SKOS Core ● ● ● Primer paso para desarrollo de la WS Es un metalenguaje Describe la estructura de los documentos Estructura jerárquica ● OWL Fundamentos en Edición electrónica - Curso 2012/2013 XML Fundamentos en Edición electrónica - Curso 2012/2013 RDF ● XML ● RDF ● ● ● ● SKOS Core ● Resource Description Framework Representación a nivel semántico Representar metadatos de los documentos Intercambio de información ● OWL Fundamentos en Edición electrónica - Curso 2012/2013 RDF Sujeto http://en.wikipedia.org/Tony_Benn Predicado Titulo Editor Atributo Wikipedia Tony Benn Fundamentos en Edición electrónica - Curso 2012/2013 SKOS Core ● XML ● RDF ● SKOS Core ● OWL ● ● Simple Knowledge Organization System Infraestructura simple, flexible, pa ra representar un lenguaje controlado. Fundamentos en Edición electrónica - Curso 2012/2013 SKOS Core Fundamentos en Edición electrónica - Curso 2012/2013 SKOS Core <rdf:RDF xmlns:rdf=”http://www.w3c.org/1999/02/22-rdf-syntax-ns#” xmlns:skos=”http://www.w3c.org/2004/02/core#” xml:base=”http://www.ukat.org.uk/thesaurus/concept/”> <skos:Concept rdf:about=”1750”> <skos:prefLabel>Economic cooperation</skos:prefLabel> <skos:altLabel>Economic co-operation</skos:altLabel> <skos:scopeNote>Includes cooperative measures in banking, trade, industry, etc. between and among countries.</skos:scopeNote> <skos:broader rdf:resource=”4382” /> <skos:narrower rdf:resource=”2108” /> <skos:narrower rdf:resource=”9505” /> <skos:narrower rdf:resource=”15053” /> <skos:narrower rdf:resource=”18987” /> <skos:related rdf:resource=”3250” /> </skos:Concept> </rdf:RDF> Fundamentos en Edición electrónica - Curso 2012/2013 OWL ● XML ● RDF ● SKOS Core ● ● ● OWL ● Web Ontology Language Utilizado para publicar y compartir datos utilizando ontologías Construido sobre RDF y codificado en XML Fundamentos en Edición electrónica - Curso 2012/2013 OWL Fundamentos en Edición electrónica - Curso 2012/2013 Ontologías <?xml version=”1.0” ?> <rdf:RDF xmlns:rdf=”http://www.w3.org/1999/02/22-rdf-syntax-ns#”> … <owl:Class rdf:ID=”Perifericos”> <rdf:comment> Los periféricos de ordenador están conectados a la CPU pero no forman parte de ella. </rdf:comment> Periférico </owl:Class> <owl:Class rdf:ID=”Entrada”> <rdf:comment> Los periféricos de entrada son una subclase de periféricos de ordenador. Entrada </rdf:comment> <rdfs:subClassOf rdf:resource=”#Perifericos” /> </owl:Class> <owl:Class rdf:ID=”Teclados”> <rdf:comment> Los teclados son una subclase de los periféricos de entrada. </rdf:comment> <rdf:subClassOf rdf:resource=”#Entrada” /> Teclado <rdf:subClassOf rdf:resource=”#Perifericos” /> </owl:Class> … </rdf:RDF> Fundamentos en Edición electrónica - Curso 2012/2013 Agentes inteligentes ● La Web semántica no alcanzará su máximo potencial hasta que se desarrollen agentes inteligentes capaces de buscar contenido en esta nueva Web, procesando la información e intercambiándola con otros programas. Fundamentos en Edición electrónica - Curso 2012/2013 Fundamentos en Edición electrónica - Curso 2012/2013 La Web actual Fundamentos en Edición electrónica - Curso 2012/2013 La Web Semántica Fundamentos en Edición electrónica - Curso 2012/2013 Funcionamiento de la Web Semántica Países Ontología Iraq Kuwait Recurso: OMS Recurso: UN Datos: Iraq, Demografía, ... Datos: Iraq, Economía, ... Economía Demografía ... ... Fundamentos en Edición electrónica - Curso 2012/2013 Problemática de la Web semántica ● Elevado coste de su desarrollo: ● ● ○ Tiempo ○ Dinero Ontologías dependientes de un dominio. Ontologías dependientes de objetivos. ¿Solución? ○ Ingeniería de Ontologías Fundamentos en Edición electrónica - Curso 2012/2013 Conclusiones ● Tecnologías básicas de la Web semántica: ○ Lenguajes para estructurar los contenidos: estos lenguajes se crearán utilizando XML. ○ Herramienta para extraer el significado de la estructura de esas informaciones: codificado con RDF ○ Lenguajes que permitan comparar y/o combinar informaciones con distinta estructura: OWL. ○ Herramientas que permitan la recuperación eficaz de dichas informaciones: Agentes inteligentes. Fundamentos en Edición electrónica - Curso 2012/2013 Conclusiones ● Implicaciones en otros ámbitos: ○ ○ ○ ○ ○ ○ ○ ○ Extracción de información Extracción de entidades Extracción de términos Respuesta a preguntas Recuperación de información Clasificación automática Resumen automático Traducción automática Fundamentos en Edición electrónica - Curso 2012/2013 Referencias ● LeeBerners-Lee, T., Hendler, J., and Lassila, O. (2001). ● The Semantic Web. Scientific American, vol. 284, nº 5, May 2001, pp. 34-43. Rafael Pedraza-Jiménez, Lluís Codina, Cristòfol Rovira (2007). “Web semántica y ontologías en el procesamiento de la información documental”. El Profesional de la Información, Noviembre-Diciembre 2007, vol.16, nº 6, pp. 569-578. Fundamentos en Edición electrónica - Curso 2012/2013