Grao en Información e Documentación: Bases de datos documentais Curso 2013 – 2014 Bases de datos documentales: Introducción 1 Introducción Una BD documental es una BD que mantiene tablas cuyas filas contienen... Documentos (de cualquier tipo y formato) Referencias que permiten localizar documentos ...y su finalidad básica es la de permitir la recuperación de documentos, o la elaboración de nuevos documentos (por ejemplo, bibliografías). Para conseguir esto, podríamos pensar en utilizar SGBDs convencionales. Sin embargo esta opción presenta muchos inconvenientes, ya que la gestión de la información documental conlleva necesitades específicas. Por ejemplo, la realización de búsquedas que tengan en consideración el contenido de los documentos almacenados en la BD. Esta circunstancia motivo que los primeros sistemas de gestión de información documental fuesen desarrollados de forma específica, a medida de las necesidades puntuales que tuviesen, en un momento dado, un determinado grupo de usuarios. Lógicamente, y desde un punto de vista práctico, no es esta es una buena solución: enormes esfuerzos de desarrollo independientes destinados a satisfacer necesidades similares de diferentes grupos de personas. Y, sin embargo, hubo de transcurrir un período de tiempo razonablemente largo hasta que los principales SGBDs comerciales fuesen adaptados para soportar de forma explícita la gestión de información documental. Más concretamente Oracle incluye, desde su versión 7, el módulo ConText Cartridge, que podía ser añadido opcionalmente al sistema principal. Y del mismo modo, Informix (hoy absorbida por IBM) desarrolló en módulo Excalibur Text Search DataBlade Module, que hoy día puede ser utilizado con el gestor DB2 de IBM. Estos dos módulos ofrecen, entre otras funcionalidades, extensiónes (ampliaciones) particulares del lenguaje SQL para soportar búsquedas por contenido sobre los documentos almacenados en una BD. 2 Clasificación de las BDs documentales Podemos establecer diferentes clasificaciones de las BDs documentales atendiendo a diferentes criterios: Por Por Por Por Por su contenido su método de acceso su cobertura temática su cobertura documental su modelo de tratamiento documental Analizaremos a continuación las clasificaciones que podemos establecer en función de esos criterios. Autor: Juan Ramón López Rodríguez 1 Grao en Información e Documentación: Bases de datos documentais Curso 2013 – 2014 2.1 Clasificación por contenido Atendiendo a su contenido, podemos clasificar las BDs documentales en: BDs de texto completo: la BD contiene o bien documentos originalmente electrónicos, o bien transcripciones realizadas a partir de documentos en papel. También se incluye información asociada a cada documento. Un sistema de este tipo permitirá, normalmente, la búsqueda por contenido sobre los documentos. BDs de archivos de imagen: la BD contiene documentos escaneados y almacenados en formato de imagen, o bien, directamente, fotografías o vídeos en formato digital. Este tipo de sistemas no permite, normalmente, la búsqueda por contenido. BDs referenciales: la BD almacena información para localizar y obtener cada documento, pero no el documento en sí mismo. (ej, el catálogo de una biblioteca). Cada tabla incluye campos con información sobre los documentos o incluso enlaces para poder recuperar el documento a través de otros programas o sistemas. 2.2 Clasificación por modo de acceso BDs con acceso local: la BD es accesible desde un único equipo, o como mucho desde los equipos de una red local BDs con soporte CDROM: La BD, y el sistema para acceder a la misma, se almacenan en un CD, que puede ser copiado y distribuido a sus usuarios. BDs en línea: la BD es accesible desde cualquier ordenador con conexión a Internet, en diferentes modalidades: Acceso vía Telnet: una ventana del ordenador del usuario simula una terminal del ordenador que contiene la BD, simulando un acceso local. El acceso a la BD puede ser controlado a través de un sistema de menús, o bien mediante el uso de comandos especiales. Acceso vía web: el acceso a la BD se realiza a través de una aplicación Web, por medio de un navegador. En cualquiera de los dos casos, el acceso a la BD puede ser libre, o bien protegido mediante una contraseña, que bien pudiera obtenerse tras la firma de un contrato. El uso de BDs con acceso local o soporte CDROM es obligatorio en el caso de usuarios que no dispongan de acceso a Internet. El uso de CDROM tiene asociada la desventaja de que la información que contenga dejará de estar actualizada con el paso del tiempo (algo que no ocurre en el caso de las BDs en línea, que hacen accesibles de inmediato a sus usuarios las actualizaciones producidas en la BD). Este inconveniente se puede paliar mediante la distribución periódica de nuevas versiones del CD a sus usuarios. 2.3 Clasificación por cobertura temática BDs monotemáticas: contienen documentos relativos a un único tema, interesantes para especialistas en un determinado área de conocimiento: Autor: Juan Ramón López Rodríguez 2 Grao en Información e Documentación: Bases de datos documentais Curso 2013 – 2014 Científico tecnológicas Económico-empresariales Médico-sanitarias Medios de comunicación Político-jurídicas ... Generalistas: satisfacen necesidades de información general, estando destinadas a un gran número de usuarios 2.4 Clasificación por cobertura documental BDs que almacenan un único tipo de documento (ej. BD de tesis doctorales) BDs que almacenan tipos diferentes de documentos (ej. catálogo de una bibioteca pública) 2.5 Clasificación en base al modelo de tratamiento documental BDs de sumarios/sin análisis de contenido: se almacenan sólo datos básicos relativos a cada documento (autor, título, fuente...). Como mucho, se incluye un resumen del documento realizado por el autor y extraido del propio documento. Sólo se admiten búsquedas sobre palabras del título del documento. Catálogos de biblioteca: Solo contienen información sobre los fondos de una biblioteca (es decir, están asociados a un fondo documental predeterminado), catalogados siguiendo normas internacionales. BDs de análisis documental completo: asociado a cada documento, se almacena un resumen creado ex profeso para la base de datos; o incluso un conjunto de términos representativos: Descriptores: palabras descriptivas de la temática de cada documento, extraidas de un vocabulario común y preestablecido, que pueden estar organizadas en niveles constituyendo una indización. (ej: encabezamientos y subencabezamientos de materia en catálogos de biblioteca) Palabras clave: palabras seleccionadas al dar de alta una obra en la BD, que se definen sobre la marcha con el fin de complementar al conjunto de descriptores preestablecido para poder fijar con mayor precisión la temática de cada documento. Los tres tipos de información mencionados se puyeden combinar de muy diversas formas. Así, podemos encontrarnos con BDs documentales... ...con clasificación y resumen: esta opción permite muchas formas diferentes de recuperar el mismo documento (búsqueda por palabras clave y contenido del resumen) ...con clasificación e indización: esta opción permite lograr una mayor pertinencia de los resultados obtenidos en la búsqueda de Autor: Juan Ramón López Rodríguez 3 Grao en Información e Documentación: Bases de datos documentais Curso 2013 – 2014 documentos; aunque implica que el usuario debe conocer previamente los descriptores del índice para poder utilizarlos en la definición de su búsqueda. ...con clasificación, indización y resúmenes: la más completa de todas. Resumiendo, en una BD con análisis documental completo podemos localizar documentos de muy diversas formas: Busqueda por contenido del resumen/título de cada documento. Búsqueda por palabras clave/descriptores asociados a cada documento. Búsqueda por contenido del documento. Índices de citas: se trata de un tipo de BD documental muy específico, que almacenan las citas bibliográficas de revistas científicas y publicaciones de relevancia sobre determiados temas o áreas de conocimiento. Permiten seleccionar aquellos documentos más relevantes en una determinada temática, o pueden ser utilizados para la realización de estudios bibliométricos. Autor: Juan Ramón López Rodríguez 4 Grao en Información e Documentación: Bases de datos documentais Curso 2013 – 2014 Bibliografía Rodríguez Yunta, Luis. Bases de datos documentales: estructura y uso. En: MALDONADO, Ángeles (coord.). La información especializada en Internet. CINDOC, 2001 Autor: Juan Ramón López Rodríguez 5