Recuperación de información Bibliografía - Maristella Agosti, Fabio Crestani & Gabriella Pasi (eds.): “Lectures on Information Retrireval” Springer-Verlag, 2001. ISBN 3-540-41933-0. - William B. Frakes & Ricardo Baeza Yates: “Information Retrieval: Data Structures & Algorithms” PTR Prentice-Hall, 1992. ISBN 0-13-463837-9. Recuperación de información Selección de información documental desde un dispositivo de almacenamiento en respuesta a consultas realizadas por un usuario. NOTA: Se desea que la información recuperada sea relevante para el usuario y que se obtenga en un intervalo de tiempo adecuado. Sistemas de Recuperación de Información Se encargan del almacenamiento de (datos acerca de) documentos para su posterior recuperación por parte de los usuarios Ejemplos: Bases de datos documentales Buscadores en la World Wide Web Diferencias con los sistemas convencionales de gestión de bases de datos: Las consultas en bases de datos tradicionales están muy formalizadas mientras que en recuperación de información tienen un formato menos estructurado. La respuesta proporcionada por un DBMS tradicional es siempre la información deseada (determinista). En cambio, en recuperación de información, la respuesta suele incluir documentos no relevantes (probabilística). En DBMSs, la evaluación del éxito del sistema depende únicamente de la exactitud de la respuesta. En recuperación de información existen otros factores (como la satisfacción del usuario). Recuperación de información 1 © Fernando Berzal Base de Datos Documental doc1 Documentos Relevantes Necesidad de Información doc2 Recuperación ... SRI docN doc1 doca docb .. dock doc2 doc3 .. docN Documentos o Relevantes Documentos Análisis Representación del Documento Cálculo de Similitud Documentos Recuperados Representación de la Consulta Consulta de Usuario Recuperación de información Análisis 2 © Fernando Berzal Evaluación de un sistema de recuperación de información Eficiencia Tiempo de respuesta Espacio de almacenamiento necesario Eficacia Grado en el que el Sistema de recuperación de información trabaja correctamente. Precisión: En qué medida los documentos recuperados por el SRI son relevantes para el usuario. Exhaustividad (recall): En qué medida el SRI recupera todos los documentos relevantes de la base de datos. No Recuperados Recuperados A B D C No Relevantes Relevantes Precisión = Exhaustividad = C B+C C D+C 1 Precisión 0 Recuperación de información Exhaustividad 1 3 © Fernando Berzal