Doctorado - Extracción de Información Textual

Anuncio
Recuperación de Información
Geográfica
FERNANDO S. PEREGRINO
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Recuperación de Información
La Recuperación de Información (IR:
Information Retrieval) es la ciencia de la
búsqueda de información en documentos, búsqueda
dentro de los mismos, búsqueda de metadatos que
describan documentos, etc.
Se divide en dos partes:
Indexación.
Búsqueda.
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Recuperación de Información
Indexación.
Búsqueda.
Recuperación de Información
Indexación.
Corpus:
Recuperación de Información
Ejemplo de índice invertido:
Corpus:
T0: “It is what it is”.
T1: “What is it”.
T2:”It is a banana”.
Índice resultante:
"a": {2}
"banana": {2}
"is":
{0, 1, 2}
"it":
{0, 1, 2}
"what": {0, 1}
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Recuperación de Información
Indexación.
Búsqueda.
Recuperación de Información
Búsqueda:
Topic:
Descriptive:
When and where Astrid Lindgren die?
Descriptive sin StopWords:
astrid lindgren die
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Recuperación de Información
Análisis sintáctico (FreeLing):
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Recuperación de Información Geográfica
La Recuperación de Información Geográfica (GIR:
Geographical Information Retrieval) es una
especialización de la IR con metadatos Geográficos
asociados.
Los sistemas GIR necesitan de un mínimo de
información semántica, es decir, un lugar o rasgo
geográfico asociado a un documento.
Los sistemas GIR suelen separar el análisis e
indexación de texto de la indexación geográfica.
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Sistema GIR
Arquitectura:
GeoTagging.
Indexación geográfica y de texto.
Almacenamiento de datos.
Clasificación geográfica por relevancia.
Navegación en los resultados.
Sistema GIR
También se divide en dos partes:
Indexación.
Búsqueda.
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Sistema GIR
También se divide en dos partes:
Indexación.
Búsqueda.
Sistema GIR
XML del Yahoo! PlaceMaker:
ÍNDICE
Recuperación de Información.
Indexación.
Búsqueda.
Análisis sintáctico.
Recuperación de Información Geográfica.
Sistema GIR.
Indexación.
Búsqueda.
Sistema GIR
También se divide en dos partes:
Indexación.
Búsqueda.
Sistema GIR
Ejemplo de filtro de un topic:
Descargar