Recuperación de información con dispositivos

Anuncio
Recuperación de
información con
dispositivos móviles
Sergio Cala Cordero
Sonia Valenciano Rufet
Antonio Ángel González Jiménez
Claudia Falcón Borrero
26/01/2010
Recuperación de información con dispositivos móviles
ÍNDICE
Introducción ................................................................ 3
Resumen -Abstract ..................................................... 3
Técnicas y métodos actuales ....................................... 3
Entorno experimental .................................................. 8
Resultados obtenidos .................................................. 10
Líneas de investigación actuales .................................. 11
Conclusiones ................................................................ 11
Bibliografía ................................................................... 12
2
Recuperación de información con dispositivos móviles
Introducción
Estamos en un mundo dónde cada vez las necesidades de información son cada vez
mayores, cada vez se demanda más la información móvil, accesible y disponible desde
cualquier dispositivo y desde cualquier lugar. Este trabajo pretende analizar la recuperación de
la información en dispositivos móviles. Se presentarán técnicas y métodos actuales, en
recuperación de información de imágenes, acceso a web vía dispositivos móviles, bibliotecas
digitales en dispositivos móviles y recuperación de información específicos (medicina,
agricultura, economía). Se estudiará en más detalle un sistema experimental de recuperación
de información turística. Serán mencionadas las líneas de investigación futuras abiertas y
finalmente se concluirá el trabajo con las conclusiones del mismo.
Abstract
This world every time information needs are increasing, there is increasing demand for
mobile information more accessible and available from any device, anywhere. This work
analyzes the information retrieval on mobile devices. Techniques and current methods will be
presented in image retrieval, web access via mobile devices, mobile digital libraries and
information retrieval purposes (medicine, agriculture, economy). Be studied in more detail an
experimental system for retrieval of tourist information. Will be referred to future research
lines open and finally completed the work with the conclusions.
Técnicas y métodos actuales
La proliferación de la tecnología inalámbrica y de dispositivos móviles como las PDAs y
los teléfonos móviles ha generado una gran demanda de contenidos de información móviles,
así como de técnicas efectivas de Recuperación de Información para estos dispositivos. Se hace
necesario el uso de nuevas tecnologías para la representación, modelado, indexación y
recuperación de datos móviles.
Actualmente existen diversas técnicas para permitir esto. Algunas se centran en el
desarrollo de aplicaciones específicas en los dispositivos móviles. Otras se enfocan a la
modificación de las aplicaciones del lado de los servidores que contienen la información. Y
otras más desarrollan elementos intermedios entre el cliente móvil y el servidor de la
aplicación. El uso de una técnica u otra depende del tipo de aplicación del que se esté tratando
para obtener un buen rendimiento.
Este apartado se centra en describir brevemente los distintos métodos de
Recuperación de Información que existen actualmente para dispositivos móviles. Hoy en día,
las principales áreas de desarrollo son de entretenimiento, siendo las menos las que involucran
3
Recuperación de información con dispositivos móviles
aspectos relevantes como el uso de servicios públicos y especializados en campos como la
medicina, educación e investigación, servicios bancarios, etc., y últimamente orientados al
turismo integrando tecnologías como los sistemas GIS.
Acceso a la web
Cuando se habla de Web Móvil se está haciendo referencia a una web en la que el
usuario puede acceder a la información desde cualquier lugar, independientemente del tipo de
dispositivo que utilice para ello. Actualmente es posible acceder desde un dispositivo móvil al
contenido web, pero existen bastantes imitaciones: la mayoría de los móviles que hay en el
mundo no son muy avanzados, son muy simples, tienen teclados y pantallas pequeñas, y
cuentan con navegadores muy simples también. Además existen otros problemas tales como
el escaso ancho de banda que pueden usar.
Actualmente los desarrolladores tienen que diseñar versiones de las páginas webs
accesibles desde el dispositivo móvil con el fin de mejorar la velocidad de carga de la web,
adaptarla a las dimensiones de cualquier móvil sin perder calidad, y mejorar la usabilidad de la
interfaz de forma que sea lo más intuitiva posible. Después se alojan en dominios o
subdominios destinados para este tipo de webs, como el subdominio m. No se trata de
miniaturizar el contenido para mostrarlo sin más en pequeños displays, algo sencillo aplicando
estándares web, sino adaptarlo a un contexto móvil: es decir, movilizar el contenido. Se
pueden ver los siguientes ejemplos:





m.Facebook.com
m.Twitter.com
m.Yahoo.com
m.Gmail.com
m.Ask.com
Ilustración 1: Página de Facebook versionada para dispositivos móviles.
4
Recuperación de información con dispositivos móviles
Por su parte el WC3 (Consorcio del World Wide Web) ha puesto en marcha la Iniciativa
de Web Móvil que busca resolver los problemas de interoperabilidad y usabilidad que
actualmente dificultan el acceso a la Web desde dispositivos móviles y hacer posible uno de los
objetivos principales del W3C que consiste en alcanzar una Web única, sin tener que realizar
versiones.
Recuperación de información espacial
Actualmente ya se han desarrollado sistemas de Recuperación de Información en los
que se ha integrado el contexto geográfico.
Con el conocimiento de su localización, el usuario del dispositivo móvil es capaz de
realizar peticiones de información que dependan de la localización espacial. Para ello el
sistema de Recuperación de Información debe ser capaz de reconocer la información de
contexto presente en las páginas web (si incluye un código postal, un nº de teléfono, etc.),
además de explorar la información geográfica que se puede extraer del dispositivo móvil. Para
saber la información espacial del dispositivo se usa el sistema GPS (Sistema de
posicionamiento Global), el cual es un sistema global de navegación por satélite que permite
determinar en todo el mundo la posición de un objeto. Así se devolverán al usuario sólo las
páginas web que sean relevantes atendiendo a su posición actual.
Se puede observar, por ejemplo el sistema “Geotumba” (1), buscador geográfico de
información web. En este sistema se precisa de:


La representación del contexto geográfico del usuario, y del contexto geográfico de su
necesidad de información en el dispositivo móvil. Por ejemplo: si el usuario quiere
buscar los restaurantes que se encuentran cerca de su localización actual.
La identificación del contexto para cada página web. Esta función se delega al servidor
que contiene la información.
Ilustración 2: Aplicación de Geotumba, captura de las coordenadas geográficas.
5
Recuperación de información con dispositivos móviles
Bibliotecas digitales en los móviles
En un ambiente de cómputo móvil, donde uno de los objetivos principales es el
obtener y consultar información de manera instantánea de una manera eficiente, desde
cualquier lugar, en cualquier momento y en cualquier dispositivo, los servicios normalmente
ofrecidos en las bibliotecas digitales deben ser redefinidos, así como incluir otros servicios. Las
bibliotecas digitales cuentan con servicios que de manera general se pueden agrupar en
categorías como búsquedas, navegación, acceso de usuarios registrados, y administración de
las mismas. Cambiar a un ambiente móvil implica contemplar otros servicios que actualmente
no están presentes en el uso tradicional de las bibliotecas digitales. Por ejemplo, la navegación
por voz es una característica con la que ya cuentan muchos dispositivos móviles, y la ubicación
de usuarios es una característica que facilitan los sistemas GPS, como ya se ha mencionado en
el apartado anterior.
En el caso de las bibliotecas digitales se usa el modelo de cliente-proxy-servidor. El
proxy se puede visualizar como un proceso que se encarga de hacer un procesamiento
intermedio entre el cliente y el servidor. Este procesamiento consiste en la transformación del
contenido para visualización en beneficio del cliente. La comunicación entre el cliente móvil, el
proxy y el servidor de biblioteca digital se debe realizar a través de parámetros. Los
parámetros entre el cliente móvil y el proxy deben ser enviados usando el protocolo WAP y
WML (2), y los parámetros entre el proxy y el servidor de biblioteca digital, deben ser enviados
usando algún formato de representación estándar de datos, como XML. El proxy está
conformado por dos módulos principales: el transcoder y el adaptador de contenido. De
manera general, el transcoder hace las operaciones de conversión y el adaptador de contenido
decide cómo hacerlas valiéndose de varios parámetros y servicios.
Ilustración 3: Flujo de la información en una búsqueda.
6
Recuperación de información con dispositivos móviles
Recuperación de datos en diversos campos (medicina, agricultura, economía, etc.)
Trabajar en un determinado lugar, como puede ser un hospital, requiere movilidad y
coordinación. Es debido a la complejidad de las tareas a realizar, a la necesidad de intercambio
de información, y a que tanto la información como los recursos se encuentra distribuidos. El
uso de computadoras de mano y PDAs, inalámbricos conectados a un
Sistema de Información significa una mejora de la disponibilidad de información.
La funcionalidad del sistema se puede ilustrar con un simple escenario: Un médico
tiene a un paciente con neumonía, y quiere comprobar los datos de otro paciente que tuvo los
mismos síntomas para saber cómo actuó en aquel caso, pero resulta que su computadora se
encuentra en otro piso. Por lo tanto usa su PDA, que se encuentra conectada al servidor de
información del Hospital, para realizar la consulta. También podría querer consultar artículos
científicos en los que se hable del periodo de administración del tratamiento. Por lo tanto el
sistema debe almacenar tanto los datos e historial de los pacientes como artículos científicos
del ámbito de la medicina.
En estos sistemas de recuperación de información también es común el modelo de
cliente-proxy-servidor. Se desarrolla el software de cliente para la PDA de tal forma que se
pueda comunicar con un servidor proxy que, a su vez, se comunica con el depósito de datos a
través de un servlet. Se usa la interfaz de comunicación inalámbrica de la PDA para
comunicarse con el servlet en el servidor proxy. De esta forma se tiene un control total sobre
la interfaz de usuario, y la totalidad de las consultas son realizadas en el servidor. El cliente
transmite al servidor solo los datos necesarios para realizar estas consultas y espera que se
muestren los resultados. Por lo tanto sólo los datos locales son almacenados en el dispositivo
móvil.
Ilustración 4: Ejemplo de recuperación de información en un Sistema de Información de un Hospital.
7
Recuperación de información con dispositivos móviles
Recuperación de información en imágenes
Hoy en día los dispositivos móviles con cámara se han vuelto muy populares. Con la
tecnología adecuada, estos móviles pueden convertirse en un sistema de recuperación de
información muy potente. Actualmente se han desarrollado aplicaciones que permiten realizar
consultas en la Web en base a una imagen capturada mediante la cámara del dispositivo. Lo
que se pretende es, contando con una imagen de la que se quiere conocer más información
(por ejemplo la fotografía de una obra de arte de la que se busca el nombre), se recuperan en
la Web las imágenes que más se acerquen. También es posible contar con algún tipo de
información textual que puede ayudar a la consulta.
En los siguientes apartados se describe más detalladamente este método de
recuperación de información en dispositivos móviles.
Entorno experimental
Como ya se comentó anteriormente la recuperación de información a través de
teléfonos móviles y más concretamente información gráfica es muy demanda por los usuarios
de dichos dispositivos. Se estudiará un artículo relacionado que realiza nuevas aportaciones al
mundo de la recuperación de información vía dispositivos móviles, por ello, y por el gran
interés que ha despertado en los componentes del grupo, se ha analizado específicamente.
El artículo se titula “Scene recognition with camera phones for tourist information
access” (3) que traducido al español significa “Reconocimiento de escenas con teléfonos con
cámaras para el acceso a la información turística”. En él se explica cómo se ha creado un
sistema el cual recibiendo una foto te devuelve información del lugar donde se encuentra
dicha escena.
A continuación se entra en detalle en el entorno de desarrollo, los datos o bases de
datos utilizadas y en el funcionamiento del sistema descrito.
Scene recognition with camera phones for tourist information
access
¿Qué rodea la investigación?
Se explica en el artículo que, hasta el momento de su publicación, existían proyectos
como por ejemplo uno llamado AGAMENON que utilizaba móviles con cámaras para mejorar
las visitas de sitios arqueológicos y museos, este se basaba el reconocimiento de un contorno
determinado dentro de la imagen para reconocer el sitio o el objeto dentro de un museo tenía.
Dicho sistema tenía 95% de aciertos pero solo tenía como base imágenes de dos sitios y cuatro
objetos distintos.
Otro sistema con el que se compara es IDeixis que está orientado a encontrar páginas
web que pueden ser útiles para el usuario basado en imágenes que el mismo mande a través
8
Recuperación de información con dispositivos móviles
de su teléfono móvil. Pero probando dicho sistema de una base de datos de 12000 fotos de 50
pruebas solo acertó en 3 casos.
Sistema propuesto
La novedad que propone el artículo es el reconocimiento de una imagen
independientemente de la calidad de la misma y la búsqueda de información de dicha imagen
reconocida. Dicho sistema se ha denominado SNAP2TELL y ha sido desarrollado en un
dispositivo móvil Nokia N80 una única base de datos STOIC 101 y un algoritmo que usa un
patrón de discriminación para el aprendizaje y reconocimiento de una escena con una serie de
características locales.
Ilustración 5 sistema SNAP2TELL
ARQUITECTURA DE SNAP 2TELL
El prototipo se ha implementado como arquitectura cliente/servidor/Base de datos. Se
ha desarrollado en Java sobre un Nokia N80 que tiene funcionalidad de tomar fotos y enviarlas
a un servidor. Los resultados recibidos son tanto la imagen reconocida de la escena y un texto
descriptivo.
Ilustración 6 Ejemplo de consulta y valor devuelto
BASE DE DATOS STOIC 101
9
Recuperación de información con dispositivos móviles
Consiste en una colección de 5278 imágenes de Singapur tomadas desde distintos
ángulos y distinta luminosidad obteniendo unas 16 imágenes por escena.
RECONOCIMIENTO DE ESCENAS USANDO PARTES DISCRIMINATIVAS
En el artículo proponen un nuevo patrón de reconocimiento basado en obtener las
partes de la imagen diferencie a esa imagen de otra. Esa estrategia de selección genera partes
de las imágenes que sirven para el entrenamiento y posterior aprendizaje del sistema.
Resultados obtenidos
A continuación se presentan los resultados obtenidos sobre el sistema de identificación de
sitios turísticos:
Scene recognition with camera phones for tourist information access
Para evaluar el sistema se utilizará la base de datos STOIC 101, usando 90 clases de
escenas, cada una de ellas con 5 imágenes de entrenamiento además se tendrá un conjunto
independiente de prueba con 110 imágenes. Reseñar también que todas las imágenes han sido
redimensionadas a 320x240.
Se observa que las características más relevantes a la hora de reconocer escenas son
los bordes y el color. En la siguiente tabla se mostrará los resultados de los efectos al aplicar
las características color y bordes, además de las escalas pertinentes. Si se analizan los
resultados se verá como la característica color juega un papel más importante que la
característica borde.
Contándose el tiempo medio empleado desde que se envía la imagen, hasta que se
recibe la información solicita, usando para ello la tecnología Bluetooth es de 11 segundos.
Se adjunta una nueva tabla en la que se podrá observar una cierta mejoría en los
resultados, obteniendo como máximo un 92% por un 88% obtenido en la tabla anterior. Esta
mejora viene producida por la inclusión de información adicional, usando para ello un GPS,
que aporta la localización actual del dispositivo.
10
Recuperación de información con dispositivos móviles
Líneas de investigación actuales
Hoy en día se sigue avanzando en el sector de recuperación en dispositivos móviles,
exponemos un resumen de las encontradas en (4):







Resúmenes automáticos y personalización de la información móvil.
Adaptación de contenido para dispositivos pequeños.
Recuperación de datos móviles basados en la extracción de contenido, indexación y
anotación.
Minería de datos de log de consultas o clicks realizados y de tráfico web en dispositivos
móviles.
Modelos de recuperación eficientes y de procesamiento de consultas de información
móviles de bases de datos distribuídas,
Propagación de información mediante dispositivos móviles
Recuperación de información de distinto tipo.
Conclusiones
Como ya se ha mencionado a lo largo del trabajo, la recuperación de información en
dispositivos móviles cada vez está cobrando más protagonismo y cada vez son más las cosas
que se pueden realizar desde un simple móvil o una pda. El acceso a la web da accesibilidad a
multitud de sistemas de recuperación de información, que pueden tanto para ocio
(recuperación de información turística) como para temas laborales (recuperación de
información para médicos).
Se han presentado tanto las técnicas actuales como los sistemas y líneas de
investigaciones abiertas. Es seguro que cada vez habrá más personas trabajando en la
realización de estos tipos de sistemas ya que llegarán a ser lo más demandados en un futuro
no muy lejano.
11
Recuperación de información con dispositivos móviles
Bibliografía
1. Mobile Geotumba: Geographic information retrieval system for mobile devices. Freitas,
Sergio, Afonso, Ana Paula y Silva, Mario.
2. http://es.wikipedia.org/wiki/Wireless_Markup_Language. [En línea]
3. SCENE RECOGNITION WITH CAMERA PHONES FOR TOURIST INFORMATION ACCESS. JooHwee, Lim, y otros. 2007, ICME.
4. Photo-to-Search: Using Multimodal Queries to Search. Xin, Fan, y otros.
5. http://www.w3c.es/Divulgacion/GuiasBreves/webmovil. [En línea]
6. http://www.elmundo.es/navegante/2008/05/27/tecnologia/1211846698.html. [En línea]
7. http://www.elmundo.es/navegante/2008/05/27/tecnologia/1211846698.html. [En línea]
8. MODELO DE ACCESO MÓVIL A BIBLIOTECAS DIGITALES. RAMÍREZ ARELLANO, ALDO
ANTONIO. 2004.
9. http://www.alzado.org/articulo.php?id_art=668. [En línea]
12
Descargar