Recuperación de información con dispositivos móviles Sergio Cala Cordero Sonia Valenciano Rufet Antonio Ángel González Jiménez Claudia Falcón Borrero 26/01/2010 Recuperación de información con dispositivos móviles ÍNDICE Introducción ................................................................ 3 Resumen -Abstract ..................................................... 3 Técnicas y métodos actuales ....................................... 3 Entorno experimental .................................................. 8 Resultados obtenidos .................................................. 10 Líneas de investigación actuales .................................. 11 Conclusiones ................................................................ 11 Bibliografía ................................................................... 12 2 Recuperación de información con dispositivos móviles Introducción Estamos en un mundo dónde cada vez las necesidades de información son cada vez mayores, cada vez se demanda más la información móvil, accesible y disponible desde cualquier dispositivo y desde cualquier lugar. Este trabajo pretende analizar la recuperación de la información en dispositivos móviles. Se presentarán técnicas y métodos actuales, en recuperación de información de imágenes, acceso a web vía dispositivos móviles, bibliotecas digitales en dispositivos móviles y recuperación de información específicos (medicina, agricultura, economía). Se estudiará en más detalle un sistema experimental de recuperación de información turística. Serán mencionadas las líneas de investigación futuras abiertas y finalmente se concluirá el trabajo con las conclusiones del mismo. Abstract This world every time information needs are increasing, there is increasing demand for mobile information more accessible and available from any device, anywhere. This work analyzes the information retrieval on mobile devices. Techniques and current methods will be presented in image retrieval, web access via mobile devices, mobile digital libraries and information retrieval purposes (medicine, agriculture, economy). Be studied in more detail an experimental system for retrieval of tourist information. Will be referred to future research lines open and finally completed the work with the conclusions. Técnicas y métodos actuales La proliferación de la tecnología inalámbrica y de dispositivos móviles como las PDAs y los teléfonos móviles ha generado una gran demanda de contenidos de información móviles, así como de técnicas efectivas de Recuperación de Información para estos dispositivos. Se hace necesario el uso de nuevas tecnologías para la representación, modelado, indexación y recuperación de datos móviles. Actualmente existen diversas técnicas para permitir esto. Algunas se centran en el desarrollo de aplicaciones específicas en los dispositivos móviles. Otras se enfocan a la modificación de las aplicaciones del lado de los servidores que contienen la información. Y otras más desarrollan elementos intermedios entre el cliente móvil y el servidor de la aplicación. El uso de una técnica u otra depende del tipo de aplicación del que se esté tratando para obtener un buen rendimiento. Este apartado se centra en describir brevemente los distintos métodos de Recuperación de Información que existen actualmente para dispositivos móviles. Hoy en día, las principales áreas de desarrollo son de entretenimiento, siendo las menos las que involucran 3 Recuperación de información con dispositivos móviles aspectos relevantes como el uso de servicios públicos y especializados en campos como la medicina, educación e investigación, servicios bancarios, etc., y últimamente orientados al turismo integrando tecnologías como los sistemas GIS. Acceso a la web Cuando se habla de Web Móvil se está haciendo referencia a una web en la que el usuario puede acceder a la información desde cualquier lugar, independientemente del tipo de dispositivo que utilice para ello. Actualmente es posible acceder desde un dispositivo móvil al contenido web, pero existen bastantes imitaciones: la mayoría de los móviles que hay en el mundo no son muy avanzados, son muy simples, tienen teclados y pantallas pequeñas, y cuentan con navegadores muy simples también. Además existen otros problemas tales como el escaso ancho de banda que pueden usar. Actualmente los desarrolladores tienen que diseñar versiones de las páginas webs accesibles desde el dispositivo móvil con el fin de mejorar la velocidad de carga de la web, adaptarla a las dimensiones de cualquier móvil sin perder calidad, y mejorar la usabilidad de la interfaz de forma que sea lo más intuitiva posible. Después se alojan en dominios o subdominios destinados para este tipo de webs, como el subdominio m. No se trata de miniaturizar el contenido para mostrarlo sin más en pequeños displays, algo sencillo aplicando estándares web, sino adaptarlo a un contexto móvil: es decir, movilizar el contenido. Se pueden ver los siguientes ejemplos: m.Facebook.com m.Twitter.com m.Yahoo.com m.Gmail.com m.Ask.com Ilustración 1: Página de Facebook versionada para dispositivos móviles. 4 Recuperación de información con dispositivos móviles Por su parte el WC3 (Consorcio del World Wide Web) ha puesto en marcha la Iniciativa de Web Móvil que busca resolver los problemas de interoperabilidad y usabilidad que actualmente dificultan el acceso a la Web desde dispositivos móviles y hacer posible uno de los objetivos principales del W3C que consiste en alcanzar una Web única, sin tener que realizar versiones. Recuperación de información espacial Actualmente ya se han desarrollado sistemas de Recuperación de Información en los que se ha integrado el contexto geográfico. Con el conocimiento de su localización, el usuario del dispositivo móvil es capaz de realizar peticiones de información que dependan de la localización espacial. Para ello el sistema de Recuperación de Información debe ser capaz de reconocer la información de contexto presente en las páginas web (si incluye un código postal, un nº de teléfono, etc.), además de explorar la información geográfica que se puede extraer del dispositivo móvil. Para saber la información espacial del dispositivo se usa el sistema GPS (Sistema de posicionamiento Global), el cual es un sistema global de navegación por satélite que permite determinar en todo el mundo la posición de un objeto. Así se devolverán al usuario sólo las páginas web que sean relevantes atendiendo a su posición actual. Se puede observar, por ejemplo el sistema “Geotumba” (1), buscador geográfico de información web. En este sistema se precisa de: La representación del contexto geográfico del usuario, y del contexto geográfico de su necesidad de información en el dispositivo móvil. Por ejemplo: si el usuario quiere buscar los restaurantes que se encuentran cerca de su localización actual. La identificación del contexto para cada página web. Esta función se delega al servidor que contiene la información. Ilustración 2: Aplicación de Geotumba, captura de las coordenadas geográficas. 5 Recuperación de información con dispositivos móviles Bibliotecas digitales en los móviles En un ambiente de cómputo móvil, donde uno de los objetivos principales es el obtener y consultar información de manera instantánea de una manera eficiente, desde cualquier lugar, en cualquier momento y en cualquier dispositivo, los servicios normalmente ofrecidos en las bibliotecas digitales deben ser redefinidos, así como incluir otros servicios. Las bibliotecas digitales cuentan con servicios que de manera general se pueden agrupar en categorías como búsquedas, navegación, acceso de usuarios registrados, y administración de las mismas. Cambiar a un ambiente móvil implica contemplar otros servicios que actualmente no están presentes en el uso tradicional de las bibliotecas digitales. Por ejemplo, la navegación por voz es una característica con la que ya cuentan muchos dispositivos móviles, y la ubicación de usuarios es una característica que facilitan los sistemas GPS, como ya se ha mencionado en el apartado anterior. En el caso de las bibliotecas digitales se usa el modelo de cliente-proxy-servidor. El proxy se puede visualizar como un proceso que se encarga de hacer un procesamiento intermedio entre el cliente y el servidor. Este procesamiento consiste en la transformación del contenido para visualización en beneficio del cliente. La comunicación entre el cliente móvil, el proxy y el servidor de biblioteca digital se debe realizar a través de parámetros. Los parámetros entre el cliente móvil y el proxy deben ser enviados usando el protocolo WAP y WML (2), y los parámetros entre el proxy y el servidor de biblioteca digital, deben ser enviados usando algún formato de representación estándar de datos, como XML. El proxy está conformado por dos módulos principales: el transcoder y el adaptador de contenido. De manera general, el transcoder hace las operaciones de conversión y el adaptador de contenido decide cómo hacerlas valiéndose de varios parámetros y servicios. Ilustración 3: Flujo de la información en una búsqueda. 6 Recuperación de información con dispositivos móviles Recuperación de datos en diversos campos (medicina, agricultura, economía, etc.) Trabajar en un determinado lugar, como puede ser un hospital, requiere movilidad y coordinación. Es debido a la complejidad de las tareas a realizar, a la necesidad de intercambio de información, y a que tanto la información como los recursos se encuentra distribuidos. El uso de computadoras de mano y PDAs, inalámbricos conectados a un Sistema de Información significa una mejora de la disponibilidad de información. La funcionalidad del sistema se puede ilustrar con un simple escenario: Un médico tiene a un paciente con neumonía, y quiere comprobar los datos de otro paciente que tuvo los mismos síntomas para saber cómo actuó en aquel caso, pero resulta que su computadora se encuentra en otro piso. Por lo tanto usa su PDA, que se encuentra conectada al servidor de información del Hospital, para realizar la consulta. También podría querer consultar artículos científicos en los que se hable del periodo de administración del tratamiento. Por lo tanto el sistema debe almacenar tanto los datos e historial de los pacientes como artículos científicos del ámbito de la medicina. En estos sistemas de recuperación de información también es común el modelo de cliente-proxy-servidor. Se desarrolla el software de cliente para la PDA de tal forma que se pueda comunicar con un servidor proxy que, a su vez, se comunica con el depósito de datos a través de un servlet. Se usa la interfaz de comunicación inalámbrica de la PDA para comunicarse con el servlet en el servidor proxy. De esta forma se tiene un control total sobre la interfaz de usuario, y la totalidad de las consultas son realizadas en el servidor. El cliente transmite al servidor solo los datos necesarios para realizar estas consultas y espera que se muestren los resultados. Por lo tanto sólo los datos locales son almacenados en el dispositivo móvil. Ilustración 4: Ejemplo de recuperación de información en un Sistema de Información de un Hospital. 7 Recuperación de información con dispositivos móviles Recuperación de información en imágenes Hoy en día los dispositivos móviles con cámara se han vuelto muy populares. Con la tecnología adecuada, estos móviles pueden convertirse en un sistema de recuperación de información muy potente. Actualmente se han desarrollado aplicaciones que permiten realizar consultas en la Web en base a una imagen capturada mediante la cámara del dispositivo. Lo que se pretende es, contando con una imagen de la que se quiere conocer más información (por ejemplo la fotografía de una obra de arte de la que se busca el nombre), se recuperan en la Web las imágenes que más se acerquen. También es posible contar con algún tipo de información textual que puede ayudar a la consulta. En los siguientes apartados se describe más detalladamente este método de recuperación de información en dispositivos móviles. Entorno experimental Como ya se comentó anteriormente la recuperación de información a través de teléfonos móviles y más concretamente información gráfica es muy demanda por los usuarios de dichos dispositivos. Se estudiará un artículo relacionado que realiza nuevas aportaciones al mundo de la recuperación de información vía dispositivos móviles, por ello, y por el gran interés que ha despertado en los componentes del grupo, se ha analizado específicamente. El artículo se titula “Scene recognition with camera phones for tourist information access” (3) que traducido al español significa “Reconocimiento de escenas con teléfonos con cámaras para el acceso a la información turística”. En él se explica cómo se ha creado un sistema el cual recibiendo una foto te devuelve información del lugar donde se encuentra dicha escena. A continuación se entra en detalle en el entorno de desarrollo, los datos o bases de datos utilizadas y en el funcionamiento del sistema descrito. Scene recognition with camera phones for tourist information access ¿Qué rodea la investigación? Se explica en el artículo que, hasta el momento de su publicación, existían proyectos como por ejemplo uno llamado AGAMENON que utilizaba móviles con cámaras para mejorar las visitas de sitios arqueológicos y museos, este se basaba el reconocimiento de un contorno determinado dentro de la imagen para reconocer el sitio o el objeto dentro de un museo tenía. Dicho sistema tenía 95% de aciertos pero solo tenía como base imágenes de dos sitios y cuatro objetos distintos. Otro sistema con el que se compara es IDeixis que está orientado a encontrar páginas web que pueden ser útiles para el usuario basado en imágenes que el mismo mande a través 8 Recuperación de información con dispositivos móviles de su teléfono móvil. Pero probando dicho sistema de una base de datos de 12000 fotos de 50 pruebas solo acertó en 3 casos. Sistema propuesto La novedad que propone el artículo es el reconocimiento de una imagen independientemente de la calidad de la misma y la búsqueda de información de dicha imagen reconocida. Dicho sistema se ha denominado SNAP2TELL y ha sido desarrollado en un dispositivo móvil Nokia N80 una única base de datos STOIC 101 y un algoritmo que usa un patrón de discriminación para el aprendizaje y reconocimiento de una escena con una serie de características locales. Ilustración 5 sistema SNAP2TELL ARQUITECTURA DE SNAP 2TELL El prototipo se ha implementado como arquitectura cliente/servidor/Base de datos. Se ha desarrollado en Java sobre un Nokia N80 que tiene funcionalidad de tomar fotos y enviarlas a un servidor. Los resultados recibidos son tanto la imagen reconocida de la escena y un texto descriptivo. Ilustración 6 Ejemplo de consulta y valor devuelto BASE DE DATOS STOIC 101 9 Recuperación de información con dispositivos móviles Consiste en una colección de 5278 imágenes de Singapur tomadas desde distintos ángulos y distinta luminosidad obteniendo unas 16 imágenes por escena. RECONOCIMIENTO DE ESCENAS USANDO PARTES DISCRIMINATIVAS En el artículo proponen un nuevo patrón de reconocimiento basado en obtener las partes de la imagen diferencie a esa imagen de otra. Esa estrategia de selección genera partes de las imágenes que sirven para el entrenamiento y posterior aprendizaje del sistema. Resultados obtenidos A continuación se presentan los resultados obtenidos sobre el sistema de identificación de sitios turísticos: Scene recognition with camera phones for tourist information access Para evaluar el sistema se utilizará la base de datos STOIC 101, usando 90 clases de escenas, cada una de ellas con 5 imágenes de entrenamiento además se tendrá un conjunto independiente de prueba con 110 imágenes. Reseñar también que todas las imágenes han sido redimensionadas a 320x240. Se observa que las características más relevantes a la hora de reconocer escenas son los bordes y el color. En la siguiente tabla se mostrará los resultados de los efectos al aplicar las características color y bordes, además de las escalas pertinentes. Si se analizan los resultados se verá como la característica color juega un papel más importante que la característica borde. Contándose el tiempo medio empleado desde que se envía la imagen, hasta que se recibe la información solicita, usando para ello la tecnología Bluetooth es de 11 segundos. Se adjunta una nueva tabla en la que se podrá observar una cierta mejoría en los resultados, obteniendo como máximo un 92% por un 88% obtenido en la tabla anterior. Esta mejora viene producida por la inclusión de información adicional, usando para ello un GPS, que aporta la localización actual del dispositivo. 10 Recuperación de información con dispositivos móviles Líneas de investigación actuales Hoy en día se sigue avanzando en el sector de recuperación en dispositivos móviles, exponemos un resumen de las encontradas en (4): Resúmenes automáticos y personalización de la información móvil. Adaptación de contenido para dispositivos pequeños. Recuperación de datos móviles basados en la extracción de contenido, indexación y anotación. Minería de datos de log de consultas o clicks realizados y de tráfico web en dispositivos móviles. Modelos de recuperación eficientes y de procesamiento de consultas de información móviles de bases de datos distribuídas, Propagación de información mediante dispositivos móviles Recuperación de información de distinto tipo. Conclusiones Como ya se ha mencionado a lo largo del trabajo, la recuperación de información en dispositivos móviles cada vez está cobrando más protagonismo y cada vez son más las cosas que se pueden realizar desde un simple móvil o una pda. El acceso a la web da accesibilidad a multitud de sistemas de recuperación de información, que pueden tanto para ocio (recuperación de información turística) como para temas laborales (recuperación de información para médicos). Se han presentado tanto las técnicas actuales como los sistemas y líneas de investigaciones abiertas. Es seguro que cada vez habrá más personas trabajando en la realización de estos tipos de sistemas ya que llegarán a ser lo más demandados en un futuro no muy lejano. 11 Recuperación de información con dispositivos móviles Bibliografía 1. Mobile Geotumba: Geographic information retrieval system for mobile devices. Freitas, Sergio, Afonso, Ana Paula y Silva, Mario. 2. http://es.wikipedia.org/wiki/Wireless_Markup_Language. [En línea] 3. SCENE RECOGNITION WITH CAMERA PHONES FOR TOURIST INFORMATION ACCESS. JooHwee, Lim, y otros. 2007, ICME. 4. Photo-to-Search: Using Multimodal Queries to Search. Xin, Fan, y otros. 5. http://www.w3c.es/Divulgacion/GuiasBreves/webmovil. [En línea] 6. http://www.elmundo.es/navegante/2008/05/27/tecnologia/1211846698.html. [En línea] 7. http://www.elmundo.es/navegante/2008/05/27/tecnologia/1211846698.html. [En línea] 8. MODELO DE ACCESO MÓVIL A BIBLIOTECAS DIGITALES. RAMÍREZ ARELLANO, ALDO ANTONIO. 2004. 9. http://www.alzado.org/articulo.php?id_art=668. [En línea] 12