Introducción a la indización de Web Introducción World Wide Web es una parte de Internet que permite a los clientes publicar y consumir información rápida, eficaz y fácilmente. El Web define y asume un sencillo protocolo estándar de comunicaciones que permite a los clientes compartir una amplia variedad de tipos de datos, como texto, sonidos, imágenes e incluso vídeo. El Web está compuesto de millones de documentos que contienen vínculos especiales que apuntan a otros documentos. A estos vínculos se les conoce como localizadores uniformes de recursos o direcciones URL y pueden apuntar a documentos almacenados en el equipo local o en cualquier otro equipo conectado a Internet. Hay dos tipos de programas que hacen que funcione el Web, servidores Web y exploradores de Web. Un servidor Web se ejecuta en un equipo y acepta y atiende peticiones de exploradores de Web. Los servidores Web no proporcionan ninguna interfaz de usuario para los usuarios, son el código de canalización que carga documentos y los entrega a los exploradores de Web. Un explorador de Web es un programa ejecutado por los usuarios en sus equipos locales. El explorador de Web interpreta las direcciones URL dentro de un documento Web y se pone en contacto con el servidor Web que almacena ese documento. El explorador pide el documento al servidor y a continuación lo muestra en pantalla al usuario. Debido a la facilidad de uso y al rico contenido que proporciona el Web, el tráfico en Internet ha aumentado enormemente en los últimos años. Se estima que casi la mitad de todo el tráfico en Internet está relacionado ahora con el Web. Al mismo tiempo la cantidad de información disponible en el Web ha crecido igual de rápido si no más. Indización de Internet Para atender esta explosión de información y ayudar a los usuarios a encontrar la información que necesitan, han aparecido varios sitios de indización de Internet. Algunos ejemplos de estos sitios son http://www.yahoo.com, http://altavista.digital.com y http://www.excite.com. Estos sitios son eficaces sistemas que buscan información en Internet e indizan los contenidos de texto. Estos sitios de indización permiten a los usuarios exponer consultas sobre los índices para buscar sitios y documentos que traten los temas en los que están interesados. Por ejemplo, un usuario puede estar interesado en la epilepsia. Una consulta sobre epilepsia en http://www.lycos.com devuelve el siguiente documento del Web (entre otros): CORTEZA CEREBRAL DE TORTUGA Y EPILEPSIA Epilepsia experimental en el cerebro in vitro de tortuga. La epilepsia es una entidad clínica que se caracteriza por la ocurrencia de crisis. http://iibce.edu.uy/neurofisiologia/tortuga.htm Este tipo servicio de indización y búsqueda hace que World Wide Web sea un recurso mucho más útil al permitir a los usuarios encontrar la información que necesitan a través de todos los documentos del Web. Sin un mecanismo de indización y búsqueda, los usuarios estarían obligados a adivinar qué sitios son útiles e interesantes y, a continuación, examinar los sitios, esperando encontrar referencias a la información que necesitan. Indización de intranet A medida que estos sitios de indización de Internet se hicieron más populares, otros sitios individuales vieron el valor de la indización y búsqueda de contenidos y comenzaron a ofrecer los mismos servicios acerca de su propia información local. Los primeros servicios eran implementaciones personalizadas, pero pronto el software de servidor Web comenzó a proporcionar servicios de indización y búsqueda como otra característica del servidor. Muchas corporaciones están creando ahora Web internos para proporcionar documentos a sus empleados con la misma facilidad de utilización que el World Wide Web. Como las corporaciones producen cantidades enormes de información, también necesitan aprovechar la tecnología de indización y búsqueda para ayudar a sus usuarios a encontrar los documentos correctos rápidamente. Index Server Index Server es la solución de indización y búsqueda de contenidos de Microsoft para Microsoft Internet Information Server (IIS). Indiza el texto completo y las propiedades de los documentos almacenados en un servidor IIS. Permite al administrador (o a cualquier usuario familiarizado con los documentos de Web) crear sencillos formularios de consulta. Index Server se puede utilizar para proporcionar servicios de indización tanto para intranet corporativas como para sitios en Internet.