Server

Anuncio
Introducción a la indización de Web
Introducción
World Wide Web es una parte de Internet que permite a los clientes publicar y consumir información
rápida, eficaz y fácilmente. El Web define y asume un sencillo protocolo estándar de comunicaciones que
permite a los clientes compartir una amplia variedad de tipos de datos, como texto, sonidos, imágenes e
incluso vídeo.
El Web está compuesto de millones de documentos que contienen vínculos especiales que apuntan a otros
documentos. A estos vínculos se les conoce como localizadores uniformes de recursos o direcciones URL y
pueden apuntar a documentos almacenados en el equipo local o en cualquier otro equipo conectado a
Internet. Hay dos tipos de programas que hacen que funcione el Web, servidores Web y exploradores de
Web. Un servidor Web se ejecuta en un equipo y acepta y atiende peticiones de exploradores de Web. Los
servidores Web no proporcionan ninguna interfaz de usuario para los usuarios, son el código de
canalización que carga documentos y los entrega a los exploradores de Web. Un explorador de Web es un
programa ejecutado por los usuarios en sus equipos locales. El explorador de Web interpreta las direcciones
URL dentro de un documento Web y se pone en contacto con el servidor Web que almacena ese
documento. El explorador pide el documento al servidor y a continuación lo muestra en pantalla al usuario.
Debido a la facilidad de uso y al rico contenido que proporciona el Web, el tráfico en Internet ha
aumentado enormemente en los últimos años. Se estima que casi la mitad de todo el tráfico en Internet está
relacionado ahora con el Web. Al mismo tiempo la cantidad de información disponible en el Web ha
crecido igual de rápido si no más.
Indización de Internet
Para atender esta explosión de información y ayudar a los usuarios a encontrar la información que
necesitan, han aparecido varios sitios de indización de Internet. Algunos ejemplos de estos sitios son
http://www.yahoo.com,
http://altavista.digital.com
y
http://www.excite.com. Estos sitios son eficaces sistemas que buscan información en Internet e
indizan los contenidos de texto. Estos sitios de indización permiten a los usuarios exponer consultas sobre
los índices para buscar sitios y documentos que traten los temas en los que están interesados.
Por ejemplo, un usuario puede estar interesado en la epilepsia. Una consulta sobre epilepsia en
http://www.lycos.com devuelve el siguiente documento del Web (entre otros):
CORTEZA CEREBRAL DE TORTUGA Y EPILEPSIA
Epilepsia experimental en el cerebro in vitro de tortuga.
La epilepsia es una entidad clínica que se caracteriza por la ocurrencia de crisis.
http://iibce.edu.uy/neurofisiologia/tortuga.htm
Este tipo servicio de indización y búsqueda hace que World Wide Web sea un recurso mucho más útil al
permitir a los usuarios encontrar la información que necesitan a través de todos los documentos del Web.
Sin un mecanismo de indización y búsqueda, los usuarios estarían obligados a adivinar qué sitios son útiles
e interesantes y, a continuación, examinar los sitios, esperando encontrar referencias a la información que
necesitan.
Indización de intranet
A medida que estos sitios de indización de Internet se hicieron más populares, otros sitios individuales
vieron el valor de la indización y búsqueda de contenidos y comenzaron a ofrecer los mismos servicios
acerca de su propia información local. Los primeros servicios eran implementaciones personalizadas, pero
pronto el software de servidor Web comenzó a proporcionar servicios de indización y búsqueda como otra
característica del servidor.
Muchas corporaciones están creando ahora Web internos para proporcionar documentos a sus empleados
con la misma facilidad de utilización que el World Wide Web. Como las corporaciones producen
cantidades enormes de información, también necesitan aprovechar la tecnología de indización y búsqueda
para ayudar a sus usuarios a encontrar los documentos correctos rápidamente.
Index Server
Index Server es la solución de indización y búsqueda de contenidos de Microsoft para Microsoft Internet
Information Server (IIS). Indiza el texto completo y las propiedades de los documentos almacenados en un
servidor IIS. Permite al administrador (o a cualquier usuario familiarizado con los documentos de Web)
crear sencillos formularios de consulta. Index Server se puede utilizar para proporcionar servicios de
indización tanto para intranet corporativas como para sitios en Internet.
Descargar