martes, 16 de junio de 2015

Web superficial y Web profunda

Cuando buscamos algo en internet sólo tenemos acceso a una pequeña parte de la información que existe.
La información en la Web puede ser:

La Web Superficial o visible: comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda. Según Lluis Codina debería llamarse red no indizable.

La Web Profunda o invisible: describe toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.

  • Web opaca: compuesta por archivos que no están incluidos en los índices de los buscadores
    • por la la extensión de la indización,
    • por la frecuencia de la indización, 
    • por el número máximo de resultados visibles (entre 200 y 1000) 
    • por ser URL desconectadas.
  • La Web privada: páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos: 
    • las páginas están protegidas por contraseñas. 
    • Contienen un archivo “robots.txt” para evitar ser indizadas. 
    • Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página. 
    • excluidos deliberadamente por su falta de utilidad. 
  • Web propietaria: páginas en las que es necesario registrarse para tener acceso al contenido (gratuito o pagando)
  •  Web realmente invisible son páginas que no pueden ser indizadas por 
    • limitaciones técnicas de los buscadores, 
    • programas ejecutables y archivos comprimidos
    • páginas generadas dinámicamente (que se generan a partir de datos que introduce el usuario)
    • información almacenada en bases de datos relacionales
Recursos de búsqueda en la Web Profunda:


No hay comentarios:

Publicar un comentario