La información en la Web puede ser:
La Web Superficial o visible: comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda. Según Lluis Codina debería llamarse red no indizable.
La Web Profunda o invisible: describe toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.
- Web opaca: compuesta por archivos que no están incluidos en los índices de los buscadores
- por la la extensión de la indización,
- por la frecuencia de la indización,
- por el número máximo de resultados visibles (entre 200 y 1000)
- por ser URL desconectadas.
- La Web privada: páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
- las páginas están protegidas por contraseñas.
- Contienen un archivo “robots.txt” para evitar ser indizadas.
- Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página.
- excluidos deliberadamente por su falta de utilidad.
- Web propietaria: páginas en las que es necesario registrarse para tener acceso al contenido (gratuito o pagando)
- Web realmente invisible son páginas que no pueden ser indizadas por
- limitaciones técnicas de los buscadores,
- programas ejecutables y archivos comprimidos
- páginas generadas dinámicamente (que se generan a partir de datos que introduce el usuario)
- información almacenada en bases de datos relacionales

No hay comentarios:
Publicar un comentario