Características principales.
- Su información no está contenido en base de datos.
- Es de acceso libre
- No se requiere la realización de un proceso de registro para acceder a la información (formada por páginas web estáticas, es decir páginas formadas por archivos con url fijas o accesibles desde otro enlace).

La Web Invisible o Web profunda
Es toda la información que no se puede recuperar de forma tradicional interrogando a los buscadores convencionales, generalmente es información almacenada y accesible mediante base de datos, parte de la información es invisible a los robots de los buscadores convencionales, ya que los resultados se generan de la contestación a una pregunta directamente mediante páginas dinámicas, es decir páginas que no tienen una url fija y que se construyen en el mismo instante, es decir temporales desapareciendo una ves cerrada la consulta (Es un banco amplio de información ubicado en catálogos, revistas digitales, diccionarios, blogs, contenidos de sitios que demandan login (redes sociales, plataformas educativas, etc.)
4 tipos de contenidos invisibles en la Web.
- La Web opaca. Esta compuesta por archivos que si bien pueden estar incluidos en los indices de los buscadores no lo están, por alguno de los siguientes motivos.
Extensión de la indexación (a veces por economía no todas las páginas de un sitio son indexadas en los buscadores).
Frecuencia de la indexación (los buscadores no poseen la capacidad de indexar todas las páginas existentes, a diario se agregan y modifican mucho y no se puede incluir a todas)
Número máximo de resultados visibles (aunque los motores de búsqueda arrojen un gran numero de resultados generalmente limitan el numero de documentos que se muestran entre 200 y 1000).
Url desconectadas (presentan documentos por relevancia basadas en el número de veces referenciadas en otro, o de la popularidad y número de visitas.
- La Web Privada. Son las páginas web que podrían estar indexadas en los buscadores pero son excluidas deliberadamente porque las páginas están protegidas por contraseña, contienen un archivo robot.txt para evitar ser indexadas, contienen un campo no index para evitar que el buscador pueda indexar la parte correspondiente el cuerpo de la página, contiene en general documentos excluidos deliberadamente por su falta de utilidad ya que son los dueños de la información los que deciden que no se encuentre disponible por lo que difícilmente se podrán mecanismos legítimos para franquear esa barrera.
- La Web propietaria. Es la web donde se requiere registrarse para acceder al contenido.
- La Web realmente invisible. Son páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores( programas ejecutables, archivos comprimidos, páginas dinámicas, información almacenada en base de datos relacionales)
Algunos recursos de búsqueda en la Web profunda.
- The Virtual Library (http://vlib.org/)
- Infoplease (http://www.infoplease.com/index.html)
- Deep Web (http://www.deepwebtech.com/)
- TechXtra (http://techxtra.tradepub.com/)


No Response to "La Web superficial y la Web profunda."
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.