Web invisible

Définition

Le terme de web invisible, aussi appelé web profond ou web caché (deep web ou hidden web en anglais) englobe l’ensemble du web accessible en ligne, mais non répertorié par les moteurs de recherche traditionnels (ou alors « mal » répertorié par ceux-ci). On peut y regrouper entre autres les bases et banques de données, les bibliothèques en ligne, les pages protégées par mot de passe, les intranets, les extranets… On l’oppose au web surfacique.

Enjeux

Le web invisible pourrait représenter un contenu 500 fois plus important que le web classique et de qualité souvent supérieure, ses données étant en général plus contrôlées et souvent validées. Bien que ce ne soit pas une généralité, on y retrouve souvent des données provenant de sources sûres, officielles, universitaires… dont la pertinence n’est pas à mettre en doute et dont le contenu est unique et introuvable ailleurs sur le web, n’ayant pas vocation à être diffusé au grand public. Ces bases de données peuvent être mises en place par des institutions, des entreprises, des universités, des communautés… dans le but de partager certaines informations dans un cadre restreint, limitant parfois l’accès aux tierces personnes par mot de passe. Cependant, un grande part du web invisible reste accessible à tous, mais son utilisation restant souvent une affaire d’initiés ou d’habitués. En effet, les moteurs de recherche ne trouvant pas l’information contenue dedans, il est indispensable pour l’utilisateur d’y accéder par une manipulation supplémentaire, en utilisant par exemple un moteur de recherche interne à la base de données ou en effectuant une navigation personnelle.

Perspectives

Le contenu de ce web invisible apportant des informations supplémentaires, voire complémentaires à celles existant sur le web classique, les utilisateurs auraient tout intérêt à s’y voir faciliter l’accès, notamment par l’intermédiaire de moteurs de recherche. De telles initiatives ont déjà vu le jour, dans un cadre universitaire en premier lieu. Il faut ainsi citer le moteur de recherche allemand BASE développé par l’Université de Bielefeld en Allemagne, qui effectue l’indexation automatique des bibliothèques numériques utilisant le protocole Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH). D’autres projets voient également le jour dans diverses universités de par le monde. Enfin, les moteurs de recherche traditionnels commencent eux aussi à offrir l’accès au web invisible, en proposant de chercher des images, des vidéos, l’actualité, des cartes…cependant, malgré ces avancées leur pénétration dans le web invisible est encore très limitée. Ces différentes initiatives ont pour effet d’estomper les frontières entre web invisible et web surfacique, ce phénomène étant accentué par l’ouverture du contenu des maisons d’édition ou des bibliothèques aux moteurs de recherche classiques. A long terme, le web invisible pourrait se composer exclusivement de contenu protégé par mot de passe, toutes les autres bases de données ayant été mises à disposition du grand public.

Événements


Plus d'événements

Partenaires