Blog

[Antisèche] Web profond : plongez dans la face cachée d'Internet

2

Derrière les termes Web  se cache une multitude sites qui ne sont pas forcément visibles ni accessibles au grand public. Alors qu’est-ce qui reste enterré dans les profondeurs du Web ? Qui s’y cache et pour quelles raisons ? L’antisèche d’RSLN vient répondre à ces questions. 

Vous avez parfois l’impression qu’une recherche sur Internet s’apparente à jeter un filet dans l’océan, pour reprendre l’analogie du fondateur de BrightPlanet Mike Bergman ? Et pour cause, toutes les informations ne sont pas si facilement accessibles. 

Commençons d’abord par rappeler que le Web est constitué de différentes couches, la première – et la plus visible – étant celle accessible depuis les moteurs de recherche dont les robots scrutent la toile. Ils référencent ainsi les pages statiques liées à d’autres pages. Mais il en existe d’autres plus secrètes, parfois même cachées sous la surface.

La face cachée de la toile

Il s’agit du « web profond », aussi appelé « web invisible », c’est-à-dire un Web non indexé par les moteurs de recherche.  

Loin d’être anecdotique, il représente en vérité la grande majorité des pages présentes sur Internet. Il n’existe pas de statistiques officielles concernant la part que représentent ces contenus sur la toile, toutefois, Mike Bergman, dont l’entreprise crée des logiciels permettant de scruter et d’analyser les profondeurs du web, estime qu’ils seraient 500 fois plus nombreux qu’en surface. Un phénomène qu’il représente de la manière suivante :

Dans ce Web invisible se superposent différentes autres couches. On parle ainsi de « Web opaque » s’agissant des contenus Web qui pourraient potentiellement être indexés mais qui ne le sont pas. Plusieurs raisons peuvent expliquer ce phénomène : la complexité de la conception des pages, la nécessité d’une authentification… 

On considère d’un autre côté le web privé comme les pages web dont l’accès aux robots des moteurs de recherche est refusé par l’administrateur. De fait, il est impossible d’y avoir accès par leur biais mais le site peut rester accessible aux internautes, comme c'est le cas pour les sites des campus d'universités par exemple. 

Que se passe-t-il dans le « Web profond » ?

Mais que se passe-t-il précisément sur le « web profond » ? Outre les échanges les plus illégaux et les plus immoraux du terrifiant « Dark Web », le « web profond » est un espace de création incroyable ayant créé ses propres outils en ligne. 

Hidden Wiki y prend ainsi la place de Wikipédia, et Torgle celle des moteurs de recherche. Mais s’y développent aussi des objets web nouveaux tel que Silk Road, la place de marché qui met en contact acheteurs et vendeurs de manière anonyme. Celle-ci mobilise par ailleurs le bitcoin, monnaie électronique autonome qui n’est soumise à aucune réglementation du système monétaire international.

N’importe quelle marchandise peut donc faire l’objet d’un échange, jusqu’aux plus illégales notamment les armes qui ont ensuite été bannies des transactions. 

 

Un point commun à ces différentes pratiques mérite d’être soulevé : l’utilisation du réseau Tor ou « le routeur oignon ». Celui-ci se compose de « couches » successives de routeurs permettant de naviguer anonymement.

Autre objet surprenant présent dans le « web profond » : la bibliothèque en ligne d’Alexandrie. Une bibliothèque crowdsourcée qui permet à chaque internaute de déposer le livre qu’il souhaite et de récupérer celui qu’il veut.

De quoi relativiser la vision anxiogène du « Web profond » comme « l’espace d’échange privilégié des criminels ».

2 Comments


NP

Marrant, à lire aussi sur le deep web (LeTemps.ch, 24 août) : www.letemps.ch/.../20000_lieues_sous_Google (abonnement gratuit)

le 29 August 2013
hollande

comment se connecter a la bibliothèque en ligne d'Alexandrie?

le 29 August 2013

Pingbacks and trackbacks (1)+

Ajouter un commentaire


Loading
biuquote
  • Comment
  • Preview

S'abonner à la newsletter

Votre adresse email sera uniquement utilisée pour vous envoyer la newsletter de RSLN. Microsoft ne l'utilisera pour aucune autre communication, qu'elle soit commerciale ou institutionnelle. Microsoft ne vend ni ne loue ses listes d'abonnées à des tiers.