EDSNBlog → Le web : ce que Google (et les autres) ne vous disent pas.

Le web : ce que Google (et les autres) ne vous disent pas.

12 février 2024

Le web n'est peut-être pas celui que vous croyez. Il regorge de secrets et de surprises. Souvent pour le meilleur, parfois pour le pire, il est un espace d'information d'une taille colossale, dont la majeure partie vous est cachée.

Illustration des couches du web

C’est le matin. L’heure de votre café ou de votre thé. Vous saisissez votre tablette et lancez un navigateur web. Votre moteur de recherche s’affiche et attend que vous saisissiez quelque chose. Pour la plupart d’entre vous, c’est Google qui vous tend les bras. Non pas parce que vous l’avez choisi, mais parce que c’est comme ça. Vous écrivez quelques mots-clés et le moteur de recherche vous retourne une liste de résultats. Vous pensez alors, à juste titre, être sur le web, mais il n’en est rien. En réalité, vous êtes emprisonné dans le royaume de Google ou de l’entreprise qui gère votre moteur de recherche. Ce royaume fait bien partie du web, mais il vous limite à une fraction infinitésimale de son étendue : celle qui est la plus profitable à Google Inc. ou à l’entreprise qui propulse votre moteur de recherche.

Nous ne connaissons pas précisément le volume réel du web. Environ 4 à 5% du web serait référencé par les moteurs de recherches. Alors, voici un petit tour d’horizon.

Le web de surface

L’image de l’iceberg est souvent utilisée pour représenter le web, et je la trouve plutôt cool. Alors, imaginez que vous êtes en bateau et qu’un gigantesque iceberg se dresse devant vous. Vous savez déjà que la partie visible au-dessus de l’eau est minuscule par rapport à sa masse immergée. Cette partie visible correspond au web auquel vous pouvez accéder depuis un navigateur comme Safari, Brave ou DuckDuckGo Browser. Cependant, si vous effectuez une recherche avec un moteur comme Google, vous n’accédez plus à la totalité de cette surface visible, mais seulement à une infime portion, celle qui est la plus rentable pour lui. Les stratégies de référencement (SEO) règnent en maîtres.

Pour explorer l’ensemble de cette surface, il faut délaisser les moteurs de recherche et utiliser des annuaires ou entrer directement l’adresse des sites web que vous souhaitez visiter.

Les annuaires ? Qu’est-ce que c’est ? Pour celles et ceux qui l’ont connu, c’est l’équivalent d’un “bottin téléphonique” numérique. Il prend la forme d’un site référençant des milliers d’autres sites web, généralement classés par thèmes et centres d’intérêt. Contrairement aux moteurs de recherche, les résultats ne sont pas monétisés ni biaisés par des intérêts commerciaux.

Voici quelques annuaires que vous pourriez explorer :

Le web sous la surface

Ce niveau est juste sous la surface. Il est librement accessible et composé principalement de sites “underground”, souvent encore indexés par les moteurs de recherche, mais qui échappent aux classements habituels.

Le web profond (Deep Web)

Le web profond est cette immense partie cachée sous la surface de l’eau. On estime qu’il représente environ 95 % du web. Vous pouvez y accéder avec votre navigateur habituel, mais pas via un moteur de recherche classique. Ce sont des “espaces réservés”, nécessitant des identifiants ou des autorisations spécifiques. Ce niveau comprend des bases de données privées, des archives universitaires, des informations médicales ou bancaires, ainsi que des ressources non indexées.

Le web encore plus profond (Dark Web)

Vous êtes curieux(se) et vous avez décidé de plonger encore plus loin. Vous êtes toujours dans le Deep Web mais la lumière de la surface n’est plus suffisante pour vous éclairer. Vous atteignez le Dark Web. Ici, les lois et les règles ne sont plus vraiment les mêmes. Il vous faut un navigateur spécifique, et dès votre arrivée, vous serez surveillé(e). Des pirates amateurs tenteront peut-être de vous attaquer si vous explorez sans précaution. Pourquoi ? Parce que la technologie du Dark Web ne protège pas les utilisateurs comme le fait le web de surface.

Il est impératif de savoir ce que vous faites ou d’être accompagné(e) par un expert. Antivirus, VPN spécifique, pare-feu et autres mesures de sécurité sont nécessaires. Une fois les menaces les plus basiques évitées, vous resterez toutefois sous surveillance : cyberpolice, pirates plus expérimentés (et beaucoup plus dangereux), acteurs invisibles du web souterrain.

Le Dark Web est une zone d’ombre, non seulement en raison de ce qu’on y trouve, mais aussi par l’anonymat qu’il procure. Certes, on y trouve des activités illégales, mais il sert aussi de refuge à des journalistes et activistes contournant la censure des régimes autoritaires. Aller sur le Dark Web n’est pas illégal en soi.

Au-delà du Dark Web

J’ai hésité à ajouter ce chapitre, mais après tout, nous explorons le web en profondeur, alors allons-y.

Dans notre métaphore de l’iceberg, vous auriez plongé si profondément que vous approcheriez maintenant de sa base. À ce niveau, votre matériel doit être modifié pour pouvoir fonctionner. Techniquement, c’est toujours le Dark Web, mais ici, même les autorités ne s’aventurent plus. C’est un espace très particulier, abritant des projets confidentiels, des intelligences artificielles et des superordinateurs.

Encore plus bas se trouve un des niveaux les plus énigmatiques du web : le Mariana Web. Il porte le nom du fossé océanique le plus profond connu, la fosse des Mariannes, qui atteint plus de 10 kilomètres sous la mer et est considéré e comme l’un des environnements les plus extrêmes sur Terre. Ce niveau hypothétique du web serait accessible uniquement via des algorithmes complexes nécessitant des ressources de calcul considérables, inaccessibles à nos bons vieux ordinateurs au silicium. C’est un espace où résideraient les données les plus sécurisées et les recherches les plus avancées. Mais bien entendu, son existence même est sujette à débat. D’ailleurs, je me suis amusé à interroger GPT-4 sur le sujet:

(…) En résumé, le Mariana Web est plus une notion de folklore internet qu’une réalité tangible.” M’a-t-elle répondu.

D’autres modèles d’IA m’ont simplement affirmé ne rien savoir à ce sujet et l’une d’elles m’a même suggéré que j’avais fait une erreur de frappe. Secret oblige ?

J’espère que vous avez pris plaisir à cette petite incursion dans l’univers fascinant du web !


WebInternetDark WebDeep WebSurface WebMariana WebSécurité informatiqueVie privéeConfidentialitéCybersécurité