Blog

Le web 3.0, c'est pour quand ?

1

ANTISECHE - On l'imagine beau et intelligent, sachant tout de nous et capable de prévoir nos moindres désirs. Le web 3.0 serait aux données ce que le 2.0 était à nos amis et à notre vie sociale. Mais pour que la chimère devienne réalité, il faut que les développeurs avancent pas à pas, en pragmatiques et sachent raison garder : c'est ce que nous a expliqué Robin Berjon, le consultant en standards web et frenchie au W3C que nous vous avions déjà présenté. Petit point sur la situation. 
 

RSLN : on dit que le web 3.0 sera "sémantique". Qu'est-ce que ça veut dire exactement ?

Robin Berjon : L'idée de base du web sémantique, c'est de mettre en réseau des données qui soient traitables de façon automatique par des ordinateurs. Actuellement le contenu des pages web est orienté vers l'utilisateur, il est fait pour les humains, avec des éléments ergonomiques qui ne sont pas facilement traitables par des machines.

Automatiser tout cela, c'est fabriquer un web de données. On parle d'ailleurs de moins en moins de web sémantique, mais plus de web des données, de linked data. Quant au "web 3.0", il ne correspond tout simplement à rien : c'est peut-être un concept marketing mais ça n'a aucun fondement technique. On ne fait pas des versions du web !   
 

Quand on pense à ce web du futur, on imagine tout un tas de chose formidables... qu'est-ce que ça représente pour toi ?

R.B : La vision classique, c'est que tu dis à ton ordinateur "commande-moi une pizza". Il sait qui tu es, il peut retrouver tes préférences, toutes les pizzerias alentour où que tu sois, retrouver les notes de gens que tu connais et en qui tu as confiance, trouver le restaurant dont la pizza qui a la meilleure note en fonction de tes goûts, la commander et la faire livrer à ton adresse. Un monde où les données sont tellement partout et si accessibles que tu n'as pas de question à te poser.

Ce scénario est inenvisageable dans un futur proche, car il y a encore beaucoup de chemin à faire pour en arriver là. D'abord il faut aller au-delà des données "bêtes". Il faut pouvoir obtenir le contexte de chaque donnée : les données et leur interprétation doivent aller ensemble. Si tu donnes un nom, par exemple celui de Jaurès, la machine doit pouvoir savoir si tu veux parler de l'homme politique, de la station de métro ou du titre d'un livre. Si tu donnes un nombre, il faut savoir à quoi il se réfère. Sur la base de ces informations, on doit pouvoir faire des formes d'inférence ou de recherche. Par exemple, pour trouver toutes les personnes nées le 15 mars dans une liste donnée. Tout ça implique un tas de techniques et de mécaniques. 


Justement, où en est-on dans ce processus ?

R.B : Il y a eu beaucoup de fantasmes. Une bonne partie des développeurs qui bossent en ce moment sur le web sémantique se tirent une balle dans le pied, car il travaillent sur des trucs qui demandent de repartir de zéro. Ils manquent de contact avec la réalité : pour que ça fonctionne il faudrait partir de ce qui existe déjà, en l'augmentant avec des modèles tout simples. Aujourd'hui une grosse partie de la communauté sémantique comprend ça, même si certains - les "ontologistes" - veulent mener le débat très loin avec la description de méta-méta-données.

Tout le système d'ontologies complexes dont on a parlé pendant des années - qui consiste, en gros, à créer un nouveau web plus structuré en parallèle de celui que l'on connaît - va à mon avis disparaître, ou sera utilisé dans des cas particuliers. Par exemple pour des données d'entreprise : ces nouvelles règles d'inférences, c'est intéressant surtout pour des systèmes d'entreprises très complexes.
 

Le web 3.0 serait alors celui que l'on connaît, mais augmenté ? 

Oui. Aujourd'hui on a des données, on a simplement besoin de les traiter de manière plus automatisée. On commence à voir comment faire, mais ça ne va pas être une révolution. Il faudra demander le minimum de changements infrastructurels pour que ça fonctionne.

En fait, c'est plus facile d'obtenir le scénario que j'ai décrit avec des données bien exploitables dans le système existant. Pour moi, l'objectif pragmatique du web sémantique serait de faciliter l'exploitation de données réutilisables. C'est déjà la direction que prennent naturellement les choses. Le web de base est lui-même devenu plus sémantique : il y a beaucoup de données qu'on peut extraire d'une page web de façon automatique.

A l'avenir, on peut imaginer que chacun pourra manipuler des données complexes sans avoir besoin de grandes connaissances en informatique. Si on en arrive là, on aura tellement facilité la tâche des développeurs qu'on y aura déjà gagné quelque chose.
 

Est-ce que le mouvement open data participe de la création de ce web sémantique ?

Le mouvement open data pourrait être parfait pour le web sémantique, mais le problème est que les données ne sont pas au bon format : ce sont en majorité des fichiers Excel, souvent de mauvaise qualité. Pourtant elles sont là, publiées en masse partout dans le monde - et il va bien falloir en faire quelque chose. On ne peut pas demander aux institutions de les convertir elles-mêmes vers de nouveaux formats adaptés au web sémantique : ce serait bien trop cher ! Mais on peut les encourager à continuer de publier leurs données au format CSV, et demander aux développeurs qui souhaitent les utiliser d'ajouter eux-mêmes et de partager les métadonnées qui permettront de mieux les traiter. Ce ne serait pas si difficile car ce travail est crowdsourçable.

Pour que l'open data contribue efficacement au web sémantique, il faudra enfin encourager la publication de données de qualité. Le W3C participe de cette normalisation avec ses standards : les données ouvertes se classent par exemple de 1 à 5 étoiles qui permettent d'évaluer la facilité de leur réutilisation.

Mais le web sémantique ne se nourrit pas que de données ouvertes : nos données personnelles participent énormément au système. De ce côté, il faudra s'occuper d'un problème qui n'a pas été soulevé au moment où l'utopie du web sémantique a été formulée : c'est la question de la confidentialité des données. 

Tommy Pouilly (@5h55) le 22/08/2013
Tommy
Tommy Pouilly (@5h55) le 22/08/2013

1 Comments


Sandrine Delage

Bonjour, votre article est très clair sur un sujet opaque pour beaucoup. Nous l'avons donc cité dans le blog Mère et fille 2.0, qui essaie de démystifier le Web pour les 7-77 ans. Merci beaucoup !
www.digitaltruelife.com/.../...0-3.0-.-soleil.html

le 23 October 2013

Ajouter un commentaire


Loading
biuquote
  • Comment
  • Preview

S'abonner à la newsletter

Votre adresse email sera uniquement utilisée pour vous envoyer la newsletter de RSLN. Microsoft ne l'utilisera pour aucune autre communication, qu'elle soit commerciale ou institutionnelle. Microsoft ne vend ni ne loue ses listes d'abonnées à des tiers.