Vu sur le web

Ouverture des données : un retard français ?

0

Après le lancement de la plateforme data.gouv.fr en décembre dernier, la mission Etalab est entrée dans une seconde phase de développement en lançant Dataconnexions, un programme d’incitation à réutiliser des données publiques doté d’une enveloppe de 600 000 euros. Les innovateurs de tous horizons sont invités à participer à l’aventure de l’Open data, à travers quatre concours qui doivent récompenser des projets à forte valeur culturelle, économique, pédagogique, écologique ou citoyenne. 

A cette occasion, le cabinet d'études Qunb a dévoilé les résultats d'une intéressante étude comparative des données disponibles sur les plateformes française, anglaise et américaine.

Premier constat : même si notre plateforme revendique plus de 350 000 fichiers de données, l'analyse ne porte que sur les 4114 fichiers considérés comme uniques - le site comporte en effet beaucoup de doublons.

Voici les principaux enseignements de cette étude :

> Des domaines d'application(s) variés

Les données publiques des trois pays ne s'adressent pas aux mêmes secteurs : quand la France privilégie les données économiques (budget de l'Etat, production agricole...), les Etats-Unis mettent le paquet sur les données géographiques (comme la densité de population ou les prix de l'immobilier). Le Royaume-Uni, quant a lui, dispense beaucoup d'informations sur la santé et la démographie.

 

> La qualité des données reste une gageure

Pour faciliter la réutilisation des données, leur qualité est un enjeu majeur. Elle se mesure à deux choses : le niveau de structuration, et l'obsolescence

Concernant la structuration des données, l'étude distingue trois niveaux de qualité des données disponibles sur les plateformes :

- Les données structurées sont immédiatement utilisables. Elles représentent le tiers de la plateforme américaine, ce qui est une très bonne performance.

- Les données semi-structurées nécessitent, pour être opérationnelles, quelques efforts de traitement et de nettoyage des tableaux et des fichiers. C'est la forme sous laquelle on trouve l'écrasante majorité des données françaises.

- Les données non structurées sont comme une boite remplie d'outils, mais tellement mal rangés que vous ne retrouverez jamais le bon tournevis quand vous en avez besoin : parfaitement inutile.

Alors, quelles sont les performances de nos trois pays en la matière ? La qualité de leurs données se donne à voir dans le diagramme ci-dessous :

L'étude permet de distinguer les bons des mauvais élèves parmi les principaux fournisseurs de données : par exemple, les services du Premier ministre sont le premier distributeur de données structurées de la plateforme française. Le Ministère de l'Education nationale obtient le bonnet d'âne, en étant parmi les plus gros fournisseurs de données non structurées.

Concernant l'obsolescence, une comparaison entre la France et le Royaume-Uni montre que les données britanniques pourraient bien être plus utiles que les nôtres, car elles sont plus à jour

> Des données pour quelles innovations ?

La fin de la présentation donne quelques exemples des applications développées avec les données des différentes plateformes. On peut les regrouper en formulant les questions auxquelles elles permettent de répondre :

- Culture et loisirs : Quelle est la meilleure balade à vélo ? Où puis-je planter ma tente ? 

- Sécurité : Quels sont les crimes autour de chez moi ?

- Promotion de la transparence : combien gagne le directeur adjoint du British Museum ?

- Suivi des travaux de la législature : quels sont les projets de loi en cours de discussion ?

- Sous-veillance : où va l'argent de mes impôts ?

Vous voulez en savoir plus ? Retrouvez le détail de l'étude dans la présentation ci-dessous :

> Pour aller plus loin

Tommy Pouilly le 11/07/2012
Tommy
Tommy Pouilly le 11/07/2012
Photographie : RSLN #9

Ajouter un commentaire


Loading
biuquote
  • Comment
  • Preview

S'abonner à la newsletter

Votre adresse email sera uniquement utilisée pour vous envoyer la newsletter de RSLN. Microsoft ne l'utilisera pour aucune autre communication, qu'elle soit commerciale ou institutionnelle. Microsoft ne vend ni ne loue ses listes d'abonnées à des tiers.