Open data : comment publier les données ?

Open data : comment publier les données ? Société

De plus en plus de collectivités locales envisagent de mettre en ligne leurs données publiques, à l’instar de Rennes et de Paris. Mais une fois la décision prise de se lancer dans le mouvement de l'Open data, d'autres questions subsistent. Nous vous proposons quelques pistes pour réussir au mieux ce lancement.

Tout d'abord, quelles données publier ?

En théorie, la réponse est simple : toutes les données publiques d’une collectivité peuvent être publiées, à l’exception des données nominatives, de celles qui relèvent de la vie privée et de la sécurité. La pratique s’avère beaucoup plus complexe.

D’abord, certaines données sont à la frontière du public et du privé. Se pose ensuite la question de la dangerosité potentielle de certaines informations : les plans des conduites de gaz, par exemple, sont des données publiques… et hautement sensibles à la fois. Une analyse juridique préalable est donc préférable avant toute publication.

Avec quelle licence ?

Le choix de la licence est important pour encourager et protéger en même temps les utilisateurs potentiels. La licence définit ainsi le caractère payant ou gratuit de l’exploitation des données, le degré de liberté accordé aux utilisateurs, les modalités d’accès aux données, ou encore les contraintes pour l’émetteur concernant la mise à jour des données.

Aujourd’hui, plusieurs types de licence coexistent, proposant différents cadres de réutilisation. En complément, l’APIE a élaboré deux modèles de licence type pour les administrations lorsque la réutilisation est soumise à des conditions particulières et/ou au paiement d’une redevance.

Comment publier les données ?

Trois cas de figure sont possibles.

1) Publier les données sous un format facilement accessible

La publication sous la forme de fichiers dits « plats », fichiers Excel par exemple, que l’utilisateur télécharge intégralement. Ce mode de publication convient aux données cartographiques. 

Mais pour les données plus complexes, comme celles qui sont livrées en temps réel (le temps d’attente dans la file d’un musée par exemple), il n’est pas forcément le plus facile à utiliser, notamment par les développeurs qui veulent concevoir des services ou des applications. Ces derniers doivent en effet héberger les données chez eux et les « reprogrammer » avant d’envisager une quelconque exploitation.

2) Publier des API

Pour faciliter le travail des développeurs et les encourager à utiliser les données, il est possible de publier des API (interfaces de programmation) qui vont leur permettre de faire directement des requêtes au sein des données, sans avoir besoin de les télécharger intégralement.

Seul bémol : les API sont spécifiques aux données publiées. En d’autres termes, il existe autant d’API que de jeux de données, ce qui ne va pas dans le sens d’une mutualisation des efforts des développeurs qui voudraient utiliser les données de plusieurs sources différentes.

3) Utiliser un protocole standard

Enfin, on peut avoir recours à un protocole basé sur des standards du web, qui permet d’utiliser le même langage et le même format quelles que soient les structures de données. L’avantage de cette solution, c’est qu’elle permet de développer plus rapidement des applications et favorise l’émergence d’un écosystème de développeurs autour des jeux de données.

Parmi ces protocoles, on peut citer SPARQL, développé par l’organisme de standardisation W3C, ou OData (solution développée par Microsoft, l'éditeur de RSLN, NDLR) adopté, par exemple, par la ville d’Edmonton, au Canada.

Où héberger les données ?

Reste enfin la question de l’hébergement des données. L’Open data suppose une plateforme capable d’héberger un nombre croissant de données et d’applications, totalement sécurisée, accessible à tous et en mesure de supporter de forts pics de trafic. Le nuage s’impose de plus en plus ici comme un partenaire naturel.

« Notre métier, ce n’est pas de faire de l’informatique, encore moins de la maintenance de serveurs, mais de proposer de meilleurs services aux citoyens », explique Chris Moore, le directeur des systèmes d’information d’Edmonton.

Edmonton a ainsi choisi d’héberger les données et les applications hors des serveurs de la ville, en s’appuyant sur les technologies de cloud computing de Microsoft [NDLR : l'éditeur de RSLN]. « Nous voulions aller vite », souligne Chris Moore, qui explique que, grâce à cette solution, trois semaines seulement ont été nécessaires à la publication des premiers jeux de données.

« Le choix d’infrastructures propres aurait été beaucoup trop long et fastidieux. Le cloud nous a semblé une solution naturelle, une manière logique d’étendre notre écosystème en ligne. » 

>> Cet article est issu du prochain numéro de Regards sur le numérique, version papier, qui sera très prochainement disponible en téléchargement en ligne.

> Pour aller plus loin :

 

Dans open data
florence Florence Puybareau le 11/03/2011

On en parle sur Twitter


20 Comments


RomainPouzol

Open data : comment publier les données ? http://j.mp/eFcayo

le 11 March 2011 à 8h31
sylvek

RT @RomainPouzol: Open data : comment publier les données ? http://j.mp/eFcayo

le 11 March 2011 à 8h34
ehooge

Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 2h10
pcrevoisier

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 2h11
emmanuel_guez

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://t.co/QiFurpJ #opendata (via @rslnmag) / @hugovanmalle

le 12 March 2011 à 2h17
AgentNum

Assez MS centré Smile RT @ehooge Quelles données publiques publier ? Et comment les publier ? http://t.co/FJuL56f #opendata (via @RSLNmag)

le 12 March 2011 à 2h32
LiberTIC

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 4h13
actuvisu

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 4h20
angelalvarez

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 4h33
joelmatriche

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 4h42
joelmatriche

"Open data : comment publier les données ?" (RSLN) #opendata #transparency http://goo.gl/LiXe4

le 12 March 2011 à 5h23
nicolaspatte

Choix du protocole, du format, de la licence: quelles données publier, où et comment => http://3.ly/7ckR #opendata

le 12 March 2011 à 5h28
iDalgo_

RT @nicolaspatte: Choix du protocole, du format, de la licence: quelles données publier, où et comment => http://3.ly/7ckR #opendata

le 12 March 2011 à 6h07
romainmazon

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 6h44
EC_opendata

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 7h01
JBezivin

Open Data How to publish your data? [in fr] http://goo.gl/6kaqG #OpenData

le 12 March 2011 à 10h58
choblab

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 12 March 2011 à 11h21
Aymeric_DV

RT @ehooge: Quelles données publiques publier ? Et comment les publier ? http://ow.ly/4d16x #opendata (via @rslnmag)

le 13 March 2011 à 12h00
Urb4lyon

Open data : comment publier les données ? http://tinyurl.com/5r68jud

le 14 March 2011 à 10h43
concertURBAIN

RT @Urb4lyon: Open data : comment publier les données ? http://tinyurl.com/5r68jud

le 17 March 2011 à 12h34

Pingbacks and trackbacks (2)+

Ajouter un commentaire


biuquote
  • Comment
  • Preview
Loading