La mise en place d’une politique open data doit se faire avec des moyens adaptés. La plateforme de partage des données en est un élément central.
Avec la généralisation de l’ouverture des données dans les administrations et dans les services publics, de nombreux décideurs se posent des questions sur la stratégie à observer concernant les plateformes open data et les outils de gestion des données. En effet, une politique d’ouverture des données fait apparaître de nombreux challenges dont le choix d’une plateforme open data reste un point important.
L’open data est une formidable opportunité pour les citoyens de mieux comprendre leurs institutions et leurs actions, si les données mises à disposition le sont dans les meilleures conditions. Sinon, il n’y aurait aucun bénéfice à avoir effectué ce long processus. Car autant être honnête, la mise en place d’une stratégie open data demande des investissements et des réflexions de fond.
En France, le nombre de projets open data est de plus en plus grand. Il existe une grande disparité dans les outils pour la mise en œuvre de ces projets. Je vous propose un petit tour d’horizon des principales plateformes open data et de leur mise en place.
CKAN : la solution libre
Une solution libre avec une communauté active est la solution bien souvent préférée par les « gros » sites d’open data. Reste le problème de l’hébergement qui doit être assuré indépendamment de la plateforme. Des combinaisons avec WordPress ou Drupal sont possibles pour assurer un hébergement et une interface plus conviviale.
On trouve de nombreux exemples de sites open data qui utilisent CKAN ici : http://ckan.org/instances/
C’est clairement la solution préférée des sites gouvernementaux avec comme représentant les données ouvertes des Etats-Unis (data.gov) et celles du Royaume-Uni (data.gov.uk). Voir l’article sur les 10 sites de référence de l’open data.
Besoin de conseils pour choisir ?
STAT4DECISION vous conseille et vous oriente pour la mise en place de votre politique open data et pour le choix des outils. N'hésitez pas à nous contacter !
D’un point de vue technique, CKAN est un logiciel libre donc le code source est accessible et modifiable, il s’agit de code en Python pour le backend et de JavaScript pour la partie interface. Des technologies de gestion de données type PostgreSQL ou SQLAlchemy sont utilisées.
La mise en place peut être rapide mais la personnalisation et l’optimisation demande plus d’investissement qu’une solution clé en main. Une communauté de développeurs conséquente assure une évolution constante de la technologie et des outils.
En dehors des outils de recherche, de visualisation, de cartographie classiques, CKAN propose aussi des extensions externes qui sont rassemblées sur ce site : https://github.com/ckan/ckan/wiki/List-of-extensions
Il s’agit généralement d’extensions disponibles sur des sites importants qui ont été programmées par les équipe de ces sites.
CKAN est donc une solution non hébergée (même si des solutions payantes hébergées sont proposées sur le site) qui sera adaptée à une grosse quantité de jeux de données.
Socrata : le leader outre Atlantique
Socrata se différencie de CKAN par le fait qu’il s’agit d’une solution commerciale hébergée. Il propose aujourd’hui une solution open source pour faciliter les migrations.
Socrata a été racheté par Tyler Technologies et est aujourd’hui l’un de leurs produits.
Sur le marché américain, il s’agit du leader incontesté des offres payantes avec notamment comme client les villes de New York et San Francisco (dont j’ai parlé dans l’article les 10 sites de référence de l’open data).
Les produits Socrata sont des produits propriétaires basés sur des technologies open source telles que PostgreSQL, MongoDB, Elasticsearch, Angular, D3.js, et Chef. Le marketplace permet de mettre à la disposition de tous des applications utilisant les données ouvertes.
La cible visée est clairement nord-américaine et les produits proposés sont orientés open source.
Malheureusement, aucun détails sur leurs tarifs ne sont disponibles. De plus, pour des clients francophones, peu d’adaptations semblent proposées.
OpenDataSoft : le français qui monte
C’est la solution française ! Il s’agit d’une solution hébergée tout en un qui vous évite d’avoir à gérer des installations et des aspects trop techniques. L’inconvénient de ce type de solution est le manque de personnalisation et le coût récurrent lié à un abonnement.
L’équipe d’OpenDataSoft est jeune et réactive ce qui assure une bonne maintenance et des nouveautés fréquentes. Il s’agit d’une start-up en pleine expansion.
On pourra regretter l’absence d’extensions « externes » mais les visualisations existantes permettent déjà de nombreuses utilisations des données. De plus, un système d’API pour réutiliser les données dans des applications est mis à disposition.
OpenDataSoft est une solution adaptée si vous voulez être accompagné dans toutes les étapes de votre politique open data. Leurs principaux clients sont français, notamment la mairie de Paris, la SNCF et bien d’autres.
Ils présentent de nombreux cas pratiques sur leur site.
Autres solutions open source
De nombreux autres projets open source pour la mise à disposition de données en open data sont aujourd’hui disponibles.
On pourra citer :
- Dataverse : avec plus de 70 projets installés dans le monde, https://dataverse.org/
- UData : c’est la plateforme développée par EtatLab en France pour data.gouv.fr. Construit à partir de CKAN, c’est un projet à part entière : https://github.com/opendatateam/udata
- DKAN et JKAN qui sont des adaptations de CKAN pour d’autres CMS
- Koumoul qui est un projet français et qui est utilisé notamment pour le site de l’ADEME. https://koumoul.com/
Il en existe bien d’autres, n’hésitez pas à nous les indiquer en commentaire.
Comment choisir ?
Le choix d’une solution doit se faire après une étude complète des besoins, des ressources et des attentes concernant votre site open data. Les sites Internet des plateformes présentées plus haut regorgent de conseils et d’exemples qui vous seront d’une grande aide.
Faut-il donc opter pour une solution open source libre ou des solutions propriétaires en SaaS ? Outre l’aspect politique de ce choix, il faut prendre en compte tous les paramètres techniques, financiers et humains pour répondre à cette question.
Besoin de conseil ?
Nous vous aidons à définir votre politique open data et à mettre en place votre plateforme.
Deux principaux cas se présenteront :
- Vous possédez beaucoup de jeux de données qui devront être mis à jour fréquemment. Vous serez obligé de recruter du personnel compétent pour assurer la maintenance de votre plateforme.
- Une solution open source vaudra la peine, à condition de posséder un système d’hébergement efficace.
- Vous êtes une petite structure avec peu de jeux de données et besoin d’une solution rapidement.
- Une solution hébergée tout en un sera souvent plus adaptée. Pour ce cas, la solution française a ma préférence.
Vos remarques, commentaires et compléments d’informations sont les bienvenus.
N’hésitez pas à nous consulter si vous voulez plus de détails.
Partager cet article
Comments 6
Bonjour,
Cet article date du 28 septembre 2015.
Qu’en est-il aujourd’hui en mars 2017 ?
Existe-il une quelconque mise à jour de l’article, ou un article équivalent plus récent ?
Merci.
Bonjour,
Depuis septembre 2015, le paysage n’a pas profondément évolué. Les outils proposent bien sûr plus de fonctionnalités (plus de formats, plus de visualisation et plus d’API), mais les plus importants sont toujours dans l’article.
On peut néanmoins noter l’apparition de quelques nouveaux acteurs, notamment :
Nous mettrons prochainement à jour l’article afin de suivre l’évolution de ce domaine.
Bonjour,
pas de maj en vue en 2019,
est ce toujours d’actualité ? Bien cordialement
Bonjour,
Les outils présentés sont toujours d’actualités, il y a eu des améliorations en terme de fonctionnement et quelques nouveautés. Nous allons mettre à jour l’article dans les semaines à venir.
Cordialement,
Emmanuel
Bonjour,
Merci pour ces informations intéressantes.
Avez-vous publié une mise à jour de cet article ?
Cordialement
Bonjour,
Nous venons de publier une nouvelle mise à jour.
Cordialement,
Emmanuel