Fin juin 2015, une annonce est passée assez inaperçue dans le monde de la data science mais celle-ci annonce un changement impressionnant dans le développement du logiciel R : la création par la Linux foundation du R consortium, un consortium rassemblant de nombreux acteurs, avec Microsoft aux avant-postes, visant à promouvoir l’utilisation de R et à faciliter son adoption.
Un peu d’histoire de R
Commençons par rappeler quelques points importants de l’histoire de R.
R a été créé au début des années 90 en Nouvelle-Zélande et ne cesse de grandir depuis. A partir de 1997, un groupe de chercheurs appelé « R Core Team » composé aujourd’hui de 20 personnes a l’autorisation de modifier le code source de R. Bien sûr tout un chacun peut soumettre des packages mais le noyau du logiciel est géré par ces 20 personnes. Deux autres structures sont importantes pour R, la R foundation et le CRAN.
La R foundation
C’est une organisation non lucrative créée par la R Core Team visant à fournir un soutien pour le développement du projet R. Elle sert d’interlocuteur pour ceux qui voudraient soutenir ou interagir avec la communauté des développeurs du logiciel R. Cette fondation détient et administre les droits d’auteur du logiciel R et la documentation liée.Le CRAN
C’est le « Comprehensive R Archive Network », il s’agit d’un réseau de seveurs ftp et web hébergés dans différents lieux autour du monde qui stocke le code et la documentation de R de façon à rendre R accessible de manière rapide de n’importe quel point du globe. Il s’agit aussi du lieu où les nouveaux packages sont soumis afin d’être mis à la disposition des utilisateurs de R.L’état actuel de R et de sa communauté
Abrité derrière la R Foundation, basée à Vienne en Autriche, le développement de R a toujours été protégé par un noyau d’irréductibles adeptes du logiciel libre qui ont assuré son indépendance mais qui ont aussi restreint son adoption par les acteurs économiques (la R Core Team).Depuis l’avènement du big data, le logiciel R est devenu le logiciel qu’il faut utiliser pour faire de la data science (sans oublier Python et d’autres nouveaux langages dont nous parlerons plus tard sur ce blog). Petit à petit, tous les acteurs du logiciel essayent soit de se différencier, soit de se lier à R (on a vu apparaître la possibilité d’appeler R depuis des logiciels commerciaux ce qui aurait été inimaginable il y a dix ans). Il est donc logique que les grandes entreprises américaines s’y intéressent. Par exemple, Microsoft a racheté Revolution Analytics il y a quelques mois. Mais ce qui s’est passé la semaine dernière constitue une première dans l’histoire de R.
Le R consortium
La Linux foundation qui promeut le système d’exploitation Linux vient d’annoncer la création du R consortium qui vise à promouvoir l’utilisation de R. Cette annonce montre bien que R doit passer à un autre niveau sachant que la Linux foundation met en avant la transformation de logiciels libres en logiciels toujours libres, mais concurrents de logiciels commerciaux.Le but de la Linux foundation est de doter Linux des outils marketing, juridiques et d’une standardisation qui lui permette de concurrencer Windows de Microsoft.
Le R consortium se placera dans une optique d’organisation et de standardisation afin de grignoter la place des leaders que sont, entre autres, SAS et IBM-SPSS.
Le changement d’objectif se voit très bien en comparant les deux sites :
- La R foundation et son site plutôt basique (c’est le moins que l’on puisse dire même s’il a subi un coup de jeune il y a peu de temps) : R foundation
- Le R consortium et son site très « tendance » : R consortium
La Linux foundation a l’habitude de ce type de projet dans lequel elle rassemble des gros du secteur (ici on a quand même Microsoft, Tibco, Google, Oracle…) pour rendre un logiciel libre « business ready ».
Sur leur nouveau site, le R consortium assure ne pas interférer sur le développement du langage et du logiciel mais plutôt contribuer à mettre en place des communautés et aider la mise en valeur de R.
Le communiqué de presse officiel peut être trouvé ici (en anglais) : linux-foundation-announces-r-consortium-support-millions-users-around
Reste à savoir si la communauté sera réceptive à ce type de projets. Une chose est sûre, l’existence du R consortium montre que R est en train de passer à une étape supérieure de son développement et que c’est une bonne chose pour le développement de la data science.
A suivre…
Partager cet article
Comments 1
Pingback: Le langage de la data science - STAT4DECISION