Cette première moitié de l’année a été extrêmement riche en nouveautés et nous a permis de confirmer la force d’un certain nombre d’outils dans le domaine de la data science et du développement. J’en ai sélectionné 4 qui me paraissent spécialement intéressants.
Retour sur la conférence UseR! à Toulouse
La conférence UseR! 2019 avait lieu à Toulouse. C’était l’occasion de faire un point sur l’état de la communauté R (#rstats) et des dernières avancées.
Que propose Microsoft pour la Data Science ?
Suite à la parution du quadrant Gartner de 2019, je vous propose de rentrer dans le détail de l’offre Microsoft pour la Data Science.
Qui sont les utilisateurs de Python en data science ?
La python software foundation vient de publier une enquête sur les utilisateurs de Python. Nous étudions les utilisateurs en data science
10 sites de référence de l’open data
Depuis quelques années, l’open data a pris une place importante dans les politiques publiques. La plupart des gouvernements et des organisations à but non lucratif se sont engagés dans une mise à disposition des données.
De nombreux sites rassemblent ces données et permettent de télécharger des jeux de données. Nous vous présentons dix sites de référence sur lesquels des données et des ressources sont disponibles, il s’agit de choix subjectifs mélangeant des sites francophones et anglophones. N’hésitez pas à nous suggérer d’autres sites pour étoffer cette liste.
Le tri à plat et le tri croisé avec R et Python
Le tri à plat et le tri croisé sont des opérations de base pour la description des données. Nous proposons une description de ces opérations et des exemples de code en R et en Python.
Nouveau classement des plateformes data science 2019
Le cabinet Gartner vient de sortir son classement ou plutôt son cadran (magic quadrant) sur les plateformes data science et machine learning pour 2019.
Cette représentation des différents logiciels de data science est devenu une habitude dans la data science. Analysons ensemble ce rapport 2019.
Le langage Julia va-t-il remplacer R et Python ?
Le langage Julia est un langage adapté à la data science mais faut-il s’y plonger ? Quels en sont les principes ? Faisons un point sur son évolution.
Python 2 ou python 3 – la fin d’un dilemme
Le langage python est de plus en plus présent en data science. Une question récurrente durant ces 10 dernière années était le choix de la version du langage entre python 2 et python 3, est-ce bel et bien fini ?
Quelles différences entre les plateformes open data ?
La mise en place d’une politique open data doit se faire avec des moyens adaptés. La plateforme de partage des données en est un élément central.
Avec la généralisation de l’ouverture des données dans les administrations et dans les services publics, de nombreux décideurs se posent des questions sur la stratégie à observer concernant les plateformes open data et les outils de gestion des données. En effet, une politique d’ouverture des données fait apparaître de nombreux challenges dont le choix d’une plateforme open data reste un point important.