Cet article fait suite à de nombreux échanges liés aux licences d’utilisation dans le logiciel libre. Même s’il s’agit d’un thème plutôt juridique il est central pour de nombreux acteurs de la data science. Je parle ici des licences liées aux outils logiciels et non des licences liées aux documents (comme Creative Commons).
Le machine learning pour tous
Voici quelques temps que le terme machine learning est présent dans le monde de la data. De plus en plus d’utilisateurs métiers, de managers, de dirigeants entendent ce mot. Il est souvent associé au big data, à l’intelligence artificielle… Je profite donc de cet article pour vous en présenter les grandes lignes sans formules ni trop de technicité.
IBM-SPSS, KNIME, RapidMiner et SAS toujours leaders parmi les data science platforms
La dernière étude du cabinet Gartner compare les data science platforms. On s’attendait à ce nouveau nom, mais y a-t-il de réelles nouveautés ?
Et si vous deveniez data scientist ?
Comme beaucoup, vous rêvez de devenir data scientist. Une fois que vous l’avez dit vous vous retrouvez face à un mur vertigineux et une première question périlleuse : un data scientist, c’est quoi ?
Les étapes pour utiliser Python en data science
Depuis quelques années, le langage python prend une ampleur tout à fait inattendue avec une utilisation de plus en plus large. En science des données, python est devenu le langage de prédilection pour le traitement et l’analyse des données. Python en data science est devenu une référence.
Grâce à un écosystème d’API extrêmement riche il permet de traiter des données de types très variées (entre autres SQL mais aussi noSQL) et de piloter des outils de traitement avancé (notamment Spark avec PySpark pour le traitement massivement parallèle de données dites big data).
Dans cet article, mon objectif est de vous présenter un processus assez standard de développement d’outil pour le traitement des données avec le langage python en introduisant les bibliothèques adaptées.
Le langage de la data science
Quel langage choisir ? Est-ce que le choix de R est automatique ? Faut-il préférer un langage propriétaire ou un langage libre ? Est-ce qu’il faut choisir un langage générique ou un langage orienté pour le calcul scientifique ? Autant de questions que tout data scientist se pose lors de la mise en place d’un projet ou lors de l’apprentissage de nouvelles techniques.
Comme vous l’imaginez, il n’y a pas une réponse unique à toutes ces questions. Voici quelques éléments de réponse.
Petite révolution dans le monde du logiciel R
Fin juin 2015, une annonce est passée assez inaperçue dans le monde de la data science mais celle-ci annonce un changement impressionnant dans le développement du logiciel R : la création par la Linux foundation du R consortium, un consortium rassemblant de nombreux acteurs, avec Microsoft aux avant-postes, visant à promouvoir l’utilisation de R et à faciliter son adoption. Commençons …
Bienvenue à tous
Bonjour, Bienvenue sur le blog de STAT4DECISION, il servira à vous tenir informé des nouveautés, des actualités et des informations originales sur le monde de l’analyse de données, du big data, de l’open data et de la data visualisation, mais aussi à poster des articles sur des méthodes d’analyse. Nous nous ferons un plaisir d’échanger avec vous afin de mieux …
- Page 2 of 2
- 1
- 2