Une forêt aléatoire ou random forest est une méthode d’apprentissage supervisé extrêmement utilisée par les data scientists. En effet, cette méthode combine de nombreux avantages dans le cadre d’un apprentissage supervisé. Dans cet article, je vais vous présenter l’approche et une application avec le langage python et le package de machine learning, scikit-learn.
Faire une régression logistique avec python
Dans cet article nous allons appliquer une régression logistique avec python en utilisant deux packages très différents : scikit-learn et statsmodels. Nous verrons les pièges à éviter et le code associé.
Traiter différents types de colonnes avec scikit-learn et ColumnTransformer
La classe ColumnTransformer de scikit-learn permet de traiter de manières différentes les colonnes d’un jeu de données, notamment les variables qualitatives et quantitatives.