Formation scikit-learn pour le machine learning
Cette formation vous permettra de maîtriser l'utilisation du package scikit-learn pour la construction de modèles de machine learning.
Prochaines sessions (2 jours) :
26 et 27 mai 2025 à Paris et à distance
20 et 21 novembre 2025 à Paris et à distance
Formation aussi disponible dans vos locaux (sur demande)
A propos
Une formation scikit-learn pour le machine learning vous permettant de maîtriser l'utilisation du package scikit-learn, référence mondiale pour le machine learning en python. Par des cas pratiques développés dans des notebooks, vous découvrirez toutes les spécificités de cet outil complet pour la construction de modèles de machine learning.
Cette formation de deux jours convient parfaitement à la formation d'utilisateur de python désirant se perfectionner à l'utilisation de scikit-learn.
Cette formation scikit-learn pour le machine learning vous permet d'approfondir l'utilisation et de maitriser les bonnes pratiques du package scikit-learn.
Formation en petits groupes (maximum 7 participants) pour assurer un échange optimal avec le formateur.
Le programme
Objectifs
- Connaître les principaux concepts du machine learning
- Construire un pipeline de machine learning avec scikit-learn
- Maîtriser les étapes de création d'un modèle de machine learning (de la préparation à la validation)
Organisation des journées
Nous nous concentrons sur des applications pratiques.
- Introduction
- Les concepts du machine learning
- Le processus de construction d'un modèle de machine learning
- L'écosystème de développement autour de scikit-learn (python, numpy, pandas...)
- Utilisation de Scikit-Learn
- Les principes de scikit-learn pour les modèles de machine learning
- La notion de pipeline en machine learning
- Un premier modèle de machine learning avec scikit-learn
- Préparation des données et preprocessing
- Comment préparer des données pour un modèle de machine learning ?
- Les preprocessing de scikit-learn
- Le traitement des données qualitatives
- Le traitement des données manquantes
- L'utilisation du ColumnTransformer de scikit-learn
- Sélection de meilleur modèle avec scikit-learn
- Gérer le sur-apprentissage
- Validation du modèle (train / test, validation croisée...)
- Les métriques d'évaluation des modèles de machine learning
- L'ajustement des hyperparamètres avec scikit-learn
- Gestion automatique
- Combinaison dans un pipeline
- Focus sur certaines méthodes de machine learning
- Modèles linéaires
- Modèles basés sur des arbres (forets aléatoires, GBM...)
- Autre modèles
- Le cas des modèles non supervisés dans scikit-learn
- Mise en œuvre de modèle de machine learning non supervisés avec scikitlearn et comparaisons.
- Passage en production d'un modèle de machine learning avec scikit-learn - les différentes approches.
Les outils
Lors de cette formation, nous utiliserons Python 3 et le package scikit-learn ainsi que tous l'environnement pydata (Jupyter, numpy, pandas, matplotlib...).
Votre formateur
Emmanuel Jakobowicz est data scientist, développeur et formateur Python depuis de nombreuses années. Il est co-organisateur du Meetup PyData Paris et auteur de l'ouvrage python pour le data scientist aux éditions Dunod. Spécialisé dans la création et l'implémentation de méthodes avancées d’analyse de données, il a un doctorat en statistique appliquée.
Public : Data analyst ou data scientist désirant monter en compétence sur scikit-learn.
Prérequis : Bases en python et en traitement de données ou avoir suivi la session Python pour la data science.
Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82
Inscription
Tarif : 1100 euros HT par participants pour 2 jours
- Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
- Nos tarifs sont HT et n'incluent pas les déjeuners.
Inscription et demande d'informations
Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.
Toutes nos formations peuvent être prises en charge par l'ensemble des OPCO grâce à notre référencement DataDock et notre certification Qualiopi.
Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.
Partager cette page