Formation python pour la data science

4.8 / 5

Découvrez le langage python pour des applications en data science

Prochaines sessions (3 jours) :

2 au 4 décembre 2024 à Paris et à distance - confirmée
17 au 19 mars 2025 à Paris et à distance

Formation python pour la data science aussi disponible dans vos locaux (sur demande)

Description

Vous êtes data scientist, utilisateur de R, analyste SAS ou développeur, et vous désirez découvrir python pour la data science et le traitement des données ? Cette formation est faite pour vous.

Trois jours intensifs pour acquérir les bases de l’utilisation du langage python pour des applications en analyse de données, data mining et data science.

Après une introduction au langage python (ou un rappel si vous avez déjà utilisé python), vous apprendrez à maîtriser les bibliothèques spécialisées en data science, data mining et data visualisation. Basée sur de nombreux exercices pratiques, cette formation vous permet d’être immédiatement opérationnel pour le traitement de vos données grâce à python.

Vous découvrirez à la fois numpy et pandas pour la manipulation des données, matplotlib et seaborn pour leur visualisation et scikit-learn pour la création de modèles.

Formation en petits groupes avec maximum 7 participants pour plus d’échanges avec nos formateurs !

Inscrivez-vous !

Le programme

Objectifs

  • Maîtriser les bases de python
  • Etre capable d’analyser des données avec python
  • Etre capable d’automatiser le traitement de données avec python
  • Connaître les outils pour la data science de python

Organisation des journées

Durant ces journées, nous nous concentrons sur des applications pratiques pour maîtriser le langage python.

Jour 1

  • Introduction au langage python
    • Pour qui ? Pour quoi faire ? Comment ?
    • Les consoles et le débogage en python
    • Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
    • Construction d’un outil de calcul de statistiques simples
    • Les classes, les objets et la création de bibliothèques
  • Python pour le traitement des données
    • Le processus de développement d’un outil en python pour la data science

Jour 2 :

  • La manipulation de données avec numpy : les arrays pour les données structurées et non structurées
  • L’importation des données (texte, csv, Excel, web scrapping., SQL..)
  • La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes) avec pandas et scipy
  • La data visualisation
    • Présentation des principes de la data visualisation
    • Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
    • Présentation de visualisation plus avancées
    • Pour aller plus loin : Utilisation de Bokeh pour des visualisations interactives

Jour 3:

  • Introduction au machine learning : présentation des principes de l’apprentissage automatique
  • Préparation des données avec la bibliothèque scikit-learn
  • Cas pratiques en machine learning
    • La prévision en marketing
    • L’extraction d’informations pertinentes
    • Les k-means pour la compression d’images
    • Le traitement de données textuelles
  • L’automatisation et la mise en production de traitements avec python (pipeline)
  • Aller pus loin : Les bibliothèques pour le big data et le deep learning
    • pyspark
    • keras / tensorflow
  • Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants

Les outils

Lors de cette formation, nous utiliserons les environnements Anaconda et des Jupyter notebooks pour illustrer l'utilisation de Python en analyse de données.

Les participants auront accès à un environnement de développement durant la formation et à la suite de la formation afin de pratiquer sans avoir à installer d'outils sur leurs machines.

Le formateur

Emmanuel Jakobowicz est data scientist, développeur et formateur Python depuis de nombreuses années. Il est co-organisateur du Meetup PyData Paris et auteur de l'ouvrage python pour le data scientist aux éditions Dunod. Spécialisé dans la création et l'implémentation de méthodes avancées d’analyse de données, il a un doctorat en statistique appliquée.

  • anaconda
  • Python
  • Jupyter

Profils :

  • Data analyst désirant découvrir python en data science
  • Manager désirant comprendre les spécificité de python
  • Développeur spécialisé dans d’autres langages

Prérequis :

  • Connaissances de base en traitement de données (statistique et
    tables de données)
  • Pas de prérequis en python

Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82

Inscription

Tarif inter-entreprises : 1600 euros par participant pour 3 jours

  • Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
  • Nos tarifs sont HT et n'incluent pas les déjeuners
  • Tarif intra-entreprise (sur mesure, selon vos besoins) : nous contacter pour évaluation

Prochaines sessions :
2 au 4 décembre 2024 à Paris et à distance - confirmée
17 au 19 mars 2025 à Paris et à distance
18 au 20 juin 2025 à Paris et à distance

Inscription et demande d'informations

Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.

Toutes nos formations peuvent être prises en charge par l'ensemble des OPCO grâce à notre référencement DataDock et à notre certification Qualiopi.

    ouinon
    ouinon
    ouinon
    En cliquant sur "Envoyer", vous acceptez que vos données personnelles soient utilisées pour vous recontacter dans le cadre de votre demande.
    Pour connaître et exercer vos droits, veuillez consulter notre politique de confidentialité.

    Evaluations

    4.8 / 5
    Évaluation moyenne de la formation par les participants sur les 12 derniers mois.

    Témoignages

    Très clair, très complet, donnant les moyens de passer de débutant à pleinement opérationnel en un temps record. Excellente mise en contexte pour permettre de comprendre la raison et la logique de chaque élément.
    Christophe W. sur la formation Python pour la data science
    Pédagogie adaptée à un groupe de profils variés. Formation efficace basée sur la pratique (Jupyter notebook) qui permet une mise en application dès la fin de la formation. Formation à distance très bien gérée et très agréable.
    Séverine D. sur la formation Python pour la data science
    Qualité, progressivité, exercices pratiques...
    Jean J. sur la formation Python pour la data science
    Organiser une session sur mesure !

    Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.

    Vous voulez aller plus loin, suivez notre parcours python pour la data
    D'AUTRES FORMATIONS POUR VOUS

    Partager cette page