FC9BD13

Stage inter entreprise

Prix 2024 :

1 850 €

Comment financer sa formation ?

Durée :

2 jour(s)

Prochaine(s) session(s)

  • Du 12/09/2024 au 13/09/2024 à Paris

Présentation

Le langage Python est reconnu comme l'un des langages majeurs en informatique. C'est l'un des plus utiles pour les utilisateurs scientifiques et techniques, particulièrement dans le domaine des sciences des données.

 

Objectifs

  • Lire les données depuis différentes sources (fichiers HTML, fichiers Excel, bases de données, etc.)
  • Nettoyer et fusionner les données
  • Réaliser des analyses simples (statistiques descriptives, visualisations graphiques, régression, etc.)
  • Préparer les données pour leur utilisation dans des pipelines d’apprentissage statistique
  • Programme

    Introduction

    Prise en main de Python

    • Python : environnements virtuels, installation de bibliothèques, Jupyter notebook
    • Variables, types et structures de contrôle (boucles, conditions, etc.)

    Entrées/sorties en Python

    • Lire et écrire des données depuis un fichier
    • Rappel sur la notion de chemin d’accès
    • Erreurs et exceptions : comment Python signale-t-il les erreurs ? Comment gérer les erreurs ?

    Fonctions

    Pourquoi et comment définir une fonction en Python ?

    • Différentes manières d’appeler une fonction en Python
    • Utilisation de modules et de bibliothèques tierces

    Structures de données

    • Listes, ensembles et dictionnaires
    • Comment utiliser des classes existantes en Python ?

    Données tabulaires

    • Bibliothèque Numpy
    • Bibliothèque Pandas
    • Chargement de données depuis des fichiers Excel, des fichiers HTML et des bases de données
    • Opérations basiques (filtres, opérations sur les colonnes, etc.)

    Représentations graphiques

    • Découverte de Matplotlib et Seaborn
    • Personnalisation des graphes

    Manipulation des DataFrame

    • Groupby
    • Jointures
    • Nettoyage de données (gestion des valeurs manquantes, validation, etc.)

    Manipulation de séries temporelles

    • Index et filtrage
    • Opérations sur des fenêtres glissantes

    Classification et régression

    • Aperçu de la bibliothèque Sklearn
    • Mise en place d’un pipeline d’apprentissage statistique
    • Comment interfacer Sklearn et Pandas ?

    Étude de cas

    Analyse des données du Covid

    • Intégration et consolidation des données provenant de plusieurs sources
    • Représentation graphique
    • Analyse des données et prédiction de l’évolution

    Synthèse et conclusion

  • Points forts

    Formation pratique permettant la prise en main des principales libraires Python pour le traitement des données.

  • Modalités pédagogiques

    Travaux pratiques

  • Public cible et prérequis

    Ingénieurs, développeurs devant traiter des données en Python.


    Des connaissances de base en programmation sont nécessaires afin de tirer pleinement profit de la formation.

  • Responsables

    • Guillaume WISNIEWSKI

      Enseignant-chercheur en informatique à l'Université Paris Diderot. Il est diplômé de Télécom Paris et de l'Université Pierre et Marie Curie. Son activité de recherche et d’enseignement porte sur l’apprentissage statistique et ses applications au traitement de langage naturel.

Prochaine(s) session(s)

  • Du 12/09/2024 au 13/09/2024 à Paris

Vous êtes intéressé(e) et/ou vous voulez procéder à une inscription ?

N'hésitez plus et complétez le formulaire. Nous revenons vers vous ensuite pour répondre à vos questions et/ou compléter votre inscription.
Ordre
  • Participant

  • Participant

  • Participant

Nous sommes également à votre disposition par téléphone

Appelez le +33 (01) 75 31 95 90