FC9BD09

Stage inter entreprise

Prix 2021 :

2 100 €

Comment financer sa formation ?

Durée :

3 jour(s)

Prochaine(s) session(s)

  • Du 10/05/2021 au 12/05/2021 à Paris

Présentation

L'émergence des nouvelles technologies informatiques de type Big Data et Cloud Computing a révolutionné notre capacité d'analyse des données et d'extraction des connaissances, cœur du métier du Data Scientist.

 

Dans cette formation, nous utilisons des outils Big Data sur la plateforme Cloud de Google afin de réaliser des analyses statistiques et du Machine Learning. Au travers de cas d'étude concrets sur des données climatiques, nous explorons plusieurs décennies de données satellitaires.

Objectifs

  • Utiliser et adapter les nouvelles pratiques et méthodes pour le traitement de données massives sur une plateforme Cloud en ligne.
  • Mettre en œuvre les méthodes classiques de fouille de données.
  • Programme

    Introduction

    Prise en main de Google Cloud Platform

    • Machines virtuelles (Compute)
    • Stockage en ligne (Storage)
    • Plateforme de traitements (DataProc)
    • Environnement d'analyse de données (Datalab)
    • Gestion du coût d'utilisation

    Introduction aux plateformes distribuées et technologies du Big Data

    • Stockage et processing distribués
    • Bases de données distribuées (NoSQL Columnar Storage)
    • Processing de données pour analyses en mode Batch (Hadoop, Spark/Python)
    • Analyse interactive de données (BigQuery)

    Présentation du jeu de données réelles

    • Variables observées
    • Problématiques sous-jacentes (étude de tendances, mise en évidence d'oscillations, interpolation/extrapolation/classification de données)

    Algorithmes de Machine Learning

    • Méthodes de régression usuelles (linéaires ou non, paramétriques ou non)
    • Méthodes de classification (supervisées ou non, paramétriques ou non)

    Synthèse et conclusion

  • Modalités pédagogiques

    La formation comprend des travaux pratiques qui permettent d'appliquer les notions abordées.

  • Public cible et prérequis

    Ingénieurs, chefs de projets souhaitant pratiquer des outils statistiques et informatiques du Big Data sur des données réelles.


    Des notions en bases de données, en programmation Python et en méthodes statistiques permettent de tirer un meilleur profit de la formation.

  • Responsables

    • Ons JELASSI BEN ATALLAH

      Enseignant-Chercheur à Télécom Paris en Machine Learning et en apprentissage statistique distribué, elle est également consultante en métrologie des réseaux auprès de grandes entreprises pour lesquelles elle effectue des missions d'audit et d'expertise. Ses travaux de recherche actuels, au sein du département "Image, Données et Signal" portent sur le passage à l'échelle des algorithmes d'apprentissage statistique.

Prochaine(s) session(s)

  • Du 10/05/2021 au 12/05/2021 à Paris