FC9BD19

Stage inter entreprise

Prix 2021 :

1 000 €

Comment financer sa formation ?

Durée :

1 jour(s)

Prochaine(s) session(s)

  • Du 15/06/2021 au 16/06/2021 à Paris

Présentation

Le framework Spark s'est imposé comme l'outil de référence pour le traitement distribué des données. Cette formation permet d'en maîtriser l'écosystème et les concepts de base à travers des études de cas pratiques.

Objectifs

  • Identifier les concepts fondamentaux de Spark.
  • Traiter des données avec Spark grâce au calcul distribué.
  • Manipuler les RDD (Resilient Distributed Datasets) ainsi que les fonctionnalités plus récentes.
  • Programme

    Introduction à Spark

    • Historique
    • Problèmes à résoudre
    • Écosystème
    • Alternatives à Spark

    RDD et son utilisation dans Spark

    • Évaluation paresseuse
    • partition
    • lineage

    Présentation des opérateurs de base en Spark RDD

    • Comment Spark effectue ses calculs

    Fonctionnalités avancées de Spark :

    • Présentation de Spark DF/DS (par comparaison avec SQL) Stream.

    Études de cas et traitement de données sur Spark

  • Modalités pédagogiques

    Travaux pratiques sur Spark

  • Public cible et prérequis

    Ingénieurs et techniciens ayant besoin d'utiliser Apache Spark pour le stockage et le traitement des données.


    Une expérience de la programmation informatique, du langage SQL et de bonnes connaissances en informatique répartie sont nécessaires pour suivre cette formation avec profit.

  • Responsables

    • Louis JACHIET

      Louis est Maître de conférence en informatique à Télécom Paris au sein de l'équipe DIG (Data, Intelligence and Graphs). Ses thématiques de recherche et d'enseignement sont l’algorithmique, les bases de données, les langages de programmation et la logique.

Prochaine(s) session(s)

  • Du 15/06/2021 au 16/06/2021 à Paris