FO9BD01

Durée :

7 semaines

Prochaine(s) session(s)

  • Du 01/01/2020 au 31/12/2020
Formation réalisée par: 
Télécom Paris

Présentation

Le MOOC «Fondamentaux pour le big data» vous permet d'acquérir efficacement le niveau prérequis en informatique et en statistiques pour suivre des formations dans le domaine du big data et data science. Le big data offre de nouvelles opportunités d’emplois au sein des entreprises et des administrations. De nombreuses formations préparant à ces opportunités de métiers existent. Le suivi de ces formations nécessite des connaissances de base en statistiques et en informatique que ce MOOC vous propose d’acquérir dans les domaines de l’analyse, algèbre, probabilités, statistiques, programmation Python et bases de données.

D’une part, les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data ; ce MOOC vous explique pourquoi.

D’autre part, le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours vous initie à la programmation avec ce langage, particulièrement en utilisant la bibliothèque Numpy.

Enfin, le traitement des données massives et la prédiction nécessitent des analyses statistiques. Cette formation vous fournit les concepts élémentaires en statistiques tels que les variables aléatoires, le calcul différentiel, les fonctions convexes, les problèmes d'optimisation et les modèles de régression. Ces bases sont appliquées sur un algorithme de classification le Perceptron.

 

Objectifs

De nombreuses personnes souhaitent accéder aux métiers du big data en raison des importants besoins de recrutement dans ce domaine. Ces personnes recherchent une solution flexible, accessible et compatible avec le maintien d’une activité professionnelle leur permettant d’acquérir le niveau prérequis aux formations de spécialisation aux métiers du big data, en informatique et en statistiques.

Les objectifs de ce MOOC sont :

  • Développer des applications de base de traitement de données en Python.
  • Utiliser les concepts d'algèbre, d'analyse et de statistiques nécessaires aux sciences de données.
  • Identifier les défis liés au stockage et au calcul distribué.

 

Prochaine(s) session(s)

  • Du 01/01/2020 au 31/12/2020