MOOC : Fondamentaux pour le big data

Version imprimableVersion imprimable
Formation réalisée par  
Institut Mines-Télécom

Présentation

big_data.jpgLe big data offre de nouvelles opportunités au sein des entreprises et administrations. De nombreuses formations préparant aux métiers du big data existent. Au sein de Télécom ParisTech, nous proposons un Mastère Spécialisé « Big Data: Gestion et analyse des données massives » et un Certificat d’Etudes Spécialisées « Data Scientist ». Le suivi de ces formations nécessite des connaissances de base en statistiques, en mathématiques et en informatique. L’objectif de ce MOOC est de fournir ces connaissances de base. Les compétences visées par le MOOC constituent un préalable indispensable aux formations préparant aux métiers du big data dans les domaines de l’analyse, l’algèbre, les probabilités, les statistiques, la programmation Python et les bases de données.

D’une part, les bases de données relationnelles ne sont pas toujours adaptées aux systèmes de données massives qui sont déployées dans les contextes big data. Ce MOOC en explique les raisons.

D’autre part, le langage Python est un langage très utilisé dans le domaine du traitement des masses de données. Ce cours initie à la programmation grâce à ce langage, particulièrement avec la bibliothèque Numpy.

Enfin, le traitement des données massives et la prédiction nécessitent des analyses statistiques. Cette formation fournit les concepts élémentaires en statistiques tels que les variables aléatoires, le calcul différentiel, les fonctions convexes, les problèmes d’optimisation et les modèles de régression. Ces bases sont appliquées sur un algorithme de classification, le Perceptron.

 

Programme

  • Programmation Python
  • Limites des bases de données relationnelles
  • Algèbre
  • Analyse
  • Probabilités
  • Statistiques
  • Classifieur Perceptron

 

Format

Ce MOOC est ouvert en continue : vous pouvez vous inscrire quand vous le souhaitez, et avancer à votre rythme.

Avant le début du MOOC, un test de connaissances de type quiz est organisé afin de vérifier le niveau des candidats. Les prérequis sont des bases en mathématiques et de l'algorithmique (niveau L2 validé).

Le MOOC comporte 7 semaines, chaque partie se termine par un quiz validant les acquis des différentes sessions vidéos. Les forums de discussions sont animés une demi-journée par semaine. Un quiz final faisant suite à un projet validera l’ensemble du MOOC.

Vous pouvez passer vos quiz et travailler sur votre mini-projet quand vous le souhaitez. Néanmoins, il faudra patienter un peu pour obtenir votre attestation : les prochaines  sessions d'évaluation se tiendront le 22 novembre 2018, le 18 avril 2019, le 23 août 2019 et le 13 janvier 2020.
.

 

Objectifs

De nombreuses personnes souhaitent accéder aux métiers du big data en raison des importants besoins de recrutement dans ce domaine. Ces personnes recherchent une solution flexible, accessible et compatible avec le maintien d’une activité professionnelle leur permettant d’acquérir le niveau prérequis aux formations de spécialisation aux métiers du big data, en informatique et en statistiques.

Les objectifs de ce MOOC sont :

  • Développer des applications de base de traitement de données en Python.
  • Utiliser les concepts d'algèbre, d'analyse et de statistiques nécessaires aux sciences de données.
  • Identifier les défis liés au stockage et au calcul distribué.

 

Stephan Clemençon présente le MOOC Fondamentaux pour le big data