FC9BD15

Stage inter entreprise

Durée :

2 jour(s)

Prochaine(s) session(s)

  • Du 14/05/2020 au 15/05/2020 à Paris
  • Du 01/12/2020 au 02/12/2020 à Paris

Présentation

Le traitement des grandes masses de données, dans différents secteurs d’activités, se base sur l’apprentissage statistique/ machine learning. Les méthodes de régression et leur pénalisation permettent de répondre à plusieurs problématiques dans les entreprises, en mettant l’accent sur les approches non paramétriques permettant une grande souplesse de modélisation. Les forêts aléatoires ainsi que différentes méthodes d’optimisation permettent d’apprendre les paramètres des modèles à l’aide de données d’entraînement (utilisant une descente de gradient ou non). D’autres problèmes industriels sont traités grâce au traitement statistique des séries temporelles.

Objectifs

L’objectif de cette formation est de prendre en main les différentes méthodologies d’apprentissage statistique tant pour les données indépendantes que pour les séries temporelles. Les concepts ainsi que les résultats introduits permettront de déployer les méthodes les plus récentes, de l’écriture d’un modèle à son optimisation. Cette formation a pour but de mettre en oeuvre les algorithmes d’apprentissage les plus répandus ainsi que leur application à de nombreux jeux de données. Il s’agira en particulier de disposer des outils indispensables à l’implémentation de modèles et d’architectures bien dimensionnés suivant les problèmes considérés.

  • Programme

    Rappels de Machine learning

    • Introduction à la théorie de l'apprentissage
    • Réduction de dimension (Analyse en composante principale et décomposition en valeurs singulières)

    Modèles de régression

    • Rappels sur la régression multivariée (linéaire, pénalisation)
    • Régressions non paramétriques
    • Forêts aléatoires pour la régression
    • Forêts aléatoires combinées aux réseaux de neurones

    Méthodes de gradient pour l'apprentissage de modèles complexes

    • Convergence des méthodes de gradient, gradient stochastique et gradient accéléré
    • Méthodes de gradient utilisées en apprentissage profond
    • Application aux réseaux de neurones (Feed Forward, avec convolution)
    • Algorithme du gradient stochastique pour les modèles à données cachées

    Apprentissage pour les séries temporelles partiellement observées

    • Méthodes bayésiennes et réseaux de neurones récurrents pour les séries temporelles
  • Modalités pédagogiques

    Dans ce cours, nous fournirons de nombreux exemples illustratifs utilisant des données simulées ainsi que des données réelles (données économétriques, météorologiques, applications en vision). Des séances de travaux pratiques en Python seront réalisées.

  • Public cible et prérequis

    Ce cours s’adresse aux ingénieurs, chefs de projets souhaitant approfondir leurs connaissances en apprentissage statistique. Les différentes séances auront pour but de détailler le développement des méthodes considérées ainsi que de fournir des éléments théoriques justifiant leurs performances. Les participants devront donc avoir un goût pour la modélisation et l’analyse statistique.

    Des connaissances de base en statistiques ou en machine learning : notions de probabilités/statistiques élémentaires (variables aléatoires, loi d’une variable aléatoire, espérance, etc.) ainsi que d’une connaissance des enjeux des méthodes d’apprentissage (notions de régression et de classification) sont indispensables pour le suivi de cette formation.

  • Responsables

    • Sylvain LE CORFF

      Professeur de statistiques à Télécom SudParis. Il était Chargé de recherche CNRS à l’université Paris-Sud (Institut de Mathématique d’Orsay). Ses domaines d’intérêt majeurs sont : probabilités numériques, statistiques calculatoires, méthodes de Monte Carlo (séquentielles et par chaînes de Markov), modèles à données latentes, estimation non paramétrique.

Prochaine(s) session(s)

  • Du 14/05/2020 au 15/05/2020 à Paris
  • Du 01/12/2020 au 02/12/2020 à Paris

Vous pourriez aussi être intéressé par...

En savoir plus

CES Gestion de projet déploiement LAN et datacenter

Domaine : Systèmes d'information et réseaux d'entreprises

Durée : 21 jour(s)

Session(s) :

  • Du 26/11/2019 au 25/09/2020 à Paris
En savoir plus

CES Lean Management

Domaine : Management de la transformation numérique

Durée : 18 jour(s)

Session(s) :

  • Du 01/09/2020 au 01/09/2021 à Paris
En savoir plus

CES Architecture en cybersécurité, RSSI

Domaine : Cybersécurité

Durée : 28 jour(s)

Session(s) :

  • Du 23/03/2020 au 01/10/2020 à Paris