FC9BD04

Stage inter entreprise

Prix 2020 :

1 500 €

Comment financer sa formation ?

Durée :

2 jour(s)

Prochaine(s) session(s)

  • Du 28/09/2020 au 29/09/2020 à Paris - 1 500 €

Présentation

Les sciences de l’information transforment aujourd’hui de nombreux domaines tels que la médecine, la finance, le marketing, la défense ou encore la sécurité. La capacité à traiter et analyser des données de très grande dimension, souvent massives (big data) est un enjeu majeur dans ces secteurs d’activités. La discipline qui développe et étudie des méthodes concrètes pour modéliser ce type de données est le machine learning. A l’interface des mathématiques appliquées et de l’informatique, cette discipline vise à produire des outils de prédiction et d'aide à la décision, automatiquement, à partir d’un apprentissage sur des données et des évènements. L'apparition d'algorithmes très performants pour la classification de données en grande dimension, tels que le boosting ou les support vector machines (SVM) dans le milieu des années 90, a progressivement transformé le champ occupé jusqu'alors par la statistique traditionnelle. Celle-ci s'appuyait en grande partie sur le prétraitement réalisé par l'opérateur humain. Cette formation présente le domaine et ses fondements. Ses problèmes et ses méthodes les plus récentes sont également étudiés. Les concepts sont illustrés par des applications variées.

Objectifs

  • Découvrir les fondements historiques et théoriques de l’apprentissage automatique
  • Comprendre les bases de quelques algorithmes majeurs en Machine Learning, ainsi que les situations dans lesquelles les appliquer
  • Programme

    Problématiques traitées par le Machine Learning 

    • classification
    • régression
    • réduction de dimension

    Introduction à la théorie de l’apprentissage (principe de la minimisation de risque empirique)
    Exemples applicatifs :

    • LDA (Linear Discriminant Analysis) (supervisé)
    • K-means (non supervisé)

    Sur-apprentissage, sélection de modèle

    Optimisation pour le Machine Learning

    Régression logistique

    Arbres de classification

    Méthodes ensemblistes

    SVM (Support Vector Machine)

    Introduction aux réseaux de neurones

    Synthèse et conclusion

  • Modalités pédagogiques

    TP en Python :

    • Initiation à scikit-learn
    • Application des algorithmes vus en cours
    • Compréhension des mesures de performances et des avantages/inconvénients des différentes méthodes
  • Public cible et prérequis

    Ingénieurs et techniciens ayant besoin de méthodes d'apprentissage pour automatiser des tâches (prédiction, décision, etc.) de manière performante. Chefs de projets qui souhaitent mieux identifier les tâches que le machine learning permettrait d'automatiser.

    Des bases en Python : (opérateurs clés (if, for, etc.), listes, dictionnaires) et des connaissances en mathématiques  (fonctions et dérivées, limites, norme et produit scalaire) sont nécessaires pour suivre cette formation avec profit.

  • Responsables

    • Stephan CLEMENÇON

      Professeur au département Image, Données, Signal de Télécom Paris, il anime l’équipe de recherche S2A (Statistiques et Applications) au sein du laboratoire LTCI. Ses recherches portent principalement sur la théorie statistique de l'apprentissage. Il est responsable du Mastère Spécialisé « Big Data » à Télécom Paris et a été titulaire de la chaire industrielle « Machine Learning for Big Data » de 2013 à 2018. Il enseigne le machine learning à Télécom Paris, à l'ENSAE Paris, à l'Université Paris 7 et à l'ENS Cachan.

    • Igor COLIN

      Chercheur, docteur en apprentissage statistique de Télécom Paris. Ses domaines de recherches sont l’optimisation, les algorithmes distribués/décentralisés, la théorie de l’apprentissage.

Prochaine(s) session(s)

  • Du 28/09/2020 au 29/09/2020 à Paris - 1 500 €

Vous pourriez aussi être intéressé par...

En savoir plus

Machine Learning avancé

Domaine : Intelligence Artificielle et Big Data

Durée : 2 jour(s)