Aperçu des sections

  • Contexte et objectif général :

    A la croisée de plusieurs champs disciplinaires : mathématiques, probabilités, statistiques, informatique, théorie de l’information et visualisation, la science des données met en œuvre différents outils d’analyse de données afin d’extraire automatiquement des informations utiles, des connaissances, à partir de données potentiellement massives. Le but ultime est de rendre cette information plus facile à exploiter, la protéger et la valoriser. Elle pourra servir de base ensuite à des processus d’évaluation et d’aide à la décision. 


    Source : https://towardsdatascience.com/introduction-to-statistics-e9d72d818745

    Ce cours est organisé en 2 UEs. La première de Master 1 permettra aux étudiant d'acquérir les bases mathématiques et informatiques de la science des données. La seconde de Master 2 abordera les notions plus avancées d'intelligence artificielle et d'apprentissage artificiel.


    UE Science des Données - Niveau 1 (Master 1)

    Les techniques actuellement mises en avant en intelligence artificielle reposent sur l'utilisation de données, nombreuses et hétérogènes, qui peuvent être croisées, analysées, afin de faire émerger des comportements récurrents, d'expliquer certains phénomènes, voire de prédire certains faits. Cette introduction permet de décrire les contextes propices à ce genre d'approches et donner un inventaire des techniques utilisées dans le domaine.  Cet enseignement a pour objectif de renforcer les compétences théoriques avec un approfondissement des statistiques et de la théorie des probabilités. D'autre part, les étudiants seront formés à l'utilisation de langages informatiques (SQL et R) pour réaliser des projets permettant de mettre en pratique les aspects théoriques de la science des données.

    Mots clés : probabilités, statistiques, base de données, apprentissage artificiel, R, sql.

    Prérequis : notions de base en probabilités, statistiques et programmation.

    Intervenants 

    • Gérard Dray (gerard.dray at mines-ales.fr) - Enseignant Chercheur - EuroMov Digital Health in Motion, Univ Montpellier, IMT Mines Ales, Ales, France
    • Nicolas Sutton-Charani (nicolas.sutton-charani at mines-ales.fr)- Enseignant Chercheur - EuroMov Digital Health in Motion, Univ Montpellier, IMT Mines Ales, Ales, France
    • Pierre Jean - Ingénieur de Recherche (pierre.jean at mines-ales.fr) - EuroMov Digital Health in Motion, Univ Montpellier, IMT Mines Ales, Ales, France


    Emploi du temps



  • Cours Introduction - Gérard Dray - Jeudi 25 janvier 2024

  • Cours No Code Data Science - Gérard Dray - Jeudi 25 janvier 2024

  • Cours Bases de Données - Pierre Jean - Jeudi 1er février 2024

    Les ressources sur le cours de base de données (SQL) de Pierre JEAN sont disponibles sur son site professionnel incluant la présentation au format PDF, les fichiers ressources et des exemples de codes :




  • PROJET

    Marqué
    • Objectif
      L'objectif de ce projet est de mettre en pratique des méthodes statistiques classiques et des méthodes apprentissage automatique sur un jeu de données de la littérature :
      https://bmcmedinformdecismak.biomedcentral.com/articles/10.1186/s12911-020-1023-5
      Le travail demandé est d'une part de reproduire au mieux les analyses et résultats proposés dans l'article et d'autre part de proposer d'autres approches originales d'analyse, de visualisation et de prévision.



      Rendu

      Le format attendu est un notebook Rmarkdown.


      Données

      Les données sont disponibles sur : https://www.kaggle.com/andrewmvd/heart-failure-clinical-data

      Une base de données SQL est à créer.  Les accès aux données seront gérés dans R via des requêtes SQL.


      Références 

      https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0181001




    • Logo flexdashboard

      The goal of flexdashboard is to make it easy to create interactive dashboards for R, using R Markdown.