Passer au contenu principal
Moodle UM
  • Accueil
  • Tous les cours
    Catalogue de cours Recherche de cours
  • Aide
    Enseignants / Personnels Etudiants Assistance
  • Vidéo
  • ENT
  • Plus
Fermer
Activer/désactiver la saisie de recherche
Français ‎(fr)‎
Deutsch ‎(de)‎ English ‎(en)‎ Español - Internacional ‎(es)‎ Français ‎(fr)‎ Italiano ‎(it)‎ 简体中文 ‎(zh_cn)‎
Vous êtes connecté anonymement
Connexion
Accueil Tous les cours Replier Déplier
Catalogue de cours Recherche de cours
Aide Replier Déplier
Enseignants / Personnels Etudiants Assistance
Vidéo ENT
  1. HAH811E9 - Science des Données - Niveau 1
  2. TP NoCode Machine Learning évalué

TP NoCode Machine Learning évalué

Conditions d’achèvement
Ouvert le : jeudi 27 mars 2025, 00:00
À rendre : jeudi 3 avril 2025, 01:00

Travaux Pratiques

Prédiction des maladies du foie


Problématique

Les maladies du foie représentent un enjeu majeur de santé publique, notamment en Inde. La détection précoce de ces pathologies est essentielle pour améliorer les résultats cliniques. Le jeu de données Indian Liver Patient Dataset (ILPD) a été collecté dans cette optique, afin de fournir un support aux médecins pour identifier plus rapidement les patients atteints. Il contient des informations cliniques et biologiques (bilirubine, enzymes hépatiques, albumine…) permettant de modéliser le risque.


Objectif du TP

Développer un modèle de machine learning capable de prédire la présence d'une maladie du foie à partir de données cliniques, en utilisant l'outil Orange.


Compétences visées

- Prétraitement et analyse de données biomédicales.
- Construction et évaluation de modèles de classification.
- Interprétation des résultats dans une démarche d’aide à la décision médicale.


Sujet du TP


1. Présentation du jeu de données

583 patients, dont 416 atteints et 167 non atteints. Variables : âge, sexe, bilirubine, enzymes hépatiques, protéines, albumine, etc.


2. Préparation des données

Chargement et exploration du fichier dans Orange. Traitement des valeurs manquantes et des variables qualitatives. Normalisation des variables si nécessaire.


3. Analyse exploratoire

Statistiques descriptives. Visualisations des distributions et des corrélations. Observation des différences entre les groupes (malades / non malades).


4. Modélisation

Application d’au moins trois algorithmes : régression logistique, k-NN, forêts aléatoires, SVM… Validation croisée pour évaluer les performances.


5. Évaluation

Utiliser uniquement la F1-mesure pour comparer les modèles. Justifier le choix du modèle final.


6. Interprétation

Analyse des variables importantes. Discussion sur l’usage potentiel du modèle dans un contexte clinique.


Modalités de rendu

Le rendu est à déposer sur l’ENT de l’Université de Montpellier. Il devra comprendre :

  • Un compte rendu (PDF) présentant les étapes réalisées, les résultats obtenus et leur interprétation.
  • Les fichiers Orange (.ows) correspondant aux workflows utilisés.
  • Possibilité de travailler en monôme ou en binôme
  • Nommage des fichiers : 
    • Nom1_Nom2.pdf
    • Nom1_Nom2.ows


Recommandations pour organiser votre travail

  • Commencer par une exploration visuelle des données pour repérer les anomalies.
  • Documenter chaque étape dans le compte rendu (préparation, choix de modèles, résultats, interprétation).
  • Tester plusieurs modèles et paramètres pour choisir celui ayant la meilleure F1-mesure.
  • Sauvegarder régulièrement vos workflows (.ows) dans Orange.
  • Soigner la qualité de la rédaction du rapport, y compris les légendes des figures.


Ressources

  • Jeu de données "Indian Liver Patient Dataset" (ILPD) : Lien vers le dataset​

  • Documentation d'Orange : Lien vers la documentation​

  • Tutoriel sur l'utilisation d'Orange pour le machine learning : Lien vers le tutoriel



Annexe – Description des variables du jeu de données ILPD

Nom du descripteur

Description

Age

Âge du patient en années. Peut influencer la prévalence et la gravité des maladies du foie.

Gender

Sexe du patient (Male ou Female). Certaines pathologies hépatiques sont influencées par le sexe.

Total_Bilirubin

Taux total de bilirubine dans le sang. Indique un dysfonctionnement hépatique ou une obstruction biliaire.

Direct_Bilirubin

Bilirubine conjuguée. Élevée en cas d’obstruction biliaire ou d’atteinte hépatique.

Alkaline_Phosphotase

Phosphatase alcaline. Élevée en cas de cholestase ou obstruction des voies biliaires.

Alamine_Aminotransferase (ALT)

Enzyme hépatique intracellulaire. Élevée en cas de cytolyse hépatique.

Aspartate_Aminotransferase (AST)

Enzyme intracellulaire moins spécifique. Élevée lors de lésions hépatiques.

Total_Proteins

Protéines plasmatiques totales. Révèle la capacité de synthèse du foie.

Albumin

Protéine synthétisée par le foie. Diminue en cas d’insuffisance hépatique.

Albumin_and_Globulin_Ratio

Rapport albumine/globulines. S’inverse en cas de maladies chroniques du foie.

Dataset

Variable cible : 1 = malade, 2 = sain.


 


Annexe – Glossaire des termes médicaux

  • Bilirubine : Pigment jaune issu de la dégradation de l’hémoglobine, dont l'accumulation provoque l'ictère.
  • Albumine : Protéine synthétisée par le foie, responsable du maintien de la pression osmotique.
  • ALT (Alanine Aminotransferase) : Enzyme hépatique intracellulaire. Son élévation traduit une souffrance hépatique.
  • AST (Aspartate Aminotransferase) : Enzyme intracellulaire retrouvée dans plusieurs organes, notamment le foie et le cœur.
  • Phosphatase alcaline : Enzyme dont l’élévation indique une obstruction des voies biliaires ou une cholestase.
  • Cytolyse : Destruction des cellules, en particulier des hépatocytes dans le contexte hépatique.
  • Cholestase : Ralentissement ou arrêt de l’écoulement de la bile.
  • Hypoalbuminémie : Diminution du taux d’albumine dans le sang, fréquente en cas de cirrhose.

 



  • 2025_Sujet_Travaux_Pratiques.pdf 2025_Sujet_Travaux_Pratiques.pdf
    27 mars 2025, 08:48
  • Indian Liver Patient Dataset v2.csv Indian Liver Patient Dataset v2.csv
    27 mars 2025, 14:00
Vous êtes connecté anonymement (Connexion)
Résumé de conservation de données
Fourni par Moodle