Étude et implémentation d’approches prédictives pour la métabolomique dans Galaxy

 Stage · Stage M2  · 6 mois    Bac+5 / Master   UMR 1332 Biologie du Fruit et Pathologie · Villenave d'Ornon Cedex (France)

 Date de prise de poste : 1 janvier 2026

Mots-Clés

Métabolomique Prédiction de phénotypes Apprentissage automatique Reproductibilité

Description

Contexte et problématique :

Les approches de métabolomique permettent d’obtenir une vision globale des métabolites présents dans un échantillon biologique, fournissant ainsi une empreinte chimique associée à un état physiologique, un stress ou un état général d’un organe, d’un individu ou d’un écosystème.
Ces données riches ouvrent la voie à des approches prédictives basées sur le machine learning, permettant d’anticiper un phénotype à partir d’un profil métabolique, notamment à l’aide de méthodes statistiques et d’apprentissage automatique. Cependant, la diversité des méthodes et des paramètres, ainsi que les risques de surapprentissage, rendent ces approches délicates à mettre en œuvre et à interpréter pour les non-spécialistes.
Dans le cadre de MetaboHub, infrastructure nationale de métabolomique et fluxomique, ce stage a pour objectif de recenser les approches existantes, d’identifier les points d’attention liés à leur utilisation et de développer un outil Galaxy facilitant leur mise en œuvre et leur diffusion auprès de la communauté scientifique.

Objectifs généraux du stage / Résultats attendus :

L’objectif du stage est de faciliter l’utilisation des approches prédictives sur données métabolomiques par les biologistes, en développant un outil dédié dans Galaxy. Pour cela, le ou la stagiaire concevra un module intégrant plusieurs méthodes d’apprentissage statistique ou automatique permettant de relier des profils métabolomiques à des phénotypes mesurés. Il ou elle analysera les bonnes pratiques et points d’attention critiques associés à ces approches, tels que la préparation des données, la sélection de variables, la validation des modèles ou leur interprétation biologique, afin d’en assurer un usage fiable et reproductible. Ce travail s’appuiera sur un inventaire bibliographique raisonné des méthodes existantes et donnera lieu à une implémentation opérationnelle dans Galaxy, testée et validée en collaboration étroite avec des biologistes sur des jeux de données réels issus de MetaboHub.
Ce stage aura lieu durant le premier semestre 2026.

Projet dans lequel s’insère le stage :

Ce travail est prévu en relation avec le consortium MetaboHub3.0 financé par le Projet de Loi de Finance.

Activités confiées au ou à la stagiaire :

  • Réalisation d’un état de l’art des approches prédictives appliquées à la métabolomique
  • Développement d’un outil Galaxy pour l’aide à la construction de modèles prédictifs, incluant des garde-fous méthodologiques
  • Tests et validation de l’outil sur des données réelles en collaboration avec des biologistes.

Profil :

  • Étudiant.e en M2 de bioinformatique, biostatistique, data science ou domaine proche
  • Compétences en analyse de données, éventuellement en modélisation prédictive (R ou Python) appréciées
  • Intérêt pour la biologie des systèmes et la métabolomique
  • Une connaissance de Galaxy et de la gestion de workflows reproductibles serait un atout, sans être indispensable
  • Bon relationnel pour interagir avec des biologistes et des informaticiens

Candidature

Procédure : Envoyer un e-mail à : sylvain.prigent@inrae.fr

Date limite : 1 décembre 2025

Contacts

 Sylvain Prigent
 syNOSPAMlvain.prigent@inrae.fr

 https://nextcloud.inrae.fr/s/RjCJzsnP7KDJyDE

Offre publiée le 22 octobre 2025, affichage jusqu'au 1 décembre 2025