Application of Large Language Models and Natural Language Processing methods on Health Studies

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Plateforme d'exploration du métabolisme · SAINT GENES CHAMPANELLE (France)

Mots-Clés

metabolomics IA LLM NLP

Description

Description du contexte et des objectifs du stage :

La plateforme d’exploration du métabolisme est spécialisée dans le développement en bioinformatique d’approches, d’outils et de bases de connaissances utiles au traitement des
données de métabolomique, avec un focus spécifique aux études large échelle en Nutrition et en Médecine personnalisées. Dans ce contexte, nous collaborons avec deux équipes INRAE
(IGEPP Rennes et TOXALIM Toulouse) pour le développement d’approches permettant d’exploiter massivement les données issues de ressources numériques publiques (bases de
données, littérature, jeux de données…) et la construction de graphes de connaissances participant à une meilleure contextualisation de nos données.

Le stage proposé s’inscrit dans ce projet et propose à la candidate ou au candidat de tester des approches basées sur les « grands modèles de langages » (LLM) ainsi que des méthodes de
« Traitement du Langage Naturel » (TLN) pour annoter des ensembles d’informations (métabolites et métadonnées biologiques et chimiques) provenant d’études de métabolomique
réalisées en Santé humaine. L’exploitation d’ontologies spécialisées issues du domaine biomédical sera abordé.

Déroulement du stage (attendus) :

  • Prise en main des approches en intelligence artificielle (LLM, BERT, …)
  • Prise en main des méthodes en TLN
  • Sélection des corpus de tests (Metabolights, PubMed, …)
  • Sélection des ontologies adaptées (via Ontology Lookup Service, NCBO BioPortal, …)
  • Réalisation d’un pipeline de traitement, déployable i) sous Docker et ii) sur une infrastructure de type Cluster Hadoop/Spark

Compétences requises :

  • Utilisation d’un langage de développement comme Python3
  • Curiosité pour les technologies orientées « Big Data » et les architectures informatiques orientées cloud
  • Connaissances en Biologie et des Omiques
  • Connaissance du langage Java est un plus
  • Niveau Master II en bioinformatique ou en informatique

Équipe d’accueil / environnement scientifique :

L’unité INRAE de Nutrition humaine (UMR1019 UNH) développe des solutions nutritionnelles innovantes pour favoriser le vieillissement en bonne santé, réduire les risques de maladies, et préserver la mobilité des personnes âgées. Le stage proposé sera réalisé au sein de l’équipe « Métabolisme et Spectrométrie de Masse » (MSM), composante principale de la Plate-Forme d’Exploration du Métabolisme (PFEM) sur le centre INRAE Auvergne-Rhône-Alpes à Theix.

La PFEM est une infrastructure scientifique majeure spécialisée dans l’étude du métabolome humain. Elle utilise des approches ouvertes en métabolomique dans le cadre de la biologie des
systèmes et vise la découverte de nouveaux biomarqueurs. La PFEM est aussi membre fondateur de MetaboHUB, l’Infrastructure Nationale en Métabolomique et Fluxomique. Au sein de l’équipe, le/la stagiaire sera intégré(e) au groupe « informatique-bioinformatique », composé de 4 ingénieurs (informatique, administration système, développement logiciel, bioinformatique).

Responsables scientifiques du stage / contact :

  • Tel : 04 73 62 47 72
  • Mail : franck.giacomoni@inrae.fr
  • Adresse : INRAE - UMR 1019 Human Nutrition Unit – Metabolism Exploration Platform MetaboHUB – Clermont Ferrand Centre de recherche de Clermont-Ferrand / Theix F-63122 Saint Genès Champanelle.

Candidature

Procédure : Envoyer votre candidature (Lettre et CV) par mail à: franck.giacomoni@inrae.fr

Contacts

 Franck Giacomoni
 frNOSPAManck.giacomoni@inrae.fr

Offre publiée le 13 octobre 2025, affichage jusqu'au 12 décembre 2025