Méthodes computationnelles innovantes pour l’analyse haut-débit des données métabolomiques

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Département Médicaments et Technologies pour la Santé (MTS/SPI) · Gif-sur-Yvette (France)  à préciser lors de l'entretien

 Date de prise de poste : 1 mars 2022

Mots-Clés

traitement du signal déconvolution data mining spectrométrie de masse métabolomique

Description

Stage M2 : Méthodes computationnelles innovantes pour l’analyse haut-débit des données de spectrométrie de masse et la découverte de biomarqueurs en santé

Contexte

La métabolomique par spectrométrie de masse (MS) est une approche de pointe pour l’exploration chimique du vivant et la découverte de biomarqueurs en santé : elle a pour objectif de détecter, quantifier et identifier les milliers de petites molécules présentes dans les échantillons biologiques, et de développer des modèles prédictifs de la survenue d’une maladie ou de la réponse à un traitement.

Aussi, l’analyse computationnelle haut-débit des données MS constitue un enjeu majeur. Celles-ci se présentent en 3D (masse, temps de rétention, intensité) sous la forme de pics correspondant aux molécules détectées, et sont à la fois volumineuses (~10^2 Mo par échantillon) et complexes. L’équipe « science des données » développe depuis plus de dix ans des méthodes et des logiciels innovants en traitement du signal et en machine learning pour les données MS.

Sujet

Pour approfondir l’identification chimique en routine des composés, des approches technologiques prometteuses (dites MS/MS ou « de fragmentation ») se sont développées récemment. L’objet du stage porte sur l’analyse computationnelle des données combinées MS et MS/MS pour la découverte de biomarqueurs en recherche clinique.

La première partie du stage portera sur le traitement du signal de ces données pour extraire les spectres de fragmentation de qualité optimale, notamment grâce aux méthodes de déconvolution 2D (séparation de sources positives, régression parcimonieuse, clustering hiérarchique) pour éliminer les contaminations diverses (bruit, molécules co-fragmentées, etc.).

La seconde partie sera consacrée à l’analyse des spectres MS/MS par des approches de fouilles de données (e.g. recherche de motifs de pics fréquents) et de machine learning/deep learning (e.g. prédiction de fonction ou de classe chimique du composé à partir des bases de données spectrales ou moléculaires publiques).

Profil

Nous recherchons un(e) candidat(e) avec une solide formation en mathématiques appliquées (traitement du signal), et en informatique (logiciels R et C), et motivé(e) par les applications multidisciplinaires (chimie, biologie, clinique). Le master pourra se prolonger par une thèse.

Contact

Etienne Thévenot (etienne.thevenot@cea.fr)
Equipe de Sciences des Données
Département Médicaments et Technologies pour la Santé (MTS/SPI)
Université Paris-Saclay, CEA, INRAE, MetaboHUB CEA Saclay, F-91191 Gif sur Yvette, France
Web: https://scidophenia.github.io/

Candidature

Procédure : Merci d'envoyer votre candidature par mail à : etienne.thevenot@cea.fr

Date limite : 15 décembre 2021

Contacts

 Etienne Thévenot

 etNOSPAMienne.thevenot@cea.fr

 https://scidophenia.github.io

Offre publiée le 7 octobre 2021, affichage jusqu'au 31 décembre 2021