Exploration de la chimiodiversité du vivant par des approches métabolomiques et fouille de données

 CDD · Thèse  · 36 mois    Bac+5 / Master   LRSV UMR5546 CNRS et IRIT UMR5505 CNRS · Toulouse (France)

 Date de prise de poste : 1 septembre 2021

Mots-Clés

LC-MS, Métabolomique, Base de données, Machine Learning, phylogénie.

Description

Informations générales


Description du projet

La chimiodiversité du vivant est estimée à plusieurs millions de composés dont seule une fraction est répertoriée au travers de plusieurs ressources hétérogènes. Le projet ChemoMaps se propose de cartographier cette diversité chimique à l’aide d’approches holistiques en reliant plusieurs couches d’informations orthogonales par l’intermédiaire de modèles d’apprentissage machine. Le projet s’appuiera sur une base de données relationnelles comprenant plusieurs milliers de composés d’origine naturelle, accompagnés de leurs métadonnées, dont l’origine biologique, la classification chimique et les activités biologiques.  Des modèles d’inférence seront développés afin de construire un réseau phylo-moléculaire. Ces inférences seront croisées aux modèles phylogénétiques existants puis validées à l’aide d’acquisitions métabolomiques par spectrométrie de masse sur des taxons d’intérêts. Ainsi, cette approche holistique permettra d’étendre la couverture du métabolome du vivant, de caractériser les systèmes évolutifs moléculaires et de prioriser la recherche de composés bioactifs sur des taxons d’intérêts. 


Objectif de la thèse

  • En collaboration étroite avec le consortium du projet ChemoMaps, identifier des taxons d’intérêts particuliers et établir des protocoles d’extractions adéquates (champignons, algues, plantes fraiches, herbiers). 

  • Mettre au point des méthodes d’acquisition UHPLC-MS innovantes en se focalisant sur le multiplexage des données. 

  • Valider les modèles d’inférences développés par le consortium en participant aux développements des modèles et des outils de requêtage.  


Contexte de travail

Cette thèse s’inscrit dans une approche résolument pluridisciplinaire à l’interface entre la fouille de donnée massive et la métabolomique par chromatographie liquide couplée à la spectrométrie de masse en haute résolution. Le candidat.e effectuera ses travaux expérimentaux au sein du Laboratoire de Recherche en Sciences Végétales (LRSV, UMR5546, UPS/CNRS) en bénéficiant des outils de la plateforme Métatoul-AgromiX (UHPLC-QEx+, UHPLC-Qtrap, GC-MS) ainsi que des réseaux de compétences Métatoul et de l’infrastructure nationale MetaboHub. La collecte d’échantillons biologique sera effectuée au Jardin du Muséum de Toulouse ainsi que dans les collections du LRSV. L’expertise en fouille de donnée sera apportée par l’institut de recherche en informatique de Toulouse (IRIT, UMR 5505 CNRS/INPT/UT3/UT1/UT2) ainsi que de son environnement matériel comprenant des serveurs de stockages et de calculs. À ce titre, ces travaux seront co-dirigés par Guillaume Marti (MCU, UT3/LRSV) et Guillaume Cabanac (MCU-HDR, UT3/IRIT). Le ou la candidat·e sera inscrit·e à l’école doctorale SEVAB de l’université Toulouse III. 



Compléments

Le ou la candidat·e devra être titulaire ou en cours d’acquisition d’un diplôme d’ingénieur et/ou d’un master 2 en bio-informatique ou informatique appliquée à la chimie des substances naturelles. Le poste nécessite de solides connaissances en langage de programmation (Python, R, SQL) et en chimie analytique. Des aptitudes de communication orale et écrite (français et anglais nécessaires) seront indispensables pour présenter les travaux en congrès et rédiger des articles dans des revues scientifiques à comité de lecture. Nous recherchons une personne motivée qui saura s’impliquer dans son projet, curieuse, ayant une certaine autonomie et une forte motivation pour développer des compétences en métabolomique, fouille de données et dans le domaine de l’apprentissage machine. De plus, cette personne devra être apte à travailler en équipe sur des projets pluridisciplinaires et apprécier communiquer avec une large communauté de chercheurs et ingénieurs de diverses disciplines. 


Spécificité du poste

Le ou la doctorant·e manipulera des solvants organiques sous sorbonne tout en respectant les bonnes pratiques de laboratoires et les normes de qualités en vigueur (ISO 9001 et NFX 50-900). 

Candidature

Procédure : Les candidatures devront inclure un CV détaillé ; au moins deux références (personnes susceptibles d’être contactées) ; une lettre de motivation d’une page ; un résumé d’une page du mémoire de master ; les notes de Master 2 ou d’école d’ingénieur obtenues jusqu’alors.

Date limite : 23 juin 2021

Contacts

Guillaume Marti

 guNOSPAMillaume.marti@univ-tlse3.fr

Offre publiée le 26 avril 2021, affichage jusqu'au 23 juin 2021