Exploration de la chimiodiversité du vivant par des approches métabolomiques et fouille de données
CDD · Thèse · 36 mois Bac+5 / Master LRSV UMR5546 CNRS et IRIT UMR5505 CNRS · Toulouse (France)
Date de prise de poste : 1 septembre 2021
Mots-Clés
LC-MS, Métabolomique, Base de données, Machine Learning, phylogénie.
Description
Informations générales
Contrat doctoral de 36 mois rémunéré (Programme CNRS 80PRIME)
Début du contrat : Septembre 2021
Lieu : Université de Toulouse III-Paul Sabatier
École doctorale : Sciences écologiques, vétérinaires, agronomiques et bioingénieries
Directeurs de thèse :
- Guillaume Marti (guillaume.marti@univ-tlse3.fr)
- Guillaume Cabanac (guillaume.cabanac@univ-tlse3.fr)
Description du projet
La chimiodiversité du vivant est estimée à plusieurs millions de composés dont seule une fraction est répertoriée au travers de plusieurs ressources hétérogènes. Le projet ChemoMaps se propose de cartographier cette diversité chimique à l’aide d’approches holistiques en reliant plusieurs couches d’informations orthogonales par l’intermédiaire de modèles d’apprentissage machine. Le projet s’appuiera sur une base de données relationnelles comprenant plusieurs milliers de composés d’origine naturelle, accompagnés de leurs métadonnées, dont l’origine biologique, la classification chimique et les activités biologiques. Des modèles d’inférence seront développés afin de construire un réseau phylo-moléculaire. Ces inférences seront croisées aux modèles phylogénétiques existants puis validées à l’aide d’acquisitions métabolomiques par spectrométrie de masse sur des taxons d’intérêts. Ainsi, cette approche holistique permettra d’étendre la couverture du métabolome du vivant, de caractériser les systèmes évolutifs moléculaires et de prioriser la recherche de composés bioactifs sur des taxons d’intérêts.
Objectif de la thèse
En collaboration étroite avec le consortium du projet ChemoMaps, identifier des taxons d’intérêts particuliers et établir des protocoles d’extractions adéquates (champignons, algues, plantes fraiches, herbiers).
Mettre au point des méthodes d’acquisition UHPLC-MS innovantes en se focalisant sur le multiplexage des données.
Valider les modèles d’inférences développés par le consortium en participant aux développements des modèles et des outils de requêtage.
Contexte de travail
Cette thèse s’inscrit dans une approche résolument pluridisciplinaire à l’interface entre la fouille de donnée massive et la métabolomique par chromatographie liquide couplée à la spectrométrie de masse en haute résolution. Le candidat.e effectuera ses travaux expérimentaux au sein du Laboratoire de Recherche en Sciences Végétales (LRSV, UMR5546, UPS/CNRS) en bénéficiant des outils de la plateforme Métatoul-AgromiX (UHPLC-QEx+, UHPLC-Qtrap, GC-MS) ainsi que des réseaux de compétences Métatoul et de l’infrastructure nationale MetaboHub. La collecte d’échantillons biologique sera effectuée au Jardin du Muséum de Toulouse ainsi que dans les collections du LRSV. L’expertise en fouille de donnée sera apportée par l’institut de recherche en informatique de Toulouse (IRIT, UMR 5505 CNRS/INPT/UT3/UT1/UT2) ainsi que de son environnement matériel comprenant des serveurs de stockages et de calculs. À ce titre, ces travaux seront co-dirigés par Guillaume Marti (MCU, UT3/LRSV) et Guillaume Cabanac (MCU-HDR, UT3/IRIT). Le ou la candidat·e sera inscrit·e à l’école doctorale SEVAB de l’université Toulouse III.
Compléments
Le ou la candidat·e devra être titulaire ou en cours d’acquisition d’un diplôme d’ingénieur et/ou d’un master 2 en bio-informatique ou informatique appliquée à la chimie des substances naturelles. Le poste nécessite de solides connaissances en langage de programmation (Python, R, SQL) et en chimie analytique. Des aptitudes de communication orale et écrite (français et anglais nécessaires) seront indispensables pour présenter les travaux en congrès et rédiger des articles dans des revues scientifiques à comité de lecture. Nous recherchons une personne motivée qui saura s’impliquer dans son projet, curieuse, ayant une certaine autonomie et une forte motivation pour développer des compétences en métabolomique, fouille de données et dans le domaine de l’apprentissage machine. De plus, cette personne devra être apte à travailler en équipe sur des projets pluridisciplinaires et apprécier communiquer avec une large communauté de chercheurs et ingénieurs de diverses disciplines.
Spécificité du poste
Le ou la doctorant·e manipulera des solvants organiques sous sorbonne tout en respectant les bonnes pratiques de laboratoires et les normes de qualités en vigueur (ISO 9001 et NFX 50-900).
Candidature
Procédure : Les candidatures devront inclure un CV détaillé ; au moins deux références (personnes susceptibles d’être contactées) ; une lettre de motivation d’une page ; un résumé d’une page du mémoire de master ; les notes de Master 2 ou d’école d’ingénieur obtenues jusqu’alors.
Date limite : 23 juin 2021
Contacts
Guillaume Marti
guNOSPAMillaume.marti@univ-tlse3.fr
Offre publiée le 26 avril 2021, affichage jusqu'au 23 juin 2021