Thèse en bioinformatique
CDD · Thèse
· 36 mois
Bac+5 / Master
IFP Energies nouvelles · Rueil Malmaison (France)
Date de prise de poste : 1 novembre 2023
Mots-Clés
Données multi-omiques
intégration de données
analyse différentielle
approche bayésienne
séparation de source
réduction de dimension
science des données
Description
IFPEN conduit des recherches pour optimiser des procédés biotechnologiques dans le domaine de la chimie biosourcée et des biocarburants. Une part significative de ces améliorations est basée sur la biologie systémique qui permet d’accroitre la connaissance des mécanismes moléculaires des microorganismes. Dans ce but, des données omiques sont collectées pour représenter les différentes strates de régulation d’une cellule en fonction de conditions données. Toutefois, le traitement de ces données est généralement réalisé par strate et exploite difficilement la complémentarité des régulations. Pour notre organisme modèle, un compendium de données génomiques, transcriptomiques et épigénétiques a été rassemblé pour deux souches et dans deux conditions différentes. Dès lors, comment extraire les comportements différentiels d'un système biologique par combinaison de différentes modalités expérimentales ?
Pour répondre à cette question, un travail de thèse ambitieux et incrémental est envisagé. La finalité est de développer un nouvel outil bio-informatique identifiant les mécanismes systémiques invariants conjointement à ceux spécifiques des conditions expérimentales. Une première analyse, basée sur des approches bayésiennes, sera étudiée pour identifier le sous-ensemble de gènes conjointement invariants au travers des conditions et modalités expérimentales. Une seconde approche complémentaire basée sur de la séparation de source sera ensuite évaluée pour détecter conjointement les sous-ensembles de gènes variants et invariants. Nous proposons ensuite d’utiliser ces sous-ensembles pour projeter les données dans un espace de faible dimension, densifiant les données des gènes invariants. Ainsi une distance des gènes variants aux gènes invariants pourra être calculée. Ce type d’analyse différentielle conjointe des données omiques permettra d’améliorer la compréhension de notre organisme modèle.
Offre publiée le 2 mars 2023, affichage jusqu'au 30 juin 2023