Mots-Clés
Métabolisme
omiques
Statistiques
Description
Stage M2 : Développement de méthodes d’identification de clusters d’intérêt à partir des résultats de modélisation suite à l’exposition de molécules toxiques.
Contexte :
L’exposition à certaines molécules chimiques a été montrée comme pouvant induire des effets indésirables sur notre métabolisme [1]. Le métabolisme est constitué d’un ensemble de processus biochimiques contenus dans les cellules des êtres vivants permettant d’assurer des tâches essentielles pour leur fonctionnement. Identifier les liens de causalité entre l’exposition à une molécule et des modifications du métabolisme constitue un enjeu majeur en santé humaine. Dans un but de réduire les tests sur les animaux permettant l’identification de possibles marqueurs métaboliques spécifiques de l’exposition à une molécule toxique, de nouvelles approches méthodologiques voient le jour. Des méthodes in vitro offrent une première exploration des mécanismes d’action métaboliques, et in silico, complémentaires à ces dernières, ajoutent une dimension supplémentaire et plus détaillée de ces mécanismes.
Parmi elles, une des approches utilisées pour détecter ces impacts métaboliques est la modélisation du réseau métabolique, qui est une représentation mathématique du métabolisme. Les outils de modélisation que nous utilisons nous permettent de concilier les données biologiques, qui sont ici des expressions de gènes, avec le réseau métabolique. L’objectif est de créer des modèles condition-spécifiques, c’est-à-dire, qui représentent de manière plus précise l’état métabolique de la cellule dans les conditions étudiées à partir de ces données de transcriptomiques. Il existe, en théorie, plusieurs modèles condition-spécifiques pouvant représenter l’état métabolique de la cellule. Nous les formalisons sous la forme d’une liste de réactions, avec pour chacune une valeur d’activation possible : ces combinaisons de valeurs d’activation représente les différents modèles possibles.
Afin d’identifier les ensembles de réactions métaboliques différentiellement activées entre deux conditions, nous utilisons une technique nécessitant un seuil [2]. Brièvement, nous comparons la fréquence d’activation des réactions entre deux conditions, puis nous sélectionnons celles dont la différence dépasse un seuil défini. Cette sélection de réactions d’intérêt nécessite donc d’interpréter les valeurs d’activations de chaque réaction sous une forme booléenne (activée ou non), et peut ainsi contribuer à une perte d’information.
Notre objectif est donc de pouvoir intégrer l’information du niveau d’expression des gènes de manière plus quantitative et d’identifier des groupes de réactions dont l’activité varie en corrélation avec le niveau d’exposition. Pour cela, nous souhaitons explorer, à travers ce projet de stage, l’utilisation et le développement de méthodes basées sur l’analyse de l’élasticité, c’est à dire, l’amplitude des valeurs quantitatives d’activation des réactions que nous obtenons pour chaque modèle condition spécifique [3, 4].
Sujet et Objectifs du stage :
Les objectifs du stage sont donc l’implémentation et l’intégration de méthodes d’analyses basées sur cette élasticité au sein du workflow de modélisation existant. L’étudiant ou l’étudiante fera un état des lieux bibliographique des méthodes existantes et appliquera les méthodes sélectionnées à des données transcriptomiques issues de la base de données publiques OPEN-TGGATES [5].
Pour mener à bien ce projet, plusieurs compétences techniques et méthodologiques seront développées, selon les étapes suivantes :
– Utiliser les bases de la modélisation et l’optimisation sous contraintes pour la simulation de flux métaboliques, en particulier avec la bibliothèque python COBRApy [6]
– Effectuer un état de l’art sur les différentes méthodes d’analyse prenant en compte cette amplitude de valeurs
– Implémenter les méthodes sélectionnées
– Mettre en place des bonnes pratiques de code, notamment pour s’assurer de la pérennité du code.
Compétences recherchées :
Nous recherchons un ou une stagiaire de master 2 ou équivalent ayant une formation de bio-informatique ou de biologie computationnelle, avec une plus forte appétence pour l’informatique répondant aux compétences listées ci-dessous :
– Programmation en python
– Anglais scientifique
– Connaissance en statistique et en optimisation sous contraintes
Les compétences suivantes seront un plus :
– Expérience avec des données transcriptomiques
– Connaissance des réseaux métaboliques
Environnement de travail :
Le stage sera réalisé au sein de l’équipe Métabolisme et Xénobiotiques, de l’unité INRAE Toxalim, qui inclut des bioinformaticiens (5 permanents et 8 contractuels/doctorants/post-doc) et des toxicologues. Il ou elle sera encadrée par Maxime Lecomte (Postdoctorant INRAE-l’Oréal) et Nathalie Poupin (Chargée de Recherche INRAE).
Merci d’envoyer CV + lettre de motivation à :
Nathalie Poupin : nathalie.poupin@inrae.fr
Maxime Lecomte : maxime.lecomte@inrae.fr
References :
[1] Heindel, JJ et al, 2017, Reproductive Toxicology.
[2] Fresnais, L et al, 2024, BMC Bioinformatics.
[3] Carbonell, P et al, 2017, ALTEX
[4] Paré, L et al, 2025, Bioinformatics
[5] Igarashi, Y et al, 2014, NAR
[6] Ebrahim, A et al, 2013, BMC Systems Biology