Mots-Clés
microbiote
data science
réseaux d'interaction
métagénomique
bioanalyse
Description
Contexte et objectifs du stage
Acteur clé de la santé humaine, le microbiome est influencé par un ensemble de facteurs internes et externes tels que la nutrition, le système immunitaire et l’environnement. Sa modularité en fait une cible prometteuse pour le développement de solutions thérapeutiques et de recommandations nutritionnelles.
La multitude de bactéries qui compose le microbiome, issues d’espèces différentes, interagissent de différentes façons. Elles s’organisent à travers ces interactions pour fournir des services écosystémiques à l’hôte. L’inférence de réseaux d’interaction repose sur des outils mathématiques permettant d’étudier les liens de dépendances et les associations entre entités au sein d’un système biologique.
Au sein de l’unité INRAE MetaGenoPolis, l’équipe InfoBioStat (IBS) a conçu plusieurs méthodes d’inférence de réseaux pour étudier les interactions entre microorganismes (exemple Référence 2). À partir de données d’abondance, les noeuds des réseaux reconstruits représentent les espèces bactériennes et les arêtes la co-abondance entre ces espèces.
Cependant, les réseaux de co-abondance d’espèces ne prennent pas en comptes l’ensemble des données à disposition (données nutritionnelles, de santé, de mode de vie) ou qui peuvent être inférées à partir des données métagénomiques (modules fonctionnels et métaboliques). Des réseaux intégratifs permettraient de mettre en évidence les liens entre les espèces bactériennes et d’autres entités biologiques pertinentes comme des modules fonctionnels ou encore avec certains groupes alimentaires. Ce travail permettra d’améliorer notre compréhension de structures microbiennes complexes et leur lien avec la nutrition et des mécanismes métaboliques sous-jacents.
Ce stage s‘inscrit dans le projet Le French Gut (lefrenchgut.fr), qui est une initiative de science participative à grande échelle qui vise à rassembler 100 000 participants. Ce projet d’envergure nationale offre une opportunité unique d’explorer l’hétérogénéité du microbiome intestinal au sein de la population française, en identifiant les facteurs clés notamment liés au mode de vie, ainsi que les perturbations liées aux maladies chroniques.
Vos missions
-
Réaliser une revue bibliographique des principales méthodes d’inférence de réseaux adaptées aux données hétérogènes du microbiome par différents moyens (recherche par
mots clés dans moteurs spécialisés, LLM, connected papers, etc.). La méthodologie de recherche devra être documentée.
-
Réaliser un tableau de synthèse des différentes approches identifiées (type de données nécessaire, modèle statistique utilisé, performances, données utilisées pour la validation, etc.)
-
Sélectionner la méthode la plus adaptée aux objectifs du stage qui sera utilisée par la suite
-
Réaliser l’inférence de réseaux sur les données mises à disposition au sein de l’équipe (dont les données du projet Le French Gut), en combinant des types de données hétérogènes (données microbiologiques, fonctionnelles et/ou nutritionnelles par exemple) afin de produire un réseau intégratif
-
Analyser les réseaux produits et identifier des clusters d’intérêt (regroupement de plusieurs variables interagissant entre elles).
Ce travail de stage contribuera plus largement aux travaux réalisés dans le cadre d’un doctorat (https://theses.fr/s395210) et pourra faire l’objet de valorisations.
Profil souhaité
Formation M2 ou école d’ingénieur en biostatistiques, bioinformatique ou biologie orienté -omiques
Compétences en statistiques et en analyse de réseaux
Maîtrise du langage R
Familiarité avec l’environnement linux
Connaissances générales en microbiologie, en écologie et sur les problématiques liées aux données métagénomiques
Bon niveau d’anglais (lu, parlé, écrit)
Références
1. Berg, G. et al. Microbiome definition re-visited: old concepts and new challenges. Microbiome 8, 103 (2020). https://microbiomejournal.biomedcentral.com/articles/10.1186/s40168-020-00875-0
2. Champion, C. et al. OneNet—One network to rule them all: Consensus network inference from microbiome data. PLOS Computational Biology 20, e1012627 (2024). https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1012627
3. Peng, X. et al. iNAP 2.0: Harnessing metabolic complementarity in microbial network analysis. iMeta 3, e235 (2024). https://onlinelibrary.wiley.com/doi/abs/10.1002/imt2.235
Le stage pourra débuter entre janvier et mars 2026.