Investigating host-microbiota cooperation with gap-filling optimization problems

Informations générales
Nom
Frioux
Prénom
Clémence
Diplôme
Thèse
Année
2018
Détails de la thèse/HDR
Université
Jury
Samuel Chaffron
Mireille Ducassé
Oliver Ebenhöh
Vincent Fromion
Philippe Potin
Marie-France Sagot
Laurent Simon
Directeur (pour les thèses)
Anne Siegel
Résumé en français
Une définition de la biologie des sytèmes est l'intégration des données et connaissances, notamment par des méthodes bioinformatiques, afin de mieux appréhender la physiologie des organismes. La difficulté se trouve dans l’application de ces méthodes aux organismes non modèles, pour lesquels les données sont limitées, et plus généralement aux systèmes hôtes-microbiotes. La compréhension des mécanismes qui régissent ces derniers est un des objectifs de l’écologie des systèmes. Pour ce faire, les réseaux métaboliques constituent une solution reliant le génome aux fonctions. Plusieurs sémantiques existent pour modéliser ces réseaux ; elles ont une grande importance lors de leur construction, particulièrement aux étapes de complétions. La complétion de réseaux métaboliques est un problème combinatoire consistant à sélectionner des réactions dans une base de données afin d’assurer que le modèle obtenu satisfasse des critères de fonctionnalité. C’est une étape importante sujette à divers écueils : sur-ajustement à un objectif erroné, ajout de réactions fausses-positives et choix de la sémantique de fonctionnalité. Cette thèse a pour objectif de mieux comprendre ces limites et d’y proposer des solutions. Une première partie des résultats a consisté à étudier et comparer à grande échelle plusieurs algorithmes de complétion pour évaluer l’impact d’une sémantique basée sur les graphes par rapport aux sémantiques basées sur les contraintes linéaires. Puis une méthode de complétion hybride alliant ces deux sémantiques a été modélisée et développée. Enfin, le problème de complétion a été étendu à l’écologie des systèmes pour la sélection de communautés et le criblage de fonctions métaboliques dans les grands microbiotes. Les problèmes modélisés et résolus dans cette thèse ont été appliqués à l’étude du métabolisme des algues brunes et du microbiote intestinal.
Résumé en anglais
Systems biology relies on computational biology to integrate knowledge and data, for a better understanding of organisms’ physiology. Challenges reside in the applicability of methods and tools to non-model organisms, for which data is limited, and more generally to host-microbiota systems. Understanding the interactions in the later is an objective of systems ecology. Metabolic networks are a useful solution to model them functionally. In this direction, several semantics exist and are at the core of metabolic network reconstruction, particularly for their refinement through gap-filling. Gap-filling is a combinatorial problem that aims at selecting reactions in databases to ensure the feasibility of a behaviour by the model. It is a very crucial step due to various pitfalls: model overfitting, false positive, choice of functionality semantics. This thesis aimed at better understand these limits and propose solutions to them. As a first results part, we benchmarked several gap-filling algorithms to assess the value of graph-based semantics with respect to the constraint based one. Then we propose a hybrid gap-filling method that reconciles both semantics. Finally, we extended the gap-filling problem towards the selection of communities and the screening of metabolic functions within large microbiotas. Problems modelled and solved during this PhD were applied to brown algae metabolism and to the human gut microbiota.