Comparaison et évaluation d’approches bioinformatiques et statistiques pour l’analyse du pathobiome des plantes cultivées

Informations générales
Nom
Pauvert
Prénom
Charlie
Diplôme
Thèse
Année
2019
Détails de la thèse/HDR
Jury
Marie-Laure Martin-Magniette (rapportrice)
Christophe Mougel (rapporteur)
Thierry Candresse (examinateur)
Chloé Delmas (examinatrice)
Frédéric Mahé (examinateur)
Jessica Vallance (co-directrice)
Corinne Vacher (directrice)
Directeur (pour les thèses)
Corinne Vacher
Jessica Vallance
Résumé en français
Les interactions entre micro-organismes sous-tendent de nombreux services écosystémiques, y compris la régulation des maladies des plantes cultivées. Un acteur de cette régulation est le pathobiome, défini comme le sous-ensemble des micro-organismes associés à une plante hôte et en interaction avec un agent pathogène. L’un des défis actuels consiste à reconstruire les pathobiomes à partir de données de metabarcoding, pour identifier des agents potentiels de biocontrôle et pour surveiller en temps réel leurs réponses aux changements environnementaux. Plusieurs verrous méthodologiques doivent cependant être levés pour atteindre ces objectifs. Tout d’abord, il n’existe pas de consensus concernant l’approche bioinformatique la plus fiable pour déterminer l’identité et l’abondance des micro-organismes présents dans les échantillons végétaux. De plus, les réseaux microbiens construits avec les méthodes actuellement disponibles sont des réseaux d’associations statistiques entre des comptages de séquences, non directement superposables aux réseaux d’interactions écologiques entre micro-organismes. L’objectif de la thèse était donc de déterminer les approches bioinformatiques et statistiques les plus pertinentes pour reconstruire des réseaux d’interactions microbiennes à partir de données de métabarcoding. Le modèle biologique était la vigne (Vitis vinifera) et l’oïdium de la vigne, Erysiphe necator. Nous avons tout d’abord déterminé l’approche bioinformatique la plus adaptée pour caractériser les communautés fongiques associées aux plantes, en comparant la capacité de 360 pipelines à retrouver la composition d’une communauté artificielle de 189 souches fongiques. DADA2 est apparu comme l’outil le plus performant. Nous avons ensuite évalué l’influence de la pratique culturale (viticulture conventionnelle vs. biologique) sur les communautés fongiques des feuilles de vigne et évalué le niveau de réplicabilité des réseaux microbiens construits avec une méthode d’inférence classique, SparCC. La réplicabilité était très faible, jetant ainsi un doute sur l’utilité de ces réseaux pour le biocontrôle et la biosurveillance. Nous avons donc utilisé une nouvelle approche statistique, le modèle PLN, qui permet de prendre en compte la variabilité environnementale, pour générer des hypothèses d’interactions au sein du pathobiome d’Erysiphe necator. Une fraction de ces hypothèses ont été testée par des co-cultures et par fouille automatique de la littérature. Quelques-unes ont été confirmées, ce qui indiquent que les réseaux microbiens, inférés adéquatement, génèrent des hypothèses plausibles d’interactions biotiques qu’il convient de tester pour développer de nouvelles stratégies de protection des cultures.
Résumé en anglais
Interactions among microorganisms underpin many ecosystem services, including the regulation of crop diseases. An actor in this regulation is the pathobiome, defined as the subset of microorganisms associated with a host plant in interaction with a pathogen. One of the current challenges is to reconstruct pathobiomes from metabarcoding data, in order to identify potential biocontrol agents and to monitor in real time their responses to environmental changes. However, several methodological hurdles must be overcome to achieve these objectives. First, there is no consensus on the most reliable bioinformatic approach to determine the identity and abundance of microorganisms present in plant samples. In addition, microbial networks built with currently available methods are networks of statistical associations between sequence counts, not directly related to networks of ecological interactions between microorganisms. The objective of the thesis was therefore to determine the most relevant bioinformatic and statistical approaches to reconstruct microbial interaction networks from metabarcoding data. The biological model was grapevine (Vitis vinifera) and the fungal agent of grapevine powdery mildew, Erysiphe necator. First, we determined the most appropriate bioinformatic approach to describe fungal communities associated with plants, by comparing the ability of 360 pipelines to recover the composition of an artificial community of 189 fungal strains. DADA2 appeared as the most powerful tool. We then evaluated the influence of the cropping system (conventional vs. organic viticulture) on foliar fungal communities of grapevine and assessed the level of replicability of microbial networks built with a standard inference method, SparCC. Replicability was very low, casting doubt on the usefulness of these networks for biocontrol and biomonitoring. We therefore used a new statistical approach, the PLN model, which allowed us to take into account environmental variability, to generate hypotheses of interactions in the pathobiome of Erysiphe necator. Some of these hypothesis were tested by co-cultures and by text-mining. A few were confirmed, indicating that microbial networks, when properly inferred, provide plausible hypotheses of biotic interactions that need to be tested to develop new strategies for crop protection.