Mots-Clés
variants structuraux
graphes de pangénomes
topologie
diversité génétique
évolution de pangénomes
adaptation
Description
La pangénomique est une approche innovante pour explorer la diversité génétique au sein d’une population, d’une espèce ou entre espèces. Le pangénome regroupe toutes les séquences présentes dans un groupe d’individus, en incluant les séquences partagées par tous (core genome) et celles spécifiques à un sous-ensemble (dispensable genome). Grâce aux avancées des technologies de séquençage de troisième génération, le nombre de génomes disponibles au sein d’une même espèce a considérablement augmenté, donnant accès à une diversité génétique plus exhaustive, comprenant les variations structurales avec leur impact sur l’adaptation aux environnements. Cela a entraîné un changement de paradigme, passant d’une référence linéaire à un graphe de pangénome.
Un graphe de pangénome rassemble l’information de plusieurs génomes dans une structure de données unique, où chaque nœud représente une séquence nucléotidique et chaque arête une connexion entre deux séquences adjacentes. Contrairement aux génomes linéaires, ces graphes capturent toute la diversité génétique d’une population.
Leur analyse topologique permet d’identifier les régions communes à tous les individus, ainsi que celles spécifiques à certains groupes. La construction de graphes de pangénome est facilitée avec l’utilsation de logiciels tel que Minigraph-cactus, et un nombre croissant d’outils permet de les exploiter pour des applications comme le génotypage. Des projets récents visent à enrichir ces graphes avec des données partielles pour mieux appréhender la diversité génétique, ou à les utiliser pour des études de GWAS.
Cependant, des défis demeurent, notamment lorsqu’il s’agit de comparer les graphes de pangénomes d’espèces différentes. L’analyse des similarités et des différences topologiques pourrait fournir des indices sur la diversité génétique de chaque espèce et les processus évolutifs, comme la sélection purifiante (réduisant la diversité) ou la sélection diversifiante (l’augmentant). Les effets de la co-évolution, comme ceux observés entre un hôte et son pathogène, pourraient aussi être analysée via une comparaison de la topologie des graphes.
Des approches issues d’autres disciplines offrent des outils prometteurs pour quantifier ces différences topologiques, comme les méthodes basées sur l’alignement de graphes ou l’intelligence artificielle. Adapter ces méthodologies au contexte des pangénomes permettrait d’explorer la diversité génétique sous un autre angle.
Cette thèse vise à développer et implémenter des approches innovantes pour analyser et comparer les graphes de pangénomes afin d’explorer la diversité intra-espèce, voire inter-espèce, en permettant de répondre à des questions telles que : Quelles régions sont spécifiques à une espèce ? Quelles régions sont partagées entre espèces ? Et, au sein des régions communes, dans quelle mesure ces structures sont-elles similaires ?
Les objectifs incluent :
- réaliser un état de l’art des méthodes de comparaison de graphes, qu’elles reposent sur des mesures topologiques ou sur l’intelligence artificielle ;
- développer des outils pour détecter les différences et similarités entre graphes, tout en tenant compte des caractéristiques biologiques des pangénomes ;
- identifier des signatures topologiques associées aux dynamiques écologiques et évolutives, comme l’impact de la domestication ou de la co-évolution.
Ces approches seront d’abord testées sur des données simulées, puis appliquées à des données réelles pour mieux comprendre les mécanismes évolutifs qui façonnent les pangénomes.
La thèse sera sous la direction de François Sabot, Séverine Bérard et Christine Tranchant-Dubreuil. Le ou la doctorante bénéficiera de l’expertise et des données disponibles dans les deux équipes d’accueil : l’équipe “PANgenome Evolution et ECosysteme” (PANEEC ) de l’UMR DIADE et l’équipe “Phylogénie et Évolution Moléculaire” (PEM ) de l’UMR ISEM .
Offre complète : https://adum.fr/as/ed/voirproposition.pl?langue=fr&matricule_prop=62396&site=gaia