M2 - Pangénomique du riz à Montpellier

Type de poste
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

Montpellier
France

Contacts
Sarah Gautier
Dievart Anne
Email du/des contacts
gautier.sarah@inra.fr
anne.dievart@cirad.fr
Description

Stage Niveau M2

Période de Stage : de Février/Mars à Août 2019

Localisation du stage : UMR AGAP, Montpellier

Encadrants: Gautier Sarah (gautier.sarah@inra.fr, Tél : +33 4 67 61 56 31) et Anne Diévart (anne.dievart@cirad.fr, Tél : +33 4 67 59 39 84)

 

De la pangénomique à la pangénique

 

CONTEXTE GENERAL

Les données de variations de présence / absence de toutes les séquences codantes (appelées presence-absence variations (PAVs)) issues de l'assemblage et l'annotation de dizaines d'accessions séquencées au sein d'une même espèce sont des ressources exceptionnelles pour les analyses d'évolution de familles de gènes et la découverte de nouveaux gènes pouvant avoir une importance considérable dans l'expression des traits agronomiques. Dans toutes les analyses pangénomiques réalisées à ce jour, et comme attendu, il a été montré que les gènes présents dans un grand nombre d'accessions (les gènes core) sont impliqués dans des fonctions biologiques essentielles, alors que les gènes présents dans peu d'accessions (dispensable) évoluent rapidement et sont liés à des fonctions plus spécifiques de développement ou défense. Les gènes de la famille des kinases sont fortement représentés dans chacune de ces catégories et l'étude de leur histoire évolutive est donc particulièrement intéressante dans un contexte pangénomique.

Jusqu'à aujourd'hui, les séquences des pangénomes décrits dans la littérature sont composées des chromosomes (gènes) du génome de référence auxquels sont ajoutés les nouveaux contigs (gènes) non homologues des autres génomes. Aucune information de position de ces "nouveaux" gènes n'est disponible. Pourtant, pour que les biologistes puissent exploiter ces données au maximum, il faut réunir un certain nombre de prérequis, dont par exemple (i) que les données de PAV soient solides et donc fiables, avec une résolution de l'ordre du gène; et (ii) qu'elles soient présentées sous un format lisible pour les biologistes et donc ordonnées physiquement sur des chromosomes. Parce que ces prérequis ne sont pas disponibles pour l'instant, les analyses basées sur les pangénomes restent pour l'instant très globales. C'est par exemple le cas des deux analyses des pangénomes de riz publiées récemment1,2.

 

OBJECTIFS DU STAGE

Les objectifs du stage sont donc de développer des méthodes et des outils permettant d'améliorer les données de PAV par la prise en compte de l'adjacence des gènes dans les pangénomes. L'espèce modèle choisie est le riz (Oryza sativa) parce qu'un grand nombre de séquences sont publiquement accessibles dans les bases de données internationales et parce que nous possédons aussi, au sein de South Green, les données de séquençage de nombreuses accessions. Ces méthodes et outils seront développés sur une famille de gènes "test": les kinases, pour, entre autres, les raisons mentionnées précédemment. La méthode utilisée s'appuiera sur des algorithmes prenant en compte de l'adjacence des gènes. Cette méthode sera utilisée dans un premier temps sur une dizaine de génomes de riz disponibles et la famille des kinases afin d’en extraire les gènes core et dispensable, de façon à construire des données de PAV fiables et ordonnées.

 

Contrairement aux analyses globales présentées dans les articles "pangénomes" publiés à ce jour (analyses pangénomiques), le stage proposé a pour objectif de développer une nouvelle méthode de construction de pangénome centrée sur les familles de gènes et leurs fonctions, dans le but de pouvoir réaliser des analyses "pangéniques" basées sur les nouvelles données PAV générées. Les outils développés seront génériques et donc adaptables à différents génomes et familles de gènes. En fonction du stagiaire et des résultats obtenus, il pourra être envisagé une poursuite en thèse et/ou le dépôt d'une demande de financement sur cette thématique.

 

BIBLIOGRAPHIE

1-Wang et al. Nature 2018

2-Zhao et al. Nature genetics 2018

 

p { margin-bottom: 0.25cm; direction: ltr; line-height: 120%; text-align: left; }a:link { }