Apprentissage : Etude du polymorphisme de génomes de légumineuses à graines via un pangénome

 Apprentissage · Stage M2  · 24 mois    Bac+4   INRAE Dijon UMR Agroécologie · Dijon (France)

 Date de prise de poste : 1 septembre 2023

Mots-Clés

pangénome génétique annotation légumineuse

Description

Contexte scientifique :
L'équipe ECP de l'UMR Agroécologie travaille sur la génomique et la génétique des légumineuses à graines (Pois, Lentille, Féverole) dans le cadre de l'agroécologie et du changement climatique. Ces génomes sont de grande taille (4,3 Gb pour le pois et la lentille, 13.5 Gb pour la féverole) et possèdent une grande complexité en éléments transposables. Le génome du pois a été séquencé via un consortium mené par l’équipe ECP en 2019 et a participé au consortium de celui de la féverole en 2023. Depuis les coûts des séquençage ont fortement diminué et la qualité des assemblages obtenus n'a cessé d'augmenter. Pour permettre de mieux activer les leviers génétiques sur ces espèces, il semble intéressant de dépasser le stade de la référence et de passer à une référence multiple via un pangénome de graphes. L'équipe dispose actuellement de plusieurs assemblages long-reads de génomes de pois et participe à plusieurs projets nous offrant un accès à d'autres séquences de pois et d'autres légumineuses d'ici les prochains mois.

Mission (s) de l’apprenti ingénieur dans ce contexte :
Durant ce stage, vous prendrez en main et caractériserez les données génomiques disponibles sur une diversité de légumineuses à graines et notamment de pois. Vous réaliserez une comparaison d'outils permettant de développer un pangénome de graphes. Vous vous appuierez pour cela sur les expériences d'autres scientifiques de l'INRAE et particulièrement ceux du PEPR AgroDiv (Genomic and functional characterization of domestic plant and animal genetic diversity as a keystone for agroecology: linking genome to phenome) et vous interagirez avec les collègues généticiens/génomiciens de l’équipe d’accueil et des équipes associées. A partir de vos résultats, vous concevrez un premier pipeline pour créer une référence pangénomique basée sur des outils existants et permettant ensuite la détection de variants structuraux (translocations, grands réarrangements) et/ou du polymorphisme de type SNP, INDEL et nombre de copies. Vous utiliserez postérieurement la référence pangénomique produite pour réaligner des reséquençages short-reads. Ils pourront être comparés aux matrices de variations SNPs déjà disponibles au sein de l’équipe.  Ces résultats serviront d’une part à alimenter une base de données graphe pour la génomique translationnelle au sein de l'unité. D’autre part, ils vous permettront de réinterpréter des résultats obtenus précédemment en GWAS. Vous participerez aussi à la réflexion sur l’utilisation de ces pangénomes en termes d’annotations (géniques et éléments transposables) afin de permettre une meilleure interprétation des résultats obtenus par les chercheurs.

Candidature

Procédure :

Date limite : 15 juin 2023

Contacts

Jonathan Kreplak

 joNOSPAMnathan.kreplak@inrae.fr

Offre publiée le 23 mai 2023, affichage jusqu'au 15 juin 2023