Intégration de données et génomique translationnelle chez les protéagineux

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

17 rue Sully
21000 Dijon
France

Contacts
Jonathan Kreplak
Nadim Tayeh
Email du/des contacts
jonathan.kreplak@inra.fr
nadim.tayeh@inra.fr
Description

Contexte général
Au sein de l’unité mixte de recherche Agroécologie de l’INRA de Dijon, l’équipe Espèces Cibles Protéagineuses (ECP) travaille depuis plusieurs années sur la génétique et la génomique des protéagineux, légumineuses à graines riches en protéines. De nombreuses ressources en génétique, génomique et autres –omiques ont été développées chez le pois pour servir à des programmes de recherche tel que le projet d’Investissement d’Avenir PeaMUST (https://www.peamust-project.fr/). Les efforts ont même conduit l’équipe ECP et ses collaborateurs à décrypter la séquence du génome de cette espèce (https://doi.org/10.1038/s41588-019-0480-1). Outre le pois, l’équipe ECP travaille également sur la féverole et depuis peu sur la lentille. La féverole et la lentille sont deux espèces phylogénétiquement proches du pois. Les recherches menées visent essentiellement à favoriser la stabilité du rendement et à améliorer la qualité des produits, donc des grains. Plusieurs facteurs rentrent en jeu y compris la résistance aux stress biotiques (maladies, ravageurs) et abiotiques (stress hydrique, stress thermique et autres).
Il y a actuellement un réel besoin pour développer des outils qui permettent (1) d’interroger et de croiser les données acquises en génétique et en –omiques chez les différentes espèces de protéagineux de manière intelligente et efficiente et (2) d’explorer les limites entre synténie structurale et fonctionnelle. Ces outils serviront pour l’amélioration variétale qui doit répondre à de nouveaux enjeux comme le réchauffement climatique et la transition agro-écologique. Croiser les connaissances fournies par la séquence du génome du pois, avec celles fournies par des approches de génétique quantitative, de détection de polymorphismes et de transcriptomique, permet par exemple de mettre en évidence les déterminants génétiques et moléculaires sous-jacents à des caractères d’intérêt. Et, s’il y a conservation de déterminisme entre espèces, les données exploitables pour une première espèce seront rapidement exploitables pour la deuxième espèce permettant ainsi d’accélérer les avancées en recherche et en sélection.

Objectifs du stage
Le stage aura pour objectif d’intégrer des données hétérogènes appartenant à diverses espèces de légumineuses pour ensuite pouvoir les interroger. Le(a) candidat(e) se familiarisera d’abord avec les données sur les légumineuses produites par l’équipe ECP et celles disponibles dans la littérature ainsi qu’avec les différentes approches de génomique comparative combinant entre autres synténie et alignements. Il constituera ensuite un corpus de données interrogeables pour répondre à un ou deux cas types de génomique translationnelle qui seront définis avec le(a) candidate(e). Ces cas types seront principalement orientés vers le transfert de données d’un organisme à l’autre. Le stagiaire devra enfin pouvoir proposer un ensemble d’analyses automatisées et des visualisations permettant une interrogation accessible et reproductible.

L’encadrement scientifique sera assuré par Jonathan Kreplak, ingénieur bioinformaticien et Nadim Tayeh, chargé de recherche en génétique et génomique.

Compétences
L'étudiant(e) devra avoir réalisé une formation en bioinformatique et être familier avec un environnement linux. Le développement se fera principalement en R pour les parties statistiques et visualisations, et avec nextflow pour la partie workflow mais pourra utiliser aussi du python et du bash. Des connaissances des principaux types de données -omiques et de génétique seraient souhaitables.

Equipe adhérente personne morale SFBI
Equipe Non adhérente