Identification de gènes impliqués dans l’élaboration des caractères agronomiques en couplant génétique d’association, sélection génomique et transcriptomique haut débit

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

GQE-Le Moulon
Ferme du moulon
91190 Gif-Sur-Yvette
France

Contacts
Stéphane Nicolas
Renaud Rincent
Email du/des contacts
stephane.nicolas@inrae.fr
renaud.rincent@inrae.fr
Description

Identification de gènes impliqués dans l’élaboration des caractères agronomiques en couplant génétique d’association, sélection génomique et transcriptomique haut débit

Mots clefs : génétique d'association, insertion/délétion, RNAseq, variation structurale, stress hydrique, sélection génomique, sélection phénomique

Encadrement:
Le stage sera encadré par Stéphane Nicolas (stephane.nicolas@inrae.fr) et Renaud Rincent (renaud.rincent@inrae.fr), Chargés de recherche, Génétique Quantitative et Méthodologie de la Sélection.

Localisation:
Le stage aura lieu à l'UMR Génétique Quantitative et Evolution - Le Moulon (Gif-sur-Yvette, http://moulon.inra.fr/) qui mène des recherches en génétique/génomique et évolution des caractères à déterminisme complexes par des approches multi-échelle.

Description du stage:
Le stage s'inscrit dans le projet investissement d'avenir Amaizing (https://amaizing.fr/) qui regroupe l'INRAE, Arvalis et l'ensemble des semenciers français travaillant sur le maïs. Dans le cadre de ce projet, nous nous intéressons aux déterminismes génétiques et aux mécanismes moléculaires impliqués dans l'élaboration de caractères d'intérêt agronomiques dont la tolérance au stress hydrique.
Pour cela, nous avons couplé des approches de génétique d'association avec des approches écophysiologiques, de protéomique quantitative, de métabolomique et de transcriptomique en collaboration avec le LEPSE (INRAE Montpellier), la plateforme de protéomique PAPPSO (INRAE GQE-Le Moulon), de métabolomique (INRAE Bordeaux), et de transcriptomique (Biogemma, Université de Louvain La Neuve, Université de Milan). Nous avons mesuré, dans un panel comportant 254 génotypes de maïs, des caractères agronomiques au champ (rendement, floraison, hauteur...), des paramètres écophysiologiques (croissance, surface foliaire, transpiration) et des phénotypes moléculaires (abondances de protéines, de métabolites et expression de certains gènes : aquaporines et florigènes) dans des environnements contrastés pour le stress hydrique (irrigation normale et déficit hydrique). Nous avons génotypé ce panel de 254 génotypes au moyen de 1 million de SNP et de 90,000 Insertions / Delétions (Mabire, Duarte et al., 2019) incluant des gènes absents du génome de référence et potentiellement impliqués dans l’adaptation à l'environnement (Darracq et al., 2018, Mabire et al., in prep). Nous avons mis en œuvre des approches de génétique d'association pour détecter des régions génomiques associées aux variations de ces différentes classes de caractères (Millet et al., 2016, Prado et al., 2018, Negro et al., 2019, Blein-Nicolas et al., 2020). Nous avons ainsi mis en évidence des régions du génome cumulant des SNP associés aux variations de caractères phénotypiques (QTL) et des SNP associés aux variations d'abondance de protéines (pQTL). Ces résultats suggèrent l'existence de déterminismes génétiques communs entre les abondances de protéines et les caractères phénotypiques et ont permis d'identifier des gènes candidats potentiellement impliqués dans la tolérance à la sécheresse (Blein-Nicolas et al., 2019). Toutefois, contrairement aux approches transcriptomiques, les approches protéomiques ne permettent pas d’accéder à l’ensemble du répertoire de gènes exprimés, notamment les protéines membranaires comme les aquaporines, connues pour être impliquées dans le stress hydrique. Le couplage de la génétique d’association avec des approches de transcriptomique ciblée (RT-PCR) sur les aquaporines (protéines impliquées dans le transport transmembranaire de l’eau) a permis d’identifier les régions régulant la réponse de ces gènes au stress hydrique (eQTLs) et ainsi de mieux comprendre l’implication de ces gènes dans la réponse du maïs au stress hydrique (Maestriaux et al., in prep). De la même manière, l’identification de eQTLs pour des florigène (gène impliqué dans la floraison) a permis de décortiquer le déterminisme génétique de la floraison chez le maïs (Castelleti et al., 2020). L’acquisition de données transcriptomiques sur l’ensemble des gènes du maïs par des approches de séquençage d’ARN (RNAseq) sur ce panel ouvre des perspectives pour mieux comprendre le déterminisme génétique des caractères.
En parallèle des approches de génétique d’association, des modèles de prédiction génomique des interactions génotype x environnement ont été appliqués avec succès sur ce jeu de données (Millet et al. 2019) dans un réseau d’essais multi-local. Une analyse différentielle de l’expression des gènes en fonction des conditions environnementales devrait permettre de déterminer des gènes d’adaptation au stress hydrique. Cette connaissance pourra être utilisée pour introduire plus d’information biologique dans les modèles de prédiction, notamment dans un contexte d’interactions génotype x environnement. L’utilisation de données omiques (transcriptomique, métabolomique) à des fins de prédiction a déjà été proposée par le passé (Schrag et al. 2018), mais encore jamais dans un contexte d’interaction génotype x environnement.

Objectif:
L’objectif de ce stage est d’étudier le déterminisme génétique de l’expression de l’ensemble des gènes mesurés par RNAseq dans le panel de 254 lignées de maïs évaluées pour leur valeur en hybride en conditions stressées et non stressées par une approche de génétique d’association, et de calibrer des modèles de prédiction génomiques reposant sur les abondances de transcrit (sélection phénomique). Les questions auxquelles le stagiaire devra répondre sont les suivantes : (i) quelles régions (Local vs Distant) et polymorphismes (InDels vs SNPs) régulent préférentiellement l’expression des gènes? (ii) dans quelle mesure la régulation de l’expression de ces gènes est modifiée en conditions de stress hydrique (étude des interactions GxE) et quelles sont les fonctions des gènes les plus affectés? (iii) quels sont les gènes candidats potentiellement impliqués dans l'élaboration des caractères agronomiques en étudiant la colocalisation des eQTLs avec les QTLs agronomiques (et éventuellement pour un sous ensemble de gènes avec des pQTLs et mQTLs), et (iv) à quel point les données de transcriptomique permettent de prédire la relation génotype/phénotype en fonction des conditions environnementales.
Pour répondre à ces questions, le/la stagiaire disposera à son arrivée de données de génotypage (1 million de SNPs et 90,000 InDels), des données de comptage RNAseq (~45,000 gènes dont l’expression aura été quantifiée dans les 254 génotypes de maïs cultivés dans deux conditions d'irrigation), de mesures écophysiologiques et agronomiques au champs. Le stagiaire disposera aussi d’un pipeline R pour effectuer les études d'association. Il disposera également de l'ensemble des QTLs précédemment identifiés. Le stagiaire devra prendre en charge l’analyse des données de RNAseq (héritabilité, évaluation de l’interaction GxE), la réalisation des tests d’association sur ces données, l’étude des colocalisations entre les eQTLs et les QTLs entre les différents caractères/conditions, ainsi que le développement de modèles prédictifs reposant sur les informations de génotypage et de transcriptomique. Ce stage pourra donner lieu à une suite en thèse.

Compétences et aptitudes :
Le/la stagiaire devra présenter une forte appétence pour l'analyse de données et les statistiques ainsi qu'une connaissance du logiciel R et/ou de la programmation. Compte tenu de la taille des jeux de données, de bonnes qualités organisationnelles et une grande rigueur seront également nécessaires.

Rémunération : Le stagiaire recevra une gratification d'environ 570-600€/mois.

Références :
-Blein-Nicolas, M., Negro, S. S., Balliau, T., Welcker, C., Cabrera Bosquet, L., Dimitri Nicolas, S., Charcosset, A., Zivy, M. (2020). Integrating proteomics and genomics into systems genetics provides novel insights into the mechanisms of drought tolerance in maize. Genome Research.
-Castelletti S, Coupel-Ledru A, Granato I, Palaffre C, Cabrera-Bosquet L, Tonelli C, et al. Maize adaptation across temperate climates was obtained via expression of two florigen genes. de Meaux J, editor. PLOS Genet. 2020;16:e1008882.
- Darracq, A., Vitte, C., Nicolas, S., Duarte, J., Pichon, J.-P., Mary-Huard, T., Chevalier, C., Berard, A., et al., (2018). Sequence analysis of European maize inbred line F2 provides new insights into molecular and chromosomal characteristics of presence/absence variants. BMC Genomics, 19 (1).
- Negro, S. S., Millet, E., Madur, D., Bauland, C., Combes, V., Welcker, C., Tardieu, F., Charcosset, A., Nicolas, S. (2019). Genotyping-by-sequencing and SNP-arrays are complementary for detecting quantitative trait loci by tagging different haplotypes in association studies. BMC Plant Biology, 19 (1).
- Mabire, C., Jorge, Darracq, A., Pirani, A., Rimbert, Madur, D., Combes, V., Vitte, C., Praud, Rivière, Joets, J., Pichon, Nicolas S. (2019). High throughput genotyping of structural variations in a complex plant genome using an original Affymetrix® Axiom® array. BMC Genomics
- Millet, E. J., Welcker, C. Kruijer W., Negro S., Coupel-Ledru A., Nicolas, S., Laborde J., et al. (2016) Genome-wide analysis of yield in Europe: allelic effects vary with drought and heat scenarios, Plant Physiology
- Millet, E. J., Kruijer, W., Coupel-Ledru, A., Prado, S. A., Cabrera-Bosquet, L., Lacube, S., et al. (2019). Genomic prediction of maize yield across European environmental conditions. Nat. Genet. 51, 952–956.
- Prado S. A., L. Cabrera‐Bosquet, A. Grau, A. Coupel‐Ledru, E. J. Millet, et al., 2018 Phenomics allows identification of genomic regions affecting maize stomatal conductance with conditional effects of water deficit and evaporative demand. Plant Cell Environ. 41: 314–326
- Schrag, T. A., Westhues, M., Schipprack, W., Seifert, F., Thiemann, A., Scholten, S., et al. (2018). Beyond genomic prediction: combining different types of omics data can improve prediction of hybrid performance in maize. Genetics 208, 1373–1385.

Equipe adhérente personne morale SFBI
Equipe Non adhérente