Développement d’un outil intégré pour réaliser des analyses GWAS

 Stage · Stage M2  · 6 mois    Bac+5 / Master   INRAE PACA UR1052/GAFL · Avignon (France)  Gratification légale (soit environ 609 €/mois pour 35h/semaine)

 Date de prise de poste : 1 janvier 2026

Mots-Clés

GWAS Nextflow nf-core singularity pipeline RShiny app génotype phénotype statistique

Description

Développement d’un outil intégré pour réaliser des analyses GWAS

Réaliser une étude d’association pangénomique vise à identifier par analyse statistique les variantes génétiques (génotype) associées à des traits spécifiques (phénotype). Cette méthodologie est fréquemment mise en œuvre dans notre unité pour les différentes espèces étudiées avec pour but d’identifier les zones du génome impliquées dans le contrôle de traits d’intérêt et leur effet sur les variations phénotypiques. Les populations étudiées, la densité et le type de marqueurs disponibles, les dispositifs expérimentaux (e.g. multi-environnement), la variabilité et la distribution des traits étudiés et les modèles mobilisés sont variables selon les espèces et les projets menés.
Jusqu’à présent nous avons réalisé ces études de façon indépendante sans construire un espace de travail collaboratif permettant de partager la méthodologie, les étapes à suivre et outils associés, les modèles et les scripts d’analyse.
L’objectif du projet est donc de capitaliser sur l’expérience et les méthodes disponibles dans l’unité pour construire un outil qui pourra être mobilisé par des non bio-informaticiens pour réaliser des analyses GWAS reproductibles et performantes.

Les étapes proposées sont :
- de construire un workflow, en s’appuyant sur un existant, représentant les étapes nécessaires à l’analyse, les données d’entrée, les outils dédiés et données produites en sortie
- de faire l’inventaire des modèles et scripts disponibles et de les caractériser de façon à réaliser l’implémentation de modèles en fonction des caractéristiques des jeux de données phénotypiques et génotypiques
- de développer un workflow en Nextflow selon des standards stricts de qualité et de reproductibilité basé sur nf-core et utilisable par des non informaticiens
- tester le workflow sur des jeux de données
- développer une interface en R Shiny (https://shiny.posit.co )

Ce pipeline sera in fine utilisé par des non bio-informaticiens.
L’étudiant.e aura accès au serveur Linux de calcul de l’unité GAFL et aux plateformes HPC d’INRAE.
Il/elle sera co-encadré.e par une directrice de recherche en génétique et un ingénieur en bio-informatique, intègrera un groupe de travail inter-CATI et interagira avec différents chercheurs et doctorants de l’unité.

Profil requis
Maîtrise de l’environnement Linux, du Bash, du langage R, utilisation et interprétation de logiciels d’analyse bio-informatique sont demandés.
Des notions de statistiques seront nécessaires pour interagir avec les chercheurs.
Des notions de base sur les outils de packaging et de conteneurisation (Singularity, https://sylabs.io/singularity/) et de management de workflow (Snakemake, https://snakemake.readthedocs.io ) seraient un plus.

References:

Marguerit, S., Galland, M., Guyomar, C., Lagnel, J., Legeai, F. & Velt, A. (2025) gwas-pipe: a Nextflow pipeline for GWAS analyses incorporating quality control, Poster, JOBIM-2025, Bordeaux
Bineau E, … Causse M. 2021. Breeding Tomato Hybrids for Flavour: Comparison of GWAS Results Obtained on Lines and F1 Hybrids. Genes. 12(9):1443. https://doi.org/10.3390/genes12091443
Desaint H, .. Causse M. 2023. Genome-Wide Association Study: A Powerful Approach to Map QTLs in Crop Plants. In: Raina, A., Wani, M.R., Laskar, R.A., Tomlekova, N., Khan, S. (eds) Advanced Crop Improvement, Volume 1. Springer, Cham. https://doi.org/10.1007/978-3-031-28146-4_15
McLeod L, .. Lefebvre V. 2023. Multi‐environment association study highlights candidate genes for robust agronomic quantitative trait loci in a novel worldwide Capsicum core collection. Plant Journal, ⟨10.1111/tpj.16425⟩. ⟨hal-04185847⟩
Monnot S, .. Boissot N. 2022. Unravelling cucumber resistance to several viruses via genome-wide association studies highlighted resistance hotspots and new QTLs, Horticulture Research, Volume 9, 2022, https://doi.org/10.1093/hr/uhac184
Pérez de los Cobos F, .. Quilot-Turion B, … Duval H. 2023. Almond population genomics and non-additive GWAS reveal new insights into almond dissemination history and candidate genes for nut traits and blooming time, Horticulture Research, Volume 10, Issue 10, October 2023, https://doi.org/10.1093/hr/uhad193

Candidature

Procédure : Envoyer un mail à Jacques Lagnel : jacques.lagnel@inrae.fr

Date limite : 22 décembre 2025

Contacts

 Jacques Lagnel
 jaNOSPAMcques.lagnel@inrae.fr

 Bénédicte Quilot
 beNOSPAMnedicte.quilot@inrae.fr

Offre publiée le 24 octobre 2025, affichage jusqu'au 22 décembre 2025