Evaluation d’une nouvelle méthode de détection de l’admixture à partir de données NGS

 Stage · Stage M2  · 6 mois    Bac+5 / Master   CIRAD UMR AGAP Institut · Montferrier-sur-Lez (France)  550

 Date de prise de poste : 2 janvier 2023

Mots-Clés

Génotypage SNP/Haplotype Modèle de Markov caché Simulations

Description

Les populations naturelles sont souvent stratifiées en groupes génétiques dont les individus issus de groupes différents peuvent s’inter-croiser pour générer des descendances admixées. Les méthodes de détection de l’admixture ne sont, pour la plupart, pas adaptées aux populations polyploïdes, car elles ont été développées dans le contexte de populations diploïdes génotypées pour des marqueurs bi-alléliques. En ce qui concerne le génotypage, les individus polyploïdes peuvent différer les uns des autres par une large gamme de dosages alléliques aux marqueurs bi-alléliques, et ces dosages sont souvent difficiles à bien estimer. Dans ce contexte, il peut être bénéfique de plutôt caractériser les différents haplotypes observés dans chaque individu. Un proxy simple pour les haplotypes est d'utiliser les combinaisons d'allèles aux marqueurs de type « single nucleotide polymorphism » (SNP) qui sont observées conjointement sur de mêmes lectures de séquençage NGS. A partir de ce type de données pour des espèces polyploïdes, une approche pour détecter l'admixture globalement et localement le long des chromosomes a été développée au sein du laboratoire. L'inférence d’admixture locale est réalisée sur la base d'un modèle de Markov caché en généralisant la méthodologie standard d'admixture locale à des niveaux de ploïdie élevés et à des marqueurs multi-alléliques.

Un premier objectif de ce stage sera d’évaluer la précision des estimations des paramètres du modèle à partir de données simulées selon un degré croissant de complexité via :

  • le modèle de Markov caché permettant de faire l’inférence
  • des approches de simulations standards de génétique des populations (ex : AdmixSim2)
  • la création d’individus admixés in sillico à partir de données de séquençage réelles

Un second objectif sera de comparer l’intérêt d’utiliser un génotypage de type haplotype par rapport à un génotypage de type SNP.

Enfin, ces résultats permettront d’appliquer au mieux la méthode à des données de reséquençage d’une population d’accessions représentative de la diversité du genre Saccharum hautement polyploïdes. Ce projet est mené dans le cadre d’une collaboration avec Joint Genomic Institut aux USA. Les variétés modernes de canne à sucre dérivent de quelques événements d'hybridations interspécifiques réalisées il y a un siècle entre Saccharum officinarum, espèce riche en sucre, (2n = 8x = 80 chromosomes) et l’espèce sauvage Saccharum spontaneum (2n = 5x = 40  à 16x = 128 chromosomes). Néanmoins, l’histoire évolutive (origine, structuration génétique et admixture) des espèces S. officinarum et S. spontaneum restent peu connues.

Compétences souhaitées :

  • langage de programmation (perl, python ou R)
  • bases solides en statistiques
  • traitement de données NGS

Montant des indemnités de stage :

Gratification minimale d’environ 550€

Quelques références récentes de l’équipe :

Three founding ancestral genomes involved in the origin of sugarcane. N Pompidor, C Charron, C Hervouet, S Bocs, G Droc, R Rivallan, ...Annals of botany 127 (6), 827-840

Genome ancestry mosaics reveal multiple and cryptic contributors to cultivated banana G Martin, C Cardi, G Sarah, S Ricci, C Jenny, E Fondi, X Perrier, ... The Plant Journal 102 (5), 1008-1025

A mosaic monoploid reference sequence for the highly complex genome of sugarcane. O Garsmeur, G Droc, R Antonise, J Grimwood, B Potier, K Aitken, ...Nature communications 9 (1), 1-10

Site web : https://umr-agap.cirad.fr/nos-recherches/equipes-scientifiques/structure-et-evolution-des-genomes

 

Candidature

Procédure : Envoyer un mail à simon.rio@cirad.fr

Date limite : 1 juillet 2023

Contacts

Simon Rio

 siNOSPAMmon.rio@cirad.fr

Offre publiée le 7 octobre 2022, affichage jusqu'au 30 novembre 2022