Assemblage hybride long/short reads, carte optique du génome du puceron du melon et du cotonnier Aphis gossypii

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

67 Allée des Chênes
84140 Avignon
France

Contacts
Jacques Lagnel
Nathalie Boissot
Email du/des contacts
jacques.lagnel@inra.fr
nathalie.boissot@inra.fr
Description

Stage 6 mois Master-2 bioinformatique
Sujet : Malgré le nombre considérable d'espèces d'insectes, peu ont été séquencées, du fait d'abord de leur petite taille. De plus, les génomes d'insectes peuvent être difficiles à assembler en raison de la combinaison d'un polymorphisme élevé, de leur hétérozygotie, la présence de régions répétées, et de la mise en commun d'individus polymorphes pour constituer des banques. Aucun génome hautement résolu n’est disponible pour les pucerons, ravageurs majeurs des plantes cultivées. Nous proposons de relever ce défi pour Aphis gossypii ravageur majeur des Cucurbitacées, cotonnier, citrus, ...
Une approche possible la combinaison de données issues de différentes technologies, en associant des lectures courtes (Illumina + 10X genomics) et longues (Oxford Nanopore), aussi bien que des cartes optiques, afin de profiter des avantages de ces méthodes et pallier les inconvénients de chacune (taille des lectures, type d’erreur).
Objectifs du stage :
Dans ce contexte, sur des données de séquençages (10X Genomics et Oxford Nanopore Technology) et de « digital molecules » (carte optique Bionano), il s’agira d’implémenter et de comparer diverses stratégies d’assemblage afin d’obtenir des génomes le moins fragmenté possible. Ces stratégies pourraient inclure des approches incluant les logiciels Canu, smartdenovo, Flye, RA-assembler, Supernova.
Le stagiaire aura accès au serveur Linux de calcul de l’unité GAFL et aux plateformes HPC de l’INRA.
L’étudiant/e sera co-encadré par un ingénieur en bio-informatique et un chercheur en génétique. Maîtrise de l'environnement Linux et du Bash, l’utilisation et interprétation de logiciels d'analyse bio-informatique et des bases sur les techniques d’assemblage de novo de génome sont demandés. De plus, des notions d’outils de packaging (Singularity) et de management de workflow (Snakemake, Nextflow) seraient un plus. Des connaissances et/ou une pratique du calcul sur cluster seraient appréciées.
Références :
1. Belser, C. et al. Chromosome-scale assemblies of plant genomes using nanopore
long reads and optical maps. Nat Plants 4, 879–887 (2018).
2. Schmidt, M. H.-W. et al. De Novo Assembly of a New Solanum pennellii Accession
Using Nanopore Sequencing. Plant Cell 29, 2336–2348 (2017).
3. Gautier, M. et al. The Genomic Basis of Color Pattern Polymorphism in the
Harlequin Ladybird. Curr. Biol. (2018). doi:10.1016/j.cub.2018.08.023

Equipe adhérente personne morale SFBI
Equipe Non adhérente