M2 - Détection de variants structuraux par assemblage de génome de novo chez l’abricotier et le chêne blanc

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

Site Forêt Bois - Domaine de l'Hermitage 69 route d'Arcachon - Pierroton
33612 Cestas
France

Contacts
Ludovic Duvaux
Quynh-Trang Bui
Email du/des contacts
ludovic.duvaux@inrae.fr
quynh-trang.bui@inrae.fr
Description

Nous proposons un stage de M2 centré sur la détection de variants par assemblage de génome de novo. Ce stage s’inscrit dans le cadre d’une collaboration entre l’UMR BIOGECO (https://www6.bordeaux-aquitaine.inra.fr/biogeco) et l’UMR BFP (https://www6.bordeaux-aquitaine.inrae.fr/bfp).

Informations générales
Dates du stage: 1er semestre 2021

Informations pratiques
Lieu du stage: UMR BIOGECO, site de Cestas-Pierroton (INRAE/Université de Bordeaux).
Le site offre un cadre agréable au sein d'un domaine forestier situé entre Bordeaux (20km) & Arcachon (40km). Le campus de recherche est accessible par les transports en commun à partir de la gare TER de Cestas (2 navettes aller et 2 navettes retour par jour).
Rémunération: selon les règles en vigueur au sein de l’INRAE.

Contexte général du stage
Jadis considérés rares, les variants structuraux (VS, i.e. variants qui modifient la taille ou la structure des chromosomes) sont à présent reconnus comme la principale source de polymorphisme génétique en terme de nombre de bases. De plus, l’effet moyen d’un VS sur un phénotype peut être aussi, voir plus important que celui d’une substitution nucléotidique. En parallèle, la démocratisation du séquençage par (très) longues lectures autorise désormais la production de génomes de haute qualité pour des espèces non-modèles. Dans ce cadre, nos laboratoires ont récemment produit les génomes de référence de l’abricotier (Prunus armeniaca) et du chêne pédonculé (Quercus robur), deux espèces d’arbres à haute importance économique et culturelle. Nous disposons également pour ces deux modèles de données de séquençage multi-individus et multi-espèces autorisant des approches de génomique comparative en écologie évolutive (P. armeniaca & P. sibirica pour l’abricotier ; Q. robur & Q. petraea pour le chêne blanc). De plus, nous allons obtenir début 2021 des données de séquençage d’individus impliqués dans des croisements contrôlés. De telles ressources génomiques permettront à nos équipes d’étudier avec précision les taux de mutation, la fréquence et la distribution génomique des VS et à terme d’étudier leur influence sur des phénotypes d’intérêt (qualité du fruit, phénologie, résistance aux pathogènes, utilisation de l’eau, etc.).

Objectifs du stage
Le but du stage consistera (i) à assembler le génome des individus impliqués dans les croisements contrôlés à l’aide d’un workflow disponible au sein de BIOGECO et (ii) à établir un premier recensement des VS détectables par comparaison des individus de nos croisements.

Déroulement du stage et formation
Le début du stage sera consacré à l’assemblage de novo des nouveaux génomes. L’étudiant(e) aura accès à plusieurs clusters de calcul performants pour réaliser les analyses, aux pipelines utilisés pour de précédents projets conduits avec les même technologies (e.g. génome du hêtre et du chêne pédonculé) et/ou à des pipelines nouvellement publiés (https://culebront-pipeline.readthedocs.io/en/latest/). La seconde partie du stage sera consacrée à l’analyse de la qualité des génomes nouvellement assemblés ainsi qu’à la détection de variants structuraux. Pour cela, l’étudiant(e) pourra s’appuyer sur les génomes de référence déjà disponibles, sur des données de séquençage à lectures courtes de plusieurs descendants des croisements contrôlés et sur l’expérience d’un réseau de partenaires habitués de ces problématiques. Les méthodes utilisées pour détecter les VS seront issues de la génomique comparative et de l’analyse de l’alignement des lectures courtes (voir Prunier et al. 2018).
À l’issue de ce travail, le stagiaire aura une solide expérience d’assemblage de génome, de scripting (python, bash, R…), de gestion des données dans une optique de science reproductible. Le stagiaire sera aussi intégré dans l’équipe de biologie évolutive de l’UMR BIOGECO et aura des interactions très fortes avec Quynh-Trang Bui et Véronique Decroocq de l’UMR BFP. Ce cadre lui permettra d’obtenir une forte expérience du travail collaboratif et d’avoir une exposition à des chercheurs et à leurs divers projets lors de réunions bimensuelles, au cours desquelles il aura aussi l’occasion de présenter son travail.

Profil recherché
Le profil est ouvert à des étudiants provenant de master de bioinformatique avec un intérêt pour la biologie évolutive. Des connaissances dans au moins un langage informatique (python, R, dans une moindre mesure C et C++) et dans l'utilisation de cluster de calculs accessibles sont fortement recommandés.

Références
Campoy J.A., Sun H., Goel M., Wen-Biao Jiao W-B., Folz-Donahue K., Wang N., Rubio M., Liu C., Kukat C., Ruiz D., Huette B. and Schneeberger K. (2020). Chromosome-level and haplotype-resolved genome assembly enabled by high-throughput single-cell sequencing of gamete genomes. doi: https://doi.org/10.1101/2020.04.24.060046
Duvaux, L. (2018). Détection génomique de CNV par nouvelles technologies de séquençage. In D. Tagu, S. Jaubert-Possamai, & A. Méreau (Eds.), Principes des techniques de biologie moléculaire et génomique (3e édition, p. 312). Quae.
Plomion, C., Aury, J.-M., Amselem, J., Leroy, T., Murat, F., Duplessis, S., … Salse, J. (2018). Oak genome reveals facets of long lifespan. Nature Plants, 4(7), 440–452.
Prunier, J., Giguère, I., Ryan, N., Guy, R., Soolanayakanahally, R., Isabel, N., … Porth, I. (2018). Gene copy number variations involved in balsam poplar (Populus balsamifera L.) adaptive variations. Molecular Ecology, (July). doi:10.1111/mec.14836

Equipe adhérente personne morale SFBI
Equipe Non adhérente