Recherche de variations structurales dans le génome humain à l’aide de données de séquençage longues lectures

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

2 rue Gaston Crémieux
91000 Evry
France

Contacts
Claire Jubin
Vincent Meyer
Email du/des contacts
claire.jubin@cnrgh.fr
vincent.meyer@cnrgh.fr
Description

Contexte général

Le Centre National de Recherche en Génomique Humaine (CNRGH/CEA), situé au Genopole d’Evry et acteur du plan France Médecine Génomique 2025, a pour mission de produire des données pour participer au développement de la recherche sur la génétique des maladies humaines. Le CNRGH possède des laboratoires et des plateformes qui utilisent des technologies de pointe en génomique, telles que le génotypage à haut débit et le séquençage de nouvelle génération, qui permettent respectivement, de réaliser des études d’association pan-génomiques et de faire du séquençage de génomes complets de population. Dans ce cadre, les variations structurales (Feuk et al, 2006) de chacun des génomes séquencés sont identifiées grâce à la comparaison des lectures produites lors du séquençage, à une séquence de référence (Kosugi et al. 2017; Cameron et al. 2019). Cela permet de produire un profil de variations sur l’intégralité du génome pour caractériser une population ou rechercher des mutations pathologiques. Pour optimiser l’identification des variations structurales nous cherchons à diversifier les méthodes de traitement des données de séquençage (mapping, assemblage) mais aussi à intégrer des données produites par de nouvelles technologies de séquençage dites « longues lectures » (Oxford Nanopore Technologies, 10X genomics).

Objectif du stage

Le stage se déroulera au sein de l’équipe de bioinformatique et s’inscrit dans la problématique d’identification de variations structurales. Le stagiaire se familiarisera d’abord avec les différents types de données sur un projet pilote en générant des rapports d’analyse; il participera ensuite au développement et à la mise en place d’un nouveau workflow intégrant les longues lectures. Cela nécessitera de combiner l’utilisation d’outils existants à de la programmation ad hoc. Mots clés : génome humain, variations structurales, NGS, séquençage « longues lectures »

Compétences

Langage de programmation : bash, python (ou perl), R Environnement de développement : linux, gitlab

Equipe adhérente personne morale SFBI
Equipe Non adhérente