Mise en place d'outils pour l'exploration de variants à travers du séquençage "longues lectures"

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Centre Nationale de Recherche en Génomique Humaine · Evry-Courcouronnes (France)  Indemnités de stage

 Date de prise de poste : 10 janvier 2022

Mots-Clés

génome humain variations structurales séquençage « longues lectures » maladies rares

Description

Le Centre National de Recherche en Génomique Humaine (CNRGH/CEA), situé au Genopole d’Evry et acteur du plan France Médecine Génomique 2025, a pour mission de produire des données pour participer au développement de la recherche sur la génétique des maladies humaines. Le CNRGH possède des laboratoires et des plateformes qui utilisent des technologies de pointe en génomique, telles que le génotypage à haut débit et le séquençage de nouvelle génération, qui permettent respectivement, de réaliser des études d’association pan-génomiques et de faire du séquençage de génomes complets de population. Dans ce cadre, les variations structurales (Feuk et al, 2006) de chacun des génomes séquencés sont identifiées grâce à la comparaison des lectures produites lors du séquençage, à une séquence de référence (Kosugi et al. 2017; Cameron et al. 2019). Cela permet de produire un profil de variations sur l’intégralité du génome pour caractériser une population ou rechercher des mutations pathologiques. A ce stade, la liste brute des variations identifiées est imprécise et contient de nombreux faux positifs. Elle doit donc être retravaillée pour cibler au mieux les variations, potentiellement causatives de pathologies, étudiées par les collaborateurs du CNRGH. Dans ce but, le laboratoire de bio-analyse met en place des pipelines afin de générer des listes hautement qualitatives.

Objectif du stage

Le stage se déroulera dans le cadre de projets du consortium EASY-Genomics sur la recherche de causes génétiques à des maladies neurodégénératives et ophtalmiques, et s’inscrira dans la problématique d’identification de variants structuraux et SNV. Le stagiaire participera à l’évolution des pipelines d’analyse et de post-analyse pour faciliter l’expertise des variants, notamment par l’intégration d’annotation de bases de données publiques et la production d’éléments visuels. Cela nécessitera de combiner l’utilisation d’outils existants à de la programmation ad hoc.

Langage de programmation : bash, python (ou perl), R

Environnement de développement : linux, gitlab, nextflow

Candidature

Procédure :

Date limite : 30 novembre 2021

Contacts

Claire Jubin

 clNOSPAMaire.jubin@cnrgh.fr

Offre publiée le 19 octobre 2021, affichage jusqu'au 30 novembre 2021