Etude épigénétique à partir des technologies de séquençage « longues lectures »

 Stage · Stage M2  · 6 mois    Bac+5 / Master   CEA/CNRGH · Evry (France)

Mots-Clés

Bioinformatique Benchmark Séquençage ONT long reads

Description

Le Contexte:

Le Centre National de Recherche en Génomique Humaine (CNRGH) du Commissariat à l'Energie Atomique (CEA), localisé au sein de la Genopole d'Evry, a comme objectif principal de faire avancer la recherche en génétique des maladies humaines.

A cette fin, le CNRGH a développé des laboratoires et des plateformes technologiques de pointe en génomique. Les technologies disponibles au CNRGH vont de plateformes de génotypage à haut débit complètement intégrées à des plateformes de séquençage nouvelle-génération. Les activités incluent des études d'association génome entier, d'expression pan-génomiques, épigénétiques, de génomique fonctionnelle et de séquençage génome entier.

Au sein du Laboratoire de Bio-informatique et d’Informatique du CNRGH/CEA, nous recherchons un étudiant, actuellement en Master 2, pour effectuer un stage de recherche d’environ 5∼6 mois. Le stage, dont le détail est décrit ci-dessous, se déroulera dans un contexte dédié à l’évaluation et aux déploiement de solution de profilage épigénétique à partir des données issues des technologies de séquençage « longues lectures » (ONT/Pacbio).

Le stage: 

Les progrès récents des technologies de séquençage à haut débit permettent le séquençage de lectures de plusieurs kilobases. Cette avancée technologique permet notamment d’aborder des questions jusqu’à lors insolubles sur la structuration du Génome et l’analyse de régions complexes. De plus, les analyses de signaux générés par les technologies ONT [1] et PacBio [2] permettent également d’adresser des questions épigénétiques en permettant une observation directe des profils de méthylation au cours du séquençage [3]. De nombreux outils, basés sur l’analyse de signal et recherche de motifs, sont aujourd’hui disponibles. Ce stage sera dédié à l’évaluation des solutions et la conception d’une chaîne de traitement dédiée aux profilages épigénétiques des échantillons. L’ensemble de ces travaux sera réalisé sur la lignée GM12878 et comparé aux résultats de la littérature. Ces travaux serviront également pour l’évaluation d’approches expérimentales complémentaires permettant d’optimiser l’obtention d’information relative à l’épigénétique des échantillons.


Les Missions:

Dans le cadre de stage l’étudiant aura pour missions:

• La réalisation d’un état de l’art sur les outils bioinformatiques du domaine

• La réalisation un benchmark en comparant les profils épigénétique obtenus aux résultats de la littérature

• L'évaluation d’une sélection de méthodes en vue de proposer un processus de traitement dédié aux profilage epigénétique des échantillons.

L’étudiant sera accueilli dans le cadre du laboratoire de Bioinformatique du CNRGH (LBI). Il sera formé en interne aux bonnes pratiques de développement (environnement gitlab), à l’utilisation d’un cluster HPC (environnement unix/slurm) ainsi qu’aux outils et données de la discipline.

Prérequis:

- Connaissances bio-informatique, génomique, programmation (python, bash, R)

Encadrants :

- Vincent Meyer, Chef du labo de Bio-informatique, CEA/CNRGH/DRF

Références

[1] https://nanoporetech.com/

[2] https://www.pacb.com/

[3] Amarasinghe, S.L., Su, S., Dong, X. et al. Opportunities and challenges in long-read sequencing data analysis. Genome Biol 21, 30 (2020). https://doi.org/10.1186/s13059-020-1935-5



Candidature

Procédure : Les candidatures avec CV seront envoyé par mail au responsable du stage

Date limite : None

Contacts

Vincent MEYER

 viNOSPAMncent.meyer@cnrgh.fr

Offre publiée le 26 novembre 2021, affichage jusqu'au 15 décembre 2022