mise au point d'un outil d'estimation de la qualité des processus de scaffolding par données Hi-C

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Genoscope, CEA Institut François Jacob · Evry (France) · Evry (France)

Mots-Clés

génomique Hi-C NGS développement

Description

Titre : mise au point d'un outil d'estimation de la qualité des processus de scaffolding par données Hi-C

Description : Les assemblages de génomes complexes sont réalisés grâce à des données de séquençage longues lectures (nanopore ou PacBio). Pour atteindre l'échelle des chromosomes, l'ajout de données dites "long range", telles que les cartes optiques ou l'Hi-C (capture de la conformation 3D des chromosomes), est essentiel.
L'Hi-C permet de valider les assemblages à base de données lectures longues et de casser les assemblages dans les régions mal assemblées. Il permet ensuite d'orienter et d'ordonner les contigs entre eux.
Il existe de nombreux outils qui permettent de manipuler les données Hi-C. Par contre, il manque des outils permettant d'avoir une estimation de la qualité des cassures et de la qualité des jonctions estimées entre les contigs.
Le ou la stagiaire devra donc prendre en main ces différents outils de manipulation des données Hi-C et développer un outil permettant de détecter les mauvaises cassures ou jonctions et d'estimer la qualité générale du processus de scaffolding.

Compétences recherchées: Le ou la candidat(e) devra maitriser l'environnement type unix, le langage python et utiliser des grilles de calcul.

Laboratoire d'accueil:
Le Genoscope – Institut de Génomique, rattaché au CEA (Commissariat à l’Energie Atomique et aux Energies renouvelables) est une grande plateforme d’envergure et de réputation internationale dans le domaine de la génomique. Au-delà d’une mission de service à la communauté, il participe à de nombreux projets d’analyse de génomes (coraux, plantes, algues, ...) et coordonne la partie génomique de projets internationaux d’études des océans (Tara Océans, Tara Pacific). Le stage se déroulera dans le laboratoire bioinformatique pour la génomique et la biodiversité, du CEA/Institut François Jacob/Genoscope, à Evry. Il s’agit d’une équipe d’une quinzaine de personnes impliquées dans différentes thématiques bioinformatiques, allant du séquençage à l'analyse des génomes. Nous proposons un stage d’une durée de 6 mois à partir de février ou mars 2022, pour un étudiant de niveau M2.

 

Candidature

Procédure : Envoyer un mail à stage_rdbioseq@genoscope.cns.fr

Date limite : None

Contacts

Caroline Belser

 stNOSPAMage_rdbioseq@genoscope.cns.fr

Offre publiée le 16 décembre 2021, affichage jusqu'au 2 mars 2022