Développement d’un pipeline d’assemblage de génomes bactériens

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Service “Bioinformatique et Informatique” de l'IRCAN (Nice) / Equipe Pr. Ruimy · Nice (France)

 Date de prise de poste : 1 février 2022

Mots-Clés

programmation, web, séquençage haut-débit

Description

Contexte de travail :

L'IRCAN est un institut public de recherche scientifique, situé à Nice, au campus Pasteur. Les sujets qui y sont développés concernent la compréhension des mécanismes biologiques unissant le vieillissement et les cancers. Le stagiaire intégrera le service "Informatique & Bioinformatique" de l'IRCAN dont le rôle est d'apporter un soutient bioinformatique et informatique aux équipes de recherche de l'institut, en parallèle au développement de ses thématiques propres.

Le projet de stage se réalisera également en partenariat avec l'équipe du Pr. Ruimy, chef de service du laboratoire de bactériologie du CHU de Nice et chercheur rattaché à l'institut C3M. Le stage sera d'une durée de 6 mois et pourra débuter entre janvier et mars 2022


Sujet :

Le sujet de stage s'articule autour d'un projet actuel qui concerne la caractérisation de souches bactériennes pathogènes nommées Bacillus cereus. De précédents travaux ont permis d'obtenir une collection de génomes de cette espèce avec une très haute qualité d'assemblage et d'annotations.

Nous avons développé une méthodologie d'assemblage et d'annotations pour ces souches particulières laquelle a été utilisée avec succès pour caractériser une quarantaine de souches. Nous souhaitons étendre cette méthodologie à d'avantage de souches en automatisant les différentes étapes via un pipeline. Également, nous aimerions proposer une interface graphique web qui autorise des non-bioinformaticiens à évaluer leurs souches nouvellement séquencées. Cette interface devra aussi présenter de manière synthétique les résultats des primo analyses.

D'un point de vue pratique, les données initiales sont constituées de séquençages à la fois en short-reads (Illumina HiSeq X) et de séquences long-reads de type Nanopore. Plusieurs outils courants sont utilisés pour aboutir à des génomes complets et annotés. Le projet demande d'être à l'aise avec l'utilisation d'outils de manipulation de séquences sous Linux (trimming, test qualité, assemblage, etc), ainsi que des compétences en Python. De même, des compétences en développement web sont fortement souhaitées (framework au choix du type Django, Ruby on Rails, Zend, etc)

Candidature

Procédure : Les candidatures comprenant CV détaillé, lettre de motivation et références (avec emails des personnes à contacter) seront adressées à croce@unice.fr et ruimy.r@chu-nice.fr

Date limite : 15 février 2022

Contacts

Dr. Olivier Croce

 crNOSPAMoce@unice.fr

Offre publiée le 19 novembre 2021, affichage jusqu'au 28 février 2022