Mots-Clés
pangenomics
nanopore
Description
De la séquence Nanopore à l’analyse pangénomique des génomes bactériens
Description
Nous proposons un stage en bioinformatique axé sur la pangénomique. Le projet se déroulera chez Groupe Florimond Desprez Belgium, situé à Tienen, Belgique, en collaboration entre les équipes Bioinformatique et Stress Biotique.
Contexte
Ce stage vise à explorer la diversité génomique au sein de deux genres bactériens : Pectobacterium et Erwinia, en utilisant des approches pangénomiques.
L’étudiant commencera par passer en revue les outils existants pour la construction, l’analyse et la visualisation des pangénomes. Sur base de cette analyse, l’outil le plus adapté sera sélectionné pour répondre aux questions scientifiques et aider les chercheurs à extraire et interpréter les données issues des pangénomes générés.
Les pangénomes seront construits à partir de jeux de données publics et de données propriétaires générées via le séquençage Nanopore.
Le stage sera structuré en trois phases :
- Collecte des données génomiques
* Identifier et récupérer des jeux de données publics
* Intégrer des données privées (assemblages Nanopore et annotations génétiques)
- Construction du pangénome
- Exploration et analyse des données
* Identifier les gènes “cœur” et “accessoires”
* Visualiser la synténie
* Réaliser des analyses phylogénétiques et extraire des marqueurs MLSA
Objectifs principaux
Collecter et formatter les données Nanopore
Évaluer et comparer les outils pangénomiques existants
Construire un pangénome avec les outils sélectionnés
Répondre à des questions scientifiques via l’analyse pangénomique
Accompagner les chercheurs dans l’exploration et l’interprétation des données pangénomiques
Présenter les résultats et les méthodologies
Compétences requises
• Stage pour Master2
• Expérience en programmation (Bash, R et/ou Python)
• À l’aise dans un environnement Linux