Mots-Clés
SNP calling
assemblage de novo hybride
nanopore/illumina
levures
bactéries
GWAS
Description
Nom de l'entreprise ou du laboratoire :
Biolaffort, filiale recherche d’un groupe de 400 salariés spécialisé dans les produits œnologiques avec un fort investissement dans la recherche et l’innovation
Adresse ou se déroulera le stage :
Univ. Bordeaux, Bordeaux INP, INRAE, OENO, UMR 1366, ISVV, F-33140 Villenave d’Ornon, France
Institut des Sciences de la Vigne et du Vin
210, chemin de Leysotte, CS 50008
33882 Villenave d'Ornon
Responsable du stage (personne qui sera contactée par les candidats):
- Nom, Prénom : Marullo Philippe
- Statut (Chercheur) :
- Coordonnées (philippe.marullo@laffort.com 0671529432) :
Titre du stage :
Analyse de génomes de levures et bactéries œnologiques. Intégration de nouvelles données de séquençage (Illumina et nanopore), phylogénie moléculaire. Mise en place d’outils de comparaison de SNP et de CNV. Curation d’une base de données (70 génomes de levures) 30 génome bactériens. Corrélation phénotype génotype par une approche GWAS pour les levures
Mots clés résumant les méthodes et techniques à utiliser au cours du stage :
Galaxy, mapping, SNP calling, assemblage de novo hybride, nanopore/illumina, levures bactéries.
Résumé du projet de stage (½ page à 1 page) :
Contexte
La société Biolaffort développe des produits pour l’œnologie en particulier des levures et des bactéries destinées à la fermentation alcoolique et malolactique des vins. Dans ce contexte elle possède un souchier de microorganisme qui est entièrement séquencé.
Objectifs
Le travail de stage consistera à analyser des données de séquençage de génome bactérien de l’espèce Oenococcus oeni réalisé avec les plateformes illumina et nanopore. Le candidat intégrera également une vingtaine de génomes de levure industrielles supplémentaires nouvellement séquencées à des données génomiques déjà existantes. Ces souches ont également été séquencées par une technique long reads (Promethion, Nanopore) permettant la recherche de variants structuraux.
Pour l’analyse des génomes par mapping de donnée Illumina un workflow est déjà en place Trimmomatics, Bowtie2, Freebayes, SNPeff et pourra être amélioré lors de l’intégrations des nouvelles séquences.
Pour l’analyse des données nanopore le candidat développera un pipeline avec les outils appropriés décrit dans la littérature. Un assemblage de novo par stratégie hybride est également envisagé pour obtenir une seule séquence chromosomique dans le cas des bactéries.
Le candidat optimisera également gestion de base de données sur Galaxy et les procédures d’analyse de données grâce à l’aide du logiciel R (phylogénie, extraction de SNP d’intérêt…).
Les compétences attendues sont une bonne autonomie en matière bio-informatique et des qualités de communication permettant la transmission de résultats obtenus. Le stage se déroulera au sein de l’unité de recherche Œnologie de l’université de Bordeaux sous la direction d’un chercheur en génétique de la société Biolaffort.
Montant des indemnités de stage :
4,05 € euros/h stagiaire de l’entreprise Biolaffort.