M2 - Automatisation et packaging conda d’un workflow visant à réaliser un « Genome wide association study » (GWAS) aux échelles des gènes accessoires et variants du coregénome

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

14 rue Pierre et Marie Curie
94701 Maisons-Alfort
France

Contacts
Nicolas Radomski
Email du/des contacts
nicolas.radomski@anses.fr
Description

Proposition de stage de Master 2 Bioinformatique

Lieu du stage : Agence nationale de sécurité sanitaire de l'alimentation, de l'environnement et du travail (Anses) / Laboratoire de sécurité des aliments (LSAL), sites de Maisons-Alfort / mission Genome Analyse Modélisation Risque (GAMeR)

Période : 6 mois en 2020 (période à définir avec l’étudiant(e))

Sujet : Automatisation et packaging conda d’un workflow visant à réaliser un « Genome wide association study » (GWAS) aux échelles des gènes accessoires et variants du coregénome

Contexte : Tu es un(e) étudiant(e) en Master 2 Bioinformatique et tu séjourneras dans la mission GAMeR constituée d’un responsable, de trois scientifiques, d’une étudiante en thèse, d’un postdoc et de deux étudiantes en M2. Cette mission transversale créée en 2015 a la charge d’intégrer la génomique au sein des missions concrètes de lutte contre les pathogènes alimentaires du LSAL de l’Anses. La mission GAMeR a publié des travaux dans les domaines de l’indentification de cibles moléculaires d’intérêt [1], la phylogénie [2], l’analyse de variants [3], l’assemblage de génomes [4–6], l’ontologie de gènes [7] et l’étude d’association entre mutation et phénotypes [8]. Nos récent travaux ont permis de développer un workflow permettant de réaliser des études d’association phénotype-trait génétique (« Genome wide association study » (GWAS)) nommé « Microbial-GWAS ». Ce workflow « Microbial-GWAS » propose les nouveautés d’intégrer une correction avancée de la structure des populations bactériennes par modèle linéaire mixte et de traiter en même temps les gènes accessoires et les variants du coregénome bactérien.

Objectifs : Suite au développement semi-automatisé du workflow « Microbial-GWAS », ce dernier doit être entièrement automatisé et packagé sous conda afin de le rendre accessible à la communauté scientifique sur GitHub et l’installer sur le cluster de calcul de la mission GAMeR. En tant qu’étudiant(e) en stage de Master 2 Bioinformatique, tu devras :
1/ Automatiser entièrement le workflow « Microbial-GWAS »,
2/ Déposer le workflow automatisé « Microbial-GWAS » sur GitHub,
3/ Packager le workflow « Microbial-GWAS » sur conda,
4/ Installer le workflow « Microbial-GWAS » sur le cluster de la mission GAMeR,
5/ Tester le workflow « Microbial-GWAS » sur un jeu de données test.
Compétences requises : R, Python, GitHub et conda.
Responsable à contacter : Nicolas Radomski (nicolas.radomski@anses.fr)

References :
1. Felten A, Guillier L, Radomski N, Mistou M-Y, Lailler R, Cadel-Six S. Genome Target Evaluator (GTEvaluator): A workflow exploiting genome dataset to measure the sensitivity and specificity of genetic markers. PLOS ONE. 2017;12:e0182082.
2. Henri C, Leekitcharoenphon P, Carleton HA, Radomski N, Kaas RS, Mariet J-F, et al. An Assessment of Different Genomic Approaches for Inferring Phylogeny of Listeria monocytogenes. Front Microbiol. 2017;8. doi:10.3389/fmicb.2017.02351.
3. Mahamat Abdelrahim A, Radomski N, Delannoy S, Djellal S, Le Négrate M, Hadjab K, et al. Large-Scale Genomic Analyses and Toxinotyping of Clostridium perfringens Implicated in Foodborne Outbreaks in France. Front Microbiol. 2019;10:777.
4. Sévellec Y, Granier SA, Randomski N, Felten A, Le Hello S, Feurer C, et al. Complete Genome Sequence of Salmonella enterica subsp. enterica Serotype Derby, Associated with the Pork Sector in France. Microbiol Resour Announc. 2018;7. doi:10.1128/MRA.01027-18.
5. Sévellec Y, Vignaud M-L, Granier SA, Lailler R, Feurer C, Le Hello S, et al. Polyphyletic Nature of Salmonella enterica Serotype Derby and Lineage-Specific Host-Association Revealed by Genome-Wide Analysis. Front Microbiol. 2018;9. doi:10.3389/fmicb.2018.00891.
6. Sévellec Y, Felten A, Radomski N, Granier S, Le Hello S, Petrovska L, et al. Genetic Diversity of Salmonella Derby from the Poultry Sector in Europe. Pathogens. 2019;8:46.
7. Felten A, Vila Nova M, Durimel K, Guillier L, Mistou M-Y, Radomski N. First gene-ontology enrichment analysis based on bacterial coregenome variants: insights into adaptations of Salmonella serovars to mammalian- and avian-hosts. BMC Microbiol. 2017;17:1–22.
8. Fritsch L, Felten A, Palma F, Mariet J-F, Radomski N, Mistou M-Y, et al. Insights from genome-wide approaches to identify variants associated to phenotypes at pan-genome scale: Application to L. monocytogenes’ ability to grow in cold conditions. Int J Food Microbiol. 2019;291:181–8.

Equipe adhérente personne morale SFBI
Equipe Non adhérente