Mots-Clés
Surveillance génomique, Galaxy, données, workflows, automatisation,
Description
Contexte de travail
L'Institut Français de Bioinformatique (IFB ; france-bioinformatique.fr) est une infrastructure nationale en biologie-santé qui fédère 35 plateformes régionales et équipes associées, ainsi qu'une unité coordinatrice, IFB-core (UMS CNRS 3601). L'IFB est également le nœud français de l'Infrastructure de Recherche européenne en bioinformatique ELIXIR (ESFRI).
L'IFB a pour missions :
(1) de mettre en place un service national en bioinformatique, accessible à tous les chercheurs en sciences du vivant, sous la forme d'une infrastructure environnée (stockage, calcul, environnement logiciel, bases de données, serveurs Web nationaux, support aux usagers, accompagnement de projets, formations, …) ;
(2) de répondre à l'évolution rapide des technologies et des besoins ;
(3) d'anticiper les futurs développements du domaine ;
(4) d'assurer la représentation des services bioinformatiques français au niveau international ;
(5) de favoriser l'engagement des communautés des sciences du vivant dans les projets nationaux et internationaux associés à la bioinformatique ;
(6) d'assurer le transfert des connaissances et technologies entre les laboratoires de recherche français et le monde industriel;
(7) d'assurer le lien entre les activités des bioinformaticiens Français et celles de l'infrastructure européenne ELIXIR.
Dans le cadre du projet national EMERGEN, l'IFB est chargé de déployer un environnement numérique pour la surveillance génomique et la recherche concernant les maladies infectieuses émergentes. Pendant les deux premières années, le projet sera consacré au traitement des données COVID-19, mais l'environnement numérique couvrira à plus long terme l'ensemble des maladies infectieuses émergentes. Le développement de cette plateforme numérique sera assuré par une équipe incluant des compétences en DevOps, développement de bases de données et de logiciels, gestion des données et analyse des données.
La personne sera recrutée sur l'un des sites d'implantation de l'IFB impliqués dans le projet EMERGEN. Ceci inclut notamment les plateformes suivantes : ARTbio (Paris), ABIMS (Roscoff), BigEst (Strasbourg), MMG-GBIT (Marseille). La personne s'intégrera dans son équipe d'accueil, et participera aux groupes de travail de l'IFB pertinents pour sa mission. Le travail sera réalisé sur site et en télétravail. Occasionnellement, des déplacements nationaux et internationaux pourront être organisés pour des réunions de projet et la participation à des conférences.
Nous vous remercions de bien prendre en compte la procédure de recrutement ci-contre.
Missions
La personne recrutée assurera les missions suivantes :
- Déployer sous Galaxy un système d'analyse automatisée des séquences de SARS-CoV-2 produites par différentes technologies NGS (Illumina, MinIon et Nanopore),
- Assurer le bon fonctionnement du serveur Galaxy dédié à ces analyses,
- Connecter les services Galaxy avec les autres composantes du projet EMERGEN (EMERGEN-DB, soumission aux dépôts internationaux de séquences),
- Réaliser des méta-analyses de l'ensemble des données produites par le projet national de surveillance génomique EMERGEN,
documenter les procédures d'analyse,
- Assurer un support aux usagers (plateformes de séquençage du projet EMERGEN).
Activités
- Collecter, comparer, adapter, tester et déployer les workflows existants pour l'analyse des génomes de SARS-CoV-2
- Installer des workflows existants dans l'environnement Galaxy
- Convertir à Galaxy certains workflows initialement implémentés sous d'autres environnements de développement
- Évaluer les performances de workflows et la conformité de leurs résultats d'analyse
- Réaliser des méta-analyses de l'ensemble des données produites par le projet national EMERGEN
- Produire des rapports d'analyse
- Interagir avec l'équipe du réseau national de ressources bioinformatiques de l'IFB pour assurer le déploiement des workflows
- Assurer, en collaboration avec les administrateurs systèmes, du serveur Galaxy dédié aux donnée SARS-CoV-2
- Participer à l'automatisation de l'intégration des services Galaxy avec les autres composantes du projet EMERGEN (base de données EMERGEN-DB, soumission des données aux dépôts internationaux, ...)
- S'intégrer dans les communautés de développeurs Galaxy aux niveaux national et international (ELIXIR)
- Interagir avec les producteurs de données (biologistes et bioinformaticiens des laboratoires de séquençages)
- Concevoir et préparer une documentation pour faciliter l'usage des workflows pour les biologistes
- Participer à des événements de formation pour les usagers du système
- Participer aux missions générales de l'IFB qui relèvent de sa compétence (développement de workflows, analyse NGS, formation, FAIRisation des données)
Compétences
Formation
- Master en bioinformatique, informatique ou biologie complété par une expérience de bioinformatique
Compétences requises
- Maîtrise du framework Galaxy
- Connaissances des technologies de production de données NGS et des méthodes d'analyse associées
- Maîtrise du langage de programmation Python
- Maîtrise du système opérateur Unix
- Connaissance des interfaces programmatiques (API REST)
Compétences additionnelles appréciées
- Expérience en analyse des variants génomiques
- Expérience dans les domaines biologiques pertinents (phylogénie moléculaire, génétique des virus)
Expérience requise
- Expérience avérée d'analyse de données NGS sous Galaxy
- Expérience de développement logiciel
Expérience additionnelle appréciée
- Déploiement et gestion de serveurs Galaxy
Savoir-être
- Capacité à travailler en équipe, en adoptant les méthodes de travail collaboratif