IE Bioinformaticien pour l’évaluation de la qualité et pour la diffusion internationale des données

 CDD · IE  · 12 mois (renouvelable)    Bac+5 / Master   Institut Francais de Bioinformatique (IFB) - CNRS · Paris (France)  A partir de 2497,74 brut selon experience

 Date de prise de poste : 1 février 2022

Mots-Clés

Data Broker, Covid-19, EMERGEN, Système-automatisé,biologie, Qualité

Description

Contexte de travail

L’Institut Français de Bioinformatique (IFB ; https://france-bioinformatique.fr/) est une infrastructure nationale en biologie-santé qui fédère 35  plateformes régionales et équipes associées, ainsi qu’une unité coordinatrice, IFB-core (UMS CNRS 3601). L’IFB est également le nœud français de l’Infrastructure de Recherche européenne en bioinformatique ELIXIR (ESFRI).

L’IFB a pour missions : (1) de mettre en place un service national en bioinformatique, accessible à tous les chercheurs en sciences du vivant, sous la forme d’une infrastructure environnée (stockage, calcul, environnement logiciel, bases de données, serveurs Web nationaux, support aux usagers, accompagnement de projets, formations, …) ; (2) de répondre à l’évolution rapide des technologies et des besoins ; (3) d’anticiper les futurs développements du domaine ; (4) d’assurer la représentation des services bioinformatiques français au niveau international ; (5) de favoriser l’engagement des communautés des sciences du vivant dans les projets nationaux et internationaux associés à la bioinformatique ; (6) d’assurer le transfert des connaissances et technologies entre les laboratoires de recherche français et le monde industriel; (7) d’assurer le lien entre les activités des bioinformaticiens Français et celles de l’infrastructure européenne ELIXIR. 

Dans le contexte de la crise sanitaire COVID-19, l’IFB est chargé de déployer une plateforme bioinformatique pour la collecte, le traitement et l’organisation des données du projet de surveillance génomique EMERGEN, et d’assurer la soumission de ces données dans les dépôts internationaux. Le financement initial de 2 ans a été réservé aux données COVID-19, mais le projet a pour vocation de développer une infrastructure durable permettant de répondre rapidement à d’autres maladies infectieuses émergentes. Le projet EMERGEN s’articule avec les initiatives similaires des autres pays, dans le cadre du réseau ELIXIR et de l’ECDC. 

L’IFB recrute un•e ingénieur•e d’études afin d’assurer l’évaluation de la qualité et le courtage des données du projet EMERGEN. Ceci consistera à mener une évaluation externe de la qualité des séquences et des métadonnées produites par les laboratoires français, et à assurer le lien entre l’IFB et les dépôts internationaux afin de diffuser les données au niveau international. 

La personne recrutée sera administrativement affectée à l’UMS CNRS 3601 IFB-core. Elle pourra être accueillie sur l’un des sites d’implantation de l’IFB associés au le projet EMERGEN, à Paris ou à Marseille. Son travail s’articulera avec les autres membres de  l’équipe IFB-EMERGEN, qui inclut également des personnes chargées de la gestion des processus système (DevOps), du développement de la base de données (WebDev), de l’analyse des données (workflows) et du courtage des données (data broker). 

La personne s’intégrera dans son équipe d’accueil, et participera, sur site et en télétravail, aux groupes de travail de l’IFB pertinents pour sa mission. Le travail nécessitera des déplacements occasionnels en France et à l’étranger pour participer à des réunions, des formations ou des événements scientifiques. 

Intitulé du poste

  • Ingénieur d’études bioinformaticien pour l’évaluation de la qualité et pour la diffusion internationale des données génomiques COVID-19 (courtage de données)

Missions

  • Réaliser une évaluation externe de la qualité (External Quality Assessment) pour les laboratoires impliqués dans le séquençage de génomes de SARS-CoV-2
  • Tester et valider les outils de courtage de données développés par l’IFB pour la soumission des données aux dépôts internationaux.
  • Vérifier la qualité des métadonnées et des séquences produites par les laboratoires séquenceurs avant de les soumettre aux dépôts internationaux.
  • Définir les procédures pour le suivi des soumissions aux dépôts internationaux (GISAID, EBI-ENA).
  • Assurer la soumission des données aux bases de données internationales GISAID et EBI-ENA. 
  • Etre l’interlocuteur•trice des dépôts internationaux pour définir les standards de qualité et pour assurer le suivi des données soumises. 

Activités

  • Prendre en charge les analyses de contrôle qualité des données et métadonnées déposées dans EMERGEN-DB en lien avec leur diffusion dans les ressources internationales.
  • Préparer les “guidelines” permettant aux producteurs de séquences de comprendre la démarche et la marche à suivre pour effectuer les dépôts sur les databases de référence. 
  • Mettre en production le service de diffusion internationale des données génomiques COVID-19 (courtage de données) dans les ressources internationales GISAID et ENA en lien avec la ressource nationale EMERGEN-DB.
  • Développer un système automatisé pour produire des bilans de qualité des données et des métadonnées. 
  • Diffuser et valoriser des résultats sous forme de rapports techniques ou d'études. 
  • Assurer une veille scientifique et technologique dans son domaine d'activité (standards de métadonnées, interfaces de soumission des dépôts, …).
  • Participer aux réunions techniques avec les partenaires nationaux et internationaux en accord avec l’ingénieur responsable des projets. 
  • Participer aux réunions européennes organisées par l’EBI et ELIXIR concernant le courtage des données. 
  • Participer aux réunions de coordination concernant le volet bioinformatique du projet EMERGEN. 

Compétences 

Formation

  • Master ou diplôme d’ingénieur en biologie et bioinformatique
  • Formation ou expérience professionnelle en évaluation de la qualité
  • Formation ou expérience en analyse des données omiques

Compétences techniques requises

  • Bonne connaissance de la biologie en général et de la génomique en particulier
  • Solides connaissances dans le domaine de l’analyse de données de séquençage à haut débit (en particulier contrôle qualité et assemblage)
  • Méthodes et outils statistiques
  • Compétences en bioinformatique et gestion/analyse de données génomiques
  • Notions des systèmes de gestion des données
  • Connaissance d’un langage d’analyse de données (R ou Python)
  • Maîtrise des commandes en ligne Unix et de langages de script

Compétences techniques appréciées

  • Une expérience en génomique virale est un atout supplémentaire. 
  • Une expérience préalable dans le développement d’une application interoperable via API serait un plus
  • Connaissances de la “Science des données” et des principes “FAIR”, en particulier dans le domaine de la gestion et de l’analyse des données “omiques”. 

Langues

  • Maîtrise de l’anglais écrit et parlé (projet européen, réunions fréquentes avec les autres partenaires)
  • Connaissance du français oral et écrit souhaitable mais non nécessaire

Savoir-faire

  • Travail à distance (équipe multi-site)
  • Bonnes capacités de communication

Savoir-être

  • Travail en équipe
  • Qualités relationnelles

Candidature

Procédure : Nous vous remercions de bien vouloir déposer votre CV et lettre de motiviation sur le portail CNRS, lien ci-dessous. (Procédure Obligatoire pour le traitement du dossier candidat).

Date limite : 31 janvier 2022

Contacts

Hélène Chiapello

 heNOSPAMlene.chiapello@inrae.fr

 https://emploi.cnrs.fr/Offres/CDD/UMS3601-VALSAI-059/Default.aspx

Offre publiée le 22 décembre 2021, affichage jusqu'au 31 janvier 2022