Ingénieur.e en bioinformatique: detection of undescribed Genetically Modified Organisms

 CDD · Postdoc  · 18 mois (renouvelable)    Bac+8 / Doctorat, Grandes Écoles   ANSES de Ploufragan (Agence Nationale de Sécurité Sanitaire de l'Alimentation et du Travail) · Ploufragan (France)  Selon expérience et niveau de formation par référence aux grilles indicaires des agences sanitaires

 Date de prise de poste : 1 juillet 2023

Mots-Clés

detection undescribed Genetically Modified Organisms Machine Learning Bioinformatics Snakemake git R Python Plant Bacteria

Description

Annonce en français (English version at the end)

 

Vos missions

Rattaché(e) à l’équipe bioinformatique de l’Unité de Génétique Virale et Biosécurité, la personne recrutée devra développer un logiciel de détection d’OGM inconnus de plante (non répertoriés). Pour cela, il-elle pourra s’appuyer sur le logiciel DUGMO [Hurel et al., BMC Bioinformatics 2020] dédié aux bactéries et l’adapter pour son utilisation sur des données de séquençage de plante, de virus, ou métagénomiques par ordre de priorité en fonction de son avancement.

Date de prise de poste

Entre le 1er juillet 2023 et le 1er décembre 2023

Rémuneration

Selon expérience et le niveau de formation par référence aux grilles indicaires des agences sanitaires ou selon statut particulier si fonctionnaire.

Conditions d'accès

- Poste réservé aux personnes ayant travaillé au moins 18 mois à l'étranger (hors de France donc) depuis mai 2020

- Travail dans un laboratoire en sur-pression, où il n'est pas possible d'ouvrir les fenêtres. Changement de tenu à l'entrée et la sortie (sauf sous-vêtements).

 

Votre équipe

La direction pilote : ANSES de Ploufragan-Plouzané-Niort.

Au sein de cette direction, l’Unité de Génétique Virale et Biosécurité (UGVB) est une unité à positionnement transversal avec une forte orientation de son activité axée sur l’innovation en méthodologie.

Dans le cadre de son activité de plateforme, l’UGVB collabore avec le Laboratoire de Santé des Végétaux d’Angers, dont l’une des problématiques est la détection d’Organismes Génétiquement Modifiés (OGM).

Vous rejoindrez une équipe de quatre personnes dédiée à l’analyse de données de séquençage haut débit. Vous pourrez vous appuyer sur l’expérience de Fabrice Touzain, votre encadrant principal, pour la partie bioinformatique, et sur celle de Stéphanie Bougeard pour les méthodes de Machine Learning employées.

Votre quotidien

Activité 1 :

  • Faire la bibliographie sur les outils de clustering, les pangénomes, les annotateurs bactériens et eucaryotes.

Activité 2 :

  • Familiarisation avec DUGMO, remplacement de l’annotateur prokka par bakta, mise à jour du modèle dans une optique d’universalité.

Activité 3 :

  • Implémentation en snakemake/python/R d’une variante du logiciel DUGMO apte à détecter des OGM inconnus de plantes.

Activité 4 :

  • Implémentation en snakemake/python/R d’une variante du logiciel DUGMO apte à traiter un échantillon métagénomique.

Activité 5 :

  • Implémentation en snakemake/python/R d’une variante du logiciel DUGMO apte à détecter des OGM inconnus de virus.

Activité 6 :

  • Valoriser chaque variante par un article dans une revue de référence à comité de lecture du domaine bioinformatique (au fur et à mesure de la fin de chaque implémentation et des tests associés).

     

Votre profil

  • Formation et expérience requises :

De formation bioinformatique Bac +5 minimum, vous avez un goût prononcé pour la recherche, avez des connaissances biologiques générales, et un attrait pour les statistiques et la programmation python/R/Snakemake.

  • Compétences :

    • Programmation en Python, R, Snakemake

    • Connaissances de conda/mamba, git et gitlab

    • Connaissances biologiques générales

    • Des connaissances en statistiques et particulièrement en Machine Learning seraient un plus

    • Bonne maîtrise de l’Anglais technique lu, écrit, parlé

    • Maîtrise des environnements Linux/Unix

    • Qualités requises : grande autonomie, organisation, rigueur

    • Une connaissance préalable des outils bioinformatiques et des méthodes de traitement des données issues de séquençages haut débit serait un plus (bwa, bowtie2, fastp, shovill, etc…)

 

[English version]

Your missions

Attached to the bioinformatics team of the Viral Genetics and Biosafety Unit, the person recruited will have to develop software for the detection of unknown plant GMOs (not listed). For this, he/she will be able to use the DUGMO software [Hurel et al., BMC Bioinformatics 2020] dedicated to bacteria and adapt it for use on plant, virus or metagenomic sequencing data in order of priority depending on his/her progress.

 

Date of taking office

Between July 1, 2023 and December 1, 2023

 

Remuneration

According to the experience and the level of training by reference to the indexed grids of the health agencies or according to particular statute if civil servant.

 

Specific conditions

- Access to the position restricted to those who have worked at least 18 months abroad since May 2020.

- You will work in a laboratory in overpressure. It is impossible to open the windows. Change of clothes at the entrance and exit (except underwears).

Your team

The management leads: ANSES de Ploufragan-Plouzané-Niort.

Within this department, the Viral Genetics and Biosafety Unit (UGVB) is a transversal unit with a strong orientation of its activity towards innovation in methodology.

Within the framework of its platform activity, the UGVB collaborates with the Plant Health Laboratory of Angers, one of the problems of which is the detection of Genetically Modified Organisms (GMO).

You will join a team of four people dedicated to the analysis of high-throughput sequencing data. You will be able to rely on the experience of Fabrice Touzain, your main supervisor, for bioinformatics part, and on Stéphanie Bougeard for the Machine Learning methods used.

 

Your work

 

Activity 1 :

  • Do the bibliography on clustering tools, pangenomes, bacterial and eukaryotic annotators.

Activity 2 :

  • Familiarization with DUGMO, replacement of the prokka annotator by bakta, update of the model with a view to universality.

Activity 3 :

  • Implementation in snakemake/python/R of a variant of the DUGMO software able to detect unknown GMOs in plants.

Activity 4 :

  • Implementation in snakemake/python/R of a variant of the DUGMO software able to process a metagenomic sample.

Activity 5 :

  • Implementation in snakemake/python/R of a variant of the DUGMO software able to detect unknown virus GMOs.

Activity 6 :

  • Valorize each variant by an article in a peer-reviewed journal in the bioinformatics field (as each implementation and associated tests are completed).

 

Your profile

  • Education and experience required:

With a minimum of 5 years of higher education in bioinformatics, you have a strong taste for research, general biological knowledge, and an interest in statistics and Python/R/Snakemake programming.

  • Skills :

    • Programming in Python, R, Snakemake

    • Knowledge of conda/mamba, git and gitlab

    • General biological knowledge

    • Knowledge in statistics and especially in Machine Learning would be a plus

    • Good level of technical English read, written and spoken

    • Proficiency in Linux/Unix environments

    • Required qualities: great autonomy, organization, rigor

    • Previous knowledge of bioinformatics tools and methods for processing data from high-throughput sequencing would be a plus (bwa, bowtie2, fastp, shovill, etc...)

 

Candidature

Procédure : Adresser au plus tard le 15/06/2023, lettre de motivation + CV à fabrice.touzain@anses.fr Send by 15/06/2023 at the latest to fabrice.touzain@anses.fr, letter of motivation + CV

Date limite : 15 juin 2023

Contacts

Fabrice Touzain

 faNOSPAMbrice.touzain@anses.fr

Offre publiée le 22 mars 2023, affichage jusqu'au 15 juin 2023