Mise en production d’applications web sur données génomiques

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

TA 176/PS1
Boulevard de la Lironde
34398 Montpellier
France

Contacts
Guilhem Sempéré
Email du/des contacts
guilhem.sempere@cirad.fr
Description

Dockerisation, génération de releases, tests unitaires, optimisation de code et benchmarks

———————————————————————————————————————————————————————————————————————

Contexte

La gestion structurée de données volumineuses est un challenge majeur dans le quotidien des laboratoires de recherche travaillant avec des données génomiques (agronomie, santé, etc...). Si certains chercheurs ont acquis la double compétence biologie / informatique, une bonne partie d’entre eux restent en difficulté face à des jeux de données grandissants, et manquent souvent de solutions pour les gérer sur le long terme.

Depuis quelques années au sein du CIRAD, des applications web sont développées dans le but de répondre à cette problématique, en offrant des interfaces conviviales permettant d’importer de grands volumes d’informations dans des bases de données NoSQL, de les garder à disposition sous une forme centralisée, interrogeable et partageable, et ainsi de les ré-exploiter de manière efficace.

 

Description du stage

La personne sélectionnée pour ce stage sera amenée à intervenir sur 2 applications 3-tiers développées en Java, MongoDB, HTML et Javascript :

- MetaXplor [1], un système en cours de finalisation, visant à gérer des séquences métagénomiques [2] et leur assignation à une taxonomie [3]. Le travail principal à effectuer autour de cette application consistera à la rendre distribuable sous la forme de conteneurs Docker. Quelques développements Java seront également nécessaires pour optimiser certaines procédures, comme l’import d’un arbre taxonomique dans MongoDB à partir de fichiers à plat. Un manuscrit visant la publication d’un article présentant cet outil sera rédigé en parallèle du déroulement de ce stage.

- Gigwa [4,5], qui se focalise sur la gestion de variations génomiques (données de génotypage [6] à haut débit : SNP, INDEL…). Ce logiciel, déjà mature et utilisé par divers instituts en France et à l’étranger, est en constante évolution et nécessite la mise en œuvre d’un certain nombre de développements qui faciliteront sa maintenance et la mise en production des versions à venir, notamment écriture de tests unitaires et de scripts de génération de bundles. Un travail d’évaluation de l’efficacité d’une évolution de la structure de données sera également à prévoir.

Selon l’avancement des points précédents, le / la stagiaire pourrait être amené(e) à participer à la reconfiguration d’un serveur de production (modification d’architecture RAID, réflexion sur la mise au point d’une solution de backup).

Le stage se déroulera dans un environnement technique motivant et pluridisciplinaire, encadré par une équipe d’informaticiens et de bioinformaticiens. Les technologies principalement utilisées seront Docker, Java et MongoDB.

 

Profil recherché

  • Licence 3 ou Master en informatique ou bioinformatique ;

  • Expérience significative en programmation Java ;

  • Des notions sur les concepts de gestionnaire de conteneurs (Docker) ;

  • Autonomie et bon relationnel ;

  • Une expérience dans l’utilisation de certains des outils suivants seraient un plus : Apache Maven, Apache Ant, MongoDB, Eclipse, Spring Framework, Sun / Oracle Grid Engine, Slurm ;

  • Des connaissances en bioinformatique seraient bienvenues mais non indispensables.

 

Gratification: oui

Durée : 5 à 6 mois

Date de début : Septembre 2019

Lieu : Campus de Baillarguet, Montferrier sur Lez (Hérault)

Dossier de candidature : CV et lettre de motivation

Encadrement: Guilhem Sempéré, UMR Intertryp, guilhem.sempere@cirad.fr

 

1 http://agris.fao.org/agris-search/search.do?recordID=FR2019151753

2 https://fr.wikipedia.org/wiki/M%C3%A9tag%C3%A9nomique

3 https://fr.wikipedia.org/wiki/Taxonomie

4 https://doi.org/10.1186/s13742-016-0131-8

5 https://doi.org/10.1093/gigascience/giz051

6 https://fr.wikipedia.org/wiki/G%C3%A9notypage

Equipe adhérente personne morale SFBI
Equipe Non adhérente