Développement de workflow ETL et d’interfaces web pour le portail de données plantes FAIDARE

 Stage · Stage M2  · 6 mois    Bac+5 / Master   INRAE URGI · Versailles (France)  500

 Date de prise de poste : 1 février 2024

Mots-Clés

Plant development FAIR web interface ETL Python Docker GNU/Linux Shell/Bash Java Spring Angular RDF JSON web services REST

Description

L'URGI est une unité de recherche INRAE dédiée aux plantes. Elle héberge une plateforme de bio-informatique dont l'une des activités majeures est d'assurer, en suivant les principes FAIR, le partage, la standardisation et la structuration des données de recherche de projets nationaux et internationaux. Le partage des données passe, entre autres, par l’utilisation de portails de données, dont en particulier le portail FAIDARE (https://urgi.versailles.inrae.fr/faidare/) qui est développé à l’URGI. Il s’agit d’un portail de recherche de données scientifiques indexant plus de 30 bases de données internationales à ce jour. Divers supports de formation1,2 donnent un aperçu de ses fonctionnalités. Ce logiciel sera l’objet de ce stage, son architecture repose sur : une base de données NoSQL Elasticsearch, alimentée avec des JSON compatibles avec la BreedingAPI (www.brapi.org) via un ETL en python3 et des scripts de chargements en bash. L’interface de requêtage4 repose sur un backend Java + Spring Boot et un frontend en Angular, communiquant par web services REST.

La personne recrutée pour ce stage participera à la mise à niveau vers la BrAPIV2 de l’application, la mise en place de fonctionnalités d’export de données, l’amélioration du workflow d’ETL, et éventuellement l’ajout de fonctionnalités de recherche utilisant des alignements d’ontologies5. Elle sera intégrée à une équipe de développement de cinq personnes travaillant sur des projets parallèles. Elle sera encadrée en suivant les méthodologies agiles afin de lui permettre de prendre en main les technologies et l’architecture dans de bonnes conditions.

 

1 https://moodle.france-bioinformatique.fr/pluginfile.php/638/course/section/118/Module6.2_FAIDARE- overview.pptx
2 https://hal.inrae.fr/hal-03851454
3 https://github.com/elixir-europe/plant-brapi-etl-faidare

4 https://github.com/elixir-europe/plant-faidare

5 https://doi.org/10.57745/ZLJYQO

Candidature

Procédure : Les candidatures (CV + lettre de motivation) doivent être adressées au plus tard le 15/11/2023 par courriel à cyril.pommier@inrae.fr avec l’objet suivant : [stage 2024 – développement - FAIDARE]. Les candidatures seront évaluées au fur et à mesure.

Date limite : 30 novembre 2023

Contacts

Cyril Pommier

 cyNOSPAMril.pommier@inrae.fr

 https://urgi.versailles.inrae.fr/About-us/News/M2-dvp-web

Offre publiée le 29 septembre 2023, affichage jusqu'au 30 novembre 2023