Développement d’une interface machine web pour l’exploration des modèles d’IA en métagénomique quantitative

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

32 avenue Henri Varagnat
93143 Bondy
France

Contacts
Edi Prifti
Youcef Sklab
Email du/des contacts
edi.prifti@ird.fr
youcef.sklab@ird.fr
Description

Mots clés : IA, microbiome, métagenomique, interface web, R Shiny

Contexte
Les chercheurs de l’unité de modélisation mathématique et informatique des systèmes complexes (UMMISCO) de l’IRD sont impliqués depuis de nombreuses années dans la thématique de la modélisation des écosystèmes microbiens. Ils ont développé une approche originale d’IA permettant de découvrir des modèles interprétables de signatures métagenomiques en se basant sur des langages spécifiques et différentes heuristiques. L’approche appelée « predomics » [1] a été implémenté en tant que paquetage R. Ces développements méthodologiques ont été appliqués dans de nombreuses études dans le contexte des maladies complexes humaines, notamment les maladies cardiométaboliques [2-6].

Motivation
Malgré le grand potentiel que cette approche offre pour identifier des signatures microbiennes, pour accélérer la création d’applications utiles tant pour les patients que pour d’autres domaines tels que l’environnement, son utilisation reste modeste par la communauté scientifique. Nous souhaitons améliorer l’utilisabilité de cette approche originale et performante par les biologistes et chercheurs de tout domaine.

Existant
Une application R Shiny a déjà été développée en tant qu’interface homme-machine permettant le chargement, filtrage, lancement des analyses ainsi que l’analyse des résultats. Cependant, cette application nécessite une mise à jour importante afin d’intégrer la version la plus récente du package ainsi qu’un nouveau module d’analyse approfondie des familles de modèles de prédiction.

Objectifs
L’objectif de ce travail de stage est de reprendre le développement de l’application predomicsApp basé sur R shiny afin d’intégrer la nouvelle version du package ainsi qu’un nouveau module d’exploration des modèles et de développer une plateforme web dédiée à la méthodologie « predomics » permettant de :
1. Communiquer avec l’application R Shiny afin de charger et préparer les données, soumettre des analyses et analyser les résultats de façon dynamique
2. Visualiser plusieurs pages web, dont la plupart seront écrites en markdown afin de documenter l’approche ainsi que ces différents cas d’utilisation. Une génération dynamique de ces pages devra être proposée afin de prendre en compte les nouvelles versions du package.
3. S’interfacer avec un cluster de calcul pour le lancement et la gestion des analyses dans l’environnement HPC de l’unité
4. Implémenter un module de formation avec une vidéo/tutoriel d’introduction à l’approche predomics.
5. Implémenter un intranet dédié aux membres du projet et au partage de connaissances.

Profil recherché / competences
Nous recherchons un ingénieur en informatique pour effectuer un stage de 6 mois dans un laboratoire de recherche dynamique.
- Développement web (avec des frameworks comme Angular ou React), Python, R et Shiny.
- Connaissances des systèmes de gestion de versions de code (Git) et d’intégration continue (Travis-CI, Jenkins)
- Connaissances du domaine scientifique (metagénomique, apprentissage machine), une connaissance des frameworks Tensorflow, Keras ou Torch serai un plus
- Indépendance, rigueur,
- Expérience en création de projets et intérêt pour la recherche

Des objectifs détaillés pourront être fournis sous la forme d’un cahier de charges techniques. Nous insistons sur le fait que la plateforme doit être réalisée sous une architecture micro-service ou hexagonale. Tout le code devra être documenté, le respect des bonnes pratiques et standards est requis. Un document d’architecture sera attendu et devra préciser :
- Choix techniques et méthodologiques
- Conception détaillée de la base de données
- Plan de travail et planning
- Architecture générale et détaillée
- Plan de déploiement
- Cahier de tests fonctionnels
Les livraisons se feront par incréments avec une méthode agile.
La plateforme doit être modulaire, facilement maintenable et extensible et devra permettre de s’intégrer avec d’autres systèmes sans interrompre le service.

Conditions générales
Au vu des conditions particulières de la pandémie COVID-19, ce stage s’effectuera principalement en distanciel, avec un suivi régulier du candidat et des avancés du développement.

Durée : 6 mois
Date de début : 1er décembre 2020
Responsable : Edi Prifti (CR) | edi.prifti[at]ird.fr
Encadrant : Youcef Sklab | youcef.sklab[at]ird.fr

Références
1 Prifti, E. et al. Interpretable and accurate prediction models for metagenomics data. Gigascience 9, doi:10.1093/gigascience/giaa010 (2020).
2 Nguyen, L. S. et al. Effect of congenital adrenal hyperplasia treated by glucocorticoids on plasma metabolome: a machine-learning-based analysis. Sci Rep 10, 8859, doi:10.1038/s41598-020-65897-y (2020).
3 Le Chatelier, E. et al. Richness of human gut microbiome correlates with metabolic markers. Nature 500, 541-546, doi:10.1038/nature12506 (2013).
4 Qin, N. et al. Alterations of the human gut microbiome in liver cirrhosis. Nature 513, 59, doi:10.1038/nature13568 (2014).
5 Aron-Wisnewsky, J. et al. Major microbiota dysbiosis in severe obesity: fate after bariatric surgery. Gut 68, 70, doi:10.1136/gutjnl-2018-316103 (2019).
6 Forslund, K. et al. Disentangling type 2 diabetes and metformin treatment signatures in the human gut microbiota. Nature 528, 262-266, doi:10.1038/nature15766 (2015).

Equipe adhérente personne morale SFBI
Equipe Non adhérente