Formalisation et portage dans Galaxy de stratégies de traitement de données applicables aux données

 Stage · Stage M1  · 3 mois    Bac+4   PFEM - UMR 1019 - INRAE · Saint-Genès-Champanelle (France)

 Date de prise de poste : 1 février 2024

Mots-Clés

metabolomique galaxy R data-processing

Description

Lieu : Theix (site INRAE)
Laboratoire : Plateforme d’Exploration du Métabolisme
Encadrant : Mélanie Pétéra
Durée : 3 à 5 mois
Début du stage : possible à partir de février 2024 – fin du stage au plus tard mi-juillet 2024
-----
Contexte
La Plateforme d'Exploration du Métabolisme (PFEM) est une plateforme de spectrométrie de masse (MS) dédiée aux études de métabolisme, reconnue nationalement comme à l’international, notamment dans le domaine de la métabolomique appliquée à la nutrition et à la santé. Sa composante métabolomique s’inscrit au sein de l'Unité de Nutrition Humaine (UNH) de l’Institut national de recherche pour l'agriculture, l'alimentation et l'environnement. Les intérêts de recherche de la PFEM concernent le développement de méthodes analytiques basées sur la MS ainsi que d'outils bio-informatiques, le tout dans le but notamment de permettre une meilleure caractérisation des déviations métaboliques associées au développement de maladies métaboliques chroniques et l'étude des relations entre la nutrition et la santé. Ceci couvre notamment :
- l'établissement de profils métaboliques à l'aide d'approches multiplateformes dans les biofluides et les tissus ;
- le développement de stratégies analytiques pour l'identification de biomarqueurs à l'aide de MS à ultra-haute résolution et d'outils bio-
informatiques ;
- le développement de modèles et d'outils pour améliorer l'extraction de connaissances à partir de données à haut débit.

Objectif du stage
La PFEM travaille actuellement à formaliser un ensemble de stratégies de traitement de données pour conforter son offre de service pour des analyses de haut-débit. Ceci passe par la possibilité de traiter les données qu’elle génère via l’interface web Galaxy (https://galaxyproject.org/), déjà utilisée pour une partie de ses analyses. L’objectif du stage est de participer à la concrétisation de cet objectif en portant dans Galaxy une partie des stratégies élaborées.
Concrètement il s’agit principalement, à partir de scripts ou packages R déjà existants, de développer des outils Galaxy adaptés aux contraintes et ambitions de la PFEM (visualisation de résultats adaptés, se conformer aux formats existants, aux bonnes pratiques de la communautés…).
Ceci passe notamment par ce qui suit :
- design du traitement de données pris en charge par l’outil (définition des données d’entrée/sortie, paramètres nécessaires…) ;
- design de l’interface de l’outil Galaxy (ordonnancement des paramètres) et scripting du fichier XML le formalisant ;
- documentation de l’outil (rédaction de contenus à destination des utilisateurs, des développeurs et de la communauté).
Le test d’outils Galaxy déjà existants en vue de les améliorer est également envisageable dans le cadre du stage.
Il est attendu de la personne accueillie qu’elle fasse preuve de rigueur et d’un bon sens de l’organisation pour assurer la traçabilité de l’ensemble des productions et tests associés. De plus, la personne devra être à même de rédiger de courts comptes-rendus de points d’avancement (relevés de décisions, TODO-lists…).

Environnement et contexte de travail
Le stage sera réalisé au sein de la PFEM, au sein d’un institut public de recherche. La plate-forme, certifiée ISO9001 et NF X50-900, est l’un des membres fondateurs de l’infrastructure nationale d'excellence MetaboHUB créée en 2013. La PFEM rassemble une dizaine d'appareils de MS de différents types. Actuellement le fonctionnement de la composante métabolomique est assuré par quinze titulaires dont neuf chimistes/analystes, deux statisticiens, deux bio-informaticiens et un informaticien

Compétences souhaitées
- Bonne connaissance et pratique du langage R.
- Être capable d’appréhender raisonnablement les concepts de méthodes statistiques non nécessairement maitrisées initialement, de
même pour l’utilisation de solutions logicielles non connus initialement.
- Motivation pour évoluer dans un environnement pluridisciplinaire (Biologie, Chimie, Masse, Informatique) et interagir avec différents
acteurs lors du stage.
- Rigueur, autonomie, sens de l’organisation.
- Les éléments suivants sont un plus mais ne sont pas obligatoires :
 o Connaissance de l’environnement Galaxy 
 o Bases en XML
 o Bases en versionnement de code (Git)

Candidature

Procédure : Curriculum vitæ et lettre de motivation à adresser conjointement à : melanie.petera@inrae.fr et contact-pfem@inrae.fr Merci d’indiquer en objet « [candidature stage de Master] Portage dans Galaxy de stratégies de traitement de données »

Date limite : 1 janvier 2024

Contacts

 Melanie Petera

 meNOSPAMlanie.petera@inrae.fr

Offre publiée le 24 novembre 2023, affichage jusqu'au 1 janvier 2024