Mots-Clés
RShiny
annotation
mass spectrometry
Description
Titre
Développement d'outils bioinformatiques avancés et ergonomiques contribuant à un flux de travail complet et semi-automatisé pour l'annotation de données de spectrométrie de masse haute résolution générées dans le cadre d’approches de profilage non-ciblé.
Unité d’accueil
LABoratoire d’Étude des Résidus et Contaminants dans les Aliments (LABERCA),
École Nationale Vétérinaire, Agroalimentaire et de l’Alimentation Nantes Atlantique (ONIRIS).
101 route de Gachet, Nantes, France
Contexte
Le développement d'un workflow automatisé complet et ergonomique pour la fouille de données acquises par chromatographie couplée à la spectrométrie de masse haute résolution (HRMS) selon des approches dites de suspect screening (SS) et de non-targeted screening (NTS) apparaît comme un enjeu crucial pour une mise en œuvre efficace de ces approches au sein du LABERCA et également au niveau Européen. Ce travail sera en effet réalisé pour répondre aux besoins de divers projets de recherche européens ou nationaux en cours au LABERCA. Il s’agira de tendre vers une norme européenne sur le traitement des données en exposomique SS/NTS, répondant aux objectifs d'harmonisation conformes à la notion de FAIR data.
A ce jour, une large gamme d'outils logiciels est disponible pour effectuer un ou plusieurs composants de ce traitement de données. Et même si plusieurs initiatives existantes dans ce domaine sont bien identifiées et reconnues, il n’existe pas encore de ligne directrice consensuelle permettant de couvrir totalement les besoins. Ainsi, une solution intégrée, durable et en open access permettant d'effectuer toutes les étapes fait toujours défaut.
Le traitement des données fait ici référence à l'analyse des données HRMS après leur acquisition, avec des capacités à gérer un grand nombre d’échantillons dans un temps raisonnable. Dans le cas du SS, le traitement des données consiste essentiellement en l'utilisation d'une base de données de référence pour comparer et faire correspondre chaque signal détecté dans l'échantillon analysé à une liste de composés déjà connus et référencés. S’agissant du NTS, le traitement des données est clairement encore plus difficile et nécessite des outils et des compétences bioinformatiques et/ou statistiques particuliers. Ceci afin de couvrir les besoins suivants : l'extraction des informations utiles à partir des données brutes, la sélection des pics, l'alignement des pics et leur annotation. Dans ce cadre, le LABERCA s’est impliqué dans le développement d’outils bioinformatiques capables d’exploiter une signature chimique particulière associée à un groupe donné de substances. Un exemple illustratif est l’outil R Shiny Haloseeker qui permet la recherche des substances halogénées, par l’analyse et la visualisation des schémas isotopiques typiques qui peuvent être repérés à partir des données HRMS. Le LABERCA est également impliqué dans le développement de l’instance Galaxy, qui permet la gestion automatisée de workflow pouvant intégrer divers outils existants et ce quel que soit le type de code ( R, Python et autres langages).
Objectifs
L’objectif principal de ce stage de 4 à 6 mois est de contribuer au développement d'un workflow d'annotation intégré et ergonomique pour l'identification des composés détectés par le profilage chimique HRMS, sous la supervision d’un bioinformaticien expérimenté. L'objectif global du projet sera alors de fournir un pipeline complet et harmonisé au niveau de l'Union Européenne, permettant de passer des données HRMS brutes aux données annotées avec des performances qualitatives consolidées.
Après la découverte et la prise en main du code et des outils existants (R, Python, C++, Shiny, SQLite, Git), le stagiaire se verra confier la résolution de problèmes par la programmation d’outils s’insérant dans le workflow global.
Compétences requises
- Goût pour la programmation et le développement web ;
- Connaissance des langages R et Python ;
- Connaissances dans la création et l’administration de bases de données (Oracle, SQL) ;
- Capacités organisationnelles et de travail collaboratif ;
- Curiosité scientifique.
Gratification de stage
Selon barème en vigueur (Environ 550 €/mois)
Durée
Quatre à six mois, entre janvier et août 2023
Candidature
A adresser à ronan.cariou@oniris-nantes.fr sous forme d’un dossier pdf unique contenant a minima une lettre de motivation et un CV.
Contacts
Dr. Ronan CARIOU, Chimiste analyste, chef projet
M. Julien SAINT-VANNE, Bioinformaticien, plateforme MELISA
Dr. Jean-Philippe ANTIGNAC, Directeur adjoint, Responsable scientifique - axe santé
Dr. Gaud DERVILLY, Directrice adjointe, Responsable scientifique - axe alimentation