Conception et évaluation de workflow d'analyse proteogénomique d’intérêt biomédical sous Galaxy

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

17 Avenue des Martyrs
38054 Grenoble 9
France

Contacts
Yves Vandenbrouck
Email du/des contacts
yves.vandenbrouck@cea.fr
Description

Contexte :
La protéogénomique est une approche qui intègre les données génomiques (Whole Genome Sequencing) et/ou transcriptomiques (RNA-Seq) aux données protéomiques obtenues par spectrométrie de masse (LC-MS/MS) afin d'identifier directement les séquences de protéines exprimées dans un échantillon biologique et dont les variants résultants d’une altération génétique peuvent avoir un rôle fonctionnel dans le développement des pathologies [Alfaro et al., 2014, Nature Meth]. Récemment des études de profilages moléculaires à haut-débit ont démontré l’importance de la protéogénomique pour la découverte de variants protéiques (protéoformes) qui potentiellement impliqués dans les processus tumoraux [Mertins et al., 2016, Nature]. Afin d’atteindre cette objectif, le processus d’analyse devrait idéalement enchainer les étapes suivantes: 1. la génération d’une banque de séquences protéiques annotées dérivées des données RNA-Seq; 2. le “matching” des données MS/MS avec les variants putatifs suivi d’étapes de filtrage pour valider leur identification ; 3. enfin l’analyse fonctionnelle de ces variants par leur remise en contexte biologique permet aux chercheurs d’évaluer la nature de leur impact. Cependant, la mise en œuvre de cette stratégie implique de nombreuses étapes calculatoires et l'intégration de briques logicielles diverses au sein de workflows spécialisés, ce qui limite fortement son accès et donc son utilisation par les chercheurs. Dans ce contexte, des outils ont été développés par la communauté Galaxy couvrant, d’une part la partie protéogénomique (projet Galaxy-P) [Sheynkman et al., 2014, BMC Genomics] et d’autre part, la partie analyse fonctionnelle (projet ProteoRE) [Vandenbrouck et al., 2019, Proteomics].
Sujet :
L’objectif du stage vise à la conception d’un workflow complet d’analyse protéogénomique ; il s’agit d’identifier, intégrer et optimiser l’ensemble des composants Galaxy existants, voire d’en développer de nouveau le cas échéant, assemblé au sein d’un workflow à des fins d’évaluation grandeur nature par la ré-utilisation de jeux de données publiques. Le travail du stagiaire portera sur la constitution des jeux de données, la sélection des outils Galaxy existants et les tests, leur déploiement sur l’instance ProteoRE et l’implémentation d’un workflow de protéogénomique et son évaluation. Le/la stagiaire participera également à la documentation du/des workflows résultants, idéalement sous la forme de « hands-on » Galaxy Traing Network (http://training.galaxyproject.org). Le stage est localisé à Grenoble. Il/Elle sera régulièrement amené à interagir avec les différentes partenaires du projet et à présenter ses avancées en réunions de travail.

« ProteoRE » est une instance Galaxy pour l’analyse fonctionnelle de données multi-omics (http://www.proteore.org), co-développée Valentin Loux (plate-forme Migale, INRA, Jouy-en-Josas) et Yves Vandenbrouck (équipe EDyP, U1038, CEA/INSERM/UGA, Grenoble), et soutenu par l’IFB (Institut Français de Bioinformatique). « Galaxy-P » est une instance Galaxy pour l’analyse de données de protéomique (MS/MS) développé par le groupe du Pr. Tim Griffin (Université du Minnesota, USA). Les équipes Galaxy-P et ProteoRE ont développé des interactions qu’elles souhaitent étendre via ce projet collaboratif.

Compétences requises et/ou à acquérir
• Maîtrise d’un langage de programmation (Python…)
• Maîtrise du langage XML
• Apprentissage de l’environnement Galaxy ( https://galaxyproject.org)
• Connaissance d'environnements d’outils de gestion de version (e.g. GitHub)
• Stratégie d’analyse multi-omics (données RNA-Seq et protéomique MS/MS)
• Rigueur, culture gestion de projet et bonnes capacités relationnelles
• Anglais

Stage rémunéré (selon grille indiciaire du CNRS)
Durée envisagée: 6 mois
Contact et encadrant de stage: yves.vandenbrouck@cea.fr

Equipe adhérente personne morale SFBI
Equipe adhérente