Mots-Clés
Galaxy
Genome Hub
Hevea
Description
Description du poste / de la mission
L'UMR Amélioration Génétique et Adaptation des Plantes méditerranéennes et tropicales (AGAP institut) recrute un.e ingénieur.e en bio-informatique pour le déploiement d'application web (Genome Hub & Galaxy) pour 18 mois.
En effet, nous avons initié au sein de l'unité le concept de Genome Hubs, un système d'information ayant pour vocation de centraliser un large volume de données génomiques publiques ou privées relatives à une espèce (génomes de référence, larges projets de résequençage) ainsi que différentes données omiques (ex : GWAS, RNAseq, polymorphismes SNP, orthologie, synténie) générées dans le cadre de projets de recherche menés au sein l'unité. Le Genome Hub repose sur le CMS Drupal et le module Tripal qui permet d'interagir avec la base de données Chado, et intègre également un ensemble d'outils bioinformatiques (ex: Blast, JBrowse, Gigwa...) permettant d'exploiter et d'analyser les données hébergées.
Dans ce contexte, vous serez en charge de la création de deux nouvelles instances de Genome Hubs sur l'Hévéa et le Palmier en lien respectivement avec les équipes BURST (projet RUBIS) et GSP (projet FreePalm).
Plus spécifiquement, les missions qui vous serons confiées porteront sur :
- la mise en place d'une instance Drupal pour les 2 génomes (thèmes et module),
- l'intégration de l'assemblage et de l'annotation structurale dans la base de données Chado via le module Tripal,
- le déploiement des outils de recherche (Blast, Gene search) et visualisation associés (JBrowse, Synvisio, Gigwa)
- le recueil et l'intégration des ressources omiques (RNA Seq, SNP) accumulées par les équipes dans les outils appropriés.
Au travers du réseau South Green, nous avions mis en place une instance Galaxy (une application web qui permet la création, le partage et l'exécution de workflows d'analyses). Actuellement, cette instance n'est plus fonctionnelle. Nous souhaiterions la redéployer sur l'infrastructure de l'Institut Français de Bioinformatique (IFB). Vous serez donc en charge de mener cette action en interaction avec la communauté Galaxy France. Elle pourra être réalisée en parallèle des missions présentées précédemment.
Dans un second temps, vous devrez transférer les workflows originaux crées dans South Green ainsi que ceux mis en avant par le projet ShortCut. Ce travail se fera avec les différents développeurs de South Green.
Vous serez accueilli.e au sein du collectif bioinformatique de l'UMR AGAP Institut.
Profil souhaité
Formation et expérience demandées :
Diplôme de type master 2 ou école d'ingénieur en bioinformatique ou informatique.
Compétences scientifiques et techniques requises :
- Bonne connaissance en développements d'applications et de workflows en bioinformatique,
- Bonne connaissance théorique des approches de bioinformatique pour l'analyse de données NGS (Transcriptome, WGS),
- Programmation en Python, bash
- Connaissance des technologies web (JavaScript, PHP, HTML5, CSS3, …)
- Utilisation courante du logiciel de gestion de version git
Compétences complémentaires appréciées :
- Utilisation courante d'environnements de calcul haute-performance (cloud ou cluster)
- Expérience dans l'utilisation et le développement avec des gestionnaires de workflow (Snakemake, Nextflow, …)
Compétences relationnelles :
- Goût pour le travail en équipe dans un milieu multidisciplinaire
- Autonomie et sens de l'initiative
- Capacité à s'adapter face à un public de non spécialistes