Développement d’outil sous galaxy pour la reconstruction phylogénétique et pour l’analyse statistique liée à la métagénomique

Type de poste
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

<p class="p1">INRA</p><p class="p1">Domaine de Vilvert</p><p class="p1">78350 Jouy en Josas</p>
Jouy en Josas
France

Contacts
Géraldine PASCAL
Mahendra MARIADASSOU
Maria BERNARD
Email du/des contacts
geraldine.pascal@inra.fr
mahendra.mariadassou@inra.fr
maria.bernard@inra.fr
Description

<p class="p1"><strong>Mots clés</strong> résumant les méthodes et techniques à utiliser au cours du stage : Galaxy, R, métagénomique, arbre phylogénétique, phyloseq</p><p class="p1">&nbsp;</p><p class="p1">Résumé du projet de stage&nbsp;</p><p class="p3"><span class="s1"><b><i>Contexte&nbsp;: </i></b></span>Trois équipes de recherche de l&rsquo;INRA des sites de Toulouse et de Jouy-en-Josas travaillent ensemble en bio-informatique et en bio-statistique au développement de méthodes et d&rsquo;outils pour le traitement et l&rsquo;analyse des données métagénomiques. Le stage proposé sera encadré par Maria Bernard de l&rsquo;équipe Sigenae (http://www.sigenae.org/), par Mahendra Mariadassou de l&rsquo;unité Maiage (http://maiage.jouy.inra.fr/) et par Géraldine Pascal de l&rsquo;unité GenPhySE (http://genphyse.toulouse.inra.fr/groups/ned). L&rsquo;étudiant effectuera son stage à l&rsquo;INRA de Jouy-en-Josas.</p><p class="p3"><span class="s1"><b><i>Objectifs&nbsp;: </i></b></span>Avec le séquençage haut-débit, les pipelines de traitements de séquençage d&#39;ARNr 16S actuels produisent de gros jeu de données de séquences. Le traitement de ces séquences pour produire des tables d&#39;abondances d&#39;OTUs et leur affiliation taxonomique peut être très long et les solutions les plus efficaces sont souvent dédiées aux spécialistes ou difficiles à mettre en œuvre. Dans ce contexte, nous avons développé le pipeline &quot;FROGS&quot;&nbsp;: &laquo; Find Rapidly OTU with Galaxy Solution &raquo;, développé sous environnement Galaxy (https://github.com/geraldinepascal/FROGS). En sortie de FROGS, une table d&rsquo;abondance d&lsquo;OTUs est produite. L&rsquo;analyse de cette table pour mettre en regard la composition des communautés bactériennes avec certaines données environnementales d&rsquo;intérêt (pH, température, etc.) nécessite de faire appel à des méthodes statistiques dédiées aux données de type compositionnelles. Une suite de scripts d&rsquo;analyse en langage R a d&rsquo;ores et déjà été développée pour ces traitements et le but de ce stage est d&rsquo;offrir aux utilisateurs de FROGS la possibilité de lancer ces commandes R via l&rsquo;interface Galaxy.&nbsp;</p><p class="p3"><span class="s1"><b><i>Travail demandé : </i></b></span>Principales missions : (i) Prise en main de FROGS et des scripts R, (ii) Prise en main des concepts de développement pour un environnement Galaxy (iii) Conceptualisation et développement des solutions de visualisation/présentation des données de sorties rendues aux biologistes.</p><p class="p3"><span class="s1"><b><i>Compétences techniques recherchées :</i></b></span> De formation Bac + 5 de type Master II en Bioinformatique. Maîtrise d&rsquo;au moins un langage de Scripting (perl, python). Avoir les bases de développement web (HTML, CSS). Connaissances de R et des statistiques descriptives. Connaissances en génomique. Connaissance des techniques de séquençage de masse. Maîtrise de l&rsquo;anglais technique/scientifique.</p><p class="p1">Montant des indemnités de stage&nbsp;: 554,40 euros / mois</p><br/>
Laboratoire: INRA GABI