Sélection de gènes avec a priori réseau

Type de poste
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

<p>17 rue des Martyrs</p><p>F-38054 GRENOBLE Cedex 9</p>
Grenoble
France

Contacts
Laurent Guyon
Email du/des contacts
laurent.guyon@cea.fr
Description

<p>Les technologies &laquo;&nbsp;omiques&nbsp;&raquo; (génomique, protéomique, etc.) ont permis la génération de longues listes de gènes. Une question récurrente est ensuite &laquo;&nbsp;que faire avec cette longue liste de gènes&nbsp;?&nbsp;&raquo;. Nous proposons pour sélectionner des groupes de gènes pertinents dans cette liste de prendre en compte les connaissances biologiques antérieures organisées sous la forme de réseau de gènes. Nous faisons l&rsquo;hypothèse que les gènes &laquo;&nbsp;hits&nbsp;&raquo; (différentiellement exprimés, corrélés à la survie des patients, etc.) sont plus connectés dans le réseau que s&rsquo;ils étaient répartis aléatoirement. S&rsquo;appuyant sur cette hypothèse, nous avons développé GeNetSel, un package R quasi-finalisé, qui permet de sélectionner les gènes d&rsquo;intérêt avec prise en compte d&rsquo;un <em>a priori</em> réseau&nbsp;: deux gènes qui sont à la limite d&rsquo;être sélectionnés sans <em>a priori</em> le seront avec GeNetSel s&rsquo;ils sont connectés dans le réseau.</p><p>&nbsp;</p><p>Le premier objectif du stage est de vérifier l&rsquo;hypothèse selon laquelle les &laquo;&nbsp;hits&nbsp;&raquo; sont très connectés entre eux. Cela consistera à fouiller les jeux de données publiques, en particulier la base d&rsquo;expression GEO et la base de données &laquo;&nbsp;cancer&nbsp;&raquo; TCGA, et de vérifier l&rsquo;hypothèse testée sur différents réseaux de façon systématique et automatisée. Il s&rsquo;agira pour chaque jeu de données d&rsquo;identifier quel(les) voies de signalisation est attendue (ontologie), constituant ainsi une &laquo;&nbsp;vérité terrain&nbsp;&raquo; qui permettra ensuite de qualifier la performance des sélections. Le second objectif sera d&rsquo;appliquer l&rsquo;algorithme GeNetSel pour le valider sur données réelles et quantifier le gain apporté.</p><p>&nbsp;</p><p><u>Encadrant </u>:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Laurent Guyon ; <a href="mailto:laurent.guyon@cea.fr">laurent.guyon@cea.fr</a&gt; (contact email)</p><p>&nbsp;</p><p><u>Collaboration&nbsp;</u>:&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Florent Chatelain (Gipsa lab, spécialiste des tests)</p><p>&nbsp;</p><p><u>Mots clés </u>: Bioinformatique, biologie systémique (i.e. approche globale), cancer, microARN, réseaux de gènes.</p><p>&nbsp;</p><p><u>Niveau requis </u>: Bon étudiant en bioinformatique ou bon étudiant en biologie avec un fort intérêt pour l&rsquo;informatique et la manipulation de données.</p><p>La connaissance de R n&rsquo;est pas obligatoire mais serait un plus.</p><p>&nbsp;</p><p><u>Durée </u>: 4-6 mois</p><p>&nbsp;</p><p><u>Référence&nbsp;:</u></p><p>S. Robinson, J. Nevalainen, G. Pinna, A. Campalans, J. P. Radicella, and L.&nbsp;Guyon, &ldquo;Incorporating interaction networks into the determination of functionally related hit genes in genomic experiments with Markov random fields,&rdquo; Bioinformatics, vol. 33, no. 14, pp. i170&ndash;i179, 2017. (<a href="https://doi.org/10.1093/bioinformatics/btx244">lien</a&gt;)</p><p>&nbsp;</p><br/>
Laboratoire: BCI - Laboratoire de Biologie du Cancer et de l'Infection (UMR UGA/INSERM/CEA)