stage de master

 Stage · Stage M2  · 5 mois    Bac+5 / Master   Université Côte d'Azur, Laboratoire I3S · Sophia Antipolis (France)  gratification de stage

Mots-Clés

ioinformatique, génomique, cancer, analyse de réseau, intégration de données

Description

Stage de master spécialité informatique ou bio-informatique

Equipe SPARKS, laboratoire I3S (https://www.i3s.unice.fr/fr/sparks)

Encadrant : Claude Pasquier claude.pasquier@univ-cotedazur.fr

Sujet / Thématique : Détermination du rôle de la protéine SigmaR1 dans le cancer du pancréas par une approche d’intelligence artificielle

Mots-clés: bioinformatique, génomique, cancer, analyse de réseau, intégration de données

Le stage proposé s’inscrit dans un projet pluridisciplinaire visant à définir le rôle de la protéine SigmaR1 dans le cancer du pancréas pour identifier une nouvelle cible thérapeutique. Il porte sur le volet « dry lab » et a pour but le développement d’une méthode d’analyse in silico des données générées par les expérimentations biologiques.

Un grand nombre de données complexes présentes dans le monde réel peuvent se modéliser sous la forme de réseaux, c’est-à-dire des ensembles de nœuds, de liens entre ces nœuds (arêtes) et d’attributs associés aux nœuds et aux arêtes. Les interactions génétiques et moléculaires peuvent ainsi être représentées sous la forme d’un réseau dans lequel les nœuds correspondent aux gènes, les arêtes indiquent des relations d’inhibition ou d’activation, et les attributs associés aux nœuds reflètent l’expression des gènes dans un contexte particulier. L’existence d’une structuration en communautés de ces réseaux (c’est-à-dire, la possibilité de les diviser en modules cohésifs et denses) est une propriété importante car elle permet souvent d'expliquer la fonctionnalité du système. La mise au point de méthodes d’identification de ces communautés est étudiée par les participants au projet qui ont récemment proposé des algorithmes de recherche des modules actifs dans des réseaux combinant des données sur les interactions protéine-protéine (PPI) et des résultats de RNA-Seq [1-2].

Ce stage contribuera à étendre les méthodes développées pour permettre l’analyse de réseaux comprenant plusieurs types de nœuds, de liens et d’attributs. Concrètement, les réseaux sur lesquels nous allons travailler comprennent plusieurs types de nœuds (des transcrits, des protéines), plusieurs types d’interconnexions fonctionnelles (des interactions physiques, des traductions génétiques) et plusieurs données associées aux nœuds (les variations d’expression des transcrits ainsi que l’abondance des protéines). L’intégration des données pourra se faire sur la base de résultats récents portant sur la combinaison de plusieurs vues [3-4].

L’étude d’une telle modélisation, prenant en compte les composants individuels, leurs interactions et différentes mesures de leur activité est susceptible de révéler plus précisément des sous-parties de réseaux particulièrement actives mais aussi de mieux comprendre les processus à l’œuvre à l’échelle du système biologique.

La méthode développée sera évaluée sur des jeux de données artificiels et publics. Elle sera ensuite appliquée aux données générées par les expérimentations biologiques menées dans le cadre du projet et validées en « wet lab ». La méthode sera diffusée en Open Source à la communauté.

 

Références

1. Corrêa, L., Pallez, D., Tichit, L., Soriani, O., & Pasquier, C. (2019, December). Population-based meta-heuristic for active modules identification. In Proceedings of the Tenth International Conference on Computational Systems-Biology and Bioinformatics (pp. 1-8).

2. Pasquier, C., Guerlais, V., Pallez, D., Rapetti-Mauss, R., & Soriani, O. (2021). Identification of active modules in interaction networks using node2vec network embedding. BioRxiv. doi:10.1101/2021.09.22.461345.

3. Mitra, S., Saha, S., & Hasanuzzaman, M. (2020). Multi-view clustering for multi-omics data using unified embedding. Scientific reports, 10(1), 1-16.

4. Ata, S. K., Fang, Y., Wu, M., Shi, J., Kwoh, C. K., & Li, X. (2021). Multi-view collaborative network embedding. ACM Transactions on Knowledge Discovery from Data (TKDD), 15(3), 1-18.

 

Candidature

Procédure : Envoyer un mail à claude.pasquier@univ-cotedazur.fr

Date limite : None

Contacts

Claude Pasquier

 clNOSPAMaude.pasquier@univ-cotedazur.fr

Offre publiée le 12 septembre 2022, affichage jusqu'au 8 novembre 2022