Evaluation et développement de méthodes d'analyse d'enrichissement multi-omiques

 Stage · Stage M2  · 6 mois    Bac+4   CEA/CNRGH · Evry (France)

Mots-Clés

Génomique Bioinformatique Mathématique Enrichissement Intégration

Description

Contexte

Le Centre National de Recherche en Génomique Humaine (CNRGH) du Commissariat à l'Energie Atomique (CEA), localisé au sein de la Genopole d'Evry, a comme objectif principal de faire avancer la recherche en génétique des maladies humaines.

A cette fin, le CNRGH a développé des laboratoires et des plateformes technologiques de pointe en génomique. Les technologies disponibles au CNRGH vont de plateformes de génotypage à haut débit complètement intégrées à des plateformes de séquençage nouvelle-génération. Les activités incluent des études d'association génome entier, d'expression pan-génomiques, épigénétiques, de génomique fonctionnelle et de séquençage génome entier.

Au sein du Laboratoire de Bio-informatique et d’Informatique du CNRGH/CEA, nous recherchons un étudiant, actuellement en Master 2, pour effectuer un stage de recherche d’environ 5∼6 mois. Le stage, dont le détail est décrit ci-dessous, se déroulera dans un contexte dédié aux développements de solutions d’analyse associé aux données génomiques issues de grandes cohortes.


Sujet

Les progrès récents des technologies expérimentales à haut débit ont élargi la quantité de données génomique en biologie. De larges volumes de données issues de contextes expérimentaux hétérogènes et complémentaires sont aujourd’hui publiquement accessibles pour accélérer les découvertes scientifiques.

Une partie de l’interprétation de ces données s’appuie sur l’exploitation de réseaux biologiques par une analyse d’enrichissement. Dans la littérature, de nombreux systèmes ont été conçu pour apporter un support aux biologistes en capturant des interactions complexes ou inférant de nouveaux réseaux.

Ces systèmes sont souvent basés sur des approches probabilistes classiques [1,2] ou apprentissage profond [3,..,7]. Nous proposons dans le cadre de ce stage d’explorer ces différentes approches autour du calcul d'enrichissement la détermination de réseau d'intéraction sur les données issues des grands projets de séquençage (ex: TCGA , UKbiobank).


Les missions:

L’étudiant devra :

• Réaliser un état de l’art sur les techniques d’analyse d’enrichissement

• Réaliser une étude expérimentale de quelques systèmes existants avec des jeux de données réels issues des bases de données publiques (TCGA)

• Evaluation d’une sélection de méthodes en vue de proposer un pipeline d’analyse d’enrichissement sur les données issues des grands projets de séquençages

Prérequis:

- Connaissances en sciences des données, bio-informatique, génomique, - Solides compétences en développement en Python et/ou R


Références

[1] PACZKOWSKA, Marta, BARENBOIM, Jonathan, SINTUPISUT, Nardnisa, et al. Integrative pathway enrichment analysis of multivariate omics data. Nature communications, 2020, vol. 11, no 1, p. 1-16.

[2] REIMAND, Jüri, ISSERLIN, Ruth, VOISIN, Veronique, et al. Pathway enrichment analysis and visualization of omics data using g: Profiler, GSEA, Cytoscape and EnrichmentMap. Nature protocols, 2019, vol. 14, no 2, p. 482-517.

[3] MUZIO, Giulia, O’BRAY, Leslie, et BORGWARDT, Karsten. Biological network analysis with deep learning. Briefings in Bioinformatics, 2020.

[4] SCARSELLI, Franco, GORI, Marco, TSOI, Ah Chung, et al. The graph neural network model. IEEE Transactions on Neural Networks, 2008, vol. 20, no 1, p. 61-80.

[5] XU, Keyulu, HU, Weihua, LESKOVEC, Jure, et al. How powerful are graph neural networks? arXiv preprint arXiv:1810.00826, 2018.

[6] ZHOU, Jie, CUI, Ganqu, ZHANG, Zhengyan, et al. Graph neural networks: A review of methods and applications. arXiv preprint arXiv:1812.08434, 2018.

[7] TIXIER, Antoine J.-P., NIKOLENTZOS, Giannis, MELADIANOS, Polykarpos, et al. Graph classification with 2d convolutional neural networks. In : International Conference on Artificial Neural Networks. Springer, Cham, 2019. p. 578-593.

[8] White MJ, Yaspan BL, Veatch OJ, Goddard P, Risse-Adams OS, Contreras MG. Strategies for Pathway Analysis Using GWAS and WGS Data. Curr Protoc Hum Genet. 2019;100(1):e79. doi:10.1002/cphg.79

[9] Zhu, X., Stephens, M. Large-scale genome-wide enrichment analyses identify new trait-associated genes and pathways across 31 human phenotypes. Nat Commun 9, 4361 (2018). https://doi.org/10.1038/s41467-018-06805-x

Candidature

Procédure : Candidature par mail avec CV

Date limite : None

Contacts

Mallek Mziou

 maNOSPAMllek.mziou@cnrgh.fr

Offre publiée le 26 novembre 2021, affichage jusqu'au 15 janvier 2022