M2 Bioinformatique

 CDD · Stage M2  · 6 mois    Bac+5 / Master   UMR7267, équipes MDE/EES · Poitiers (France)  570 euros/mois

 Date de prise de poste : 3 janvier 2022

Mots-Clés

RNAseq pipeline l’épissage alternatif graphes de bruijn

Description

Dans  les cellules eucaryotes, l'expression de chaque gène est finement orchestrée par un réseau complexe de processus de régulation affectant les étapes de maturation du transcrit, de la transcription nucléaire à l'exportation cytosolique et à l'utilisation de l'ARNm. Une étape cruciale de ce réseau de régulation est représentée par l'épissage du pré-ARNm, le processus moléculaire qui permet l'élimination des séquences introniques et la réunion des exons. 

Ce qui fait de l'épissage un acteur exceptionnel dans le contrôle de l'expression des gènes est sa flexibilité, qui permet une augmentation remarquable du potentiel de codage du  génome par la sélection alternative d'exons. La mise en évidence d'un épissage alternatif nécessite d'accéder aux transcrits issus d'un même gène. La majorité des pipelines et outils permettant d'étudier l'épissage alternatif, nécessitent la disponibilité de génome de référence de bonne qualité ( Vitting-Seerup et al,2014, Majoros et al,2014, Rashe et al 2014, Alalancos et al 2015, Shi et al, 2015, Sacomoto et al, 2012). C'est dans ce but que nous souhaitons développer un pipeline qui donnera la possibilité d'étudier l'épissage alternatif sans recours au génome de référence en exploitant les graphes de bruijn(Si et all,2017). L'outil sera testé sur un grand jeu de données RNAseq de l'amibe Acanthamoeba castellani pour lequel un génome existe (Clarke et al,2013) avec une complétude à 70%.

L'étudiant aura en charge le développement de ce pipeline(outil). Une étude bibliographique sera réalisée pour faire un état de lieux des outils existants ainsi que leurs benchmarking (Riepe et al, 2021; Hooper 2014, Alamancos et al, 2014; Li et al, 2014). Les avantages et les limitations de ces outils/méthodes seront améliorés dans l'outil qui sera développé.

Références:   

Alamancos, G. P., et al. 2014. Methods to study splicing from high-throughput RNA sequencing data. Methods Mol Biol 1126:357-397.

Alamancos, G. P., et al. 2015. Leveraging transcript quantification for fast computation of alternative splicing profiles. RNA 21 (9):1521-1531

Hooper, J. E. 2014. A survey of software for genome-wide discovery of differential splicing in RNA-Seq data. Hum Genomics 8 (1):3.

Levin, L., et al. 2015. LEMONS - A Tool for the Identification of Splice Junctions in Transcriptomes of Organisms Lacking Reference Genomes. PLoS One 10 (11):e0143329.

Li, H. D., et al. 2014a. The emerging era of genomic data integration for analyzing splice isoform function. Trends Genet 30 (8):340-347.

Rasche, A., et al. 2014. ARH-seq: identification of differential splicing in RNA-seq data. Nucleic Acids Research 42 (14):e110-e110

Sacomoto, G. A., et al. 2012. KISSPLICE: de-novo calling alternative splicing events from RNA-seq data. BMC Bioinformatics 13 Suppl 6 (Suppl 6):S5.

Shi, Y., et al. 2015. rSeqNP: a non-parametric approach for detecting differential expression and splicing from RNA-Seq data. Bioinformatics 31 (13):2222-2224

Si, X., et al. 2017. Survey of gene splicing algorithms based on reads. Bioengineered 8 (6):750-758.

Vitting-Seerup, K., et al. 2014. spliceR: an R package for classification of alternative splicing and prediction of coding potential from RNA-seq data. BMC Bioinformatics 15 (1):81.

Candidature

Procédure : CV + Lettre de motivation à: Bouziane MOUMEN <bouziane.moumen@univ-poitiers.fr> Ascel Samba <ascel.samba@univ-poitiers.fr>

Date limite : 5 décembre 2021

Contacts

Bouziane MOUMEN, Ascel SAMBA

 boNOSPAMuziane.moumen@univ-poitiers.fr

Offre publiée le 19 octobre 2021, affichage jusqu'au 15 décembre 2021