Thèse en bioinformatique et transcriptomique

 CDD · Thèse  · 36 mois    Bac+5 / Master   Groupe de recherche en bioinformatique Scott · Sherbrooke (Canada)  À déterminer

 Date de prise de poste : 1 septembre 2022

Mots-Clés

ARN non-codant transcriptomique apprentissage automatisé génomique comparative

Description

Nous sommes un groupe de recherche en bio-informatique au sein du département de biochimie et génomique fonctionnelle à l'Université de Sherbrooke, dans le sud-est du Québec, une région reconnue pour le plein-air et les activités récréatives. Nous utilisons des approches bio-informatiques, de transcriptomique, de génomique comparative, d'apprentissage automatisé, de biologie moléculaire, de biologie des réseaux et de biologie des systèmes, dans un environnement multi-disciplinaire, pour comprendre le rôle des petits ARN nucléolaires (snoRNA) dans la régulation de l'expression des gènes. Pour ce faire, nous avons élaboré une méthodologie de RNA-seq incluant un pipeline d'analyse bio-informatique approprié pour les ARN très structurés, dupliqués et imbriqués dans d'autres gènes (1-2). Nous caractérisons l'ensemble des 2000 snoRNA annotés chez l'humain et leurs multiples fonctions cellulaires en étudiant leurs patrons d'expression et d'interactions avec des ARN et protéines dans diverses conditions et leur évolution (3-4).

Les snoRNA sont des petits ARN non-codants présents chez tous les eucaryotes et bien caractérisés pour leur rôle dans la biogénèse des ribosomes, grâce à leur capacité de modification chimique séquence-spécifique. Cependant, durant les 2 dernières décennies, de plus en plus d'études ont démontré des fonctions additionnelles pour les snoRNA dont la capacité de réguler l'expression à plusieurs niveaux dont l'épissage alternatif, la polyadénylation alternative et la stabilité des transcrits (5). L'expression des snoRNA est dérégulée dans de nombreuses maladies dont le cancer de l'ovaire que nous étudions particulièrement (6). Malgré l'étendue des fonctionnalités décrites pour les snoRNAs, la majorité des snoRNA sont peu caractérisés et certains sont mêmes manquants des annotations des génomes les mieux annotés (7). Pour augmenter la caractérisation des snoRNA et notre compréhension de leurs rôles cellulaires dans les cellules saines et dans des conditions pathologiques, nous cherchons en parallèle à 1) déterminer l'ensemble des snoRNAs dans différents eucaryotes, 2) identifier leurs cibles et leurs fonctions.

Pour l'identification des snoRNA dans différents eucaryotes, il existe présentement un petit nombre de prédicteurs, mais ceux-ci souffrent de hauts taux de faux positifs et de faux négatifs, Nous prévoyons combiner apprentissage automatisé et données d'expression pour créer des prédicteurs qui performent mieux et sont applicables à tous les eucaryotes. Pour l’identification de leurs cibles, nous avons récemment créé un prédicteur d'apprentissage automatisé pour identifier les cibles des snoRNA de type C/D (8) et nous cherchons à l'améliorer pour permettre son application à tous les eucaryotes. Nous planifions également créer un prédicteur de cibles de snoRNA de type H/ACA.

La thèse portera sur la prédiction des snoRNA et/ou de leurs cibles ARN dans différentes espèces en utilisant des approches d’apprentissage automatisé et d’analyse transcriptomique.

Profil du candidat : Étudiant(e) en bio-informatique, informatique ou dans les sciences biologiques qui connait la programmation en Python et/ou R et qui s’intéresse à l’apprentissage automatisé. Une expérience en analyse de RNA-seq et/ou en génomique comparative est un atout. 

 

La date de début de la thèse est flexible (automne 2022 ou hiver 2023).

 

Site web :

https://bioinfo-scottgroup.med.usherbrooke.ca/

 

Bibliographie

(les noms soulignés sont les étudiants du groupe Scott qui ont mené/participé à ces études)

1- Boivin V, Deschamps-Francoeur G, Couture S, Nottingham RM, Bouchard-Bourelle P, Lambowitz AM, Scott MS, Abou-Elela S (2018) Simultaneous sequencing of coding and noncoding RNA reveals a human transcriptome dominated by a small number of highly expressed noncoding genes, RNA 24(7):950-965.

2- Deschamps-Francoeur G, Boivin V, Abou Elela S, Scott MS (2019) CoCo: RNA-seq read assignment correction for nested genes and multimapped reads, Bioinformatics, 35(23):5039-5047.

3- Fafard-Couture E, Bergeron D, Couture S, Abou Elela S, Scott MS (2021) Annotation of snoRNA abundance across human tissues reveals complex snoRNA-host gene relationships, Genome Biology 22(1):1-24.

4- Bergeron D, Laforest C, Carpentier S, Calvé A, Fafard-Couture F, Deschamps-Francoeur G, Scott MS (2021) Evolutionary mechanisms of snoRNA duplication affect family size, genomic location and abundance regulation, BMC Genomics 22(1):414.

5- Bergeron D, Fafard-Couture É, Scott MS (2020) Small nucleolar RNAs: continuing identification of novel members and increasing diversity of their molecular mechanisms of action, Biochemical Society Transaction, 48(2):645-656.

6- Faucher-Giguère L, Roy A, Deschamps-Francoeur G, Couture S, Nottingham R, Lambowitz AM, Scott MS, Abou Elela S (2022) High-grade Ovarian Cancer Associated H/ACA snoRNAs Promote Cancer Cell Proliferation & Survival, Nucleic Acids Research Cancer, sous presse.

7- Boivin V, Reulet G, Boisvert O, Couture S, Abou Elela S, Scott MS (2020) Reducing the structure bias of RNA-Seq reveals a large number of non-annotated non-coding RNA, Nucleic Acids Research, 48(5):2271-2286.

8- Deschamps-Francoeur G, Couture S, Abou Elela S, Scott MS (2022) The snoGloBe interaction predictor reveals a broad spectrum of C/D snoRNA mRNA targets, Nucleic Acids Research sous presse.

Candidature

Procédure : Envoyer un mail à michelle.scott@usherbrooke.ca

Date limite : 15 juillet 2022

Contacts

Michelle Scott

 miNOSPAMchelle.scott@usherbrooke.ca

Offre publiée le 25 mai 2022, affichage jusqu'au 15 juillet 2022