M2 - Développement de méthodes pour l'analyse d'éléments transposables dans les données Single Cell de cancers

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

146, rue Léo Saignat
33076 Bordeaux
France

Contacts
Domitille Chalopin
Macha Nikolski
Email du/des contacts
domitille.chalopin-fillot@u-bordeaux.fr
macha.nikolski@u-bordeaux.fr
Description

Mise en place d’une méthode bioinformatique pour l’analyse des éléments transposables dans les données single cell RNAseq du cancer du foie

Avec plus de 800,000 morts par an, le cancer du foie est le second plus mortel, et un des cinq cancers les plus répandus au monde. Parmis les différents sous-types de cancer du foie, le carcinome hépatocellulaire (CHC ou HCC) est le plus fréquent avec 80-90 % des cas. La malignité survient majoritairement dans le cadre d’une maladie inflammatoire chronique du foie, telle que la cirrhose, et est généralement associée à un (ou plusieurs) des trois facteurs de risque (étiologie) suivants : une infection virale (HBV ou HCV), une surconsommation d’alcool ou un syndrome métabolique (obésité et diabète) (Sia et al. 2017). Le laboratoire ImmunoConcept s’intéresse en particulier au rôle des différentes populations de cellules immunitaires dans ces 3 étiologies du CHC et a généré des données single-cell RNAseq à partir de biopsies de patients pour étudier cette question.
Les éléments transposables (ETs), composants majoritaires du génome humain, sont des éléments génétiques mobiles capables de bouger et de se multiplier dans les génomes par transposition, générant ainsi des mutations. Maintenus en condition normale par un contrôle épigénétique et post-transcriptionnel rigoureux, ils sont principalement transcriptionnellement inactifs. En condition tumorale, il a été montré que la réactivation bien établie des ETs induit la production de certaines protéines rétrovirales (c’est le cas pour les éléments HERV, des rétrovirus endogènes) pouvant produire de nouveaux antigènes et activant les systèmes immunitaires adaptif ou inné (Grandi and Tramontano 2018 ; Smith et al. 2018). 

Au niveau moléculaire, une des caractéristiques de nombreux cancers, outre l’expression anarchique d’une partie des gènes, est la diminution de la méthylation de l’ADN, régulation épigénétique fondamentale au maintien de l’expression des gènes dans les cellules. Une nouvelle caractéristique liée à cette diminution de méthylation a été récemment observée et concerne la réactivation des éléments transposables (ETs). 
L’objectif principal du stage est d’identifier des ETs pouvant être de potentiels nouveaux biomarqueurs (molécule, substance ou processus indiquant la présence d’un cancer chez un individu) caractéristiques de chacune des trois étiologies du CHC (virale / alcool / syndrome métabolique). Ceci nécessitera la mise en place d’une méthode bioinformatique d’analyse de données single-cell RNAseq dédiée aux éléments transposables.

Principaux objectifs :
1- La première étape consiste en l’analyse de données publiques RNAseq bulk. L’étudiant devra en premier lieu se familiariser avec la banque de données mondiale en cancérologie, TCGA (The Cancer Genome Atlas) afin d’en extraire les données transcriptomiques RNAseq de tissus CHC. L’objectif sera d’analyser à la fois l’expression des gènes codants et l’expression des ETs. Nous suivrons la méthodologie proposée dans Kong et al. 2019. 
2- La deuxième étape est l’analyse de nouvelles données single-cell RNAseq obtenues pour les différentes étiologies par le laboratoire ImmunoConcept et la mise en place d’une méthode bioinformatique pour l’analyse des ETs dans les données single-cell RNAseq. Les propriétés liés aux ETs (très forte abondance et copies dégénérées) ainsi que les propriétés techniques inhérentes au séquençage Single Cell (séquençage de petits fragments, “dropouts”) rendent la détection et la quantification de ces séquences dans les données scRNAseq difficile. A ce jour, seule une méthode, scTE (He et al. 2020) a été développée. Il sera nécessaire de la tester sur nos jeux de données et de l’adapter si besoin.
3- Une analyse dite intégrée, regroupant à la fois le “bulk” RNAseq (pouvant être considéré comme support de référence dans notre cas) et le scRNAseq, permettra de croiser les résultats obtenus dans les deux premières parties. L’intégration permet l’utilisation simultanée de données provenant de différentes technologies, en palliant aux effets techniques de chacune. Afin d’être reproductible et de pouvoir faire des analyses à plus grande échelle, l’automatisation de cette étape d’intégration appliquée notamment aux ETs sous forme d’un pipeline sera nécessaire.
Ainsi, en plus de l’objectif biologique d’identification de nouveaux biomarqueurs des différentes étiologies du CHC, un des objectifs bioinformatique de ce stage est le développement une méthode d’automatisation de projection et d’intégration de données hétérogènes appliquée aux ETs.

Le stage se déroulera au Centre de Bioinformatique de Bordeaux (CBiB, CGFB) sous l’encadrement de Domitille Chalopin et Macha Nikolski. Un support biologique sera également apporté avec l’équipe de Maya Saleh au laboratoire ImmunoConcept.

Contacts : Domitille Chalopin (domitille.chalopin-Fillot@u-bordeaux.fr), Macha Nikolski (macha.nikolski@u-bordeaux.fr) et Maya Saleh (msaleh@immuconcept.org)

REFERENCES
Grandi and Tramontano 2018 (https://pubmed.ncbi.nlm.nih.gov/30250470/)
He et al. (https://www.biorxiv.org/content/10.1101/2020.07.23.218800v1)
Kong et al. 2019 (https://pubmed.ncbi.nlm.nih.gov/31745090/)
Sia et al. 2017 (https://pubmed.ncbi.nlm.nih.gov/28624577/)
Smith et al. 2018 (https://pubmed.ncbi.nlm.nih.gov/30137025/)

Equipe adhérente personne morale SFBI
Equipe Non adhérente