Mots-Clés
single cell RNAseq
clustering
éléments transposables
expression différentielle
Description
98 % des génomes des mammifères sont constitués de régions non codantes, dont près de 50 % sont composées d’éléments transposables (ET), tels que les rétrovirus endogènes (ERV) et les répétitions intercalées longues et courtes (LINE et SINE). Au cours de l’évolution, les ET se sont propagés dans les génomes des cellules germinales ancestrales à travers les taxons, se répliquant et s’insérant dans de nouveaux loci génomiques. Bien que des mutations aient rendu la plupart des ET immobiles, ils ont contribué à l’innovation génomique et à la régulation de l’expression des gènes, mais ont également posé des risques d’instabilité structurelle pour les cellules hôtes. Pour éviter cela, l’expression des ET est normalement inhibée par des mécanismes épigénétiques tels que la méthylation de l’ADN et les marques répressives des histones. Cependant, le contrôle épigénétique est compromis dans le cancer, ce qui peut entraîner une dérégulation de l’expression des ET.
Cette dérégulation peut, dans certain cas, induire des réponses immunitaires contre la tumeur. Par exemple, certains médicaments épigénétiques peuvent induire la réexpression de rétrovirus endogènes, provoquant des réponses antivirales dans les cellules cancéreuses traitées par « mimétisme viral », ce qui contribue à une immunogénicité accrue contre les cellules tumorales. De plus, les ET se sont révélés être une source de cibles immunologiques, appelées néoantigènes, dans le cancer.
En raison de leur nature répétitive, la quantification de l’expression des ET pose certains défis.
Le séquençage d’ARN unicellulaire (scRNA-Seq) est une avancée technique qui permet d’étudier l’expression génique cellule par cellule. La quantification de l’expression des ET dans les données scRNA-seq permet de quantifier spécifiquement ces éléments dans les cellules tumorales par rapport aux cellules infiltrant la tumeur.
Les objectifs de ce stage seront donc :
- D’établir une revue des outils existants d’analyse de l’expression des ET à partir de données scRNAseq
- De générer un pipeline d’analyse réutilisable pour l’utilisation courante des outils retenus
- D’appliquer ces outils sur des données (déjà générées et pré-caractérisées) de cellules tumorales et non tumorales de moëlle osseuse de patients atteints de lymphome folliculaire. L’enjeu biologique sera de comparer les profils des ET entre les différents compartiments cellulaires (cellules tumorales, cellules saines, microenvironnement) et au sein de ces compartiments au cours d’un traitement.
Des points complémentaires pourront être abordés suivant l’avancement du stage. Notamment, il pourra être question d’étudier les ET dans un autre contexte (données scRNAseq issues de patients atteints de maladie auto immune) ou d’approfondir l’analyse de ce type de données via des approches intégratives en combinant les profils des ET avec les profils d’expression génique.