Mots-Clés
nextflow
linux
bash
interface web
pathologies vasculaires
biologie vasculaire
Description
Contexte général et objectif du stage :
Le bon fonctionnement de nos organes dépend en parti de leur irrigation sanguine, rendue possible grâce à notre réseau vasculaire. Nos artères sont notamment adaptées pour permettre au sang d’atteindre nos organes et ont développé des mécanismes de réponses au forces hémodynamiques générées par le frottement du sang sur la paroi. Les cellules vasculaires sont en effet capables de transformer les stimuli mécaniques en messages chimiques ce qui conduit à une régulation de leurs fonctions et de l’expression de leur genes.
Une perturbation des forces hémodynamiques ou une modification de la capacité des cellules à percevoir ces forces compromettent la santé des artères. Cela se produit en particulier dans les zones de bifurcations qui, par leur conformation, sont le siège de contraintes hémodynamiques perturbées et constituent des zones de susceptibilité à des pathologies artérielles, notamment l’anévrisme intracrânien. Cette pathologie est caractérisée par une dilatation locale d’une artère cérébrale au niveau de sa bifurcation. La rupture de cette dilatation provoque une hémorragie cérébrale qui est mortelle dans 40% des cas.
Aujourd’hui la biologie de ces artères, en particulier lorsque l’anévrisme se forme, est mal connue limitant le développement de traitements pharmacologiques pour cette pathologie.
Parmi nos différents axes de recherche, notre équipe cherche actuellement à créer une base de données interrogeables sur l’expression des gènes et de leur différents transcrits dans les artères cérébrales en condition physiologique et pathologique d’anévrisme intracrânien ainsi que dans des cellules vasculaires exposées à différentes forces hémodynamiques in vitro.
L’objectif du stage sera donc d’analyser les résultats de séquençage ANR et de construire la base de données interrogeables et son interface conviviale.
Déroulé et attendus du stage :
Les échantillons d’ARN issus d’artères cérébrales murines et de cellules vasculaires humaines en culture ont été préalablement séquencés par la méthode de RNA-seq sur station Illumina NovaSeq X Plus. Suite au séquençage, les résultats bruts de RNA-seq sont stockés sous la forme de fichiers FASTQ, pour être analysées en utilisant le pipeline de rnaseq nextflow/nfcore ( https://nf-co.re/rnaseq/3.18.0 ), en modifiant certains modules si cela est nécessaire. Ce pipeline permettra d’obtenir des fichiers d’alignement (BAM/CRAM), des rapports de contrôle qualité ainsi que des données quantitatives d’expression des différents transcrits de chaque gène.
L’exploration et la visualisation des résultats seront implémentées en utilisant ou modifiant une interface préexistante et choisie en fonction des besoins des porteurs du projet: par exemple nf-core differentialabundance ( https://nf-co.re/differentialabundance/1.2.0/ ),
jbrowse2 ( https://jbrowse.org/jb2/ ), getx (https://github.com/broadinstitute/gtex-viz ), etc.... Si toutefois aucune interface ne convient, une nouvelle interface pourra être écrite, soit pour développer un serveur web dynamique (en python,java, RShiny, …) , soit pour générer des pages HTML statiques (par exemple pour visualiser l’expression d’un ARNm dans différents tissues).
Le/la stagiaire mènera ce projet de bio-analyse sous la co-supervision d’une chercheuse en physiologie vasculaire et d’un ingénieur de recherche en bio-informatique. Toutes les analyses seront effectuées sur le cluster de calcul “Glicid” dans un environnement linux (https://www.glicid.fr/acces.html). Une bonne connaissance de bash et du travail en ligne de commande sont nécessaires. La maîtrise d’outils et logiciels tels que R, python, java, HTML, javascript, slurm, snakemake/nextflow, et C/C++ serait appréciée. A l’issue du stage, l’étudiant(e) devra laisser l’ensemble des scripts d’analyse sous la forme d’un “repo” git.
Ce stage ne demande pas de compétence en biologie mais une appétence pour l’application de l’informatique sur des thématiques de santé.
Début flexible février ou Mars, durée 6 mois.