Mots-Clés
bioinformatique
NGS
multi-omics
transcriptome
methylome
workflow
visualisation
Description
Contexte :
Les malformations cardiaques congénitales (MCC) sont les anomalies congénitales les plus fréquentes, représentant un véritable défi en médecine fœtale. Leur origine peut être génétique, épigénétique, environnementale ou multifactorielle. Depuis 2023, l’exploration de ces anomalies en anténatal s’enrichit de techniques de séquençage à haut débit, notamment le séquençage de l’exome, le RNAseq et le MethylSeq.
Le projet vise à tirer parti de l’approche multi-OMICS sur du liquide amniotique pour explorer les mécanismes moléculaires impliqués dans la survenue des MCC complexes non syndromiques. Cette stratégie génère une grande diversité de données - ADN, ARN et méthylation - qui seront intégrées de manière systématique grâce à des méthodes bioinformatiques avancées.
Objectifs du stage :
L’objectif principal est de caractériser des signatures moléculaires spécifiques aux MCC via l’analyse combinée de données de séquençage de l’exome (WES), de transcriptomique (RNAseq) et d’épigénomique (MethylSeq).
Le/la stagiaire participera activement à :
• L’analyse du transcriptome fœtal (ARNm) à partir du liquide amniotique.
• L’analyse du méthylome via nanopore (profil global de méthylation).
• L’intégration bioinformatique des données multi-OMICS pour identifier des voies de signalisation altérées, des biomarqueurs potentiels et des mécanismes étiologiques impliqués dans les MCC.
Le cœur du travail portera sur le traitement, l’analyse et l’interprétation de données de séquençage haut débit :
1. Traitement primaire des données NGS
• Exome : Pipeline WES en trio (parents-fœtus), alignement (BWA), détection de variants (GATK), annotation (SnpEff/SnpSift). [Pipeline existant]
• RNAseq : Prétraitement (FastQC, trimming), alignement (STAR), quantification des transcrits (Salmon/featureCounts), analyse différentielle (DESeq2). [Pipeline à compléter]
• MethylSeq : Basecalling, mapping (Minimap2), appel de méthylation (Nanopolish ou Megalodon). [Pipeline à développer]
2. Analyse intégrative multi-OMICS
• Corrélation des gènes différentiellement exprimés et différentiellement méthylés.
• Recherche de voies de signalisation impactées (enrichissement fonctionnel via EnrichR, g:Profiler, DAVID, etc.).
• Analyse de co-expression / régulation croisée (réseaux de gènes, clustering, intégration multi-omics via MOFA, mixOmics ou autres approches basées sur l’apprentissage automatique).
• Développement d’outils de visualisation pour faciliter l’exploration interactive des résultats (R Shiny, Jupyter, etc.).
3. Enjeux scientifiques et médicaux
Les résultats de cette étude pourront :
• Contribuer à une meilleure compréhension des mécanismes précoces de la cardiogenèse.
• Identifier de nouveaux biomarqueurs pour affiner le diagnostic prénatal.
Profil recherché :
• Étudiant(e) en Master 2 Bioinformatique, Data Science ou Biostatistique.
• Compétences en analyse de données NGS, traitement RNAseq / WES / MethylSeq.
• Bonne maîtrise d’un langage de programmation (R, Python, bash).
• Connaissances en génétique humaine ou épigénétique appréciées.
Environnement de travail :
Le stage se déroulera au sein d’un groupe pluridisciplinaire composé de cliniciens, biologistes, bioinformaticiens et ingénieurs en génomique. Accès à une infrastructure de calcul haute performance et à des jeux de données originaux.
REFERENCES
1. Mone F, Eberhardt RY, Morris RK, Hurles ME, McMullan DJ, Maher ER, Lord J, Chitty LS, Giordano JL, Wapner RJ, Kilby MD; the CODE Study Collaborators. COngenital heart disease and the Diagnostic yield with Exome sequencing (CODE) study: prospective cohort study and systematic review. Ultrasound Obstet Gynecol. 2021;57(1):43-51.
2. Reuter MS, Chaturvedi RR, Liston E, Manshaei R, Aul RB M, Bowdin S, Cohn I, Curtis M, Dhir P, Hayeems RZ, Hosseini SM, Khan R, Ly LG, Marshall CR, Mertens L, Okello JBA, Pereira SL, Raajkumar A, Seed M, Thiruvahindrapuram B, Scherer SW, Kim RH, Jobling RK. The Cardiac Genome Clinic: implementing genome sequencing in pediatric heart disease. Genet Med. 2020;22(6):1015-1024.
3. Radhakrishna U, Albayrak S, Zafra R, Baraa A, Vishweswaraiah S, Veerappa AM, Mahishi D, Saiyed N, Mishra NK, Guda C, Ali-Fehmi R, Bahado-Singh RO. Placental epigenetics for evaluation of fetal congenital heart defects: Ventricular Septal Defect (VSD). PLoS One. 2019;14(3):e0200229.
4. Jiao Y, Widschwendter M, Teschendorff AE. A systems-level integrative framework for genome-wide DNA methylation and gene expression data identifies differential gene expression modules under epigenetic control. Bioinformatics. 2014;30(16):2360-2366.
5. Subramanian I, Verma S, Kumar S, Jere A, Anamika K. Multi-omics Data Integration, Interpretation, and Its Application. Bioinform Biol Insights. 2020;14:1177932219899051.