Stage M2: Signatures transcriptomiques pour le diagnostic des maladies rares musculaires

 CDD · Stage M2  · 6 mois    Bac+5 / Master   Institut Marseille Medical Genetics (MMG, UMR1251), Aix-Marseille Université · Marseille (France)

 Date de prise de poste : 2 février 2026

Mots-Clés

Transcriptomique RNA-Seq Maladies musculaires Biomarqueurs Machine Learning

Description

Offre de Stage Master 2 « IA et Maladies Rares »
Institut Marseille Medical Genetics (MMG, UMR1251)
Durée : 6 mois
Financement : Bourse de Master 2 Innovation en IA & e-Santé pour les Maladies Rares – Fondation Maladies Rares
Encadrants : Dr Svetlana Gorokhova & Dr Anaïs Baudot

Signatures transcriptomiques pour le diagnostic des maladies rares musculaires

Les analyses génétiques par séquençage de l’ADN (panel de gènes, exome ou génome) souvent ne retrouvent pas de variants pathogènes chez des patients atteints des maladies musculaires rares. Dans ces cas, le séquençage de l’ARN (RNA-Seq) peut être utile car il permet d’obtenir une vue fonctionnelle du génome et détecter les conséquences des variants génétiques non-identifiés par les analyses génétiques initiales. En effet, des variants pathogènes peuvent entraîner des anomalies dans l’expression ou l’épissage des gènes, définissant ainsi des signatures transcriptomiques spécifiques. Des anomalies globales de transcriptomes ont été déjà décrites pour certaines maladies musculaires, telles que dystrophie myotonique de type 1 (DM1) ou la dystrophie facioscapulohumérale (FSHD). Notre hypothèse est qu’il existe des signatures transcriptomiques spécifiques à d’autres maladies musculaires ainsi que des signatures spécifiques à des sous-groupes de maladies. L’objectif de notre étude est d’analyser les données transcriptomiques de patients pour identifier des signatures transcriptomiques qui permettront 1) de mieux comprendre les différences de processus physiopathologiques entre les différentes maladies musculaires, et 2) d’orienter la recherche des variants génétiques chez les patients non diagnostiqués.
Pour identifier ces signatures transcriptomiques, nous allons utiliser des données de séquençage d’ARN (RNA-Seq) provenant de biopsies musculaires de 50 patients, analysés dans le cadre d’une étude clinique menée à l’APHM. Ces données seront complétées par d’autres données RNA-Seq collectées au sein du consortium GREGOR et du projet GTEx, issues de 150 patients et de 800 contrôles. Différentes mesures peuvent être obtenues à partir des données RNA-seq : expression globale des gènes, expression par exons, profils d’épissage, et déséquilibres alléliques. Le/la stagiaire financé(e) par ce projet testera les différentes approches de Machine Learning, basées sur l’intégration conjointe des données, en s’appuyant sur des méthodes linéaires (par exemple, la factorisation de matrices), non linéaires (par exemple, les autoencodeurs) et/ou sur l’ingénierie des caractéristiques (par exemple, des approches basées sur les réseaux). De plus, il/elle testera différentes stratégies de sélection des données d’entrée, notamment en ciblant les gènes fortement exprimés dans le tissu musculaire ou les gènes impliqués dans des pathologies musculaires. Ces stratégies intégratives ont pour objectif d’identifier des signatures transcriptomiques pouvant être utilisées comme biomarqueurs pour le diagnostic et le suivi des patients. Les signatures obtenues seront également utilisées pour mieux comprendre les processus pathologiques responsables de maladies musculaires.

Encadrement :
Le/la stagiaire sera co-encadré(e) par Dr Svetlana Gorokhova et Dr Anaïs Baudot. Dr Gorokhova va établir l’accès aux données transcriptomique et métadonnées nécessaires pour le projet, guider l’étudiant(e) dans la préparation et analyse de données, ainsi qu’assurer l’interprétation biologique des résultats. Dr Baudot participera à l’encadrement de l’étudiant(e) sur le versant Machine Learning, en supervisant le développement et application des algorithmes. Le/stagiaire aura également une possibilité d’avoir une aide technologique par un ingénieur spécialiste en IA dans le cadre de soutien aux projets par l’institut LAENNEC.

Candidature

Procédure : Pour candidater, envoyez un e-mail à Svetlana Gorokhova (svetlana.gorokhova@univ-amu.fr) en joignant votre CV et une lettre de motivation.

Date limite : 15 décembre 2025

Offre publiée le 25 novembre 2025, affichage jusqu'au 15 décembre 2025