Intégration de données scRNA-seq pour la construction d’un atlas d’organoïdes rénaux

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Laboratoire des Maladies Rénales Héréditaires et Hub de Bioinformatique, Institut Imagine · Paris 15 (France)

 Date de prise de poste : Jan. 1, 2026

Mots-Clés

Transcriptomique scRNA-seq Atlas Organoïdes Maladies rares

Description

Contexte
Les organoïdes rénaux sont des structures tridimensionnelles dérivées de cellules souches pluripotentes humaines (hIPSC ou hESC), cultivées in vitro pour reproduire les principales caractéristiques morphologiques et transcriptionnelles du rein en développement. Ils représentent des modèles expérimentaux puissants pour étudier les processus de néphrogenèse, modéliser des pathologies rénales génétiques ou acquises, et tester des approches thérapeutiques dans un contexte patient-spécifique.
La transcriptomique à cellule unique (single-cell RNA sequencing, scRNA-seq) permet de capturer l’hétérogénéité cellulaire de ces organoïdes en mesurant l’expression génique à l’échelle individuelle. Cette approche ouvre la voie à une caractérisation fine des types cellulaires présents, de leurs trajectoires de différenciation, et des réponses spécifiques à des altérations génétiques ou conditions expérimentales. De nombreuses données scRNA-seq d’organoïdes rénaux existent dans la littérature, mais elles sont dispersées, produites avec des protocoles variables, et difficilement comparables entre elles. Le développement d’un atlas intégré des organoïdes rénaux permettra de rassembler ces données hétérogènes dans un cadre commun, afin :
• d’établir une carte de référence des types cellulaires retrouvés dans les protocoles d’organoïdes existants,
• de comparer la composition et la maturité des organoïdes générés par différents laboratoires,
• de mieux positionner les modèles in vitro par rapport au rein fœtal ou adulte humain,
• de faciliter l’interprétation des données issues de modèles pathologiques ou de cribles pharmacologiques.
Ce projet s’inscrit dans le cadre des recherches menées au Laboratoire des Maladies Rénales Héréditaires (Sophie Saunier et Corinne Antignac) à l’Institut Imagine, qui étudie les mécanismes génétiques et développementaux impliqués dans les maladies rénales pédiatriques. Le stage sera réalisé en étroite collaboration avec le Hub de Bioinformatique de l’Institut Imagine (Multi-Omics Analytics), qui apportera son expertise méthodologique et technique pour la mise en œuvre des pipelines de traitement, l’intégration multi-échantillons et le développement d’outils de visualisation.
Ce travail contribuera à structurer et valoriser les données transcriptomiques générées par le laboratoire, en les intégrant avec des ressources publiques existantes afin de produire un atlas de référence ouvert et utile à la communauté scientifique.

Le projet comportera trois volets principaux :
1. Data mining / collecte de données : identification et récupération de jeux de données scRNA-seq publics pertinents sur les organoïdes rénaux (GEO, ArrayExpress, HCA, etc.), accompagnées de l’extraction et de l’harmonisation des métadonnées associées. Les données seront nettoyées, formatées et intégrées dans l’environnement d’analyse interne.
2. Analyse individuelle des jeux de données : traitement des jeux de données publics et des données générées in-house à l’aide d’un pipeline unique de référence mis en place par la plateforme de bioinformatique de l’Institut. Ce pipeline comprend les étapes standards de contrôle qualité, de normalisation, de réduction de dimensionnalité, et d’annotation cellulaire préliminaire.
3. Intégration multi-échantillons / multi-sources : application de méthodes d’intégration (ex. Seurat RPCA, Harmony, scVI, LIGER) pour corriger les effets de batch et générer un atlas global et cohérent. La qualité de l’intégration sera évaluée quantitativement à l’aide de métriques telles que le silhouette score, kBET, LISI, et ARI. Une annotation cellulaire fine sera réalisée sur les données intégrées.

Le·la stagiaire travaillera en étroite collaboration avec des biologistes pour valider l’annotation cellulaire et participera à la visualisation des résultats. En effet, le développement d’un outil interactif de consultation de l’atlas (type Shiny app, CellxGene, ou Streamlit) permettant l’exploration dynamique des données (types cellulaires, marqueurs, clusters, échantillons) est envisagé si la durée du stage le permet. L’objectif est de fournir une interface accessible aux biologistes pour explorer les résultats sans expertise en programmation. Une attention particulière sera portée à la standardisation des routines d’intégration de données et à la documentation du code.

Compétences recherchées :
- Formation en bioinformatique, biostatistique ou similaire (M2 ou école d’ingénieur)
- Maîtrise de R et/ou Python
- Intérêt pour le traitement de données complexes et l’intégration multi-sources
- Connaissances en analyse de données de transcriptomique par une première expérience (stage, projet) seraient un plus
- La connaissance de Git, d’un environnement Linux et/ou du développement Shiny/Streamlit est un plus

Candidature

Procédure : Envoyer un CV + une courte lettre de motivation (objet : Stage M2 scRNA Kidney Atlas) à : Hassan SAEI (hassan.saei@inserm.fr) et Emilia PUIG LOMBARDI (me.puig-lombardi@institutimagine.org)

Contacts

 Emilia Puig Lombardi
 meNOSPAM.puig-lombardi@institutimagine.org

 Hassan SAEI
 haNOSPAMssan.saei@inserm.fr

Offre publiée le Aug. 4, 2025, affichage jusqu'au Oct. 31, 2025