Transcriptomique spatiale : sélection de variables et réduction de dimensions

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Institut Cochin · Paris 14 (France)  taux légal

 Date de prise de poste : Jan. 5, 2026

Mots-Clés

transcriptomique spatiale clustering sélection de variables réduction de dimensions reproductibilité performance

Description

Contexte

L’Institut Cochin est un centre de recherche biomédicale multithématique, réunissant 42 équipes de recherche et 10 plateformes technologiques. L’équipe « From Gametes to Birth » de l’Institut Cochin s’intéresse à la biologie de la reproduction, couvrant la production et la fusion des gamètes, les interactions entre le fœtus et la mère et les conséquences à long terme d’une grossesse.

La technologie 10x Genomics Visium permet la localisation précise de transcrits sur une coupe de tissu biologique. Du point de vue de l’analyse de données, cette technologie de transcriptomique spatiale permettant la quantification de l’expression de gènes à l’échelle du génome complet s’apparente au séquençage en cellule unique (single-cell RNA-seq).

Le clustering, qui consiste à rassembler des localisations de la coupe de tissu ayant des profils transcriptomiques similaires, est l’une des analyses couramment réalisées avec ce type de données. Elle est constituée de plusieurs étapes : normalisation des données brutes, sélection de variables, réduction de dimensions du jeu de données, intégration de données issues de plusieurs échantillons, avant le clustering à proprement parler. Pour chacune d’entre elles, des paramètres peuvent grandement affecter la qualité finale du clustering final.

Les méthodes développées pour l’analyse de données de single-cell RNA-seq ont été initialement appliquées aux données de transcriptomique spatiale. Malgré la profusion récente de méthodes spécialement développées pour tirer profit de l’information spatiale de ces données, les méthodes développées pour l’analyse de données de single-cell RNA-seq restent largement utilisées pour analyser des données de transcriptomique spatiale. De plus, le choix de paramètres pour chacune des étapes menant au clustering est très rarement discuté.

Mission

Au sein de l’équipe « From Gametes to Birth », l’étudiant(e) prendra part au développement d’une méthode visant à atteindre une reproductibilité non arbitraire du clustering de données de transcriptomique spatiale, tout en améliorant la qualité des résultats. Dans cette optique, une attention particulière sera portée aux étapes de sélection de variables et de réduction de dimensions en tirant profit de l’information spatiale des données. L’étudiant(e) aura accès à des jeux de données Visium issus de trois contextes physiopathologiques différents (membranes fœtales lors de l’accouchement et coupes de cerveau dans des contextes de prééclampsie et de méningite bactérienne). De plus, l’étudiant(e) évaluera la performance des différentes approches méthodologiques explorées à l’aide de jeux de données simulées et de jeux de données publiques.

Profil

Etudiant(e) en Master de bioinformatique, biostatistiques ou en école d’ingénieur.

Compétences

  • Connaissances en apprentissage statistique et en analyses de données omiques.
  • Maîtrise du langage de programmation R et autonomie dans l’environnement Unix.
  • Notions de développement logiciel seraient un plus

Début du stage

Le stage pourra commencer entre le 05/01/2026 et le 02/03/2025 en fonction des exigences de la formation de l’étudiant(e).

Candidature

Pour candidater, merci d’envoyer à christophe.le-priol@inserm.fr

  • Un CV (1 page)
  • Une lettre de motivation détaillant les intérêts pour ce stage (1 page)

Candidature

Procédure : Envoyer un mail à christophe.le-priol@inserm.fr

Date limite : Nov. 28, 2025

Contacts

 Christophe Le Priol
 chNOSPAMristophe.le-priol@inserm.fr

Offre publiée le Oct. 6, 2025, affichage jusqu'au Nov. 28, 2025