Stage M2: Automatisation de l’annotation d’images H&E pour pipelines de biologie spatiale

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Plateforme CurieCoreTech - Bioinformatique, Institut Curie · Paris 05 (France)  Gratification légale (soit environ 609 €/mois pour 35h/semaine)

Mots-Clés

analyse d’images annotation digital pathology

Description

Environnement de travail

L’Institut Curie est un acteur majeur dans la recherche et la lutte contre le cancer. Il se compose d’un hôpital et d’un centre de recherche regroupant plus de 1000 employés.

Au sein du centre de recherche, la Plateforme de Bioinformatique est composée d’une vingtaine de bioinformaticiens, biostatisticiens et ingénieurs logiciels, qui offrent une expertise multidisciplinaire et apportent un support aux unités de recherche de Curie, ainsi qu’aux autres plateformes et à l’hôpital, dans leurs activités quotidiennes. Nos compétences portent sur la gestion et l’analyse de données, le développement logiciels et le calcul scientifique (https://curie.fr/plateforme/curiecoretech-bioinformatique-cubic).

La plateforme bénéficie d’un environnement dynamique, étant rattachée à l’unité de recherche U1331 (INSERM – Mines ParisTech – Institut Curie) « Oncologie Computationnelle ». De plus, plusieurs ingénieurs et post-doctorants en bioinformatique sont directement intégrés dans les différentes équipes de recherche, travaillent à l’interface avec la plateforme au sein d’une structure Hub dédiée. Ce Hub bioinformatique offre un environnement favorise le partage entre bioinformaticiens, les bonnes pratiques communes, les formations et les groupes de travail.

Contexte

Le récent développement des techniques de biologie spatiale et des méthodes d’analyse d’image a ouvert de nouvelles perspectives pour l’étude détaillée de l’organisation des tissus biologiques, notamment des tumeurs [1]. Ces méthodes reposent sur l’élaboration d’une coupe d’échantillon, imagée après une coloration de routine H&E. La lame est ensuite analysée pour évaluer l’expression de gènes ou de protéines à une résolution pouvant aller jusqu’à la cellule unique. Les images constituent donc une source de données riche en informations et sont cruciales pour un nombre croissant de projets de recherche.

À l’heure actuelle, l’annotation des échantillons — par exemple pour distinguer zones tumorales, micro-environnement et tissus sains — constitue souvent une étape bloquante, faute de temps et de spécialistes. Plusieurs outils d’analyse d’images H&E, reposant sur des architectures d’IA récentes, ont été développés ces dernières années [2]. L’utilisation de ces outils sur des images H&E, ressource encore peu exploitée dans les pipelines actuels, permettrait de proposer une annotation automatique des lames et de fournir rapidement une première description de leurs échantillons aux équipes de recherche.

Le stagiaire participera à l’évaluation et à l’intégration d’outils d’annotation d’images H&E, en explorant des méthodes récentes et en produisant des visualisations exploitables par les équipes de recherche. 

Objectifs

Le but du stage est de comparer et sélectionner une stratégie d’annotation de lames histologiques (segmentation de noyau, tile embedding…), puis d’intégrer l’outil retenu dans les pipelines de la plateforme. Les principales missions associées au projet incluent : réaliser une revue des outils et méthodes d’annotation d’images H&E existants, définir une stratégie d’analyse et de comparaison des résultats des différents outils, proposer des visualisations et restitutions des annotations, et développer un module d’annotation à intégrer dans nos pipelines actuels. Le stage pourra être adapté selon le profil et l’intérêt du stagiaire: un·e étudiant·e en science des données pourra mettre l’accent sur l’exploration et l’optimisation des modèles.

Profile

Le stage s’adresse à un étudiant en Master de bioinformatique, biostatistiques, science des données (avec un intérêt du candidat pour les sciences médicales) ou tout autre domaine connexe.

Compétences recherchées:
• Maîtrise de l’environnement Linux et d’un langage de script (Python de préférence)
• Familiarité avec les principes du machine learning: clustering, réseaux de neurones…
• Connaissances ou expérience en traitement d’images (atout mais non obligatoire).
• Rigueur et autonomie
• Aptitude à communiquer en anglais.

Candidature

Date limite : 19 décembre 2025

Contacts

 Nicolas Servant
 niNOSPAMcolas.servant@curie.fr

 Rémi Montagne
 reNOSPAMmi.montagne@curie.fr

Offre publiée le 23 octobre 2025, affichage jusqu'au 19 décembre 2025