Maintenance

Une opération de maintenance aura lieu sur le site de la SFBI le 31 octobre 2025. Cette opération pourra entraîner une interruption de service.

Ingénieur / Postdoctorant en Deep Learning et Développement IA

 CDD · IR  · 24 mois    Bac+5 / Master   UMMISCO (UMI 209 – IRD / Sorbonne Université) · Paris 13 (France)

Mots-Clés

deep learning intelligence artificielle artificial intelligence ai ECG

Description

Contexte

Les projets ELDORA et DeepECG4U visent à développer une nouvelle génération de modèles d’intelligence artificielle capables de convertir des ECG papier en signaux numériques et de détecter, expliquer et prédire les troubles du rythme ou du remodelage cardiaque à partir de grandes bases cliniques multiformats.
L’ambition du poste est de concevoir, entraîner et optimiser ces modèles dans un cadre de recherche translationnelle IA-santé, en lien étroit avec des équipes de cliniciens, biostatisticiens et ingénieurs IA.

Missions Principales

1. Développement des modèles de standardisation et génération d’ECG

  • Concevoir et entraîner des modèles de deep learning dédiés à la standardisation et à la reconstruction haute fidélité d’ECG issus de sources hétérogènes (papier, PDF, formats propriétaires, signaux bruts).
  • Développer des approches de débruitage, correction de distorsion et harmonisation multi-dispositifs afin d’unifier les signaux ECG pour une exploitation robuste par les modèles d’analyse et de prédiction.
  • Mettre en œuvre des architectures génératives (auto-encoders, diffusion models ou transformers avec apprentissage contextuel – ICL) pour la synthèse, complétion et augmentation réaliste de signaux ECG.
  • Évaluer la fidélité des signaux reconstruits via des métriques cliniques (QRS, QT/QTc, amplitude, morphologie des ondes) et des mesures de similarité temporelle (corrélation, DTW).
  • Optimiser la scalabilité du pipeline pour le traitement massif de bases multi-centriques (millions d’ECG).

2. Développement des modèles de prédiction et interprétation

  • Concevoir et entraîner des modèles multimodaux associant signaux ECG, métadonnées cliniques et contextes thérapeutiques.
  • Mettre en œuvre des approches d’interprétabilité (attention, SHAP, CAM, feature attribution) pour visualiser les patterns prédictifs.
  • Optimiser la scalabilité et la reproductibilité des modèles pour les grands volumes de données (> 2 millions d’ECG).

3. Infrastructure, optimisation et intégration

  • Structurer les pipelines d’entraînement sur environnements HPC / GPU (SLURM, Docker, Kubernetes).
  • Développer des interfaces et outils de visualisation pour le suivi des résultats.

4. Collaboration et valorisation

  • Interagir avec les équipes cliniques et data scientists pour intégrer les modèles dans les workflows de recherche.
  • Participer à la rédaction technique ou scientifique (open-source, publications, rapports de projet).

Profil recherché

Formation et expérience

  • Doctorat ou diplôme d’ingénieur / master en informatique, IA, mathématiques appliquées ou data engineering.
  • Expérience confirmée (≥ 3 ans) en développement et entraînement de modèles deep learning à grande échelle.
  • Intérêt marqué pour les applications en santé numérique et la recherche interdisciplinaire.

Compétences techniques

  • Excellente maîtrise de Python, PyTorch.
  • Solides compétences en vision par ordinateur, traitement du signal et/ou modèles séquentiels.
  • Pratique de la gestion et prétraitement de grands jeux de données (HDF5, Parquet, SQL, etc.).
  • Connaissance de l’écosystème HPC / GPU (CUDA, SLURM, containers, parallel training).
  • Maîtrise des outils de suivi d’expérience (MLflow, W&B), Git, CI/CD.
  • Bonus : expérience en apprentissage multimodal ou modèles de fondation.

Aptitudes personnelles

  • Goût pour le développement rigoureux, la reproductibilité et l’optimisation de code.
  • Autonomie, curiosité, travail en équipe et communication efficace avec profils variés.
  • Esprit de recherche, pragmatisme et sens de la qualité logicielle.

Environnement scientifique

Le poste est hébergé à l’UMMISCO (UMI 209 – IRD / Sorbonne Université), un laboratoire international à l’interface entre intelligence artificielle, modélisation mathématique et santé numérique. Le/la candidat(e) rejoindra une équipe multidisciplinaire basée à la Pitié-Salpêtrière, travaillant en étroite collaboration avec des cliniciens, chercheurs en IA, et bio-informaticiens impliqués dans les projets ELDORA et DeepECG4U. Cet environnement offre un accès privilégié à des ressources HPC (GPU A100/H100), à des bases ECG massives, et à un réseau international de recherche et d’innovation (IRD, INSERM, Vanderbilt University, etc.).

Ce que nous offrons

  • Contrat CDD 2 ans au sein d’un environnement scientifique de haut niveau.
  • Participation à des projets à fort impact médical et sociétal.
  • Encadrement de qualité, interactions cliniques et opportunités de co-publication.
  • Infrastructure de calcul GPU et accès à des datasets ECG multi-sources.
  • Possibilités de contribution open-source et d’évolution vers un rôle senior ou de recherche.

Candidature

  • Envoyer un CV détaillé, une lettre de motivation, des lettres de recommandation et une liste de publications à : edi.prifti@ird.fr et ahmad.fall@ird.fr
  • (Objet : Candidature Ingénieur / Postdoc Deep Learning – ECG/IA)

Candidature

Procédure : Envoyer un CV détaillé, une lettre de motivation, des lettres de recommandation et une liste de publications à : edi.prifti@ird.fr et ahmad.fall@ird.fr (Objet : Candidature Ingénieur / Postdoc Deep Learning – ECG/IA)

Contacts

 Ahmad Fall
 ahNOSPAMmad.fall@ird.fr

 Edi Prifti
 edNOSPAMi.prifti@ird.fr

 https://cloud.ummisco.fr/s/4YwXobkRYeXpS7q

Offre publiée le 29 octobre 2025, affichage jusqu'au 27 décembre 2025