Research Engineer in Deep-Learning AI

 CDI · IR   Bac+8 / Doctorat, Grandes Écoles   CEPH Data Science Lab · Paris 10 (France)  Salaire selon qualification & expérience (à négocier)

 Date de prise de poste : 1 septembre 2026

Mots-Clés

Deep-Learning AI eXplainable AI Foundation Model Population Genetics Human Genetics Aging Multiomics

Description

Description
La Fondation Jean Dausset - CEPH (Centre d’Etude du Polymorphisme Humain) est une fondation à but non lucratif reconnue d’utilité publique située à Paris Xème à pour l’étude du polymorphisme dans le génome humain.
La Fondation a une forte orientation vers les bases génétique de la longévité et du vieillissement, dotée d’une cohorte exceptionnelle de centenaires.
Elle est impliquée dans plusieurs programmes de recherche nationaux et internationaux en génétique et génomique humaines (https://www.fjd-ceph.org/), tels que :

  • MyPEBs (EU-FP9), POPGEN (Plan France Médecine Génomique),
  • MITOCHONGEVITY (France Génomique), l’infrastructure BioCf (Equipex)
  • AGENOMICS (AXA Research Fund).

La Fondation Jean Dausset - CEPH se compose de trois entitées :

  • un Centre de Ressources Biologique (ou Biobanque) certifié ISO 20387 :2018, qui regroupe les cohortes nationales majeures en santé (cohorte COBLANCE, CONSTANCES, ELFE, E3N/E4N, …),
  • un laboratoire de Recherche en Génomique translationnelle utilisant des approches de pointe générant des données multi-omiques,
  • un laboratoire de Bio-informatique doté d’un cluster de calcul pour l’analyse de données haut-débit et d’un serveur IA (GPU A100 80Gb), avec un accès au calculateur haute performance de l’IFB ou du CEA.

La Fondation Jean Dausset – CEPH ambitionne d’être un acteur majeur sur la scène scientifique internationale. Dans ce cadre, le laboratoire de Bio-informatique de la Fondation Jean Dausset - CEPH recrute un.e Ingénieur.e (CDI) expérimenté.e en Intelligence Artificielle (IA) « deep-learning » pour renforcer ses capacités en analyses de données, notamment pour le développement de modèle « deep-learning » tel que des « foundation models » et gLMs afin d’exploiter les dernières avancées en IA et XAI dans l’étude du polymorphisme en lien avec les problématique socioéconomiques et les maladies associées au vieillissement, ainsi que la description des interdépendances au sein du génome et avec l’épigénome et les facteurs environnementaux.

Missions

  • Concevoir, implémenter et entraîner des modèles « deep-learning » pour les analyses bio-informatiques et statistiques des projets de recherche en génétique et génomique humaines de la Fondation.
  • Intégrer des données « multi-omiques » dans une architecture « deep-learning » pour des analyses de comparaison et d’interrelations entre les jeux de données « omiques ».
  • Déployer sur une infrastructure HPC et des servers locaux des modèles « deep-learning » en vue de leur entraînement et de leur exploitation.
  • Conduire des analyses bio-informatiques et statistiques pour les projets de recherche de la Fondation.
  • Travailler en étroite collaboration avec d’autre chercheurs et des cliniciens pour la conception des modèles, à l’interprétation des résultats et à leur présentation devant un auditoire pluridisciplinaire.
  • Supporter l’utilisation de l’IA dans la fondation (Agent conversationnels, Agent MCP, …)
  • Encadrer des étudiants et des stagiaires

Principales activités

  • Conduire le développement de modèles IA « deep-learning » pour les différents projets de recherche de la Fondation, incluant les contrôles qualité sur de données génétiques et multi-omiques ainsi que l’interprétation et la présentation des résultats.
  • Concevoir, implémenter et optimiser des solutions (outils et pipelines) pour l’intégration et l’exploitation des données de diverses modalités (WGS, puces à ADN, TGS, BS-seq, RNA-seq, protéomique, metabolomique, …).
  • Assurer une veille technologique dans le domaine de l’intelligence artificielle (« deep-learning », « machine learning », « eXplainable AI », …).

Formation

  • Titulaire d’un diplôme d’une Ecole d’Ingénieur ou d’une Thèse de Sciences, justifiant d’une formation en IA « deep-learning ».
  • Expérience de 5 ans en IA « deep-learning », de préférence appliquée à la génomique (gLM, foundation models, classification/segmentation/…).
  • Bonnes connaissances des méthodes et outils IA deep-learning (Transformer, CNN, …)
  • Bonnes connaissances en génétique et génomique humaines, et dans l’analyse multi-omique.
  • Des connaissances en mathématiques et en statistiques seraient aussi appréciées

Compétences Requises

  • Forte motivation scientifique et capacité à se projeter dans une petite structure ambitieuse avec une orientation vers l’impact scientifique plutôt que financier.
  • Compréhension des problématiques scientifiques dans le domaine biomédical.
  • Appétence pour le travail en équipe, aisance dans un contexte d’équipes pluridisciplinaires, capacité à collaborer avec d’autres bioinformaticiens et d’autres équipes.
  • Excellent niveau d’anglais et de français (niveau B2), aisance à l’oral (présentations en interne et en conférence internationale) et à l’écrit (rédaction de publications scientifiques, de projets pour des appels à projet).
  • Maîtrise :
    • de modules d’IA « deep-learning » (TensorFlow/PyTorch/Haiku, HuggingFace, …)
    • du génie logiciel et de la bio-informatique
    • de langages de programmation (Bash, Python, R, Rust, Slurm, LSF, …)
    • des outils de traitement de données génomiques (BWA, DESeq2, RMATS, …) et multi-omiques (ScanPy ou Seurat, MOWGLI ou MOFA, …)
    • des outils en analyse génétique (PLINK, MERLIN, …)
    • d’outils d’analyse statistiques
  • Gestion de projet

Candidature

Procédure : Send your Resume and your Motivation Letter to: • Sébastien Lemaire (sebastien.lemaire@fjd-ceph.org), • Jean-François Deleuze (deleuze@cnrgh.fr) et • Annaïg De Pastor (annaig.de-pastor@fjd-ceph.org).

Date limite : 31 mai 2026

Contacts

 Sébastien Lemaire
 seNOSPAMbastien.lemaire@fjd-ceph.org

 Annaïg De Pastor
 anNOSPAMnaig.de-pastor@fjd-ceph.org

Offre publiée le 18 mars 2026, affichage jusqu'au 31 mai 2026