Revenir à la liste des offres d'emplois Stage M1 sur 2 ans en alternance NGS et Deep Learning Apprentissage · Stage M1 · 24 mois Bac+4 Unité de Bioinformatique Clinique, Pôle de Médecine Diagnostique et Théranostique, Institut Curie · Paris 05 (France) Date de prise de poste : 1 septembre 2025 Mots-Clés NGS deepLearning pipeline aprentissage python Description L’Institut Curie, premier centre français de recherche et de lutte contre le cancer, associe un centre de recherche de renommée internationale et un ensemble hospitalier de pointe qui prend en charge tous les cancers y compris les plus rares. Fondé en 1909 par Marie Curie, l’Institut Curie rassemble sur 3 sites (Paris, Saint-Cloud et Orsay) 3 500 chercheurs, médecins et soignants autour de ses 3 missions : soins, recherche et enseignement. Description de la mission Principales activités : Afin de renforcer la qualité de la prise en charge des patients de l’Institut Curie, nous sommes à la recherche d’un(e) apprenti(e) sur 2 ans en alternance de BioInformatique M1 pour : Contribuer aux activités principales de la Bioinformatique Clinique, notamment : Evolution / optimisation de pipelines d’analyses utilisés au sein du Pôle de Médecine Diagnostique et Théranostique (génétique, immunologie clinique, pathologie notamment) Contribuer au développement d’outils originaux permettant l’amélioration de la prise en charge des patients notamment le développement d’outils basés sur le Deep Learning comme décrit ci-après Participer aux réunions biologistes avec les différentes équipes Faire de la veille technologique Implémenter des modèles de Deep Learning afin de pouvoir : représenter les résultats de différentes analyses couramment produites (variations, CNVs, méthylation, lames d’anatomopathologie, etc.) en diagnostic dans un espace latent pertinent (via des autoencodeurs variationnels, des transformers, des foundation models si disponibles et autres méthodes pertinentes) Utiliser ces différentes représentations pour faire de la classification (statut HRD, MSI, groupe tumoral, sous-groupes moléculaires notamment) afin de proposer un outil pouvant potentiellement améliorer la prise en charge des patients. Cette classification pourra se faire en partant d’un seul type de données et en combinaison afin de pouvoir apprécier l’apport de chaque type de données. Profil Compétences requises : Maîtriser l’environnement linux Maîtriser au moins l’un des langages de programmation suivants (idéalement avoir de l’expérience sur plusieurs d’entre eux) : python, java, R ou autre langage orienté objet Bonnes connaissances des outils standards de bioinformatique pour l’analyse et l’interprétation des données de séquençage haut-débit Avoir un attrait pour les interactions avec les biologistes Rigueur, dynamisme, capacité à travailler en autonomie Excellent esprit d’équipe Compétences souhaitées : Bonnes connaissances en algorithmique Versionnage du code avec GIT Maîtrise de l’anglais technique et scientifique à l’oral et à l’écrit Des compétences dans l’un ou plusieurs domaines suivants seraient un gros plus : utilisation de cluster de calcul (SGE / SLURM / LSF / MOAB, etc.), expérience en calcul distribué, utilisation de GPU, expérience en machine learning / deep learning, utilisation de gestionnaire de workflow type Nextflow / snakemake, classification supervisée et non supervisée, réduction de dimensions, conteneurisation (singularity / docker) Des connaissances en oncologie sont un plus Diplômes / qualifications requis(es) : Suivre un M1 Bioinformatique en alternance (attention la formation doit être certifiée Qualiopi) à la rentrée 2025/2026 Une première expérience en analyses de données NGS est souhaitée Candidature Procédure : Envoyer un mail avec CV + LM à victor.renault@curie.fr Contacts Victor RENAULT viNOSPAMctor.renault@curie.fr Offre publiée le 9 mai 2025, affichage jusqu'au 31 octobre 2025