Exploitation de données de santé/génomique dans un environnement sécurisé par cryptographie

 Autre · Thèse  · 36 mois    Bac+5 / Master   CEA-CNRGH / CEA-List · Evry (France)  Financement CFR / CEA

 Date de prise de poste : 2 octobre 2023

Mots-Clés

Genomique, Données de santé, IA, Cryptographie

Description

Présentation du projet doctoral, contexte et motivations

La sécurité des systèmes et des informations est aujourd’hui une condition limitante pour le développement de la digitalisation et l’utilisation des données comme source d’efficacité opérationnelle dans l’industrie et la recherche. Dans ce contexte, la commission européenne a également édité un règlement sur la protection des données personnelles qui imposent des règles strictes sur l’usage des données personnelles des citoyens Européens (RGPD). Au-delà de la réglementation, l’externalisation de données sensibles (données secrètes et données souveraines) en dehors du site industriel ou hébergeur certifié, pour assurer des traitements ou analyses dans des infrastructures de calcul externe est encore limitée en raison de l’absence de solutions garantissant la confidentialité de ces données.

La génomique se positionne aujourd’hui parmi les disciplines les plus impactée par ses contraintes d’exploitation de l’information. Si le développement de la médecine génomique du futur se trouve aujourd’hui ralenti et limité par ces contraintes, elle s’installe cependant progressivement dans le parcours du soin du patient au travers de nombreuses initiatives proposant des traitements déterminés par les caractéristiques génétiques de ce dernier. Dans ce contexte, les profils génétiques constituent une masse d’information sensible et identifiante nécessitant un cadre réglementaire, des infrastructures et des solutions de protection de la donnée permettant d’assurer un contexte d’exploitation hautement sécurisé.

La cryptographie est aujourd’hui un des axes envisagés pour la protection des données de santé dans le cadre de leur traitement et exploitation. La cryptographie homomorphe permet notamment d’effectuer des opérations dans le domaine chiffré offrant une protection globale de la chaine de traitement. Le CEA/LIST dispose aujourd’hui d’une expertise et des solutions sécurisées adaptées aux traitements avancés sur les données et leur interprétation que nous souhaitons appliquer aux données de santé. Les développements actuels du LIST permettent notamment d’envisager l’installation de modèles d'apprentissage fédéré protégés par cryptographie qui seront développés et optimisés au travers de ce projet

Parmi les secteurs applicatifs les plus développés en santé/génomique dans un contexte d’application clinique, le séquençage de tumeur permet aujourd’hui d’accompagner la caractérisation et classification fine des pathologies tumorales afin d’orienter les traitements et disposer d’un suivi longitudinal de l’évolution de la tumeur et de leur implication sur le pronostic vital du patient. Grâce aux travaux de plusieurs consortiums (TCGA, PCAWG), nous disposons de bases données agrégeant des données multi-omiques regroupant plusieurs types de Cancer largement étudiés que nous proposons d’utiliser pour le développement collaboratif d’un cas d’usage dans une démarche d’apprentissage fédéré dédié à la caractérisation des tumeurs au sein d’un environnement sécurisé par chiffrage homomorphe.  Ce cas d’usage pourra intégrer des données patients simulées, des profils génétiques, des profils d’expression, des profils de méthylation ainsi que les métadonnées associées à plusieurs familles de cancer. A partir de ces données, une sélection de modèles prédictifs dédiée à la caractérisation génomique d’une tumeur et à l’orientation du parcours de soin seront déployés au sein de l’environnement sécurisé.

Profil et compétences recherchés : Le candidat devra être titulaire d'un Master ou équivalent en Mathématique/Informatique associée à des compétences en Science des données ou Machine Learning. Des connaissances complémentaires en cyber-sécurité seraient appréciées. Le candidat devra faire preuve d'intérêt pour la recherche appliquée avec des capacités à travailler en mode collaboratif. Anglais courant.

Candidature

Procédure : CV et lettre de motivations

Date limite : 12 décembre 2023

Contacts

Vincent MEYER

 biNOSPAMoinfo.vacancies@cng.fr

Offre publiée le 14 mars 2023, affichage jusqu'au 12 décembre 2023