Il se déroulera au sein de l’équipe HeKA qui est commune à Inria Paris (https://www.inria.fr/fr/centre-inria-de-paris) et au Centre de Recherche des Cordeliers (UMR 1138 commune à l’Inserm et l’Université de Paris, http://www.crc.jussieu.fr/). Ses interactions fortes et uniques avec Inria, Inserm et l'AP-HP font de HeKA un environnement d’excellence de recherche pour le développement de projets en santé numérique, avec un impact réel sur la pratique clinique. Les membres d'HeKA s’intéressent à la valorisation de grands ensembles de dossiers patients informatisés (DPI) mis à disposition dans les entrepôts de données de santés.
L'ingénieur·e sera encadré·e par Antoine Neuraz (MD, PhD) et Adrien Coulet (PhD), tous deux chercheurs en informatique médicale et santé numérique et nécessitera des interactions avec de nombreux membres de l'équipe chercheurs, doctorants, internes, avec les ingénieurs de l'équipe SED (Service d'Expérimentation et de Développement) d'Inria et ceux de l'AP-HP.
L'objectif est le développement et l'animation de l'utilisation d'une librairie Python qui a été débutée dans l'équipe. La librairie a pour but de :
1) faciliter la manipulation (i.e., l’annotation, l’extraction, la transformation) de données de patients de différentes modalités : données structurées, textuelles, audio, et à plus long terme images, génétiques, etc. Des modules différents seront progressivement développés pour les différentes modalités.
2) proposer un module supplémentaire pour faciliter le développement et l’expérimentation de modèles de plus haut niveaux, entrainés à partir de données multimodales.