Responsable Plateforme Big Data de l'AP-HP

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

33 boulevard de Picpus
75012 Paris
France

Contacts
Elisa Salamanca
Email du/des contacts
elisa.salamanca@aphp.fr
Description

L’AP-HP

L'Assistance Publique - Hôpitaux de Paris (AP - HP) est le centre hospitalier universitaire (CHU) d’Île-De-France. Ses missions sont le soin, la recherche et l’enseignement. À dimension internationale, il est constitué de 38 hôpitaux, organisés en 12 groupes hospitaliers. Accueillant plus de 7 millions de patients par an, il possède un budget annuel de près de 7,2 milliards d’euros.

Direction des Systèmes d’Information de l’AP-HP

La Direction des Systèmes d’Information (DSI) a pour mission d'assister le Directeur Général de !'Assistance publique - hôpitaux de Paris dans la conception, le pilotage et la mise en œuvre de la politique système d’information de l'AP-HP. Elle est rattachée au secrétariat général de l’AP-HP.Sous réserve des attributions propres aux Directions assurant la maîtrise d’ouvrage métier, les missions et domaines de
Le budget d’investissement géré est de près de 70 M€ et le budget d’exploitation est de 125 M€.
Le nombre d’agents de la DSI centrale en équivalents temps pleins est de 370.

Le département Web Innovation Données au sein de la DSI a en charge :

- À travers le domaine Web, en lien avec la direction de la communication (DIRCOM) et la direction du pilotage et de la transformation (DPT) : les portails internet de l’institution (Drupal, WordPress, etc.), les outils collaboratifs (SharePoint, Alfresco, etc.), les applications mobiles et les nouveaux téléservices de l’AP-HP (paiement en ligne, prise de rendez-vous en ligne, portail patient, etc.) permettant de dématérialiser les relations avec le patient ;
- À travers le domaine Données, en lien avec la direction de l’organisation médicale et des relations avec les universités (DOMU) : (i) l’expertise données en soutien à la mise en place d’une gouvernance institutionnelle des données, (ii) le développement de l’entrepôt de données de santé et de la plateforme Big Data de l’AP-HP et l’organisation de la mise à disposition des données à des fins de recherche, de pilotage et d’innovation (iii) la maintenance de divers référentiels de données cliniques sur des standards internationaux, nationaux ou AP-HP ;
- À travers la plateforme Bio-Informatique : la proposition d’une offre de services et d'expertise aux pôles de biologie de l’AP-HP face aux besoins dans leur gestion informatique du séquençage, qu’il s’agisse de l’infrastructure, des logiciels avec leurs ressources de calcul associées, ainsi que de l’expertise métier en bio-informatique.
- A travers le domaine BNDMR (Banque Nationale de Données Maladies Rares) en lien avec la DOMU : le pilotage d’un projet national visant à développer, maintenir et déployer une application de collecte de données dans le cadre du soin (BaMaRa- Base Maladies Rares) et la mise en place d’un entrepôt de données national sur les maladies rares.

Le département a par ailleurs comme mission de favoriser l’Innovation, en lien avec la DPT: le développement progressif d’une offre permettant l’organisation d’évènements dans les hôpitaux (conférences, cafés, hackathons, etc.), le soutien aux projets les plus prometteurs, et plus généralement l’organisation de la veille et la prospective sur les transformations numériques et leur impact sur l’hôpital ;

Description du Projet Plateforme Big Data :

Le domaine Données s’occupe actuellement de la mise en place du Cluster Big Data ou de la Plateforme Mégadonnées de l’AP-HP brique principale de l’Entrepôt de Données de Santé. Les environnements techniques sur lesquels le cluster est bâti sont : Hadoop (distribution Hortonworks avec les briques Hive, Spark2, Solr, Phoenix, Hbase, HDFS, Zookeper, Ambari…), base de données structurée PostGreSQL, Jupyter Lab, l’outil I2B2…
Cette plateforme compte actuellement 22 machines pour le cluster Hadoop (4928Go RAM, 840 cores CPU,1,4To d’espace disque HDFS), de 3 machines GPU (20 GPU Nvidia), de 10 machines CPU dédiées aux environnements Jupyter pour l’analyse de données, et 1 machine NFS de 78To.
Un effort important est porté à l’intégration rapide des données cliniques (structurées et non structurées) produites dans les différents systèmes d’information hospitaliers (dossier patient informatisé ORBIS, logiciels historiques et de spécialité, données des moniteurs haute fréquence, données d’imagerie…) afin de pouvoir les mettre à disposition de tiers au travers d’outils spécifiques (logiciel I2B2, outil BI Cognos, outils propres de visualisation et de création de cohortes...) ou d’interfaces FHIR (API).

La plateforme contient aujourd’hui les données médicales de plus de 8 millions de patients (20 millions de dossiers médicaux, plus de 10 millions de diagnostics, 181 millions de résultats de laboratoires…). Un travail important de standardisation des données est en cours afin de s’aligner sur les standards internationaux et assurer une interopérabilité maximale des données (OMOP, FHIR et les terminologies médicales de référence LOINC, CIM…). Plus de 30 projets de recherche sont actuellement en cours.

L’AP-HP souhaite désormais industrialiser et accélérer la mise en place de l’entrepôt de données de santé et créer ainsi un nouveau domaine « Cluster Big Data » au sein du département WIND, qui aura pour objectifs de :
-Finaliser l’architecture de la plateforme dans son ensemble afin de répondre aux besoins métiers, et réglementaires (sécurité, traçabilité…) et l’administrer,
-D’accélérer l’intégration des données
-De développer les outils nécessaires à la mise à disposition de ces données à la communauté de recherche (outils d’analyse, d’annotation de données & Jupyter, I2B2, projet interne Cohort360 – application web permettant la constitution de cohortes de patients et leur visualisation)
-De développer les interfaces nécessaires à l’alimentation de l’ensemble des systèmes d’information nécessitant un accès à ces données (Portail Patient, logiciels métiers…)
-De créer les interfaces avec d’autres Systèmes tels que le Health Data Hub ou des réseaux de CH(U) à l’échelle régionale, nationale ou Européenne,

Il s’agit ainsi d’un nouveau domaine à créer et structurer afin de répondre aux objectifs ambitieux que se donne l’AP-HP pour développer l’usage de ses données, et notamment permettre l’émergence et le développement de l’intelligence artificielle dans le domaine médical.

Service

Composition de l'équipe

L’équipe sera composée d’environ 10 professionnels techniques (6 internes, 4 prestataires). Elle sera amenée à grossir suite aux récents partenariats engagés avec le Health Data Hub, certains industriels…

Activités

Missions générales du poste :

Le/la responsable du nouveau domaine Cluster Big Data aura pour mission principale de structurer l’équipe et de la faire monter en puissance afin de répondre aux objectifs et ambitions de l’institution. Il/Elle aura pour mission d’assurer le management de l’équipe constituée de profils techniques dans l’objectif d’accomplir au mieux, en un minimum de temps et de coût, ses missions.

Chaque année des objectifs précis seront établis en lien avec la responsable hiérarchique.

Missions spécifiques :

- Management opérationnel des professionnels de l’équipe
- Définition d’une stratégie de développements et d’architecture technique pour la plateforme et les applications/logiciels associés
- Elaboration de la feuille de route technique du Cluster Big Data
- Assurer une veille technologique pour assurer la pérennité du socle technologique des applications du domaine
- Suivi de projet et allocation des ressources et des priorités
- Planifier et coordonner les projets en liaison avec les différentes structures et partie prenantes (Département infrastructure et services : production/datacenters, équipe sécurité informatique, service ACHAT, autres services,…)
- Assurer la gestion budgétaire du projet en lien avec la directrice du département
- Echanges de haut niveau avec les professionnels chercheurs de l’AP-HP et de ses partenaires dans le domaine de l’exploitation de données : partenaires industriels, fondation AP-HP pour la recherche, Health Data Hub, CHU, partenaires académiques (Inria, Ecoles d’ingénieur, Inserm…) et partenaires internationaux
- Développement de partenariats autour des thématiques techniques propres à l’équipe et notamment les questions d’intelligence artificielle (constitution d’une Chaire, de partenariats bilatéraux …)
- Contribution à l’organisation et à la mise en œuvre d’une communication scientifique des travaux portés par l’équipe
- Contribution à la coordination et la mise en place de la stratégie IA de l’AP-HP

Profil Recherché

• Ingénieur(e) A+ et/ou PhD et/ou MD (Mathématiques, Informatique, Santé publique, etc.),
• Expérience significative dans la gestion technique de projets informatiques (admin système, développeur, architecte technique…)
• Expérience dans l’encadrement d’une équipe

Liaisons

Hiérarchique : Directrice du département WIND
Fonctionnelles:
- Les membres de l’équipe Données (dont est issue la plateforme)
- Les autres chef(fes) de projet de l’équipe WIND et de la direction du système d’information
- Les directions de la DSI
- Les autres directions de l’AP-HP et en particulier la Délégation à la Recherche Clinique et à l’Innovation
- Les Unités de Recherche Clinique de l’AP-HP, et les équipes médicales porteuses de projet de recherche
- Les contacts des différents établissements partenaires
- Les tiers extérieurs partenaires des projets, notamment le Health Data Hub

Compétences Requises

Requis :
• Maîtrise des langages Java, SQL, Python
• Maîtrise des outils ETL (Talend ou autre)
• Maîtrise des techniques, logiciels et outils du champ du machine learning/deep learning (frameworks, plateformes Big Data Hadoop, Spark…)
• Maîtrise des méthodologies devops et des outils associés (Docker, Kubernetes, jenkins…)
• Maîtrise des environnements Linux
• Rédiger/contrôler des documents techniques (Dossier d’architecture technique - DAT, Dossier d’exploitation - DEX, Dossier d’alarmes – DAL, matrice des flux réseau, etc.)
• Encadrer une équipe de développeurs
• Bonne connaissance des méthodologies de gestion de projet (cycle en V,Scrum)

Apprécié :
• Bonne connaissance des frameworks de développement web (REACT, VueJS…)
• Bonne connaissance et pratique des webservices (SOA, REST) et des technologies d’intégration à l’aide d’interfaces de programmation (API)
• Connaissance de la réglementation informatique et libertés ;
• Connaissance des standards d’interopérabilité du domaine de la santé (FHIR, OMOP, CDA, HL7, CIM, Snomed, LOINC…)
• Maîtrise de la communication et de la négociation en situation complexe

Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d'activité
• Animer / communiquer / motiver une ou plusieurs équipes
• Capacité à animer des réunions courtes, en imposant une préparation et un compte rendu
• Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence
• Concevoir et rédiger une documentation spécifique à son domaine de compétence
• S'exprimer en public
• Utiliser les logiciels métier

Connaissances associées

• Environnement des systèmes d’information hospitaliers
• Enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie…)

Qualités requises
• Esprit d’équipe
• Autonomie, rigueur, méthode
• Excellentes aptitudes relationnelles et à la communication, capacité d’écoute et de vulgarisation, capacité de formation (Aisance à l’oral, diplomatie)
• Capacité de travail importante, associée à un fort dynamisme.
• Curiosité et capacité d’adaptation et d’anticipation
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé