Projet pilote pour la détection des parcours de soins hospitaliers chez les patients HSA

 Stage · Stage M2  · 6 mois    Bac+5 / Master   l'institut du thorax – UMR Inserm 1087 / Clinique des données, CHU de Nantes · Nantes (France)

Mots-Clés

TAL parcours de soins text mining épidémiologie entrepot de données

Description

Contexte

Dans le cadre du projet Neurovasc (PEPR Santé-Numérique financé par l’ANR), nous proposons un stage de Master 2 dans le domaine de la détection de parcours de soins via l’exploitation de l’entrepôt de données du CHU de Nantes (EDBN).
Les accidents vasculaires cérébraux (AVC) sont la première cause d'handicap dans le monde. Parmi ces AVC, certains sont plus redoutés que d'autres comme les hémorragies ningées. Les hémorragiesningées ou hémorragie sous arachnoïdienne (HSA) sont la conséquence d'une irruption de sang dans l'espace compris entre le cerveau et la boite crânienne. Sa survenue entraine dans 40% des cas un décès ou handicap sévère chez des sujets âgés entre 40 et 60 ans. La majorité des HSA résulte d'une rupture d'un anévrisme intracrânien, une malformation des artères cérébrales. Une meilleure compréhension des parcours de soins pourrait permettre de sélectionner les trajectoires les plus favorables pour les patients. Par « parcours de soin » nous entendons la séquence dactivités cliniques hospitalières qui composent le processus de traitement des patients pour une pathologie ou condition
clinique donnée.
L’institut du thorax UMR Inserm 1087 travaille depuis nombreuses années sur la recherche des facteurs individuels liés à l’survenue et la rupture des anévrismes intracrâniens. La Clinique des données est aujourd’hui en charge de l’exploitation de l’EDBN, l’entrepôt qui intègre les données médicales et administratives produis par l’activité de soin de l’hôpital. Deux typologies principales de données sont contenues dans l’entrepôt : données structurées et codées, comme les diagnostics associés à l’hospitalisation (CIM-10), les actes médicaux (codage CCAM), les résultats des analyses biologiques (codification LOINC), les administrations médicamenteuses ; et des données non-structurées (textuelles), principalement des comptes rendus de consultation, d’hospitalisation, résultats d’imagerie. Ces données sont intégrées dans une base Oracle. Son exploitation s’appuie sur eHOP, un outil informatique permettant d’interroger les données. Il est ainsi possible de manipuler la base via une interface graphique pour des requêtes simples, soit directement par l’écriture de commandes SQL/R pour les requêtes plus complexes.

Objectif du stage

L’objectif du stage est de créer un pipeline d’analyses des documents contenus dans l’EDBN afin de détecter et décrire le parcours de soin hospitalier des patients ayant eu une HSA. Ensuite seront appliqués des méthodes d’analyse de séquences pour la description et la classification de différents profils de parcours de soin détectés.

Etapes

- Identification et sélection des patients concernés à partir de l’EDBN

Formatage, nettoyage et pseudonymisation des données provenant de l’EDBN
Extraction des variables d’intérêt partir de données structurées ou textuelles, utilisation de méthodes de text mining)
- Création de la base (données structurées, non structurées, temporelles)
- Analyses de données : description de la population ; étude des parcours de soins avec des méthodes d’analyse de séquences (state sequence analysis).

Compétences requises

Cette proposition de stage est offerte à un.e étudiant.e de niveau M2, ayant des bonnes compétences en sciences des données et développement logiciel, et motivé par les application dans le domaine de l’épidémiologie. Un certain intérêt pour lapplication de méthodes de traitement automatique du langage serait un plus, ainsi que la maitrise des langages SQL, R et/ou Python.

Contexte du travail

L’étudiant.e travaillera dans le cadre d'une collaboration interdisciplinaire sous la direction de Matilde Karakachoff (statisticienne/épidémiologiste - Clinique des données, CIC Inserm 1413, Pôle Hospitalo-Universitaire 11 : Santé Publique (C2D)), Pacôme Constant Dit Beaufils (neurologue/épidémiologiste, service de neurologie CHU de Nantes et équipe 1 a l’institut du thorax Inserm UMR 1087 / CNRS UMR6291 (ITX)) et Alban Gaignard (informaticien - ITX). Il/elle sera intégré.e aux unions hebdomadaires de la C2D et de l’ITX

 

Valorisation individuelle

- Travail en équipe pluridisciplinaire : informaticien, bio-informaticien, ingénieur TAL, statisticien, médecin, épidémiologiste, data manager, chef de projet
- Exploitation d’une base de données massives en santé
- Formation initiale pour la réglementation et l’accès aux données de santé
- Rédaction d’un article scientifique

 

Candidature

Procédure : Envoyer un mail à : matilde.karakachoff@chu-nantes.fr pierre-antoine.gourraud@univ-nantes.fr alban.gaignard@univ-nantes.fr

Date limite : None

Contacts

Matilde Karakachoff

 maNOSPAMtilde.karakachoff@chu-nantes.fr

Offre publiée le 26 septembre 2023, affichage jusqu'au 24 novembre 2023