Contrat d'alternance dans le domaine du Data Management de données moléculaires de patients

 Apprentissage · Autres  · 24 mois    Bac+3 / Licence   Gustave Roussy · VILLEJUIF (France)

 Date de prise de poste : 1 septembre 2021

Mots-Clés

NGS Data Données Patients J2EE MySQL iRODS

Description

Activités/missions confiées :

  1. Prise en charge de la structuration des données rétrospectives dans l’entrepôt de fichier (système en production)
  2. Automatisation des transferts de données à partir / vers l’entrepôt
  3. Production de rapports automatiques avec métriques pour le contrôle qualité et monitoring de l’entrepôt.

La plateforme bioinformatique de Gustave Roussy mène une activité de gestion de données principalement des profils moléculaires de patients issus du soin ou de la médecine personnalisée mais aussi de Recherche fondamentale. Un entrepôt de fichier est mis en oeuvre avec la technologie iRODS pour le système de fichier distant et le moteur de metadonnées KDI (en collaboration avec l’institut Curie, applicatif J2EE avec base de données MySQL).

Des microservices sont mis en place sous forme d’API REST, afin de proposer des procédures adaptées à la déclaration et la migration de données dans l’entrepôt de fichier.

Missions:

  1. Migration de données rétrospectives vers l’entrepôt (au total plusieurs dizaines de To), avec la déclaration de metadonnées (notamment patient) :
    • séquençage ciblé : données issues du soin (BIOPATH)
    • puce à ADN : colibri
    • séquençage ciblé (PF_GENOMIQUE_CLINIQUE) : ion torrent S5, ion torrent CELEBI
    • données issues de la recherche (en lien avec les données brutes des séquenceur PF_GENOMIQUE_RECHERCHE)
  2. Automatisation des récupération / partage de données :
    • agent-nextcloud : dépôt/récupération automatique de fichiers
    • agent-*cloud : selon le partenaire producteur de données, développement d’une routine de téléchargement à partir d’un acteur du cloud (ie AWS, googleCloud, Azure, etc.)
  3. Métriques en reporting automatique email ou application web:
    • contrôle qualité des données, contrôle de cohérence
    • monitoring de la volumétrie par projet
    • autres

    Si vous êtes intéressés, motivés, dynamiques et/ou que vous souhaitez de plus amples informations sur les missions, n'hésitez pas à me contacter à l'adresse marc.deloger@gustaveroussy.fr ;-)

    A bientôt !

    Candidature

    Procédure : Envoyer un mail à marc.deloger@gustaveroussy.fr

    Date limite : 1 août 2021

    Contacts

    Marc DELOGER

     maNOSPAMrc.deloger@gustaveroussy.fr

    Offre publiée le 11 juin 2021, affichage jusqu'au 1 août 2021