Mots-Clés
NGS
Data
Cancer
Données
Patients
J2EE
MySQL
iRODS
Description
Activités/missions confiées :
La plateforme bioinformatique de Gustave Roussy mène une activité de gestion de données principalement des profils moléculaires de patients issus du soin ou de la médecine personnalisée mais aussi de Recherche fondamentale. Un entrepôt de fichier est mis en oeuvre avec la technologie iRODS pour le système de fichier distant et le moteur de metadonnées KDI (en collaboration avec l’institut Curie, applicatif J2EE avec base de données MySQL).
Des microservices sont mis en place sous forme d’API REST, afin de proposer des procédures adaptées à la déclaration et la migration de données dans l’entrepôt de fichier.
Missions:
Migration de données rétrospectives vers l’entrepôt (au total plusieurs dizaines de To), avec la déclaration de metadonnées (notamment patient) :
- puce à ADN séquençage ciblé (PF_GENOMIQUE_CLINIQUE) : ion torrent S5, illumina nextseq
- données issues de la recherche (PF_GENOMIQUE_RECHERCHE) : illumina novaseq6000, Oxford Nanopore PromethION48
Automatisation des récupération / partage de données :
- agent-nextcloud : dépôt/récupération automatique de fichiers
- agent-*cloud : selon le partenaire producteur de données, développement d’une routine de téléchargement à partir d’un acteur du cloud (ie AWS, googleCloud, Azure, etc.)
Métriques en reporting automatique email ou application web: contrôle qualité des données, contrôle de cohérence monitoring de la volumétrie par projet
Si vous êtes intéressés, motivés, dynamiques et/ou que vous souhaitez de plus amples informations sur les missions, n'hésitez pas à me contacter à l'adresse marc.deloger@gustaveroussy.fr ;-)
A bientôt !