Data Engineer - Spécialiste Data Governance, Lineage & Modèle OMOP
CDI · Autres
Bac+5 / Master
ADLIN Science · Grenoble (France)
Date de prise de poste : Oct. 1, 2025
Mots-Clés
data infrastructure
OMOP
data lineage
data governance
Description
Localisation : Paris ou Grenoble
Type de contrat : CDI à temps plein
Date de démarrage : Dès que possible
Rémunération : Selon expérience et profil
Dans le cadre du développement d’une plateforme innovante dédiée à l’analyse des données omics (génomique, transcriptomique, protéomique, métabolique), nous recherchons un(e) Data Engineer expérimenté(e), spécialisé(e) en gouvernance des données, data lineage et modélisation OMOP.
Vous serez au cœur de la structuration des pipelines de données complexes, en assurant leur traçabilité, leur conformité et leur interopérabilité avec les standards du secteur de la santé.
Vous pouvez trouver l’annonce complète ici.
Missions principales
- Concevoir et maintenir des pipelines de données robustes et traçables, intégrant des données transcriptomiques et cliniques.
- Implémenter des solutions de data lineage pour assurer la traçabilité complète des transformations de données omics.
- Mettre en œuvre et maintenir le modèle OMOP CDM pour la standardisation des données cliniques et biologiques.
- Collaborer avec les équipes bioinformatiques et médicales pour intégrer les données transcriptomiques dans un cadre gouverné et interopérable.
- Définir et appliquer les standards de gouvernance des données : catalogage, qualité, sécurité, conformité (RGPD, HIPAA…).
- Participer à l’architecture des systèmes de données, en intégrant les contraintes du secteur de la santé et de la recherche.
- Mettre en place des outils de monitoring, documentation et visualisation des flux de données.
Profil recherché
- Diplôme d’ingénieur ou Master en informatique, data engineering ou biotechnologie.
- Expérience significative (5 à 7 ans) en data engineering, avec une spécialisation en gouvernance, lineage et modélisation OMOP.
- Une expérience dans le secteur de la santé ou des biotechnologies est fortement appréciée.
TECHNIQUES
- Maîtrise des outils de data engineering : Spark, Airflow, dbt, Kafka, etc.
- Expérience avec des solutions de data lineage et de gouvernance (OpenMetadata, Collibra, Talend…).
- Très bonne connaissance du modèle OMOP CDM et des outils associés (OHDSI, Atlas…).
- Expérience dans le traitement et l’intégration de données transcriptomiques (RNA-seq, expression génique…).
- Maîtrise des bases de données (SQL, NoSQL) et des architectures data modernes (Data Lake, Data Mesh…).
- Maîtrise de Python
- Connaissance en cloud
FONCTIONNELLES
- Capacité à vulgariser les enjeux techniques auprès des métiers.
- Sens de l’organisation, rigueur et autonomie.
- Expérience dans un environnement réglementé ou fortement normé (santé, pharma, recherche…).
Offre publiée le Oct. 1, 2025, affichage jusqu'au Nov. 28, 2025