Stagiaire Ingénieur.e Data - Industrialisation d’un pipeline ETL

 Stage · Stage M2  · 6 mois    Bac+5 / Master   ADLIN Science · Grenoble (France)  750

 Date de prise de poste : Feb. 2, 2026

Mots-Clés

data ETL Python

Description

Localisation : Grenoble ou Paris
Type de contrat : Stage de 6 mois
Date de démarrage : Février - Mars 2025

L’offre complète est disponible ici.

En tant que stagiaire data vous contribuerez activement à l’industrialisation d’un pipeline ETL (Extraction - Transform - Load) dédié à l’intégration de données de recherche publiques (omiques et cliniques), disponibles sur des entrepôts tels que GEO, GDC, etc.

L’objectif du stage est de transformer un ensemble de scripts exploratoires en une solution générique, robuste et évolutive, capable de gérer des volumes de données croissants et de s’adapter à de nouvelles sources et formats. Selon l’avancement et les intérêts du/de la stagiaire, une ouverture du stage pourra consister à se concentrer sur la partie “Extract” afin d’automatiser l’acquisition des données depuis de nouvelles sources.

Responsabilités

  • Industrialiser les scripts existants : packaging, modularisation
  • Mettre en place une gestion du versioning des scripts et des données
  • Concevoir une architecture scalable pour anticiper l’augmentation du volume et de la diversité des données
  • Implémenter des formats de sortie compatibles avec nos outils internes et automatiser le chargement (”Load”) dans ces outils
  • Mettre en place des tests
  • Ouverture possible : requêtage et extraction de données depuis différentes sources (bases, APIs, fichiers)

Quelle sera votre place dans l’équipe ?

Au sein de notre équipe Data & Analytics, qui fonctionne en petit comité, vous bénéficierez d’une grande autonomie. Vous collaborerez toutefois avec les autres membres de l’équipe qui continueront à faire évoluer le pipeline.

Profil

  • En dernière année d’une formation d’ingénieure généraliste, informatique ou biotechnologique avec une spécialisation en data, ou d’un master en data management
  • Bonnes bases en Python
  • Connaissances en ETL / pipelines de données
  • Compréhension des modèles de données et des formats standards (CSV, JSON, TSV, etc.)
  • Notions de contrôle qualité et de nettoyage de données
  • Connaissances en Git, Gitlab
  • Intérêt prononcé pour les données biomédicales et la recherche
  • Autonomie, organisation et curiosité technique
  • Esprit d’équipe et capacité à documenter et partager ses travaux

Candidature

Procédure : Pour en savoir plus sur cette opportunité de rejoindre ADLIN Science, contactez-nous à recrutement@adlin-science.com

Date limite : Nov. 28, 2025

Contacts

 Alicia SIMION
 reNOSPAMcrutement@adlin-science.com

 https://adlin-science.notion.site/Stagiaire-Ing-nieur-Data-Industrialisation-d-un-pipeline-ETL-2716407f769880509f57dad7efb37f7b

Offre publiée le Oct. 1, 2025, affichage jusqu'au Nov. 28, 2025