Mots-Clés
base de données
postgresql
écologie
données
interface
Description
Suivre la reproduction d’une espèce sur de nombreuses années et dans différents habitats permet d’étudier et comprendre les mécanismes évolutifs et écologiques de l’espèce. Ces mécanismes sont cruciaux pour établir et prédire les dynamiques de population ainsi que pour identifier les facteurs qui permettent le maintien des populations. La mésange bleue (Cyanistes caeruleus) et la mésange charbonnière (Parus major) sont deux espèces-modèles dans l’étude de la phénologie de reproduction de vertébrés en milieu sauvage. Depuis 1976, une équipe de chercheurs basée au Centre d’Ecologie Fonctionnelle et Evolutive à Montpellier organisent la récolte annuelle de différents types de données liées à la reproduction des mésanges sur différents sites. Ces données sont variées (observation textuelle, échantillons biologiques diverses, vidéos, images, etc.) et sont récoltées par plusieurs personnes. Elles sont ensuite incorporées dans une base de données sécurisée.
Afin de garantir la fiabilité des analyses qui en découlent, il est important de produire des données de qualité. Cela demande donc un travail important de nettoyage des données. De plus, dans un objectif d’ouverture des données de la science, il est
également nécessaire de fournir un travail de modélisation, de formalisme via des métadonnées et de partage des données. Avec l’augmentation et la complexification des données collectées annuellement, il est nécessaire de mener une réflexion sur l’optimisation du processus de la donnée dans son ensemble : nettoyage, insertion, extraction, ouverture de la base de données aux collaborateurs.
L’objectif du stage est donc de développer cette optimisation du processus et pourra s’organiser en différents points selon la durée du stage et les envies de l’étudiant·e :
-
Faciliter le nettoyage des données en développant l’automatisation de contrôle et de correction
-
Développer des APIs afin d’extraire et de mettre à jour les données de la base selon des besoins déjà identifiés
-
Développer des interfaces pour visualiser des données identifiées de la base
-
Modifier le schéma de base de données afin d’intégrer des nouveaux types de données
-
Permettre d’améliorer la FAIRisation de la base de données de façon simple en développant des outils
-
Documentations utilisateurs et développeur à enrichir
-
Développer des indicateurs pour la base pour mesurer l’évolution de celle-ci
Encadrement et environnement de travail
Le stage se déroulera au sein de l’équipe Mésange du CEFE, co-dirigée par Anne Charmantier, et du pôle numérique. L’étudiant·e bénéficiera à la fois de l’expertise d’Amélie Fargevieille, écologue, Christelle Dantec, informaticienne.
Ce cadre offre une opportunité d’intégrer un projet scientifique interdisciplinaire, au carrefour de l’écologie et du développement informatique et des bases de données
Profil recherché
Nous recherchons un·e étudiant·e en Informatique ou équivalent, motivé·e par le développement de bases de données et les APIs, avec un intérêt pour les projets collaboratifs et les enjeux environnementaux dans un esprit de science ouverte. Les compétences suivantes seront particulièrement appréciées :
-
Maitrise de SQL et des Systèmes de Gestion de Base de Données (PostGreSQL)
-
Connaissance des API
-
Bonne pratique de programmation (documentation, commentaire, versioning
de code –Git /gitlab –, mise en place de tests (unitaires, fonctionnels)… )
-
Connaissance des standards d’échange de données scientifiques
-
Des connaissances sur les métadonnées, les standards utilisés en écologie
(EML,Darwin Core, Dublin Core..), les ontologies seraient un plus.
-
Environnement Linux
-
Esprit d’analyse, autonomie et aptitude à travailler en équipe
Modalités
Durée de 3 à 6 mois
-
Lieu : CEFE, Montpellier, 1919 route de Mende
-
Encadrement : Amélie Fargevieille et Anne Charmantier (écologues), Christelle Dantec (informaticienne)
-
Gratification selon réglementation en vigueur : 659,76 €/mois
Ce stage constitue une occasion unique d’acquérir une expérience appliquée en ingénierie des données dans un cadre scientifique stimulant, tout en contribuant à un projet d’envergure sur la biodiversité et les enjeux des programmes à longs termes.
Pour candidater, merci d’envoyer CV et lettre de motivation à Amélie Fargevieille (amelie.fargevieille@cefe.cnrs.fr ) et Christelle Dantec (christelle.dantec@cefe.cnrs.fr )