Création d’un workflow Galaxy pour l’analyse des données écologiques pour la conservation

 Stage · Stage M2  · 4 mois    Bac+5 / Master   MNHN · Paris ou Concarneau (France)

Mots-Clés

Galaxy R Indicateurs Biodiversité Antartique écologie workflow Distribution d'espèces Taxons

Description

Contexte scientifique ou opérationnel, résumé du projet dans lequel s’inscrit ce stage

Un effort considérable est aujourd’hui nécessaire pour rendre les données écologiques et leur agrégation sous forme de cartes, d’indices ou de variables essentielles transparentes, accessibles et reproductibles.

Cet effort, dans le contexte de la conservation des écosystèmes antarctiques est engagé depuis 1991 grâce au Protocole de Madrid. Cependant, les données liées à la taxonomie et les analyses effectuées sur ces taxons ne sont que rarement facilement accessibles, comprises, échangeables et réutilisables (FAIR). Or, la mise en place d’outils de protection et de conservation des écosystèmes exige que les scientifiques ainsi que les décideurs politiques puissent saisir à leur niveau le contenu et les implications des analyses produites.

Objectifs du stage

Nous proposons de développer un « workflow » applicable au contexte de la conservation des écosystèmes en Antarctique et une application en utilisant les données produites lors d’une campagne (CEAMARC) réalisée au large de la Terre Adélie.

  1. formalisation d’un workflow d’analyse des données d’occurrences et des paramètres abiotiques associés
  2. intégration de scripts R existant dans la plateforme web Galaxy
  3. production des cartes de distribution d’espèces pour les >400 taxons (qui contribuera à un Atlas faunique in prep)
  4. organisation de l’information par une classification des pixels par partition
  5. production d’une écorégionalisation de la mer Dumont d’Urville
  6. calcul d’indices de biodiversité
  7. construction de variables essentielles

Démarche expérimentale, méthodes et techniques proposées

Les données d’occurrences sont disponibles dans INVMAR et les paramètres abiotiques sont publiés et disponibles (Hemery et al. 2011). Le/la stagiaire développera une interface permettant d’interroger INVMAR et de construire une matrice de données espèces x paramètres abiotiques directement utilisable par des packages R faisant référence dans le domaine (BRT, PAM, etc). Elle/il intègrera les scripts R déjà disponibles (Martin et al. In prep) dans la plateforme web Galaxy et y créera une interface de visualisation des SDM et des écorégionalisations. Suivant le temps à disposition, elle/il intègrera des calculs d’indices de biodiversité alpha et béta, faisant le lien avec le concept de variables essentielles de biodiversité.

Rôle du stagiaire dans le déroulement du projet

La/le stagiaire aura pour rôle 1-d’interroger la base INVMAR afin de collecter les données d’occurrences, 2-de produire des outils Galaxy à partir de packages R (BRT, PAM, etc), 3-de créer une interface de visualisation sous Galaxy,4-d’appliquer le workflow analytique produit sur le jeu de données CEAMARC, 5-contribuer aux publications qui en découleront. Ce jeu de donnée unique en Antarctique comprend >400 taxons collectés et identifiés dans >80 stations et 17 paramètres abiotiques avec une résolution de 750 m pour une zone de 400 x 400 km. Les SDM produits seront intégrés dans un Atlas régional des faunes benthiques, et les écorégions serviront à renforcer la proposition d’AMP de l’Est-Antarctique auprès de la CCAMLR

 

Connaissances ou compétences acquises à l'issue du stage

Développement de workflows analytiques accessibles, transparents et reproductibles ; connaissance du milieu antarctique et des commissions d’experts qui y travaillent et des enjeux de conservation dans cette région ; sensibilisation au standard FAIR ; utilisation des librairies R cluster (Maechler et al., 2021), data.table (Dowle & Srinavasan, 2021), dplyr (Wickham et al., 2021), gbm (Greenwell et al., 2021), ggplot2 (Wickham, 2016), indicspecies (Caceres & Legendre, 2009), maps (Becker et al., 2021), mapproj (McIlroy, 2021), reshape2 (Whickham, 2007)

 

 

 

 

 

Candidature

Procédure : Envoyer un mail

Date limite : None

Contacts

Yvan Le Bras (MNHN Infrastructure PNDB), Marc Eléaume (MNHN ISYEB)

 yvNOSPAMan.le-bras@mnhn.fr

Offre publiée le 1 novembre 2022, affichage jusqu'au 27 décembre 2022