Mise en place d'une procédure de gestion d'ontologies. Application au domaine de l'embryologie

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Équipe de recherche sur les Tuniciers CRBM/CNRS et l'entreprise privée Bioself Communication · Montpellier (France)  Gratification prévue

Mots-Clés

Ontologie biocuration développement ANISEED

Description

CONTEXTE

La littérature scientifique est actuellement marquée par une fragmentation extrême des données de recherche publiées, qui rend très difficile leur agrégation, leur intégration dans un contexte large et leur réutilisation, notamment dans le cadre de projets d’intelligence artificielle. Dans ce contexte, nous avons créé et nous administrons ANISEED (https://www.aniseed.cnrs.fr/) la base de données de référence mondiale dans le domaine de la biologie du développement des ascidies. Ce système est destiné à une communauté mondiale de taille moyenne (environ 70 laboratoires) dont la production (~40 articles par an) rend possible une couverture exhaustive de la littérature. Il permet l’intégration et la mise en ligne, en respectant les principes FAIR (https://www.go-fair.org/fair-principles/), des données à petite et grande échelle issues des publications et des expériences non publiées de sa communauté cible. 


Chaque article de la littérature scientifique est reformaté sous la forme d'un “article card” qui structure et centralise, grâce à l’utilisation d’ontologies moléculaires et anatomiques, l’intégralité des données de l’article sous une forme standardisée et interrogeable. 

Parmi les ontologies utilisées, notre équipe de curation, en collaboration avec la communauté ascidie a établi une ontologie anatomique décrivant, pour chaque stade de développement embryonnaire, les différents territoires anatomiques  des espèces Ciona robusta et Phallusia mammillata (https://www.aniseed.cnrs.fr/aniseed/anatomy/find_devstage). 


SUJET

Le premier but du stage est de mettre en place une procédure de mise à jour de ces ontologies. La/Le stagiaire devra se documenter et réaliser un état de l’art sur les ontologies et les technologies permettant leur représentation et leur édition. Il s’agira ensuite d’établir une procédure pour la mise à jour de l’ontologie elle même et d’analyser toutes les conséquences de son évolution  (traçabilité des mises à jour, actualisation automatique des fichiers dans les entrepôts d'ontologies et dans ANISEED, répercussions sur les annotations des profils d’expression génétique dans ANISEED). 

Dans un second temps, la/le stagiaire appliquera cette procédure pour faire évoluer deux ontologies anatomique afin que leur niveau de description atteigne l’échelle de la cellule unique : une ontologie du cerveau embryonnaire de Ciona robusta, et une ontologie embryonnaire pour Phallusia mammillata.  

En fonction du temps restant, une troisième partie du stage se penchera sur la  représentation de ces ontologies et des lignages cellulaires dans ANISEED. 

Le stage pourra être prolongé par un contrat CDD. 


PROFIL RECHERCHE

  • Grande rigueur, capacité d’analyse, réactivité, sens critique et autonomie, curiosité notamment pour les sciences de la vie.

  • Désir d’appliquer des connaissances informatiques théoriques au domaine des sciences du vivant.

  • Communication orale et annotation de code en Anglais 

  • Des connaissances minimales en biologie seraient un plus. 

  • Conception et déploiement de solutions informatique

  • Maîtrise d’un langage de programmation 

  • Connaissance de Git

  • Notions de  web sémantique et sur les ontologies. Une connaissance des formats standards d’ontologies (OWL,OBO,RDF) serait un plus.


    FORMATION REQUISE

    • Formation de niveau Bac + 5 (Master, Master Pro, Ingénieur), en informatique ou en bioinformatique avec une bonne composante de développement informatique.

      BIBLIGRAPHIE


      • ANISEED 2019: 4D exploration of genetic data for an extended range of tunicates.

      Justine Dardaillon, Delphine Dauga, Paul Simion, Emmanuel Faure, Takeshi A Onuma, Melissa B DeBiasse, Alexandra Louis, Kazuhiro R Nitta, Magali Naville, Lydia Besnardeau, Wendy Reeves, Kai Wang, Marie Fagotto, Marion Guéroult-Bellone, Shigeki Fujiwara, Rémi Dumollard, Michael Veeman, Jean-Nicolas Volff, Hugues Roest Crollius, Emmanuel Douzery, Joseph F Ryan, Bradley Davidson, Hiroki Nishida, Christelle Dantec and Patrick Lemaire

      Nucleic Acids Res. 2020 Jan 8;48(D1):D668-D675. doi: 10.1093/nar/gkz955.


      • ANISEED 2017: extending the integrated ascidian database to the exploration and evolutionary comparison of genome-scale datasets.

      M. Brozovic, C. Dantec, J. Dardaillon, D. Dauga, E. Faure, M. Gineste, A. Louis, M. Naville, K. R Nitta, J. Piette, W. Reeves, C. Scornavacca, P. Simion, R. Vincentelli, M. Bellec, S. Ben Aicha, M. Fagotto, M. Guéroult-Bellone, M. Haeussler, E. Jacox, E. K Lowe, M. Mendez, A. Roberge, A. Stolfi, R. Yokomori, C. Titus Brown, C. Cambillau, L. Christiaen, F. Delsuc, E. Douzery, R. Dumollard, T. Kusakabe, K. Nakai, H. Nishida, Y. Satou, B. Swalla, M. Veeman, J. Volff, P. Lemaire.

      Nucleic Acids Res. 2018 Jan 4;46(D1):D718-D725. doi: 10.1093/nar/gkx1108.


      • ANISEED 2015: a digital framework for the comparative developmental biology of ascidians.

      M. Brozovic, C. Martin, C. Dantec, D. Dauga, M. Mendez, P. Simion, M. Percher, B. Laporte, C. Scornavacca, A. Di Gregorio, S. Fujiwara, M. Gineste, E. K. Lowe, J. Piette, C. Racioppi, F. Ristoratore, Y. Sasakura, N. Takatori, T. C. Brown, F. Delsuc, E. Douzery, C. Gissi, A. McDougall, H. Nishida, H. Sawada, B. J. Swalla, H. Yasuo, P. Lemaire.

      Nucleic Acids Res. 2016 Jan 4;44(D1):D808-18. doi: 10.1093/nar/gkv966. Epub 2015 Sep 29.

      • The ANISEED database: digital representation, formalisation and elucidation of a chordate developmental program.

      O. Tassy, D. Dauga, F. Daian, D. Sobral, F. Robin, P. Khoueiry, D. Salgado, V. Fox, D. Caillol, R. Schiappa, B. Laporte, A. Rios, G. Luxardi, T. Kusakabe, J. S. Joly, S. Darras, L. Christiaen, M. Contensin, H. Auger, C. Lamy, C. Hudson, U. Rothbächer, M. J. Gilchrist, K. W. Makabe, K. Hotta, S. Fujiwara, N. Satoh, Y. Satou and P. Lemaire.

      Genome Res . 2010 Oct;20(10):1459-68. doi: 10.1101/gr.108175.110. Epub 2010 Jul 20.




      Candidature

      Procédure : Merci d'envoyer votre candidature par mail à contact@aniseed.cnrs.fr

      Date limite : 31 janvier 2022

      Contacts

      Christelle Dantec / Delphine Dauga

       coNOSPAMntact@aniseed.cnrs.fr

      Offre publiée le 11 octobre 2021, affichage jusqu'au 31 janvier 2022