Mots-Clés
dynamique moléculaire
métadonnées
data mining
moteur de recherche
science ouverte
graphe
principes FAIR
Description
Contexte
La dynamique moléculaire est une technique de simulation indispensable pour explorer le comportement des molécules dans de nombreux domaines allant de la science des matériaux à la biologie. Les simulations produites sont des données à haute valeur ajoutée de part l’expertise nécessaire pour les paramétrer et les analyser que les ressources de calcul mobilisées pour les générées. Dans une démarche de science ouverte, de nombreux chercheurs et chercheuses partagent leurs simulations de dynamique moléculaire dans des entrepôts de données publics comme Zenodo ou Figshare. Malheureusement, ces données sont souvent mal annotées et présentent peu de métadonnées, limitant fortement leur réutilisation [1].
[1] Tiemann et al. MDverse: Shedding Light on the Dark Matter of Molecular Dynamics Simulations. Elife (2024). DOI 10.7554/eLife.90061
Objectif du stage
L’objectif du stage est d’améliorer la réutilisation des données ouvertes de dynamique moléculaire par des approches de data mining et de visualisation de graphes.
Nous recherchons un.e stagiaire pour :
1. Étendre les métadonnées actuelles, notamment l’identité des molécules simulées.
2. Construire un moteur de recherche interactif qui expose toutes les données et métadonnées collectées.
3. Proposer des méthodes originales de visualisation des données, notamment par des approches de graphes.
Profil recherché
- Étudiant.e en Master 2 de bioinformatique ou domaine connexe.
- Bases solides en Unix et gestion de versions (git et GitHub).
- Maîtrise de la programmation Python.
- Compétences en simulation moléculaire.
- Connaissances en développement web.
- Intérêt pour la science ouverte.
- Autonomie, rigueur et esprit d’équipe.