Mots-Clés
Biodiversité, Bases de données, Pipelines, Shiny
Description
Contexte :
Ce stage s’inscrit dans le cadre des travaux menés par la startup deeptech LDgenX, spécialisée dans le développement d’outils bioinformatiques et génétiques appliqués à la traçabilité de la biodiversité.
Le ou la stagiaire sera accueilli.e au sein de la station expérimentale IFREMER de Palavas-les-Flots (34), un environnement mêlant recherche et application direct aux études sur les écosystèmes aquatiques et terrestres.
Ce stage contribuera à un projet innovant combinant séquençage d’ADN environnemental (ADNe ou eDNA), analyses bioinformatiques avancées, et développement d’applications interactives pour le traitement et la visualisation de données.
Résumé :
L’objectif du stage est de participer au développement et à l’optimisation de pipelines bioinformatiques pour l’analyse de données ADNe issues de technologies de séquençage à haut débit court-fragments (Illumina) et à long-fragments (Oxford Nanopore Technologies). Le ou la stagiaire sera amené.e à comparer des modèles d’alignement et d’assignation de séquences jusqu’à l’espèce, à identifier/filtrer voire créer des bases de données de référence de bonnes qualités, à implémenter des outils statistiques, et à développer des interfaces d’analyse interactives en R (Shiny).
Ce travail permettra d’améliorer les capacités de détection et d’identification d’espèces à partir d’échantillons environnementaux, en vue d’applications en écologie et conservation de la biodiversité.
Objectifs du stage :
1. Prise en main et amélioration de pipelines bioinformatiques
2. Comparaison de modèles d’alignement et d’analyses taxonomiques
3. Création de bases de données génétiques
4. Développement des méthodes de séquençage en long- et court-fragments
5. Création d’applications de type Shiny
Profil recherché :
Niveau M2, spécialisé.e en bioinformatique et/ou biostatistique et/ou mathématique appliquée avec un goût pour la génétique.
Compétences avancées pour du codage R, Bash et Python.
Compétences en statistiques et en gestion de données.
Motivation, rigueur, bonne capacité d’organisation et autonomie.