Méthodes multivariées pour l'analyse des données longitudinales sur le microbiome

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Biofortis · Saint-Herblain (France)  Gratification mensuelle standard en vigueur en France

 Date de prise de poste : 1 janvier 2023

Mots-Clés

metagenomics microbiome ML longitudinal GLMM

Description

Offre de stage (référence ST2023_ longitudinal)

Activité de l'entreprise : Biofortis, CRO nantaise spécialiste des essais cliniques et bioanalyses, accompagne depuis 20 ans l’innovation pour ses clients en nutrition, agroalimentaire, biotech, pharma, académique, cosmétique. Forte de ses 90 collaborateurs, supportée par l'Institut Mérieux, notre entreprise présente à son actif plus de 500 projets, 250 essais cliniques gérés full-service en France, en Europe et à l'international.

 

Sujet : Méthodes multivariées pour l'analyse des données longitudinales sur le microbiome
 

Contexte

Dans le cadre de nos activités d'analyse de données métagénomiques pour la recherche clinique, nous recherchons un(e) stagiaire pour une durée de 6 mois. Le stagiaire sera intégré et accompagné par une équipe de 6 bioinformaticiens et data scientists et bénéficiera si nécessaire du support de biologistes.

La métagénomique est une méthodologie qui vise à étudier le contenu génétique des micro-organismes (bactéries, virus, champignons, levures, etc.) qui vivent dans un environnement spécifique (intestin, océan, sol, air, etc.). Cet ensemble est connu sous le nom de microbiome. En recherche clinique où le microbiome est étudié, nous devons généralement suivre l'évolution de la composition des écosystèmes dans le temps et leur liaison avec une réponse d'intérêt, en effectuant des mesures sur le même groupe de patients. L'étude des descripteurs de base de la diversité (alpha et beta) sur des mesures répétées peut être résolue avec des outils statistiques standards. Néanmoins, l'identification de composants spécifiques du microbiome (taxonomie et fonctions) avec un comportement relevant est une tâche plus difficile, spécialement lorsque l'on souhaite conserver les caractéristiques de ces données telles que leur caractère compositionnel, la structure des zéros et/ou leur aspect en réseau. En particulier, les outils disponibles ont souvent des limites pour traiter simultanément la nature multivariée des données et les détails du plan expérimental. Ce compromis dépend également de la taille de l'échantillon disponible.

L'objectif général de ce stage est d'évaluer de manière exhaustive les outils multivariés disponibles pour la sélection des caractéristiques du microbiome liées à une réponse d'intérêt.

 

Missions

  • Explorer et résumer les méthodologies statistiques et de machine learning disponibles pour l'analyse longitudinale des données sur le microbiome et étendre l'analyse aux données multimodales, y compris le microbiome
  • Concevoir et mener des tests expérimentaux pour l'évaluation comparative de l'efficacité des outils disponibles et leur comparaison avec des solutions développées en interne. Proposer une visualisation pertinente des résultats de ces tests
  • Étudier la performance des méthodes évaluées en fonction de la taille d'échantillon
  • Proposer, mettre en œuvre et évaluer des méthodes pour la visualisation efficace de données longitudinales et la détection de profils atypiques
  • Décrire des procédures pour contrôler le FDR
     

Formation : Étudiant en Master 2 Bioinformatique, Biostatistiques, Science des données, Intelligence artificielle, Mathématiques appliquées.

Compétences : Expérience avec Git et SVN, environnement Linux, expérience avec TensorFlow/Pytorch (souhaitable), connaissance des concepts de machine learning et GLMM, maîtrise de l'anglais (oral/écrit), adaptabilité, esprit d'équipe, capacité de vulgarisation, esprit de synthèse et d'initiative, dynamisme.

Période et durée : À partir de janvier 2022 (à convenir) pour une durée de 6 mois.

Localisation : Saint-Herblain, périphérie nord-ouest de Nantes (accès direct tramway, parking)

Indemnités de stage : Rémunération convention de stage, participation titres restaurant et frais de transports en commun.

Adresser CV et lettre de motivation à :
Diego Tomassi, Senior Data Scientist
diego.tomassi@biofortis.fr

 

Références

  • Velten, B., Braunger, J.M., Argelaguet, R. et al. Identifying temporal and spatial patterns of variation from multimodal data using MEFISTO. Nat Methods 19, 179–186 (2022).
  • Saritha Kodikara, Susan Ellul, Kim-Anh Lê Cao, Statistical challenges in longitudinal microbiome data analysis, Briefings in Bioinformatics, Volume 23, Issue 4, July 2022.
  • M. Luz Calle, Antoni Susin. Identification of Dynamic Microbial Signatures in Longitudinal Studies. bioRxiv 2022.04.25.489415

Candidature

Procédure : Envoyer un mail à l'adresse mail du contact spécifiée ci-dessus.

Date limite : 1 février 2023

Contacts

Diego TOMASSI

 diNOSPAMego.tomassi@biofortis.fr

Offre publiée le 24 novembre 2022, affichage jusqu'au 1 février 2023