Mots-Clés
Multi-tableaux
multi-bloc
metabolomique
exposomique
analyse multivarié
Description
Titre Sujet
de Thèse
« Intégration
et analyse de données exposomiques et métabolomiques dans le cadre d’études
observationnelles : application à l’étude du lien entre l’exposition chimique
et la santé humaine »
Contexte/
problématique
Le concept d'exposome est
entendu comme l'intégration sur la vie entière de l'ensemble des expositions
qui peuvent influencer la santé humaine. Spécifiquement, l’étude de
« l’exposome interne » passe par la caractérisation de marqueurs
d’exposition chimiques auquel l’individu ou une population a été exposé mais
aussi, en miroir de ces paramètres, de l’altération éventuelle de biomarqueurs phénotypiques
ou physiopathologiques (e.g. le métabolome). Pour cela, les plateformes de
spectrométrie de masse à haut débit (HRMS) ont évolué pour caractériser un
grand nombre de biomarqueurs de natures différentes et générant de vastes
ensembles de données.
Le principal défi dans ce
domaine est celui de l’intégration de ces données de natures diverses, au
caractère multidimensionnel (nombre de variables très supérieur aux
observations), parfois redondantes (lié à la multi-colinéarité) et souvent
bruitées (forte variance interindividuelle associée à des facteurs de confusion
ou connexs). De nouvelles méthodes statistiques ont été proposées ces dernières
années pour intégrer les données ‘omiques’ de différentes natures (e.g. multi-omique).
Ces approches de type multi-tableaux (dites aussi multi-blocs) restent
toutefois peu explorées lorsqu’il s’agit de l’agrégation de données d’exposomique
et de métabolomique au service d’études observationnelles.
Objectifs
Le projet a pour objectif
global de développer et de mettre en œuvre une stratégie d’intégration et
d’analyse de données de biomarqueurs d’exposition (e.g. exposome) et d’effet
(e.g. métabolome) permettant de progresser dans l’étude observationnelle des
liens fonctionnels entre l’exposition chimique et la santé humaine. Il s’agira
spécifiquement, d’identifier puis d’implémenter un ensemble de modèles visant à
classifier les observations sur la base de profils d’exposition et/ou
phénotypes cliniques associés dans le cadre d’études de simulation et réelles. Dans
une deuxième étape, le développement d’un package en accès libre (R) avec un
ensemble de fonctions permettant une application en routine est attendu
Compétences
Solides connaissances en
statistique et analyse de données (Master 2 en statistique / bio-informatique).
Maîtrise le langage de programmation R. Intérêt pour le traitement de données
de santé. Capacité d’analyse et d’interprétation critique.
Laboratoire d’accueil et contact
-
LABERCA
UMR 1329 ONIRIS, INRAE, La Chantrerie 44307 Nantes, FRANCE (laberca.org). Contacte :
German Cano Sancho <
german.cano-sancho@oniris-nantes.fr>
-
Unité
Statistique, Sensométrie et Chimiométrie (StatSC) ONIRIS, Site de la Géraudière
44322 Nantes FRANCE. Contacte : Evelyne Vigneau < evelyne.vigneau@oniris-nantes.fr >