Application des méthodes multiblocs pour l’intégration de données exposomiques et métabolomiques en études de santé environnementale

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

ONIRIS - Site de la Chantrerie
101 Rte de Gachet
44307 Nantes 3
France

Contacts
German Cano-Sancho
Email du/des contacts
german.cano-sancho@oniris-nantes.fr
Description

Contexte scientifique
Les études de biosurveillance ont démontré que l’Homme est exposé à des mélanges complexes de substances chimiques durant toute sa durée de vie, observation traduite aujourd’hui dans le concept d‘exposome’. L'exposition aux substances chimiques exogènes (par exemple les contaminants d’origine anthropique) à certaines concentrations et durant des fenêtres de sensibilité particulières (période périnatale, puberté…) peut avoir un impact sur certains processus biologiques internes et à terme contribuer à l’apparition et/ou le développement de certaines maladies. L'évaluation de l'impact des polluants chimiques environnementaux sur la santé humaine est extrêmement complexe en raison de problèmes scientifiques, pratiques, économiques, mais aussi éthiques. Ces limites sont un frein à l’accès à un grand nombre de données expérimentales concernant l’exposition des populations (niveaux de concentration d’un vaste ensemble de marqueurs d’exposition reflétant la réalité de l’exposome chimique et mesurés à large échelle chez un grand nombre de sujets) et les effets associés à cette exposition. Parallèlement aux données phénotypiques générées par les plateformes à haut débit dans les domaines de l'exposomique et de la métabolomique, des approches de modélisation et de simulation apparaissent donc aujourd’hui indispensables pour accompagner ce nouveau paradigme associé à l’intégration et à l’analyse de données de diverses nature (marqueurs d’exposition et marqueurs d’effet dans le cas présent) à large échelle. L’un des défis méthodologiques est en particulier le caractère multidimensionnel (avec un nombre de variables mesurées très supérieur au nombre de sujets) et hautement redondant (lié à la multicolinéarité entre les différentes variables) de ce type de données. Au cours de la dernière décennie, de nouvelles méthodes statistiques et computationnelles multi-tableaux ont été proposées pour intégrer plusieurs tableaux de données tels que les couches de données type « Omiques » (e.g. transcriptomique, protéomique). Néanmoins, l’application des approches type multi-tableaux (ou multibloc) reste à peine explorée pour l’intégration des ensembles de données métabolomiques et exposomiques issus d'études observationnelles. Dans ce contexte, le projet proposé a pour objet global de développer et de mettre en œuvre une stratégie d’intégration et d’analyse de données permettant de progresser dans l’étude du lien environnement-santé.

Objectifs
Les principaux objectifs de ce projet sont :
(1) de réaliser une revue critique de l’état de l’art concernant la mise en œuvre des modèles multiblocs et des algorithmes dans le cadre de l’épidémiologie environnementale ;
(2) d’identifier puis d’implémenter un ensemble de modèles à partir d’un jeu de données réelles support d’un cas d’étude des liens entre exposition chimique et santé.

Méthodologie envisagée
1. Revue critique de l’état de l’art concernant les modèles multiblocs et les algorithmes associés appliqués en épidémiologie environnementale. Développement d’une stratégie de recherche pour identifier des études méthodologiques et épidémiologiques reportant des approches multibloc et/ou algorithmes d’intégration multidimensionnelle d’intérêt potentielle pour l’intégration exposomique-métabolomique. Extraction et synthèse de l’information méthodologique pertinente. Identification des forces et des limites des algorithmes et modèles.
2. Sélection, application et évaluation des modèles pour évaluer les liens entre les variables associées à l’‘exposome’, au ‘metabolome’ et les paramètres de santé, à partir d’une base de données réelle. Cette partie fera notamment appel à la mise en œuvre de démarches visant à intégrer et analyser simultanément plusieurs tableaux (K + 1) générées par plateformes de spectrométrie de masses. Des solutions mettant en œuvre des modèles multibloc ou des techniques d’intégration de tableaux multiples seront comparées par rapport à leur performance statistique, stabilité en cas de forte multi-colinéarité, capacité pour intégrer variables confondants et disponibilité des outils statistiques en code R pour l’application de routine en épidémiologie environnementale.
Les outils logiciels utilisés seront différents packages sous environnement R
Résultats attendus
- Revue structurée de modèles et algorithmes utilisés et potentiellement utiles pour intégrer des données métabolomiques et exposomiques en études épidémiologiques
- Identification des forces et des limites des modèles multiblocs et des lacunes dans la recherche pour guider les études futures.
- Fournir des lignes directrices pour l'utilisation et la mise en œuvre de certains modèles statistiques destinés aux utilisateurs.
- Mise en œuvre préliminaire de modèles sélectionnés à partir d’une base de données réelle et comparaison systématique de la performance statistique.

Encadrants (LABERCA): Dr. German Cano-Sancho / Dr. Jean-Philippe Antignac
Encadrantes (Stat-SC): Pr. Evelyne Vigneau / Dr. Véronique Cariou

Références
Ploteau, S., Cano-Sancho, G., et al. 2017. Associations between internal exposure levels of persistent organic pollutants in adipose tissue and deep infiltrating endometriosis with or without concurrent ovarian endometrioma. Environ Int 108, 195-203.
Cariou V., Qannari E.M., Rutledge D.N., Vigneau E. ComDim: From multiblock data analysis to path modeling. Food Quality and Preference 2018; 67: 27-34.
Bougeard S., Niang N., Verron T., Bry X. (2018). Current multiblock methods: Competition or complementarity? A comparative study in a unified framework. Chemometrics and Intelligent Laboratory Systems, 182, 131-148

Unité ONIRIS LABERCA (laberca.org)
Le Laboratoire d’Étude des Résidus et Contaminants dans les Aliments (LABERCA) est une Unité Mixte de Recherche de l’École Nationale Vétérinaire, Agroalimentaire et de l’Alimentation Nantes Atlantique (Oniris), dépendant du Ministère de l’Agriculture et de la Pêche. Le LABERCA est placé sous la tutelle de la Direction Générale de l’Enseignement et de la Recherche (DGER) et de l’Institut National de la Recherche Agronomique (INRA, département AlimH). Il est par ailleurs le Laboratoire National de Référence (LNR) de la Direction Générale de l’Alimentation (DGAl) en ce qui concerne l’analyse des dioxines, des polychlorobiphényles, des hydrocarbures aromatiques polycycliques et des promoteurs de croissance interdits (dont les hormones stéroïdes) en élevage. Du point de vue scientifique, le domaine d’activité général du laboratoire est celui de la sécurité de l’aliment, et plus précisément celui de l’étude des résidus et contaminants chimiques présents au sein de la chaîne alimentaire, dans une démarche globale d’appréciation du risque depuis l’agrofourniture jusqu’à l’Homme et sa descendance. Le LABERCA s’attache en effet à générer des données et des connaissances relatives aux sources, transferts et métabolismes des composés étudiés, afin de caractériser à la fois l’exposition (occurrence dans les denrées) et l’imprégnation (occurrence dans les fluides et tissus biologiques) des consommateurs vis-à-vis de ces polluants chimiques. Du point de vue analytique, les deux principaux domaines de compétence et de reconnaissance du LABERCA sont d’une part le traitement des échantillons biologiques complexes en vue de l’isolement des substances étudiées présentes au sein de ces matrices à l’état de trace, et d’autre part la mesure fine de ces composés par diverses techniques et couplages basés sur la spectrométrie de masse. Le parc instrumental du laboratoire compte parmi les plus remarquables en Europe dans le domaine de la spectrométrie de masse.

Unité Statistique, Sensométrie et Chimiométrie (Stat-SC) ONIRIS-INRA
L’unité de Statistique, Sensométrie et Chimiométrie d’Oniris est une unité sous contrat avec l’INRA. Elle compte aujourd’hui cinq enseignants-chercheurs et deux ingénieurs de recherche. Les thématiques de recherche de l’unité relèvent de la Statistique Appliquée notamment dans le cadre de la Sensométrie et la Chimiométrie. Elles ont trait à l’analyse de plusieurs tableaux de données (données de profils sensoriels, données de préférence, données biologiques, biochimiques, instrumentales…), la classification de variables (par exemple, segmentation d’un panel de consommateurs, réduction de la dimensionnalité d’un tableau de données), l’analyse des données de catégorisation perceptive notamment par des procédures de tri libre et l’analyse de données d’images hyperspectrales. L’unité de Statistique, Sensométrie et Chimiométrie a acquis, grâce à de nombreuses collaborations, une reconnaissance nationale et internationale dans ses domaines de compétence.

Equipe adhérente personne morale SFBI
Equipe Non adhérente