Mots-Clés
UHPLC–HRMS
UPLC–IMS–HRMS
High-resolution mass spectrometry
Micropolluants émergents
Métabolomique
Non-Targeted-Screening
Antibiorésistance
Description
Contexte
Les approches analytiques de type ciblé, largement utilisées en spectrométrie de masse pour l’évaluation de la contamination chimique, reposent sur la quantification d’une liste restreinte de composés d’intérêt, principalement des résidus pharmaceutiques, des biocides ou des métaux lourds connus pour exercer une pression de sélection sur les communautés microbiennes. Bien que robustes et sensibles, ces stratégies ciblées limitent l’exploration à des polluants préalablement identifiés et ne permettent pas de détecter des composés émergents ou inattendus [Hollender et al., 2017].
À l’inverse, l’analyse non-ciblée par UHPLC–HRMS (Ultra High Performance Liquid Chromatography - High Resolution Mass Spectrometry) offre une couverture beaucoup plus large du spectre chimique, en enregistrant l’ensemble des signaux détectables dans un échantillon donné [Schymanski et al., 2014, Hernandez et al., 2012]. Cette stratégie ouvre la possibilité d’identifier de nouveaux micropolluants susceptibles d’agir comme co-sélecteurs de l’antibiorésistance. Toutefois, son application reste limitée par plusieurs verrous méthodologiques qui affectent la robustesse et la comparabilité des résultats.
(I) Prétraitement et curation. La gestion du bruit de fond, la soustraction des blancs et la normalisation sont indispensables pour constituer des jeux de données fiables, mais elles souffrent encore de l’absence de standards partagés [Renner and Reuschenbach, 2023].
(II) Détection et alignement des features. Étapes sensibles aux variations instrumentales et aux choix algorithmiques ; des comparaisons entre XCMS, MZmine et OpenMS montrent des divergences pouvant entraîner des faux positifs ou négatifs [Li et al., 2023, Aigensberger et al., 2025]. Des approches récentes (p. ex. alignement fondé sur l’apprentissage profond) sont prometteuses, mais encore peu diffusées [Liu et al., 2023].
(III) Automatisation et visualisation. Le manque d’outils intégrés pour automatiser la chaîne et visualiser les sorties complique l’audit des étapes et la reproductibilité.
(IV) Évaluation de la qualité (Quality Assurance / Quality Control). Un enjeu transversal est la définition de métriques objectives pour évaluer la qualité des traitements de données et orienter les choix méthodologiques [Broadhurst et al., 2018, Evans et al., 2020]. À titre d’exemples : stabilité des features dans les QC (%CV), taux de redétection sur réplicas, rapport signal/blanc (blank ratio), précision de masse et résidus de dérive RT (Retention Time) après correction, taux de valeurs manquantes, cohérence isotopique/adduits, concordance inter-logiciels, et, lorsque possible, sensibilité/spécificité vis-à-vis de composés standards.
Dans le cadre du projet ChemBiodiv, une première chaîne de traitement numérique a été développée [Sade et al., 2024]. Le stage proposé s’inscrit dans la continuité de ces travaux et visera à optimiser le prétraitement et la détection des features dans les données UPLC–IMS–HRMS (Ultra Performance Liquid Chromatography - Ion Mobility Spectrometry - High Resolution Mass Spectrometry), tout en instrumentant des tableaux de bord QA/QC et des outils d’automatisation et de visualisation, afin de produire des jeux de données robustes et reproductibles, exploitables pour l’intégration avec les volets microbiologiques du projet.
Objectifs
Le ou la stagiaire aura pour missions principales :
-
Prétraitement et curation des données : normaliser les données et gérer le bruit de fond afin de constituer des jeux de données robustes.
-
Détection de pics (peak picking) : comparer, implémenter et optimiser différents algorithmes de détection de pics sur les données UPLC–IMS-HRMS à l’aide de logiciels libres (p. ex. XCMS, OpenMS, MZmine).
-
Automatisation et visualisation des analyses : contribuer au développement d’outils pour automatiser la chaîne de traitement et visualiser les résultats.
-
Évaluation de la qualité (QA/QC) : évaluer la qualité des traitements de données à l’aide de métriques (stabilité des features dans les QC, rapport signal/blanc, taux de redétection, précision de masse, correction de la dérive RT, valeurs manquantes, concordance inter-logiciels) afin de comparer les pipelines et d’identifier les configurations les plus performantes.
Profil recherché
Ce stage s’adresse à un·e étudiant·e en Master 2 ou en 3e année d’école d’ingénieur, en informatique, bioinformatique, data science ou dans un domaine équivalent.
-
Compétences solides en programmation (Python et/ou R a minima) pour l’analyse de données (une expérience avec des outils de bioinformatique ou de chémoinformatique serait un plus).
-
Goût prononcé pour la data science (statistiques multivariées, analyse exploratoire de données, visualisation).
-
Intérêt pour les questions environnementales.
-
Autonomie, rigueur et curiosité scientifique.
Références
-
Hollender J., Schymanski E. L., Singer H. P., Ferguson P. L. Nontarget screening with high resolution mass spectrometry in the environment: ready to go ? 2017.
-
Schymanski E. L., Singer H. P., Longrée P., Loos M., Ruff M., Stravs M. A., Ripollés Vidal C., Hollender J. Strategies to characterize polar organic contamination in wastewater: exploring the capability of high resolution mass spectrometry. Environmental Science & Technology. 2014;48(3):1811–1818.
-
Hernandez F., Sancho J. V., Ibáñez M., Abad E., Portolés T., Mattioli L. Current use of high-resolution mass spectrometry in the environmental sciences. Analytical and Bioanalytical Chemistry. 2012;403(5):1251–1264.
-
Renner G., Reuschenbach M. Critical review on data processing algorithms in non-target screening: challenges and opportunities to improve result comparability. Analytical and Bioanalytical Chemistry. 2023;415(18):4111–4123.
-
Li S., Siddiqa A., Thapa M., Chi Y., Zheng S. Trackable and scalable LC–MS metabolomics data processing using asari. Nature Communications. 2023;14(1):4113.
-
Aigensberger M., Bueschl C., Castillo-Lopez E., Ricci S., Rivera-Chacon R., Zebeli Q., Berthiller F., Schwartz-Zimmermann H. E. Modular comparison of untargeted metabolomics processing steps. Analytica Chimica Acta. 2025;1336:343491.
-
Liu Y., Yang Y., Chen W., Shen F., Xie L., Zhang Y., Zhai Y., He F., Zhu Y., Chang C. DeepRTalign: toward accurate retention time alignment for large cohort mass spectrometry data analysis. Nature Communications. 2023;14:8188. doi:10.1038/s41467-023-43909-5.
-
Broadhurst D., Goodacre R., Reinke S. N., Kuligowski J., Wilson I. D., Lewis M. R., Dunn W. B. Guidelines and considerations for the use of system suitability and quality control samples in mass spectrometry assays applied in untargeted clinical metabolomic studies. Metabolomics. 2018;14(6):72. doi:10.1007/s11306-018-1367-3.
-
Evans A. M., O’Donovan C., Playdon M., Beecher C., Beger R. D., Bowden J. A., Broadhurst D., Clish C. B., Dasari S., Dunn W. B., Griffin J. L., Hartung T., Hsu P.-C., Huan T., Jans J., Jones C. M., Kachman M., Kleensang A., Lewis M. R., Monge M. E., Mosley J. D., Taylor E., Tayyari F., Theodoridis G., Torta F., Ubhi B. K., Vuckovic D. Dissemination and analysis of the quality assurance (QA) and quality control (QC) practices of LC–MS based untargeted metabolomics practitioners. Metabolomics. 2020;16(10):113. doi:10.1007/s11306-020-01728-5.
-
Sade J., Guérin S., Mottelet S., Rocher V., Moilleron R., Le Roux J. A data analysis pipeline integrating ion mobility and high-resolution mass spectrometry for non-target screening in environmental studies. In: SETAC Europe 34 – Society of Environmental Toxicology and Chemistry; 2024.