Découverte de modifications chimiques portées par les protéines : identification rapide de jeux de spectres de masse sans filtre de masse

Informations générales
Nom
David
Prénom
Matthieu
Diplôme
Thèse
Année
2019
Détails de la thèse/HDR
Jury
Frédérique LISACEK
Jean-François GIBRAT
Alain DENISE
Yves VANDENBROUCK
Hélène ROGNIAUX
Dominique Tessier
Guillaume Fertin
Directeur (pour les thèses)
Guillaume Fertin
Dominique Tessier
Résumé en français
Les protéines remplissent de nombreuses fonctions indispensables au développement et à la survie des organismes vivants. Leur étude est primordiale pour comprendre les mécanismes biologiques au sein des cellules. La technique la plus utilisée pour caractériser les protéines est la spectrométrie de masse en tandem qui produit des
dizaines de milliers de spectres expérimentaux par analyse. Pour interpréter ces spectres –c’est-à-dire retrouver et caractériser les protéines présentes dans le mélange analysé– la méthode la plus courante consiste à les comparer à une banque pouvant contenir des centaines de milliers de spectres "modèles". Pour accélérer l’analyse, la
majorité des approches limitent le nombre de comparaisons, limitation suspectée à l’origine de difficultés d’identification.
En effet, à l’issue d’une expérience de spectrométrie de masse, 50 à 75% des spectres demeurent aujourd’hui non identifiés.

Pour résoudre ces difficultés, nous avons conçu une méthode pour interpréter les spectres de masse sans filtre de la banque. Cette
méthode repose sur une structure de données, SpecTrees, qui permet une représentation compacte du nombre de masses
partagées entre chaque paire de spectres, et sur des algorithmes qui manipulent efficacement l’information contenue dans cette structure
de donnée. L’ensemble constitue le logiciel SpecOMS diffusé à la communauté. Nous discutons l’usage des différents paramètres de
notre méthode et la comparons à un autre algorithme performant.