Connexion/Inscription
  • Créer un nouveau compte
  • Demander un nouveau mot de passe
Accueil
Société Française de Bio-Informatique
[Skip Header and Navigation] [Jump to Main Content]
  • Accueil
  • La SFBI
    • Conseil
    • Statuts
    • Adhésion
    • Paiement en ligne
  • Équipes Françaises
  • Éq. fr. (ancienne version)
  • Formations
    • Formations universitaires
      • DUT
      • Licences
      • Masters
    • Formations permanentes
    • Supports de cours
  • Emplois
    • Rechercher/filtrer
    • CDI
      • PR
      • MdC
      • CR
      • IR
      • IE
      • CDI autres
    • CDD
      • Post-doc / IR
      • IE
      • ATER
      • CDD autres
    • Thèses
    • Stages
  • Thèses
    • Thèses 2012
    • Thèses 2011
    • Thèses 2010
    • Thèses 2009
    • Thèses 2008
    • Thèses 2007
    • Thèses 2006
    • Thèses 2005
  • HDR
  • Ouvrages
  • JOBIM
  • Groupes de travail
  • Événements
  • Calendrier
  • Liens
  • Listes de diffusion
    • Archives
    • Inscription liste bioinfo
  • Recherche
  • Mentions légales
  • Aide

Communauté

  • Groupes
  • Forums
Accueil » Biblio

Modélisation et résolution par coopération de métaheuristiques : de l'atome à la séquence protéique

TitreModélisation et résolution par coopération de métaheuristiques : de l'atome à la séquence protéique
Type de publicationThèse
Nouvelles publications2008
AuteursBoisson, Jean-Charles
DirecteursTalbi, El-Ghazali, Jourdan Laetitia
RapporteursHao, Jin-Kao, Bouvry Pascal
ExaminateursBlossey, Ralph, Tufféry Pierre
Université et/ou école doctoraleUniversité des Sciences et Technologies de Lille
DiplômeDoctorat
Résumé

Modelling and solving with cooperative metaheuristics: from the atom to the protein sequence mobility

 

In this thesis, we show the importance of the modelling and the cooperation of metaheuristics for solving real problems in Bioinformatics. Two problems are studied: the first in the Proteomics domain for the protein identification from spectral data analysis and the second in the domain of the structural analysis of molecules for the flexible molecular docking problem.

For the first problem, a new model has been designed based on a direct comparison of a raw experimental spectrum with protein from databases. This model has been included in an identification engine by peptide mass fingerprinting called ASCQ_ME. From this model, an approach for the de novo protein sequencing problem has been proposed and validated. In this problem, a protein sequence has to be found with only spectral information. Our model is a three step approach called SSO for "Sequence", "Shape" and "Order". After a study of each step, SSO has been implemented and tested with three metaheuristics collaborating sequentially.

For the second problem, a study of new multi-objective models has been made and has allowed to design eight different models tested with parallel multi-objective genetic algorithms. Twelve configurations of genetic operators has been tested in order to prove the efficiency of the

hybridizing of genetic algorithms with local searches. For each part of this work, the ParadisEO platform has been used and more particularly the ParadisEO-MO part dedicated to single solution based metaheuristics for which we have substantially contributed. All this work has been funded by the PPF Bio-Informatique of the Université des Sciences et Technologies de Lille and by the ANR Dock project.

English Abstract

A travers cette thèse, nous montrons l'importance de la modélisation et de la coopération de métaheuristiques pour la résolution de problèmes réels en bioinformatique. Pour ce faire, deux problèmes ont été étudiés : le premier dans le domaine de la protéomique pour l'identification de protéines à partir de données spectrales et le second dans le domaine de l'analyse structurale des molécules pour le problème du docking moléculaire flexible. Pour le premier problème, un nouveau modèle basé sur une comparaison directe des bases de données protéiques avec les données expérimentales brutes a été mise en place. L'approche associée a été intégrée au sein d'un moteur d'identification par empreinte de masse peptide appelé ASCQ_ME. Ce modèle d'identification a permis ensuite de proposer et de valider une modélisation pour le problème de de novo protein sequencing qui consiste à retrouver la séquence d'une protéine à partir seulement des données expérimentales. Il s'agit d'un modèle en trois étapes appelé SSO pour "Sequence", "Shape" et "Order". Après une étude de chacune de ces étapes, SSO a été implémenté et testé à travers trois métaheuristiques collaborant de manière séquentielle. Pour le second problème, une étude des nouvelles modélisations multi-objectif a été menée et a conduit à la définition d'un ensemble de huit modèles différents testés à l'aide d'algorithmes génétiques multi-objectif parallèles. Une douzaine de configuration d'opérateurs génétiques ont été testé afin de mettre en évidence l'efficacité de l'hybridation des algorithmes génétiques avec des recherches locales. Pour chacune des parties, l'implémentation et la mise en place des collaborations fut possible grâce à la plateforme ParadisEO et notamment grâce à nos contributions à la partie ParadisEO-MO dédiée aux métaheuristiques à base de solution unique. L'ensemble de ces travaux a été soutenu par le PPF Bio-Informatique de l'Université des Sciences et Technologies de Lille et le projet ANR Dock.

  • Google Scholar

© SFBI, 2012 - Réalisation du site : Valentin Guignon, administration du site : Pierre Tufféry, directrice de publication : Sophie Schbath.

[Jump to Top] [Jump to Main Content]