SVM multiclasses, théorie et applications

Informations générales
Nom
Guermeur
Prénom
Yann
Diplôme
HDR
Année
2007
Détails de la thèse/HDR
Jury
Stéphane Boucheron
François Denis
Olivier Gascuel
Patrick Gallinari
Jean-Paul Haton
Michèle Sebag
Karl Tombre
Résumé en français
Les machines à vecteurs support (SVM) sont des modèles de l’apprentissage automatique qui font actuellement l’objet de nombreux travaux de recherche, ceci pour deux raisons principales : d’une part, leurs performances constituent l’état de l’art dans de multiples domaines de la reconnaissance des formes, d’autre part, elles possèdent des propriétés statistiques remarquables. Le premier modèle de SVM proposé par Vapnik et ses co-auteurs calcule des dichotomies. Il peut être utilisé pour effectuer des tâches de discrimination à catégories multiples, dans le cadre de l’application de méthodes de décomposition. Des SVM multi-classes ont également été proposées dans la littérature, parmi lesquelles nous distinguons celles qui s’appuient sur un modèle affine multivarié, que nous nommons M-SVM.
 
Ce mémoire se présente comme une étude synthétique de la discrimination à catégories multiples au moyen de SVM. Il se concentre plus particulièrement sur l’analyse des M-SVM.
 
Le chapitre deux est consacré à la description des SVM multi-classes, à leur mise en oeuvre et à l’analyse de leurs performances. Nous présentons successivement le cadre théorique de leur étude, les différents modèles, une étude théorique de leurs performances en généralisation, leur programmation ainsi que les différentes méthodes de sélection de modèle qui leur sont dédiées.
 
Le chapitre trois décrit une application de la M-SVM de Weston et Watkins en biologie structurale prédictive. Le problème traité est la prédiction de la structure secondaire des protéines globulaires.