Cartographie des connaissances : l’intégration et la visualisation au service de la biologie.

Informations générales
Nom
Jalabert
Prénom
Fabien
Diplôme
Thèse
Année
2007
Détails de la thèse/HDR
Jury
Christine Froidevaux
Guy Perrière
Yvon Cayre
Christophe Roche
Thérèse Libourel
Isabelle Mougenot
Directeur (pour les thèses)
Michel Crampes
Vincent Derozier
Sylvie Ranwez
Résumé en français
Ce mémoire s’inscrit dans un axe stratégique du groupement des écoles des Mines : GEMBio. Dans ce contexte, plusieurs collaborations ont été initiées, notamment avec des chercheurs de l’Institut Pasteur de Paris, de l’INSERM/Hôpitaux de Paris, et du CEA dans le cadre du programme ToxNuc-e. De ces échanges, est née notre problématique. Plus d’un millier de bases de données biologiques sont disponibles en ligne. Leur exploitation et le croisement de leurs contenus entraînent ce constat des chercheurs biologistes : « J’ai souvent une vingtaine de fenêtres ouvertes sur mon écran : je m’y perds ». Souvent l’analyse et le croisement des données est fait par simple copier-coller dans un tableur.
 
Si l’intégration de données à apporté des solutions ponctuelles à des problèmes particuliers, elle ne propose pas pour autant une réponse concrète à la multiplicité des fenêtres pour l’utilisateur, à la surcharge d’information, et à la difficulté de croiser l’information provenant de plusieurs sources hétérogènes.
 
Nous proposons un environnement de cartographie des connaissances biologiques qui facilite l’intégration et la visualisation des données biologiques. Basé sur un métamodèle simple de graphe, I2DEE (Integrated and Interactive Data Exploration Environment) se veut souple et extensible afin de répondre aux besoins des différentes approches existantes de l’intégration. Il permet un accès homogène aux principales ressources biologiques et son adaptabilité offre des réponses visuelles personnalisées à des tâches spécifiques.
 
Après une analyse des besoins des chercheurs biologistes et l’identification des problématiques de traitement de l’information sous-jacentes, un état de l’art de l’intégration de données hétérogènes est présenté. L’approche proposée reprend les principes existants en architecture des IHM et en cartographie géographique. L’environnement I2DEE est alors présenté à partir de son architecture et son métamodèle. Deux modules de l’environnement sont détaillés : l’entrepôt de données biologiques et la boîte à outils graphiques permettant de construire rapidement des applications adaptées. Des résultats ont été obtenus dans deux contextes applicatifs distincts : l’ingénierie terminologique et ontologique, et l’analyse de données d’expression de gènes issues de puces à ADN.
 
Ils sont discutés et analysés en regard des objectifs initialement fixés.