Apprentissage de réseaux de régulation génétique à partir de données d’expression

Informations générales
Nom
Elati
Prénom
Mohamed
Diplôme
Thèse
Année
2007
Détails de la thèse/HDR
Jury
Jean-François Boulicaut
Jean-Daniel Zucker
Florence d’Alché-Buc
Younès Bennani
Amedeo Napoli
François Radvanyi
Directeur (pour les thèses)
Céline Rouveirol
Résumé en français
Dans la foulée du séquençage de génomes complets (la génomique), la conception et l’exploitation de nouvelles approches expérimentales à haut débit (la post-génomique) ouvrent la voie à un nouveau domaine pluridisciplinaire, la biologie des systèmes qui s’intéresse entre autres à caractériser les liens entre objets biologiques participant à une même fonction. L’apprentissage automatique offre pour cette problématique un cadre à la fois théorique et méthodologique. Dans cette thèse, nous abordons l’inférence de structures de réseaux de régulation génétique. Sur la base de jeux de données de transcriptome, il s’agit d’inférer les mécanismes de régulation sous-jacents : connaître, pour chaque gène et dans un contexte cellulaire donné, les facteurs de transcription régulant son expression, et surtout quels sont les modes de coopération/concurrence qui opèrent lorsque plusieurs régulateurs agissent sur un même gène cible. Pour répondre à ce problème, nous avons proposé une méthode originale baptisé LICORN (LearnIng CoOperative Regulation Networks), capable d’apprendre des réseaux locaux de régulation coopérative et alternative aux approches globales majoritairement utilisées dans le domaine. Nous avons développé un processus complet d’extraction de connaissances autour de LICORN incluant un module de validation statistique et de croisement des réseaux inférés avec des informations biologiques déjà connues. Nous avons également développé un système d’extraction de modules de gènes afin d’évaluer la pertinence des réseaux obtenus et de mieux exploiter les résultats appris par notre système. LICORN a été évalué et validé en premier lieu sur la levure, l’organisme eucaryote le plus simple et donc le mieux connu, et puis sur des données de transcriptome d’un organisme plus complexe, l’homme.