Connexion/Inscription
  • Créer un nouveau compte
  • Demander un nouveau mot de passe
Accueil
Société Française de Bio-Informatique
[Skip Header and Navigation] [Jump to Main Content]
  • Accueil
  • La SFBI
    • Conseil
    • Statuts
    • Adhésion
    • Paiement en ligne
  • Équipes Françaises
  • Éq. fr. (ancienne version)
  • Formations
    • Formations universitaires
      • DUT
      • Licences
      • Masters
    • Formations permanentes
    • Supports de cours
  • Emplois
    • Rechercher/filtrer
    • CDI
      • PR
      • MdC
      • CR
      • IR
      • IE
      • CDI autres
    • CDD
      • Post-doc / IR
      • IE
      • ATER
      • CDD autres
    • Thèses
    • Stages
  • Thèses
    • Thèses 2012
    • Thèses 2011
    • Thèses 2010
    • Thèses 2009
    • Thèses 2008
    • Thèses 2007
    • Thèses 2006
    • Thèses 2005
  • HDR
  • Ouvrages
  • JOBIM
  • Groupes de travail
  • Événements
  • Calendrier
  • Liens
  • Listes de diffusion
    • Archives
    • Inscription liste bioinfo
  • Recherche
  • Mentions légales
  • Aide

Communauté

  • Groupes
  • Forums
Accueil » Biblio

Modèles à variables latentes pour des données issues de tiling arrays. Applications aux expériences de ChIP-chip et de transcriptome

TitreModèles à variables latentes pour des données issues de tiling arrays. Applications aux expériences de ChIP-chip et de transcriptome
Type de publicationThèse
Nouvelles publications2011
AuteursBérard, Caroline
DirecteursRobin, Stéphane, Martin-Magniette Marie-Laure
RapporteursBesse, Philippe, Celeux Gilles
ExaminateursAmbroise, Christophe, Boulesteix Anne-Laure, Journot Laurent, Aubourg Sébastien
Université et/ou école doctoraleAgroParisTech
DiplômeDoctorat
RésuméLes puces tiling arrays sont des puces à haute densité permettant l’exploration des génomes à grande échelle. Elles sont impliquées dans l’étude de l’expression des gènes et de la détection de nouveaux transcrits grâce aux expériences de transcriptome, ainsi que dans l’étude des mécanismes de régulation de l’expression des gènes grâce aux expériences de ChIP-chip. Dans l’objectif d’analyser des données de ChIP-chip et de transcriptome, nous proposons une modélisation fondée sur les modèles à variables latentes, en particulier les modèles de Markov cachés, qui sont des méthodes usuelles de classification non supervisée. Les caractéristiques biologiques du signal issu des puces tiling arrays telles que la dépendance spatiale des observations le long du génome et l’annotation structurale sont intégrées dans la modélisation. D’autre part, les modèles sont adaptés en fonction de la question biologique et une modélisation est proposée pour chaque type d’expériences. Enfin, une modélisation semi-paramétrique autorisant des distributions plus flexibles pour la loi d’émission est envisagée. Dans un objectif de classification, nous proposons un contrôle de faux-positifs dans le cas d’une classification à deux groupes et pour des observations indépendantes. Puis, nous nous intéressons à la classification d’un ensemble d’observations constituant une région d’intérêt, telle que les gènes. Les différents modèles sont illustrés sur des jeux de données réelles de ChIP-chip et de transcriptome issus d’une puce NimbleGen couvrant le génome entier d’Arabidopsis thaliana.
English AbstractTiling arrays make possible a large scale exploration of the genome with high resolution. Biological questions usually addressed are either the gene expression or the detection of transcribed regions which can be investigated via transcriptomic experiments, and also the regulation of gene expression thanks to ChIP-chip experiments. In order to analyse ChIP-chip and transcriptomic data, we propose latent variable models, especially Hidden Markov Models, which are part of unsupervised classification methods. The biological features of the tiling arrays signal, such as the spatial dependence between observations along the genome and structural annotation are integrated in the model. Moreover, the models are adapted to the biological question at hand and a model is proposed for each type of experiment. Finally, a semi-parametric modeling is considered, allowing more flexible emission distributions. With the objective of classification, we propose a false-positive control in the case of a two-cluster classification and for independent observations. Then, we focus on the classification of a set of observations forming a region of interest such as a gene. The different models are illustrated on real ChIP-chip and transcriptomic datasets coming from a NimbleGen tiling array covering the entire genome of Arabidopsis thaliana.
  • Google Scholar

© SFBI, 2012 - Réalisation du site : Valentin Guignon, administration du site : Pierre Tufféry, directrice de publication : Sophie Schbath.

[Jump to Top] [Jump to Main Content]