Dynamique de helitrons dans le génome d’Arabidopsis thaliana : développement de nouvelles stratégies d’analyse des éléments transposables

Informations générales
Nom
Tempel
Prénom
Sébastien
Diplôme
Thèse
Année
2007
Détails de la thèse/HDR
Jury
Yves Bigot
Marie-France Sagot
Pierre CAPY
Pierre Rouzé
Directeur (pour les thèses)
Ivan Couée
Abdelhak El Amrani
Jacques Nicolas
Résumé en français
Les hélitrons constituent un groupe d’éléments transposables découverts récemment dans les génome eucaryotes. A travers une étude bioinformatique, nous avons étudié leur mode d’invasion, la modularité de leur séquence et leurs impacts sur les gènes à leur proximité dans le génome d’/Arabidopsis thaliana/. Les hélitrons sont les éléments transposables les plus répandus dans ce génome ; néanmoins ils ne sont que partiellement reconnus par des logiciels d’alignement. Nous avons modélisé ces éléments sous la forme d’une grammaire formelle. Cette grammaire est constituée des deux extrémités terminales séparées par une séquence nucléotidique quelconque de taille fixée. Nous avons créé une matrice d’occurrences des modèles associant toutes les combinaisons possibles d’extrémités. La matrice a fait apparaître des associations préférentielles entre certaines extrémités et a permis la découverte de nouvelles familles d’hélitrons chimériques. La détection des ORFs contenant les protéines de transposition a permis de confirmer la relation hélitron autonome non-autonome et de comprendre le mécanisme de création des chimères d’hélitrons. Nous avons proposé une nouvelle nomenclature des hélitrons basée sur leurs extrémités et non sur leur séquence globale. L’étude de la séquence d’une famille d’hélitrons a montré une réorganisation constante des domaines nucléiques entre les différentes copies de cette famille. Pour comprendre cette organisation, nous avons mis au point le logiciel DomainOrganizer qui permet d’observer la composition en domaines des éléments transposables. DomainOrganizer détecte les frontières entre domaines à partir d’un alignement multiple et crée la liste des domaines. A partir de cette liste, il recherche, par un algorithme d’optimisation combinatoire, le nombre minimal de domaines qui recouvrent au maximum l’ensemble des séquences. Enfin, DomainOrganizer visualise et classe les séquences en fonction de leurs domaines. L’analyse par domaines de la famille AtREP21 a permis de comprendre la nature de cette variabilité et de retracer l’histoire évolutive de cette famille à partir de l’identification des domaines. L’étude de la localisation des hélitrons AtREP3 dans ce génome de plante a montré une insertion préférentielle de ceux-ci dans les promoteurs de gènes. Les profils d’expression de ces gènes, nous a permis d’identifier plusieurs clusters. Par ailleurs, les motifs de régulation ont montré une grande variabilité de motifs dans les promoteurs mais pas dans les hélitrons. Ces résultats ont montré que les hélitrons non-autonomes transportent dans leurs séquences internes des motifs de liaisons aux facteurs de transcription. Des analyses complémentaires devront être réalisées pour comprendre l’action régulatrice des hélitrons sur les gènes situés à leur proximité.