Approches in silico de l'impact des éléments transposables sur la régulation de l'expression des gènes

Informations générales
Nom
Jouffroy
Prénom
Ophélie
Diplôme
Thèse
Année
2018
Détails de la thèse/HDR
Université
Jury
Cristina VIEIRA - HEDDI
François SABOT
Karine ALIX
Josep CASACUBERTA
Directeur (pour les thèses)
Florian MAUMUS
Hadi QUESNEVILLE
Ecole Doctorale (pour les thèses)
Résumé en français
Les génomes de plantes sont peuplés de différents types d’éléments répétés, notamment des éléments transposables (ET) et des séquences satellites (simple sequence repeats, SSRs) qui peuvent avoir un impact important sur la taille et la dynamique du génome, ainsi que sur la régulation de la transcription génique. Au moins les deux-tiers du génome de la tomate sont composés de répétitions. Bien que leur impact global sur l’organisation du génome ait été largement révélé par l’assemblage du génome entier, leur influence sur la biologie et le phénotype de la tomate reste largement sans réponse. Plus spécifiquement, les effets et les rôles des répétitions de l’ADN sur la maturation des fruits charnus, processus complexe présentant un intérêt agro-économique essentiel, doivent encore être étudiés de manière approfondie et la tomate est sans aucun doute un excellent modèle pour cette étude. Nous avons réalisé une annotation complète du repeatome de la tomate pour explorer son impact potentiel sur la composition du génome de la tomate et la transcription des gènes. Nos résultats montrent que le génome de la tomate peut être fractionné en trois compartiments avec une densité de gènes et de répétitions différente, chaque compartiment présentant une composition répétée et génique contrastée, des associations gènes-répétitions et des niveaux transcriptionnels des gènes différents. Dans le contexte de la maturation des fruits, nous avons constaté que des répétitions sont présentes dans la majorité des régions méthylées différentiellement (differentially methylated regions, DMRs) et que des milliers de DMRs associées à des répétitions se trouvent à proximité des gènes, y compris des centaines qui sont différentiellement régulés durant ce processus. De plus, nous avons constaté que des répétitions sont également présentes à proximité des sites de liaison de la protéine clé de maturation RIN. Nous avons également observé que certaines familles de répétitions sont présentes à une fréquence élevée inattendue à proximité des gènes exprimés de manière différentielle au cours de la maturation de la tomate. Compte tenu du lien entre ces différentes entités, nous nous sommes demandé s’il était possible que certains éléments transposables du génome de la tomate aient été sélectionnés au cours de l’évolution pour leur impact sur le génome. Nous avons donc développé une série d’analyses afin d’essayer de détecter in silico de tels éléments. Les familles d’éléments ainsi sélectionnées sont alors au nombre de 36, et certaines se trouvent associées à des fonctions de gènes particulières. Des analyses plus fines des séquences pourraient alors potentiellement permettre de mettre en évidence des motifs d’intérêt, notamment pour la régulation transcriptionnelle des gènes.
Résumé en anglais
Plant genomes are populated by different types of repetitive elements including transposable elements (TEs) and simple sequence repeats (SSRs) that can have a strong impact on genome size and dynamic as well as on the regulation of gene transcription. At least two-thirds of the tomato genome is composed of repeats. While their bulk impact on genome organization has been largely revealed by whole genome assembly, their influence on tomato biology and phenotype remains largely unaddressed. More specifically, the effects and roles of DNA repeats on the maturation of fleshy fruit, which is a complex process of key agro-economic interest, still needs to be investigated comprehensively and tomato is arguably an excellent model for such study. We have performed a comprehensive annotation of the tomato repeatome to explore its potential impact on tomato genome composition and gene transcription. Our results show that the tomato genome can be fractioned into three compartments with different gene and repeat density, each compartment presenting contrasting repeat and gene composition, repeat-gene associations and different gene transcriptional levels. In the context of fruit ripening, we found that repeats are present in the majority of differentially methylated regions (DMRs) and thousands of repeat associated DMRs are found in the proximity of genes, including hundreds that are differentially regulated during this process. Furthermore, we found that repeats are also present in the proximity of DNA binding sites of the key ripening protein RIN. We also observed that some repeat families are present at unexpected high frequency in the proximity of genes that are differentially expressed during tomato ripening. Given the link between these different entities, we wondered whether it was possible that some transposable elements of the tomato genome were selected during evolution for their impact on the genome. To address this question, we have developed a series of analyzes to try to detect in silico such elements. A total of 36 transposable elements families were found to present empirical properties of selection, and some are associated with particular gene functions. More refined analyzes of the sequences could then potentially make it possible to discover motifs of interest, in particular for the transcriptional regulation of genes.