Identification, annotation et analyse des éléments transposables dans le génome du palmier à huile E. guineensis

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

CIRAD Avenue d’Agropolis
34398 Montpellier 5
France

Contacts
David Lopez
Estelle Jaligot
Romain Guyot
Email du/des contacts
david.lopez@cirad.fr
estelle.jaligot@cirad.fr
romain.guyot@ird.fr
Description

Identification, annotation et analyse des éléments transposables dans le génome du palmier à huile E. guineensis
Laboratoire d’accueil :

1. CIRAD, UMR AGAP ; David Lopez david.lopez@cirad.fr, Estelle Jaligot estelle.jaligot@cirad.fr
2. IRD centre de Montpellier, UMR DIADE, Romain Guyot, romain.guyot@ird.fr;

Mots clés : Génomique évolutive et structurale, bio-informatique, éléments transposables, palmier à huile.
Résumé du sujet : Les éléments transposables (ET) constituent la majeure partie des génomes des végétaux, jusqu’à plus de 80% dans les génomes des céréales. Ils sont capables d’amplifier leur nombre de copies, de créer des mutations via de nouvelles insertions génomiques et de perturber ou réguler la fonction des gènes. Mais ils ont aussi un rôle dans la structure des chromosomes et des centromères. Il existe deux grands types d’éléments transposables, les transposons (ou classe 2) qui sont mobiles via une molécule à ADN et les rétrotransposons (ou classe 1) qui sont mobiles via une molécule à ARN. Ces derniers ont une structure proche de celle des rétrovirus et ils représentent la majeure partie des ET dans les génomes des plantes. Leur identification, annotation et analyse demeurent un défi dans les génomes de grande taille. Plusieurs méthodologies bio-informatiques ont été développé pour leur identification et leur annotation : (i) de novo, via l’identification des régions répétées du génome (REPET : https://urgi.versailles.inra.fr/Tools/REPET), (ii) basée sur la structure spécifique des ET (LTR_retriever, EDTA, …) et (iii) basée sur une approche par similarité avec des bases de séquences de références. Les annotations les plus fiables intègrent ces trois approches.
Le palmier à huile (Elaeis guineensis Jacq.) est une culture importante et la première source d'huile végétale comestible au monde. Le genre Elaeis comprend deux espèces E. guineensis, (Africain) et E. oleifera (néo tropique). Le génome de E. guineensis a été publié en 2013 (génome MPOP, http://genomsawit.mpob.gov.my). Bien que partiel, ce génome a permis une première annotation des rétrotransposons en 2015. Un nouveau génotype du palmier à huile a été séquencé et assemblé. Ce génome est disponible dans le cadre de cette étude pour une annotation et une analyse exhaustive des ET afin de comprendre la composition, la structure et l'évolution de ce génome.

Objectifs : Ce projet a donc pour objectif d’étudier la composition et la structure du génome du palmier à huile via l'annotation de leurs séquences répétées. A travers ce projet, votre rôle sera de :
(i) Procéder à la classification des ET, et plus particulièrement de caractériser la diversité et l’évolution d’un groupe particulier : les rétrotransposons à LTR qui composent la majorité du génome
(ii) Déterminer la composition du génome en différentes classes d’ET
(iii) Définir la distribution de ces ET le long des chromosomes, à l’intérieur ou au voisinage des gènes
(iv) Étudier la dynamique d’insertion et l’expression
(v) Proposer des chaines de traitements automatiques d’analyse des ET

Méthodes : Ce projet s’appuiera sur une nouvelle version du génome du palmier à huile disponible pour cette étude. Vous serez en charge du traitement bio-informatique et analytique des séquences. L’identification et l’annotation des ET sera conduites sur un cluster de calcul par l’utilisation de pipelines (REPET, EDTA). La classification détaillée sera conduite avec Inpactor pour les rétrotransposons à LTR. Vous analyserez enfin la dynamique d’insertion de ces éléments et leur relation avec les régions codantes.

Profil du candidat : Niveau souhaité : Master 1 ou 2 ou équivalent. Formation en bio-informatique / analyse computationnelle avec une compétence en programmation. Une expérience préalable à l’utilisation de clusters de calculs est conseillée. Durée de stage : 4-6 mois, début février-mars 2021.

Références bibliographiques :
Orozco-Arias, S.; Isaza, G.; Guyot, R. Retrotransposons in Plant Genomes: Structure, Identification, and Classification through Bioinformatics and Machine Learning. Int. J. Mol. Sci. 2019, 20, 3837.
Singh, R., Ong-Abdullah, M., Low, ET. et al. Oil palm genome sequence reveals divergence of interfertile species in Old and New worlds. Nature 500, 335–339 (2013).
Beulé T, Agbessi MD, Dussert S, Jaligot E, Guyot R. Genome-wide analysis of LTR-retrotransposons in oil palm. BMC Genomics. 2015 Oct 15;16:795.
Ou, S., Su, W., Liao, Y. et al. Benchmarking transposable element annotation methods for creation of a streamlined, comprehensive pipeline. Genome Biol 20, 275 (2019).
Orozco-Arias S, Liu J, Tabares-Soto R, Ceballos D, Silva Domingues D, Garavito A, Ming R, Guyot R. Inpactor, Integrated and Parallel Analyzer and Classifier of LTR Retrotransposons and Its Application for Pineapple LTR Retrotransposons Diversity and Dynamics. Biology (Basel). 2018 May 25;7(2):32.

Equipe adhérente personne morale SFBI
Equipe Non adhérente