Doctorat - Reconstruction de l’évolution des répertoires d’exons chez les eucaryotes

 CDD · Thèse  · 36 mois    Bac+5 / Master   Complex Systems and Translational Bionformatics Team (CSTB) - Laboratoire ICube UMR7357 · Strasbourg (France)  2300 € brut/mois

 Date de prise de poste : 1 octobre 2026

Mots-Clés

génomique évolution exons introns

Description

French version - English below

[FR] Reconstruction de l’évolution des répertoires d’exons chez les eucaryotes

Résumé du projet

Les gènes eucaryotes sont composés de deux catégories d’éléments : les exons, inclus dans les ARN matures et les introns qui sont les régions séparant ces exons. Introns et exons sont initialement transcrits ensemble, et les introns sont excisés durant le phénomène d’épissage. L’épissage est soumis à des mécanismes de régulations qui rendent possible la maturation d’ARN différents à partir d’un même gène, de plusieurs transcrits différents, dans un processus d’épissage alternatif. Malgré le rôle des structures intron-exon dans la régulation des processus moléculaires eucaryotes, les mécanismes régissant l’évolution de ces structures sont encore peu connus.
Les études portant sur la composition en exon-intron à l’échelle du génome favorisent l’hypothèse d’un génome eucaryote ancestral riche en introns et une tendance globale à la réduction de leur nombre au cours de l’évolution, ponctuée par des événements d’expansion rapide. Il existe cependant peu de données sur les mécanismes évolutifs sous-tendant la réduction du nombre d’introns à l’échelle des gènes, ni comment cela affecte la composition en domaines des protéines correspondantes. L’accroissement du nombre de génomes de bonne qualité rend aujourd’hui possible l’étude de l’évolution des exons à une résolution plus fine que précédemment.
L’objectif de ce projet est de concevoir une méthode à large échelle d’inférence d’homologie entre exons. Cette méthode sera utilisée pour caractériser à l’échelle des répertoires de gènes entiers des eucaryotes, l’évolution des structures de gènes et les mécanismes mis en cause dans l’évolution des structures exoniques. Ces reconstructions évolutives serviront de source de données de référence pour améliorer l’annotation des structures de gènes chez les eucaryotes.

Le 1er axe du projet concerne le développement d’une méthode bioinformatique de comparaison d’exons entre gènes homologues. Elle s’appuiera sur les données OrthoInspector, une base de données d’orthologie entre gènes développée dans l’équipe d’accueil. La méthode exploitera des comparaisons de séquences entre gènes homologues pour définir les relations d’homologie entre leurs exons et la nature de ces relations. L’approche développée s’inspirera des méthodes de l’état de l’art, avec pour objectif de les étendre aux groupes hiérarchiques d’orthologues. La reconstruction évolutive ainsi obtenue sera mise à disposition dans une base de données publique et servira à décrire avec précision les mécanismes mis en jeu dans la réorganisation des structures introns-exons.

Le 2nd axe vise à exploiter les résultats des reconstructions évolutives pour affiner la qualité des annotations structurales de gènes des génomes eucaryotes. L’étudiant(e) développera une méthode d’évaluation de la qualité des annotations des structures de gènes, étendant et complétant les méthodes d’évaluation de qualité des répertoires de gènes existantes comme OMArk. Les groupes d’exons conservés pour un groupe taxonomique donné seront utilisés comme références. Pour chacun de ces groupes, le programme détectera automatiquement, la présence d’exons inattendus ou l’absence d’exons particulièrement conservés. Cette méthode sera intégrée à un programme d’évaluation et de correction de modèle de gènes et permettra d’améliorer la qualité des données disponibles dans les bases de données.

Les deux axes développés durant la thèse permettront de mettre au point une approche itérative, où des relations évolutives initiales seront utilisées pour améliorer les annotations de gènes, qui seront utilisées à leur tour pour affiner l’inférence des relations évolutives entre exons.

Profil et compétences recherchés

Le ou la candidat(e) doit être titulaire d’un Master dans le domaine de la bioinformatique et/ou génomique. Il ou elle devra être capable de démontrer de solides compétences en bioinformatique et en informatique, une bonne maîtrise de la programmation (Python) et des outils de bases de la bioinformatique. Des bases théoriques solides en biologie moléculaire et en biologie évolutionnaire sont également requises.
Un intérêt pour la génomique comparative, l’évolution et la biodiversité serait apprécié.
Financement
Cette thèse est financée et commencera le 1/10/2026. L’étudiant bénéficiera d’un contrat doctoral de droit public pour les 3 ans de réalisation de la thèse (2300 € brut/mois).

Supervision et équipe
Cette thèse sera supervisée par Odile Lecompte et Yannis Nevers, au sein de l’équipe CSTB du laboratoire ICube . L’étudiant en thèse sera suivi par le biais de réunions régulières pour discuter des avancées des projets et formuler des recommandations. Les candidats ou candidates présélectionnées seront invitées dans les locaux de l’équipe pour des rencontres avec les superviseurs et autres membres de l’équipe.

Comment candidater?

Envoyez un email avant le 25/06/2026 à Yannis Nevers (ynevers@unistra.fr) et Odile Lecompte (odile.lecompte@unistra.fr)
- Un CV
- Une lettre de motivation
- Une lettre de recommandation (Responsable de Master, encadrant de stage..)
- Vos relevé de notes de Master (M1, M2S1)

Project Summary

Eukaryotic genes are divided into two kinds of elements: the exons, which are included in mature RNA and introns which are the regions separating the exons. Introns and exons are initially transcribed together and introns are then excised through the splicing process. Distinct transcripts can be obtained from the maturation of one single gene, through the process of alternative splicing. Despite the importance of intron-exon structure in the regulation of molecular processes in eukaryotes, the mechanisms governing the evolution of exon-intron structures are still poorly known.
Studies on the intron-exon structure across eukaryotes, at the scale of the genome, support the hypothesis of an intron-rich eukaryotic ancestral genome, and a global trend of intron loss during evolution with punctual « introns burst » in some lineage. Nevertheless, there are few studies documenting evolutionary mechanisms underlying the reduction in the number of introns at the gene level, nor how this affects the domain composition of the corresponding proteins. The increasing availability of high-quality eukaryotic genomes is an opportunity to study this evolution at a finer scale than previously possible.

This project aims to design a method for large scale exon homology inference. This method will be used to characterize, at the level of entire gene repertoires, the evolution of gene structure and the mechanisms involved. Those reconstructions will be a source of reference data to help improve gene structure annotation in eukaryotes.

The first axis of the project addresses the development of a bioinformatics method for inferring exon homology between homologous genes. It will exploit data from the OrthoInspector orthology database, developed in the host team. It will exploit pairwise sequence comparisons to define the relationships between exons and the nature of this relationship (e.g. full or partial homology). The approach developed in this project will take inspiration from the state of the art but will aim to make it extendable to hierarchical orthologous groups. The evolutionary reconstruction obtained this way will be made available to the community through a public database and will be used to precisely describe the mechanisms involved in changes of gene intron-exon structure.

The 2nd axis will aim to exploit the aforementioned evolutionary reconstruction for refining the quality of structural gene annotation in eukaryotes. The student will develop a method for annotation quality evolution, extending the concept of methods for gene repertoires quality assessment (such as OMArk) for application at the exon level. Conserved orthologous exons groups will be used as reference for a given taxonomic level. For each gene, the software will detect whether all expected exons are present in the gene structure and whether unexpected exonic sequences (possibly erroneous) are present. This method will be integrated into a software for evaluating and correcting gene models which will allow to improve the overall quality of public data using evolutionary support.

The two axes developed during the PhD will be the two steps of an iterative circle where evolutionary reconstruction will help improve gene annotation quality, which will then be used to make finer scale evolutionary inferences.

Profile and expected skills

The candidate must have a Master degree in the field of bioinformatics and/or genomics. He or she must be able to demonstrate robust skills in bioinformatics and computer science. They should be able to program proficiently with Python, and to use the basic software and tools of bioinformatics. Strong theoretical bases on molecular biology and evolutionary biology are also required.
An interest in comparative genomics, evolution and biodiversity would be appreciated.

Financement

This thesis is funded and will start on the 01/10/2026. The student will be recruited under a common law doctoral contract for a duration of three years.

Team and supervision

This PhD will be supervised by Pr. Odile Lecompte and Dr. Yannis Nevers, from the Complex System and Translational Bioinformatics team in the ICube laboratory. The PhD student will be actively supervised through regular meetings with the supervisors to discuss progress in the project and make suggestions for further steps.
The preselected candidates will be invited into the team office for an interview with the supervisor and to meet other team members.

How to apply?

Please send an email before the 25/06/2026 to Yannis Nevers (ynevers (at) unistra.fr) and Odile Lecompte (odile.lecompte (at) unistra.fr) with:
- a CV
- a motivation letter
- a recommendation letter ( from your Master director or Master thesis supervisor)
- Master grade reports (M1, M2S1)

Candidature

Procédure : Envoyez un email avant le **25/06/2026** à Yannis Nevers (ynevers@unistra.fr) et Odile Lecompte (odile.lecompte@unistra.fr) - Un CV - Une lettre de motivation - Une lettre de recommandation (Responsable de Master, encadrant de stage..) - Vos relevé de notes de Master (M1, M2S1)

Date limite : 25 juin 2026

Contacts

 Yannis Nevers
 ynNOSPAMevers@unistra.fr

 https://amethis3.unistra.fr/amethis-client/prd/consulter/offre/697

Offre publiée le 4 mai 2026, affichage jusqu'au 30 juin 2026