Arbres génomiques du Vivant : nouvelles approches expérimentales

Informations générales
Nom
Scuolo
Prénom
Quentin
Diplôme
Thèse
Année
2007
Détails de la thèse/HDR
Jury
Alain GUENOCHE
Guy PERRIERE
Pierre CAPY
Patrick FORTERRE
Directeur (pour les thèses)
Bernard LABEDAN
Résumé en français
Actuellement, l’arbre du Vivant de référence est basé sur la phylogénie de l’ARN 16S. Il a été souvent souligné que cet arbre présente de nombreux défauts, en particulier une mauvaise résolution au niveau des noeuds profonds, et son manque de consensus avec les arbres basés sur d’autres gènes ubiquitaires. Le nombre croissant de génomes procaryotes entièrement séquencés a donné lieu à de nombreuses nouvelles approches pour reconstruire l’arbre du Vivant en se basant sur un grand nombre de gènes. Mais, beaucoup de ces méthodes donnent une phylogénie visiblement biaisée ou aberrante, et les meilleures méthodes sont rarement d’accord entre elles sur les relations entre les branches profondes. J’ai donc développé deux nouvelles méthodes qui visent à améliorer cette reconstruction d’arbres phylogénomiques. Dans la première, la distance inter-génomique est basée sur la distance moyenne entre les orthologues communs. Pour améliorer le signal, les orthologues sont regroupés en familles et sont filtrés selon le nombre de génomes représentés dans ces familles. La deuxième méthode est basée sur une analyse par triplet de génomes. Chaque triplet vote pour la paire de génomes la plus proche en se basant sur les distances relatives entre les orthologues communs. Deux variantes de vote sont utilisées, une proportionnelle et une majoritaire. Dans la première, le vote est divisé entre les trois paires possibles proportionnellement au nombre d’orthologues communs en faveur de chaque paire. Dans la seconde variante, le vote est attribué uniquement à la paire ayant le plus d’orthologues en sa faveur. La somme des votes reçus par chaque paire de génomes détermine leur proximité. Ces nouvelles méthodes, appliquées sur la comparaison des protéomes de 120 génomes entièrement séquencés, semblent donner des relations profondes solides comme le regroupement des bactéries hyperthermophiles avec les firmicutes et les fusobactéries, et le regroupement des actinobactéries avec Deinococcus-Thermus et les cyanobactéries.