Bioinformatique structurale pour la recherche de protéines de bactériophages

 Stage · Stage M2  · 6 mois    Bac+5 / Master   I2BC · Gif sur Yvette (France)  gratification de stage

 Date de prise de poste : 3 janvier 2023

Mots-Clés

AlphaFold, prédiction de structure, bactériophages, recherche d'homologie lointaine

Description

Utilisation de l’information structurale pour la recherche de protéines de « connecteurs » de bactériophages, en vue de leur classification

Les protéines de phages sont par essence très éloignées en séquence les unes des autres, mais leur fonction est reconnaissable en structure tri-dimensionnelle. Nos travaux antérieurs, utilisant HHpred, un outil d’alignement profil-profil, avaient permis d’identifier toute une série de protéines de connecteurs, protéines nécessaires à l’assemblage de la tête à la queue des particules virales bactériennes (Lopes et al., 2014 doi: 10.1186/1471-2164-15-1027). Un score de similarité entre phages, basé sur le degré de similarité d’une collection de 3 à 8 protéines structurales de phages incluant les connecteurs avait ensuite été calculé et utilisé pour proposer une classification des phages en grands clades, via l’interface Virfam.

Depuis, grâce à la métagénomique virale, une grande diversité de nouveaux phages ont été séquencés, mais leur classification représente un réel défi, et en particulier leurs connecteurs sont indétectables avec Virfam. Avec l’avènement d’AlphaFold (Jumper et al., 2021 doi: 10.1038/s41586-021-03819-2), il devient possible d’augmenter encore la sensibilité de détection de protéines de connecteurs, en comparant non plus des profils d’alignements multiples, mais des prédictions de structures tridimensionnelles.

Le premier objectif du stage sera donc (i) de générer la prédiction AlphaFold d’un représentant de chaque famille de connecteurs présents dans Virfam, puis (ii) de rechercher les connecteurs putatifs de trois nouveaux phages représentatifs du microbiote intestinal, en deux étapes : 1. Génération de prédiction 3D sur toutes les protéines de fonction inconnue du module de gènes structuraux de ces trois phages, puis 2. Comparaison par paire au moyen d’un logiciel d’alignement 3D, de chacune de ces prédictions à l’ensemble des connecteurs connus.

En parallèle, sur les mêmes phages représentatifs pour lesquels aucun connecteur n’est identifié, un second objectif sera de construire des profils améliorés avec l’outil MMseqs2 (Steinegger & Söding, 2017 doi: 10.1038/nbt.3988) en tirant profit des bases de données enrichies de séquences environnementales, et de comparer la performance de l’utilisation de ces profils pour la recherche de connecteurs à l’approche du premier objectif reposant sur les prédictions de structure 3D.

Ceci devra permettre de compléter l’étude antérieure en incorporant de nouvelles familles de connecteurs issus des nouveaux phages analysés, et d’ouvrir la voie à une classification plus exhaustive de ceux-ci.

 

Le stage sera encadré par Jessica Andreani et se déroulera dans l'équipe "Assemblages moléculaires et intégrité du génome" (CEA Saclay/I2BC, responsables R. Guerois et F. Ochsenbein). Les travaux de l'équipe, couplant bioinformatique et approches expérimentales, visent à comprendre et prédire les mécanismes en jeu dans la formation des complexes macromoléculaires. L'équipe a développé plusieurs outils de bioinformatique structurale et obtenu de très bons résultats aux défis CAPRI de prédiction des structures d'interactions protéiques. Le stage sera co-encadré par Marie-Agnès Petit, responsable de l'équipe Phages à l'INRAe (Jouy en Josas). Nos deux équipes ont établi une collaboration durable.

 

Sélection de publications récentes des deux équipes :

• InterEvDock3: a combined template-based and free docking server with increased performance through explicit modeling of complex homologs and integration of covariation-based contact maps, Nucleic Acids Research 2021 (co-corresponding author J. Andreani): https://doi.org/10.1093/nar/gkab358

Associated webserver: https://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock3/

• Atomic-level evolutionary information improves protein–protein interface scoring, Bioinformatics 2021 (co-corresponding author J. Andreani): https://doi.org/10.1093/bioinformatics/btab254

Associated data and code http://biodev.cea.fr/interevol/interevdata/

• Phagonaute: A web-based interface for phage synteny browsing and protein function prediction, Virology 2016 (corresponding author MA Petit): https://doi.org/10.1016/j.virol.2016.05.007

Associated webserver http://genome.jouy.inra.fr/phagonaute

• Automated classification of tailed bacteriophages according to their neck organization, BMC Genomics 2014 (co-author MA Petit, corresponding author R. Guerois): https://doi.org/10.1186/1471-2164-15-1027

Associated webserver http://biodev.cea.fr/virfam/

Candidature

Procédure : Envoyer CV, lettre de motivation et les coordonnées d'une ou deux références à Jessica Andreani.

Date limite : 15 octobre 2022

Contacts

Jessica Andreani

 jeNOSPAMssica.andreani@cea.fr

Offre publiée le 8 septembre 2022, affichage jusqu'au 15 octobre 2022