Bioinformatique structurale pour la recherche de protéines de bactériophages
Stage · Stage M2 · 6 mois Bac+5 / Master I2BC · Gif sur Yvette (France) gratification de stage
Date de prise de poste : 3 janvier 2023
Mots-Clés
AlphaFold, prédiction de structure, bactériophages, recherche d'homologie lointaine
Description
Utilisation de l’information structurale pour la recherche de protéines de « connecteurs » de bactériophages, en vue de leur classification
Les protéines de phages sont par essence très éloignées en séquence les unes des autres, mais leur fonction est reconnaissable en structure tri-dimensionnelle. Nos travaux antérieurs, utilisant HHpred, un outil d’alignement profil-profil, avaient permis d’identifier toute une série de protéines de connecteurs, protéines nécessaires à l’assemblage de la tête à la queue des particules virales bactériennes (Lopes et al., 2014 doi: 10.1186/1471-2164-15-1027). Un score de similarité entre phages, basé sur le degré de similarité d’une collection de 3 à 8 protéines structurales de phages incluant les connecteurs avait ensuite été calculé et utilisé pour proposer une classification des phages en grands clades, via l’interface Virfam.
Depuis, grâce à la métagénomique virale, une grande diversité de nouveaux phages ont été séquencés, mais leur classification représente un réel défi, et en particulier leurs connecteurs sont indétectables avec Virfam. Avec l’avènement d’AlphaFold (Jumper et al., 2021 doi: 10.1038/s41586-021-03819-2), il devient possible d’augmenter encore la sensibilité de détection de protéines de connecteurs, en comparant non plus des profils d’alignements multiples, mais des prédictions de structures tridimensionnelles.
Le premier objectif du stage sera donc (i) de générer la prédiction AlphaFold d’un représentant de chaque famille de connecteurs présents dans Virfam, puis (ii) de rechercher les connecteurs putatifs de trois nouveaux phages représentatifs du microbiote intestinal, en deux étapes : 1. Génération de prédiction 3D sur toutes les protéines de fonction inconnue du module de gènes structuraux de ces trois phages, puis 2. Comparaison par paire au moyen d’un logiciel d’alignement 3D, de chacune de ces prédictions à l’ensemble des connecteurs connus.
En parallèle, sur les mêmes phages représentatifs pour lesquels aucun connecteur n’est identifié, un second objectif sera de construire des profils améliorés avec l’outil MMseqs2 (Steinegger & Söding, 2017 doi: 10.1038/nbt.3988) en tirant profit des bases de données enrichies de séquences environnementales, et de comparer la performance de l’utilisation de ces profils pour la recherche de connecteurs à l’approche du premier objectif reposant sur les prédictions de structure 3D.
Ceci devra permettre de compléter l’étude antérieure en incorporant de nouvelles familles de connecteurs issus des nouveaux phages analysés, et d’ouvrir la voie à une classification plus exhaustive de ceux-ci.
Le stage sera encadré par Jessica Andreani et se déroulera dans l'équipe "Assemblages moléculaires et intégrité du génome" (CEA Saclay/I2BC, responsables R. Guerois et F. Ochsenbein). Les travaux de l'équipe, couplant bioinformatique et approches expérimentales, visent à comprendre et prédire les mécanismes en jeu dans la formation des complexes macromoléculaires. L'équipe a développé plusieurs outils de bioinformatique structurale et obtenu de très bons résultats aux défis CAPRI de prédiction des structures d'interactions protéiques. Le stage sera co-encadré par Marie-Agnès Petit, responsable de l'équipe Phages à l'INRAe (Jouy en Josas). Nos deux équipes ont établi une collaboration durable.
Sélection de publications récentes des deux équipes :
• InterEvDock3: a combined template-based and free docking server with increased performance through explicit modeling of complex homologs and integration of covariation-based contact maps, Nucleic Acids Research 2021 (co-corresponding author J. Andreani): https://doi.org/10.1093/nar/gkab358
Associated webserver: https://bioserv.rpbs.univ-paris-diderot.fr/services/InterEvDock3/
• Atomic-level evolutionary information improves protein–protein interface scoring, Bioinformatics 2021 (co-corresponding author J. Andreani): https://doi.org/10.1093/bioinformatics/btab254
Associated data and code http://biodev.cea.fr/interevol/interevdata/
• Phagonaute: A web-based interface for phage synteny browsing and protein function prediction, Virology 2016 (corresponding author MA Petit): https://doi.org/10.1016/j.virol.2016.05.007
Associated webserver http://genome.jouy.inra.fr/phagonaute
• Automated classification of tailed bacteriophages according to their neck organization, BMC Genomics 2014 (co-author MA Petit, corresponding author R. Guerois): https://doi.org/10.1186/1471-2164-15-1027
Associated webserver http://biodev.cea.fr/virfam/
Candidature
Procédure : Envoyer CV, lettre de motivation et les coordonnées d'une ou deux références à Jessica Andreani.
Date limite : 15 octobre 2022
Contacts
Jessica Andreani
jeNOSPAMssica.andreani@cea.fr
Offre publiée le 8 septembre 2022, affichage jusqu'au 15 octobre 2022