Prédiction des interactions protéine-ARN en couplant des données structurales et omiques

 Stage · Stage M2  · 6 mois    Bac+5 / Master   CEA / I2BC · Gif sur Yvette (France)

 Date de prise de poste : 3 janvier 2022

Mots-Clés

interactions protéine-ARN analyse de données omiques structure macromoléculaire évolution macromoléculaire

Description

Les interactions macromoléculaires sont au cœur de la plupart des processus biologiques. L’objectif général du projet est de mieux comprendre les mécanismes moléculaires à la base des interactions protéine-ARN. De récents progrès dans les expériences à haut débit ont produit des quantités énormes de données et ont largement étendu le répertoire de ces interactions. Cependant, un grand décalage subsiste entre ce déluge d’information à grande échelle et la rareté des données biophysiques et structurales à plus haute résolution.

Le projet vise à développer une approche bio-informatique intégrative pour coupler les données massives issues des récentes expériences « omiques » à haut débit (génomique, interactions) aux données structurales détaillées. Le stage consistera dans un premier temps à construire une base de données permettant de coupler l’information disponible sur les interactions protéine-ARN au niveau « omique » à l’information évolutive et structurale. Cette base permettra d’étudier la faisabilité de différentes approches statistiques et d’apprentissage automatique pour extraire des caractéristiques décrivant les interactions protéine-ARN. En fonction de l’avancement du stage, ce travail pourra se poursuivre par l’exploitation de ces informations dans des méthodes prédictives et/ou par l’analyse des réseaux d’interactions, puisque la plupart des interactions protéine-ARN s’inscrivent au cœur de complexes multi-partenaires.

Le.la stagiaire sera impliqué.e dans le développement méthodologique et logiciel (programmation en langage Python). Il.elle participera aussi à la vie du projet et de l’équipe, y compris par des réunions bibliographiques et des présentations de ses travaux.

Le stage se déroulera au sein de l’UMR 9198 Institut de Biologie Intégrative de la Cellule (I2BC), sur le site du CEA Saclay. Notre équipe « Assemblages moléculaires et intégrité du génome » s’appuie sur un couplage fort entre approches bio-informatiques et expérimentales pour caractériser, prédire et inhiber les assemblages macromoléculaires. Nous contribuons à améliorer les méthodes de prédiction des structures de complexes en combinant l’information évolutive avec des approches plus traditionnelles [1] ; nous avons ainsi développé le serveur InterEvDock [2]. Cette stratégie a permis de classer notre équipe en tête du challenge international CAPRI de prédiction structurale des interactions en 2016 et 2019 [3]. Notre équipe possède aussi de l’expérience dans l’intégration de données protéomiques et structurales [4] ainsi que dans l’analyse de données transcriptomiques et génomiques [5].

Le sujet de stage s’inscrit dans un projet plus large financé par l’ANR. En fonction du déroulement du stage et du projet professionnel du.de la stagiaire, le projet pourrait éventuellement se poursuivre par un CDD ingénieur (sur financement ANR). La poursuite en thèse est également envisageable mais nécessiterait de candidater pour obtenir un financement spécifique.

La date de début et la durée du stage peuvent être ajustées en fonction des contraintes de la formation M2.

Références :

[1] Quignot C, Granger P, Chacón P, Guerois R, Andreani J. Atomic-level evolutionary information improves protein-protein interface scoring. Bioinformatics. 2021. btab254. doi: 10.1093/bioinformatics/btab254. PMID: 33901284.

[2] Quignot C, Postic G, Bret H, Rey J, Granger P, Murail S, Chacón P, Andreani J, Tufféry P, Guerois R. InterEvDock3: a combined template-based and free docking server with increased performance through explicit modeling of complex homologs and integration of covariation-based contact maps. Nucleic Acids Res. 2021. 49(W1):W277-W284. doi: 10.1093/nar/gkab358. PMID: 33978743.

[3] Nadaradjane AA, Quignot C, Traoré S, Andreani J, Guerois R. Docking proteins and peptides under evolutionary constraints in Critical Assessment of Prediction of Interactions rounds 38 to 45. Proteins. 2020. 88(8):986-998. doi: 10.1002/prot.25857. PMID: 31746034.

[4] Postic G, Andreani J, Marcoux J, Reys V, Guerois R, Rey J, Mouton-Barbosa E, Vandenbrouck Y, Cianferani S, Burlet-Schiltz O, Labesse G, Tufféry P. Proteo3Dnet: a web server for the integration of structural information with interactomics data. Nucleic Acids Res. 2021. 49(W1):W567-W572. doi: 10.1093/nar/gkab332. PMID: 33963857.

[5] Baejen C, Andreani J, Torkler P, Battaglia S, Schwalb B, Lidschreiber M, Maier KC, Boltendahl A, Rus P, Esslinger S, Söding J, Cramer P. Genome-wide Analysis of RNA Polymerase II Termination at Protein-Coding Genes. Mol Cell. 2017. 66(1):38-49.e6. doi: 10.1016/j.molcel.2017.02.009. PMID: 28318822.

Candidature

Procédure : Envoyer un mail de candidature avec CV et motivation à Jessica Andreani : jessica.andreani@cea.fr

Date limite : 17 décembre 2021

Contacts

Jessica Andreani

 jeNOSPAMssica.andreani@cea.fr

Offre publiée le 2 novembre 2021, affichage jusqu'au 17 décembre 2021