Prédiction de complexes ARN-ARN et ARN-Protéines

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

Bâtiment IBGBI. 23 bv. de France
91000 Evry
France

Contacts
Fariza Tahi
Email du/des contacts
fariza.tahi@univ-evry.fr
Description

Description du sujet de thèse :

Les ARN sont des molécules qui jouent des rôles essentiels à différents niveaux de la vie de la cellule. Ces molécules, composées d’une succession de nucléotides, adoptent des conformations structurales 2D et 3D et interagissent entre elles et avec des protéines pour former des complexes (ARN-ARN ou ARN-Protéines). Identifier ces interactions et de manière générale ces complexes est un enjeu important pour la compréhension du vivant mais aussi des maladies. Les méthodes computationnelles sont ici essentielles pour aider à les identifier, les méthodes expérimentales étant très coûteuses. Les rares méthodes computationnelles existantes s’intéressent à des complexes avec un nombre d’ARN et de protéines réduit, souvent égal à deux.
L’objectif de la thèse est de proposer des méthodes modulaires et holistiques permettant de prédire des complexes avec plusieurs ARN et protéines, en prenant en compte différentes informations (sources de données) relatives à ces molécules. Dans l’équipe nous avons récemment proposé une méthode et un outil appelé RCPred pour la prédiction de complexes ARN-ARN (Legendre et al. 2019). Nous proposons dans ce nouveau projet de thèse de développer des méthodes pour la prédiction de complexes ARN-Protéines prenant en compte, à l’aide d’une approche probabiliste, des connaissances et/ou contraintes exprimées par l’utilisateur, ou issues par exemple de données expérimentales de type SHAPE, ou de motifs 3D (dans la continuité de précédents travaux réalisés dans l’équipe (Becquey et al. 2020)) répertoriés par exemple dans la base de données Carnaval (Reinharz et al., 2018).
L’approche algorithmique qui sera utilisée est une approche basée sur l’optimisation combinatoire dans des graphes stochastiques pour lesquels chaque sommet et/ou arête a une probabilité d’existence (Ando et al. 2009, Zhuqi et al. 2014, Murat et al. 2006). Le problème d’optimisation étudié sera la recherche de cliques optimales dans ce contexte probabiliste, c’est-à-dire par exemple des cliques ayant à la fois une probabilité d’existence élevée (au dessus d’un certain seuil) et un poids important.
Ce travail sera plus particulièrement appliqué à l’étude des causes de la sensibilité de cellules de peau humaine au traitement du cancer par radiothérapie, étude menée au sein de l'équipe de Michèle Martin du laboratoire LGRK du CEA à Evry (Vulin et al. 2018, Fortunel et al. 2019). Il s’agira dans ce projet de prédire les ARN non-codants longs impliqués dans cette sensibilité et les complexes qu’ils forment entre eux et avec certaines protéines, pour à terme un traitement adapté.
Les algorithmes développés donneront lieu à des outils qui seront mis à disposition de la communauté scientifique via la plateforme logicielle de bioinformatique EvryRNA (http://EvryRNA.ibisc.univ-evry.fr).

Equipe adhérente personne morale SFBI
Equipe Non adhérente