Thèse : Modélisation intégrative des molécules d’ARN à l’aide du sondage chimique

 Concours · Thèse  · 36 mois    Bac+5 / Master   CiTCoM, UFR de Pharmacie, Université Paris Cité · Paris (France)

Mots-Clés

ARN modélisation moléculaire énergie libre apprentissage automatique

Description

Projet de thèse

La pandémie de SARS-CoV-2 a mis en évidence l'importance d'étudier les molécules des ARN, leur dynamique et leurs interactions avec les protéines [1]. En effet, ces phénomènes sont d’une importance physiologique cruciale. De nombreux virus (e.g. VIH, Hépatite C, coronavirus) utilisent la structure de leurs ARN pour manipuler les machineries cellulaires, par exemple pour traduire leur ARNm [2]. De telles fonctions reposent à la fois sur le repliement tridimensionnel (3D) spécifique des ARN, qui lui-même dépend de la séquence et de la manière dont les nucléobases s'apparient. Ces propriétés sont encore plus cruciales pour la formation des complexes protéine-ARN [3]. Cependant, l'obtention de structures 3D à haute résolution par cristallographie aux rayons X ou RMN reste un défi, comme le montre le faible nombre de structures d’ARN déposées dans la banque de données de structures PDB. Pour surmonter le manque de structures 3D, plusieurs techniques à basse résolution ont été développées au cours des dernières décennies pour modéliser ces structures. Par exemple, le sondage chimique, et notamment la technologie SHAPE [4], dont les données permettent de biaiser la prédiction in silico des structures secondaires (2D) [5] et 3D de l'ARN en intégrant des contraintes sur les appariements des bases. Cependant, la réaction chimique entre le réactif SHAPE et l’ARN n’implique pas directement les bases, mais le ribose [6] qui les porte et plusieurs questions restent ouvertes surtout sur le lien entre la structure de l’ARN, et la réactivité chimique de la sonde [7].

L'objectif de la thèse proposée est double. Premièrement, comprendre l'origine chimique de la réactivité des sondes SHAPE, et dévoiler ainsi la relation complexe entre les réactivités mesurées, la géométrie locale de l'ARN, et son environnement. Deuxièmement, intégrer ces informations dans un cadre théorique et computationnel récemment développé, afin de biaiser la prédiction in silico des structures d'ARN 3D. Plusieurs méthodes seront utilisées : des simulations de dynamique moléculaire standard et avancées, des approches de chimie quantiques, l’analyse en modes normaux et enfin l’apprentissage automatique (Machine Learning). L'étudiant(e) sera aussi amené(e) à développer des logiciels d'analyse en langage Python, spécialement conçus et adaptés au système étudié, à participer au développement des logiciels/scripts nécessaires pour l’implémentation de méthodes intégratives (par exemple en utilisant PLUMED) et à améliorer ou adapter des logiciels existants dans l’équipe. 

[1] T Glisovic FEBS Lett., 2008, 582 (14), 1977-1986. [2] J Deforges Biochimie 2015, 114, 48-57. [3] S Jones Biophys. Rev. 2016, 8, 359-367. [4] CE Hajdin et al. Proc. Natl. Acad. Sci. 2013, 110 (14), 5498-5503. [5] A Saaidi et al. Nucleic Acids Res. 2020, 48 (15), 8276-8289
[6] JL McGinnis, et al. J. Am. Chem. Soc. 2012, 134 (15), 6617-6624. [
7] E Frezza et al. Methods 2019, 162-163, 108-127.

Contexte 

La thèse sera effectuée dans l'équipe STAV au sein du laboratoire CiTCoM (UMR CNRS 8038, Université Paris Cité), une unité multidisciplinaire avec une expertise en modélisation moléculaire, biochimie, chimie organique, biologie structurale et microbiologie. Le(la) candidat(e) participera au projet quadriennal MAGENTA (Modelling RNA structures usinG chEmical probiNg daTA) financé par l'ANR (Agence Nationale de la Recherche) dans le cadre du dispositif JCJC. L'objectif de MAGENTA est double : premièrement, comprendre l'origine chimique de la réactivité de SHAPE et dévoiler la relation complexe entre les réactivités mesurées, la géométrie locale de l'ARN et son environnement pour les molécules d'ARN libres ; deuxièmement, intégrer ces informations dans un cadre théorique et computationnel nouvellement développé, pour biaiser et prédire les structures d'ARN. Le projet est mené en étroite collaboration avec nos collègues expérimentateurs de l'équipe qui sont experts en sondages biochimiques, comme SHAPE.

Modalité de recrutement

Le(la) candidat(e) sélectioné(e) participera au concours de l'école doctorale MCTI au sein de l'Université Paris Cité et déposera le dossier à l'école doctorale. La date limite de réception du dossier est le 3 mai 2023.

Toutes les informations sur le calendrier et le modalités de dépot de la candidature à l'école doctorale sont disponibles au lien suivant : https://ed563.u-paris.fr/financement/contrats-doctoraux-ed-563/

Le contrat doctoral commencera le 01/10/2023.

Prérequis 

Les candidats doivent être titulaires d'un Master en physique, chimie, science des matériaux, bioinformatique, ou dans des domaines connexes. Les candidats idéaux ont déjà de l'expérience dans la modélisation moléculaire des biomolécules. Une expérience dans un ou plusieurs des domaines suivants sera prise en compte :

- Simulations de dynamique moléculaire

- Apprentissage automatique

- Méthodes de l'énergie libre

Candidature

Procédure : Envoyer un mail à elisa.frezza@parisdescartes.fr avec un CV et une lettre de motivation.

Date limite : 23 avril 2023

Contacts

 Elisa Frezza

 elNOSPAMisa.frezza@parisdescartes.fr

 https://cloud.parisdescartes.fr/index.php/s/b3qLngpnFm2Ea3W#pdfviewer

Offre publiée le 8 avril 2023, affichage jusqu'au 29 avril 2023