Une modélisation hybride, logique et linéaire, pour prédire in silico l’effet de perturbations sur le métabolisme

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

LS2N Université de Nantes – faculté des Sciences et Techniques (FST) Bâtiment 34
2 Chemin de la Houssinière
44322 Nantes
France

Contacts
GUZIOLOWSKI, Carito
BOURDON, Jérémie
Email du/des contacts
carito.guziolowski@ec-nantes.fr
Jeremie.Bourdon@univ-nantes.fr
Description

Une modélisation hybride, logique et linéaire, pour prédire in silico l’effet de perturbations sur le métabolisme

Encadré par

Jérémie Bourdon, Professeur des Universités, Université de Nantes
Carito Guziolowski, Maître de conférences, Centrale Nantes
LS2N, UMR 6004, Nantes

Pré requis

L’étudiant recruté aura un profil d’informaticien ou de bioinformaticien avec une appétence pour les paradigmes de programmation suivants: programmation logique et par ensemble-réponse, programmation linéaire.

Financement

Ce sujet de thèse est éligible aux financements doctoraux du Ministère de l’Enseignement Supérieur, de la Recherche et de l’Innovation (MESRI).
Les candidats doivent impérativement figurer dans le tiers supérieur de leur promotion pour prétendre à ce type de financement.

Contexte

Un des gros enjeux actuel en biologie des systèmes consiste à comprendre les mécanismes qui distinguent les comportements de deux systèmes biologiques, avec des applications réelles en cancérologie notamment où l’enjeu va consister à comprendre ce qui distingue les cellules résistantes à un traitement de celles qui répondent convenablement à ce traitement. C’est un objectif de ce qui est communément appelé la médecine personnalisée où l’enjeu pour le médecin est de proposer au patient le bon traitement au bon dosage pour lui.
Si l’on souhaite proposer un outil d’aide à la décision, il convient d’être en mesure de prédire in silico l’effet d’un traitement (ou d’un stress) sur les cellules comme par exemple, sur leur faculté à croître. De nombreux modèles mathématiques, tirés de la programmation linéaire, décrivent les différentes règles de croissance de tissus cellulaires (Agren et al. 2012; Ryu, Kim, and Lee 2015) et les méthodes de reconstructions automatiques de modèles mathématiques de ces tissus, à base de données omiques sont maintenant robustes (Prigent et al. 2017). Précisément, ces modèles, appelés réseaux métaboliques sur génome entier, sont obtenus en considérant toutes les réactions biochimiques qui peuvent se produire au sein de la cellule et la croissance de la cellule, modélisée par une fonction mathématique, dépend alors des conditions environnementales et de la présence où l’absence de certains enzymes connus pour cataboliser les réactions biochimiques. Prédire l’action d’une thérapie revient donc à analyser son effet sur les enzymes et ou les réactions biochimiques en général. Une littérature assez abondante a proposé par le passé des méthodes d’analyse systématique de certaines thérapies avec des succès importants dans la mise au point de nouvelles thérapies (Agren et al. 2014). Cependant, l’effet d’une thérapie est très rarement direct, la thérapie ayant très souvent comme effet de déréguler une voie de signalisation qui contrôle la production des enzymes et les méthodes définies jusqu’ici ne sont pas en mesure de les prendre en compte.

Récemment, l’idée de modéliser les réseaux de signalisation et de régulation à base de programmes logiques a été introduite pour détecter les mécanismes qui contrôlent les changements d’états cellulaires en intégrant des données omiques qui permettent de connaître l’état ou l’abondance des entités moléculaires comme les gènes ou protéines. Ces données omiques peuvent être “personnalisées” au niveau du patient ou lignée cellulaire. Ceci a permis de définir des méthodes originales pour mettre en évidence les mécanismes clés permettant de distinguer des populations de lignées cellulaires ou de patients ayant une réponse différente au même traitement (Razzaq et al. 2018; Chebouba et al. 2018; Miannay et al. 2018).

L’objectif de la thèse est de proposer une méthode permettant de comprendre les mécanismes biologiques déclenchés par un traitement (drogue) sur la viabilité cellulaire à l’échelle des lignées cellulaires et cohortes de patients atteints d’un cancer. Cette méthode se construira grâce à une modélisation hybride Logique/Linéaire qui propage l’effet d’un traitement des voies de signalisation, modélisées par des programmes logiques, sur la croissance cellulaire obtenue en optimisant un programme linéaire. Les premières piste de ce travail sont exposées dans (Razzaq et al. 2019).

Plan de travail

Nous décomposons le travail souhaité en trois parties destinées à intégrer et modéliser des connaissances biologiques différentes : (1) expression de gènes mesurée pour un type cellulaire ou tissue d’un ensemble de patients ou lignées cellulaires chez l’human, (2) Pathway Databases, connaissance sur comment les entités moléculaires agissent les unes avec les autres, et (3) expériences fonctionnelles de viabilité cellulaire qui mettent en relation des lignées cellulaires avec leur taux de viabilité après un traitement donnée. Ces connaissances biologiques sont disponibles grâce à nos collaborations avec de chercheurs en cancérologie à Nantes et Rennes, et grâce à la diffusion massive de ces types des données par des défis internationaux tel que les DREAM-challenges, ou par de bases de données dédiées.

  1. Construction du réseau biologique à partir des données d’expression de gènes et bases de données publiques. Les réseaux biologiques que nous étudierons sont de deux types : (a) régulation et signalisation et (b) métaboliques. Les deux sont des réseaux génériques et donc composés par des mécanismes impliqués dans différentes types cellulaires chez l’homme. Dans ce processus nous allons nous appuyer sur l’outil BRAvo (article en préparation) qui permet de lancer des requêtes sur des ressources publiques comme Pathway Commons et Drug Bank, en utilisant le Web Sémantique à partir d’une liste de gènes cibles. A la fin de cette étape nous obtiendrons un réseaux hybride (RH) qui combine les deux types de mécanismes biologiques.
  2. Modèles informatiques. L’information contenue dans le (RH) constitue notre base de connaissance, sur laquelle nous développerons dans un premier temps des programmes logiques pour confronter les observations expérimentales (expression des gènes) avec la connaissance de régulations (Pathway Databases). Cette confrontation aura pour objectif d'intégrer deux types de connaissances indépendantes (régulation et expression de gènes) et de spécialiser le modèle, i.e. restreindre la connaissance à celle qui est valide seulement pour les jeux de données expérimentaux du type cellulaire d’intérêt. Dans un deuxième temps, nous allons relier le résultat d’une déduction du programme logique dans un programme à contraintes linéaires pour obtenir des informations quantitatives (taux de viabilité cellulaire).
  3. Validation des modèles informatiques. Cette partie se fera avec des analyses statistiques ainsi qu’avec des itérations entre les prédictions informatiques et les observations expérimentales. Notamment les observations biologiques concernant la viabilité cellulaire après un traitement.

Références

  • Agren, Rasmus, Sergio Bordel, Adil Mardinoglu, Natapol Pornputtapong, Intawat Nookaew, and Jens Nielsen. 2012. “Reconstruction of Genome-Scale Active Metabolic Networks for 69 Human Cell Types and 16 Cancer Types Using INIT.” PLoS Computational Biology. https://doi.org/10.1371/journal.pcbi.1002518.
  • Agren, Rasmus, Adil Mardinoglu, Anna Asplund, Caroline Kampf, Mathias Uhlen, and Jens Nielsen. 2014. “Identification of Anticancer Drugs for Hepatocellular Carcinoma through Personalized Genome-Scale Metabolic Modeling.” Molecular Systems Biology 10 (March): 721.
  • Chebouba, Lokmane, Bertrand Miannay, Dalila Boughaci, and Carito Guziolowski. 2018. “Discriminate the Response of Acute Myeloid Leukemia Patients to Treatment by Using Proteomics Data and Answer Set Programming.” BMC Bioinformatics 19 (Suppl 2): 59.
  • Miannay, Bertrand, Stéphane Minvielle, Florence Magrangeas, and Carito Guziolowski. 2018. “Constraints on Signaling Network Logic Reveal Functional Subgraphs on Multiple Myeloma OMIC Data.” BMC Systems Biology 12 (Suppl 3): 32.
  • Prigent, Sylvain, Clémence Frioux, Simon M. Dittami, Sven Thiele, Abdelhalim Larhlimi, Guillaume Collet, Fabien Gutknecht, et al. 2017. “Meneco, a Topology-Based Gap-Filling Tool Applicable to Degraded Genome-Wide Metabolic Networks.” PLoS Computational Biology 13 (1): e1005276.
  • Razzaq, Misbah, Loïc Paulevé, Anne Siegel, Julio Saez-Rodriguez, Jérémie Bourdon, and Carito Guziolowski. 2018. “Computational Discovery of Dynamic Cell Line Specific Boolean Networks from Multiplex Time-Course Data.” PLoS Computational Biology 14 (10): e1006538.
  • Ryu, Jae Yong, Hyun Uk Kim, and Sang Yup Lee. 2015. “Reconstruction of Genome-Scale Human Metabolic Models Using Omics Data.” Integrative Biology. https://doi.org/10.1039/c5ib00002e.
  • Razzaq, Misbah, Chebouba, Lokmane, Le Jeune, Pierre, Mhamdi, Hanen, Guziolowski, Carito, Bourdon, Jérémie. Logic and Linear programs to understand cancer response. Book chapter to appear in Automated Reasoning for Systems Biology and Medecine, Springer 08/2019. hal-01897036

Candidature

  • N’hésitez pas à nous contacter si vous avez la moindre question sur le processus de candidature: Carito.Guziolowski@ec-nantes.fr; Jeremie.Bourdon@univ-nantes.fr
  • Votre candidature doit contenir (1) un CV, (2) une lettre de motivation démontrant votre intérêt pour ce projet de recherche et (3) une copie de vos diplômes de Bac +3 à Bac +5 ou équivalent. Date limite pour candidater : 22/04/2019
  • En parallèle vous pourriez candidater à travers le site de l’UBL https://theses.u-bretagneloire.fr/mathstic/theses-2018. Ce sujet figure parmi les sujets proposés au sein du LS2N.
Equipe adhérente personne morale SFBI
Equipe Non adhérente