Mots-Clés
Immunogénicité
Protein
Language Models
Épitopes partagés
Thérapie génique
Désimmunogénisation
Biologie computationnelle
Description
Contexte et intérêt biologique
La thérapie génique et cellulaire repose massivement sur l’utilisation de protéines exogènes (GFP, luciférase, mCherry) comme outils de suivi et de sélection. Ces protéines, totalement étrangères au protéome humain, induisent une forte réponse immunitaire qui compromet l’efficacité des traitements (CAR-T cells, thérapies géniques).
L’équipe IRCAN a récemment développé un atlas computationnel exhaustif des épitopes partagés dans le protéome humain et murin, révélant une redondance massive qui pourrait être exploitée pour concevoir des protéines moins immunogènes. Le défi consiste à créer des variants fonctionnels de protéines exogènes, mais tolérés par le système immunitaire, afin de prolonger l’efficacité des thérapies.
Travail attendu
Le/la stagiaire participera au développement et à l’application d’outils bioinformatiques pour :
-
analyser des séquences protéiques et leurs propriétés structurales ;
-
intégrer des données publiques d’expression et de structure (GTEx, TCGA, Human Protein Atlas, AlphaFoldDB) ;
-
mettre en œuvre et adapter des algorithmes existants (EpitopeMapper, arDCA), dans l’objectif de proposer des modèles prédictifs et de nouvelles séquences protéiques optimisées.
Approche scientifique
Atlas pondéré des tissus (Tissue-weighted Atlas, TWA) : intégration des données d’expression (GTEx, TCGA, Human Protein Atlas) pour estimer le risque immunologique selon le contexte tissulaire et identifier des « fenêtres de tolérance ».
-
Caractérisation structurale des épitopes : exploitation des modèles de langage protéique (pLM) et des prédictions AlphaFold/ESM pour évaluer les propensions structurales et antigéniques des peptides.
-
Design computationnel de protéines désimmunisées : modification d’algorithmes génératifs (arDCA) pour proposer de nouvelles séquences tolérées tout en conservant la fonctionnalité des protéines rapporteurs.
Profil recherché
-
Étudiant·e en Master 1 ou 2 bioinformatique, biologie computationnelle, data science ou école d’ingénieurs avec spécialisation bioinfo
-
Compétences en analyse de séquences et en programmation (R ou Python)
-
Intérêt pour la modélisation structurale des protéines et la thérapie génique
-
Bon niveau d’anglais scientifique
-
Autonomie, rigueur et goût pour le travail interdisciplinaire
Encadrement et lieu
Laboratoire : IRCAN (Institut de Recherche sur le Cancer et le Vieillissement, Nice, Université Côte d’Azur)
Équipe encadrante : Patrick Brest (Inserm), Olivier Croce (CNRS), Christina Cayron (CNRS)
Collaboration : Inria (équipe ABS – Structural Bioinformatics Library, E. Sarti, F. Cazals)
Lieu principal : IRCAN, Nice, avec interactions régulières avec l’équipe Inria Sophia Antipolis