Offre de thèse en biologie computationnelle et expérimentale

 CDD · Thèse  · 36 mois    Bac+5 / Master   Inserm UMR1078 · Brest (France)

 Date de prise de poste : 3 octobre 2022

Mots-Clés

Epissage, variations de l’ADN, modèles prédictifs, analyses de données génétiques, cancer

Description

Titre

Rôle de la variabilité des séquences 3’ des introns dans l’épissage des ARN pré- messagers

 

Sujet

L’épissage des ARN pré-messagers requiert quatre déterminants de séquence essentiels : des séquences 5’-donneur, 3’-accepteur d’épissage, une séquence polypyrimidique et un point de branchement. Bien que ces éléments de séquence soient remarquablement conservés, ils admettent des variations en contenu et/ou en position relativement à la borne 3’ de l’ARN pré-messager, en particulier la séquence polypyrimidique et le site de branchement (A), tandis que les deux bornes, 5’ (GU) et 3’ (AG) introniques, sont quasiment fixées.

Cette région intronique 3’ est reconnue par la sous-unité U2 du spliceosome (complexe ribonucléoprotéique au sein duquel se produit la réaction d’épissage), et en particulier par la protéine U2AF2 (U2AF65), qui constitue la partie amont de la sous-unité U2, formant un hétérodimère avec la protéine U2AF1 (U2AF35) qui reconnaît invariablement la séquence accepteur AG-3’ intronique. Cependant, il existe peu de méthodes permettant de prédire les conséquences des variations dans la région 3’ des introns.

Une profonde dérégulation de l’épissage est notamment observée dans les cancers en raison de variabilité à la fois dans les séquences 3’ des introns, ainsi que dans les protéines de l’épissage qui interagissent avec ces séquences.

Les objectifs du projet de doctorat sont de mieux comprendre l’impact des variations de la séquence intronique 3’ sur l’épissage, et d’identifier de nouveaux gènes importants pour le développement des cancers. Ce projet relève d’une approche duale, bio-informatique et expérimentale de validation. Il comprendra 2 volets :

  • Une partie bio-informatique principale dans laquelle il s’agira de :
    • Cartographier les séquences polypyrimidiques en 3’ des introns (cibles de la protéine U2AF2, de la sous-unité U2 du spliceosome) tout génome
    • Rechercher un/des consensus de séquence dans deux catégories de cohortes : une large cohorte de sujets indemnes de pathologies et dans une ou plusieurs cohortes de patients avec cancer (solide ou hématologique)
    • De dénombrer les proportions relatives, aux sites accepteurs 3’, des séquences AAG, TAG et CAG (le taux de reconnaissance des sites 3’AG par U2AF1 peut être affecté par le nucléotide précédent (en rouge) et par les mutations d’U2AF1)
  • Une partie expérimentale secondaire qui consistera en l’analyse de l’épissage par transfection de minigènes portant l’un ou les autres de ces trois environnements nucléotidiques, en présence d’U2AF1 sauvage ou mutée.

Compétences scientifiques et techniques requises :

Formation en bio-informatique : langage de programmation R et/ou Python, familier avec l’environnement Unix/Linux, connaissances en statistiques et en analyse/traitement de données génétiques.

Expérience en biologie cellulaire et moléculaire et en génétique/génomique.

Autres compétences souhaitées :

Autonomie, travail en équipe, lecture d’articles scientifiques en anglais, communication écrite et orale en anglais

Candidature

Procédure : Candidature à envoyer à Laurent Corcos (laurent.corcos@inserm.fr) et Gaelle Marenne (gaelle.marenne@inserm.fr)

Date limite : 31 mai 2022

Contacts

Gaelle Marenne

 gaNOSPAMelle.marenne@inserm.fr

Offre publiée le 4 mai 2022, affichage jusqu'au 31 mai 2022