Apprentissage automatique sur données de spectroscopie de modifications d'ARN pour distinguer des stades de cancers

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

LIRMM - UMR 5506 & Univ Montpellier 2 (CC 05016) 860 rue de St Priest - Montpellier cedex 5 FRANCE
34095 Montpellier 5
France

Contacts
Eric RIVALS
Email du/des contacts
rivals@lirmm.fr
Description

Mots-clé : apprentissage automatique, statistique, épitranscriptome, marques épitranscriptomiques, développement, cancer

L'identification de bio-marqueurs spécifiques du cancer sont essentiels pour diverses prévisions et décisions médicales (diagnostic, pronostic, stratification de patients, évaluation de la pertinence d'une thérapie). Récemment, il a été montré que la régulation de l'expression des gènes est influencée par des modifications des bases des ARNs. Ces modifications sont dynamiquement contrôlées (ajoutées, lues ou effacées) sur une grande partie des ARNs produits dans les cellules. Contrairement à des mutations génétiques, ces modifications dites "épitranscriptomiques" ne changent pas la base, mais en quelque sorte la "décorent". En outre, certaines de ces modifications ont été associées à divers cancers. Grâce à une plateforme montpelliéraine unique en France (mise en place au sein de notre consortium), on peut étudier globalement par spectroscopie de masse la présence de ces modifications dans un échantillon de cellules.

Dans ce projet, nous disposons des mesures d'une trentaine de modifications effectuées sur des tissus de patients sains et cancéreux. L'objet de ce stage est de développer une approche d'apprentissage automatique qui recherchent les combinaisons de modifications permettant de distinguer les cellules saines de cellules cancéreuses, voire de les relier au stade cancéreux.
Les tissus de patients sont collectés par un des partenaires, le SIRIC de Montpellier.

Mettre en place un analyse permettant de normaliser les mesures, d'étudier les corrélations entre les mesures de différentes marques, et de proposer des stratégies d'apprentissage automatique (machine learning) qui 1/ distinguent les échantillons de cellules saines de ceux de cellules cancéreuses, puis 2/ déterminent les modifications associées à différents stades d'un cancer.

References :
1. Delaunay, S. and M. Frye, RNA modifications regulating cell fate in cancer. Nat Cell Biol, 2019. 21(5): p. 552-559.
2. A.C. Muller and S. Guido. Introduction to Machine Learning with Python: A Guide for Data Scientists. O'Reilly (édition en Anglais et en Français).
3. Gilbert Saporta. Probabilités, analyse des données et Statistique. Technip. 2011.

Prérequis et connaissances
- analyse statistique
- apprentissage automatique
- programmation en python
- goût pour les thématiques pluridisciplinaires

Qualités souhaitées :
- motivation
- programmation
- capacités de synthèse et d'analyse
- ouverture d'esprit.

Gratification : ~ 520 euros mensuels.

Lieu : Montpellier
Structure d'accueil : équipe Méthodes et Algorithmes pour la Bioinformatique, LIRMM UMR 5506 CNRS & Univ Montpellier
Encadrants : E. Rivals (CNRS), A. David (INSERM)
Partenaires à Montpellier :
- Institut de Génomique Fonctionnelle (IGF) https://www.igf.cnrs.fr/index.php/fr/
- SItes de Recherche Intégrée sur le Cancer (SIRIC) https://www.icm.unicancer.fr/fr/recherche/siric-montpellier-cancer
- Clinical Proteomics Platform, IRMB, Hopital St Eloi
- Institut régional du Cancer de Montpellier (ICM) https://www.icm.unicancer.fr/fr

Equipe adhérente personne morale SFBI
Equipe Non adhérente