Stage M2 - Apprentissage de réseaux booléens prédictifs pour la différenciation cellulaire

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

351, cours de la Libération
33400 Talence
France

Contacts
Loïc Paulevé
Email du/des contacts
loic.pauleve@labri.fr
Description

Apprentissage de réseaux booléens prédictifs pour la différenciation cellulaire

Contexte

L'apprentissage de modèles informatiques permettant de reproduire et prédire les processus de différenciation cellulaire est un défi majeur avec de nombreuses applications en biologie et en médecine. D'un côté, les modèles logiques, en particulier avec les réseaux booléens, sont de plus en plus employés par les équipes en biologie théorique et expérimentale car ils correspondent bien avec le niveau de granularité des connaissances actuelles. D'un autre côté, l'essor des technologies de mesures en cellule unique, en particulier avec le single-cell RNA-seq, offre des données précises sur l'évolution des expressions des gènes au cours de processus de différenciation cellulaire.
Actuellement, à l'aide de méthodes logiques, nous savons énumérer des réseaux booléens qui satisfont les pré-requis demandés sur leur comportement, mais nous ne savons pas encore comment sélectionner ceux qui ont de bonnes capacités prédictives.

Objectifs

L'objectif de ce stage est d'ouvrir la voie à l'apprentissage de réseaux booléens prédictifs, en mettant au point différents scores de prédiction et en appliquant des méthodes d'apprentissage pour mettre en avant des caractéristiques des réseaux à optimiser. Par exemple: vaut-il mieux privilégier les réseaux simples, ou au contraire les plus complexes?

Le travail consistera dans un premier temps à mettre au point différents scores de prédictions d'un réseau booléen vis-à-vis de données de tests, et de les appliquer à différents jeux de données relatifs à la différenciation cellulaire. Puis, il faudra explorer différentes méthodes de type "Random Forests" ou encore "Principal Feature Analysis" pour apprendre les caractéristiques des réseaux booléens qui influent leur score de prédiction.
Le résultat du stage sera intégré dans la bibliothèque Python BoNesis (github.com/bioasp/bonesis).

Compétences recherchées

Une bonne connaissance des méthodes de type "Random Forests" et "Principal Component Analysis" est fortement recommandée, avec des connaissances générales en logique propositionnelle et SAT, et des compétences en programmation (Python préférable, mais pas nécessaire). Aucune connaissance particulière en biologie n'est nécessaire.

Bibliographie

Remarques

Poursuite en thèse possible (financement acquis sur projet ANR)

Equipe adhérente personne morale SFBI
Equipe Non adhérente