Stage M2 - Inférence de réseaux de régulation de gènes chez un insecte ravageur
Stage · Stage M2 · 6 mois Bac+5 / Master UMR 0203 BF2i (Biologie Fonctionnelle, Insectes et Interactions) · Villeurbanne (France)
Mots-Clés
bioinformatique intelligence artificielle réseaux de gènes régulation de l'expression facteurs de transcription agronomie
Description
Description du laboratoire d'accueil
Les recherches menées au laboratoire BF2I sont centrées sur la compréhension des fonctions gérant l’interaction d’insectes ravageurs d’importance agronomique (charançons et pucerons) avec leurs partenaires biologiques directs (plante hôte, bactéries symbiotiques). L’objectif finalisé de ces recherches est d’apporter des outils et de définir de nouveaux concepts pour une approche intégrée de la protection des plantes contre leurs insectes ravageurs. Nos résultats de recherche seront à la base du développement de pratiques agronomiques durables et respectueuses de la santé humaine et des agroécosystèmes.
Contexte scientifique
La régulation de la transcription représente l’un des mécanismes fondamentaux de contrôle de la quantité de protéines produites dans une cellule. Cette régulation est essentielle pour assurer les besoins cellulaires selon les conditions environnementales et le stade de développement de l'organisme. Les facteurs de transcription (ou TF, pour Transcription Factors) jouent un rôle fondamental dans ce processus, en particulier chez les organismes eucaryotes en se liant spécifiquement à des séquences géniques régulatrices (promoteurs, amplificateurs ou inactivateurs) [1]. La liaison d'un TF sur une séquence régulatrice permet soit d'activer, soit d’inhiber la transcription du gène qu'il régule. Faire l’inventaire des TF d’un organisme, combiné aux données transcriptomiques dans différents tissus, conditions ou stades de développement, permet d’appréhender les mécanismes de régulation de l’expression des gènes et constitue le point de départ pour la reconstruction des réseaux de régulation génique.
L'inférence de réseaux de régulation génique à partir de données à haut débit (RNAseq, biopuces) est un problème complexe, et différentes approches ont été proposées jusqu'à présent dans la littérature. Les principales approches peuvent être classées en quatre grandes familles, à savoir les méthodes basées sur 1) des mesures de corrélation ou d'information mutuelle, 2) des algorithmes d'inférence bayésienne 3) des algorithmes de régression 4) des algorithmes de classification [2,4]. Chaque méthode présente ses propres avantages et biais, chacune étant plus adaptée à la détection de certains types de liens de régulation à partir des données. Dans ce cadre, différentes études ont montré que la combinaison de plusieurs méthodes d’inférence conduit à des résultats plus robustes et de meilleure qualité [3]. Enfin, il est parfois possible d’améliorer encore les prédictions de ces combinaisons de méthodes d’inférence en les associant à d’autres sources de données, comme la présence de sites de fixations de TF dans le génome, à proximité des gènes cibles [5].
Au sein du laboratoire, nous avons développé GReNaDIne [4], une librairie Python qui implémente 17 méthodes d’inférence de réseaux de régulation de l’expression des gènes, incluant plusieurs méthodes d’apprentissage automatique (Random Forest, Gradient Boosting, SVM, ...), et permettant de les combiner pour former des ensembles de prédicteurs [3]. Ces méthodes ont montré de bons résultats sur des jeux de données de type benchmark, et l'un des objectifs de ce stage sera de contribuer au développement de GReNaDIne, et de permettre son utilisation conjointement avec l’outil PyScenic, qui vise à inclure l’analyse des sites de fixations de TF, afin d’améliorer la qualité des résultats.
En parallèle de ces développements, des premiers travaux ont également été initiés afin d’identifier et annoter les TF codés par le génome du puceron du pois Acyrthosiphon pisum, l’un des deux modèles d’insectes ravageurs sur lesquels le laboratoire BF2i travaille. Ce stage sera l’occasion de finaliser ces travaux d’annotation avec éventuellement une mise à disposition des annotations au travers du déploiement d’une base de données.
Pouvoir reconstruire les réseaux de régulation de l’expression des gènes des insectes ravageurs comme le puceron du pois permettra d’identifier les mécanismes clefs à la base du développement et de la différenciation de ses organes, et notamment des bactériocytes, ces cellules spécialisées de l’insecte hôte qui hébergent des bactéries symbiotiques indispensables à sa survie. Perturber l’interaction symbiotique entre l’insecte et sa bactérie en ciblant la régulation de l’expression des gènes au sein des bactériocytes pourrait alors constituer un moyen de lutte innovant contre les insectes ravageurs de culture.
Missions
- Développement de la librairie GReNaDIne afin de permettre son utilisation conjointe avec l’outil PyScenic, pour une meilleure prédiction des réseaux de régulation géniques.
- Annotation des facteurs de transcription chez le puceron du pois (avec le déploiement d’un site web / base de données pour la consultation des annotations)
- Prédiction des sites de fixation des facteurs de transcription chez le puceron du pois
- Inférence de réseaux de régulation de gènes à partir des données transcriptomiques disponibles
- Contribution à la rédaction d’un article scientifique sur le sujet.
Profil recherché
- Étudiant en master 2 (Bac+5), ou niveau équivalent (diplôme d’ingénieur), en bioinformatique.
- Compétences en développement Python
Candidature
Procédure :
Date limite : None
Contacts
Nicolas Parisot
niNOSPAMcolas.parisot@insa-lyon.fr
Offre publiée le 22 octobre 2021, affichage jusqu'au 15 février 2022