Analyse bioinformatique et statistique des motifs cis-régulateurs chez les plantes

 Stage · Stage M2  · 6 mois    Bac+5 / Master   IPS2 · Gif-sur-yvette (France)  450

Mots-Clés

motifs cis-régulateurs, plantes, statistiques, bioinformatiques

Description

Etude de la distribution de motifs cis-régulateurs par une analyse comparée d’une vingtaine de plante


La recherche de motifs cis-régulateurs contrôlant l’expression des gènes est une voie activement explorée aujourd’hui pour identifier et exploiter en sélection des facteurs génétiques clés responsables de caractères d’intérêt agronomique.

L’étude des motifs cis-régulateurs est un projet de l’équipe. Il y a quelques années, nous avons développé la méthode PLMdetect (Preferentially Located Motif detection) pour identifier des motifs sur-représentés dans les promoteurs à une distance préférentielle du site d’initiation de la transcription chez Arabidopsis thaliana.  Ces deux dernières années, grâce au travail de thèse de J. Rozière, PLMdetect a été optimisée pour étendre les régions génomiques étudiées et de l’appliquer à plusieurs jeux originaux de données d’expression acquis chez A. thaliana et le maïs en réponse à différents types de stress. Par son travail sur A. thaliana et le maïs, J. Rozière a identifié 3 groupes de PLM pour chaque espèce en 5’ UTR et en 3’ UTR. En utilisant les sites de fixation connus des facteurs de transcription, environ 10 % des PLMs ont pu être annotés comme des site de fixation et ainsi 90 % des PLM restants restent des motifs nouveaux non caractérisés.


L’objectif du stage est de mener le même type d’étude sur une vingtaine de plantes pour étudier la similitude des PLM entre les plantes et ainsi permettre une meilleure caractérisation des PLM inconnus. L’objectif du stage sera (i) d’utiliser un pipeline déjà mis en place pour extraire les séquences promotrices des gènes d’une vingtaine d’espèces de plante (ii) d’appliquer la méthode PLMdetect sur la vingtaine d’espèces de plante (iii) d’analyser les PLM identifiés pour caractériser la distribution des motifs cis-régulateurs identifiés. Ce stage permettra de se familiariser avec l’emploi d’un cluster de calcul et l’analyse de grands jeux de données. L’analyse des PLM nécessitera des tests d’hypothèse et d’utiliser de la classification non supervisée. Ces analyses seront réalisés avec le logiciel R.

Candidature

Procédure : Envoyer un mail avec un CV et une lettre de motivation

Date limite : None

Contacts

Marie-Laure Martin

 maNOSPAMrie_laure.martin@agroparistech.fr

Offre publiée le 30 novembre 2021, affichage jusqu'au 28 janvier 2022