Biostatistique pour la détection d’empreintes PPR

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

IBGBI
23 bvd de France
91000 Evry
France

Contacts
Guillem Rigaill
Etienne Delannoy
Email du/des contacts
guillem.rigaill@inrae.fr
etienne.delannoy@inrae.fr
Description

Projet: Biostatistique et machine learning pour la détection d’empreintes PPR chez le
chloroplaste.

Les organites, mitochondries et chloroplastes, sont le lieu de la respiration et de la
photosynthèse et jouent un rôle clé dans plusieurs voies métaboliques. Leur rôle dans la
production végétale n'est donc pas à démontrer. Les protéines pentatricopeptide-repeat
(PPR) jouent un rôle clé dans l'expression du génome des organites. Elles régulent son
expression en altérant la séquence, la maturation, le turnover et la traduction des ARN. Il y
a près de 500 protéines PPR chez Arabidopsis, mais leur mode d'action n'est que
partiellement compris.
Classiquement, les sites de fixation (ou empreintes) des PPR sont détectées en
comparant la quantité de petits ARN d'une plante sauvage et d'une plante mutante pour
une PPR. Pour réaliser cette expérience il faut donc disposer d'une plante mutante ce qui
restreint fortement l'utilisation de cette approche. Nous étudions la possibilité de détecter
des empreintes PPR en utilisant seulement des échantillons sauvages. L’utilisation d’outils
de machine learning simples sur des données RNAseq de petits ARN permet de prédire
des empreintes déjà connues avec une spécificité d’environ 50% et une sensibilité de 20%.
L’objectif du projet est d’améliorer ces prédictions en intégrant d’autres sources
d’information, notamment la séquence génomique, la connaissance (même si très partielle)
d’un code de fixation PPR.

Compétences récherchées :
- Doctorat en biostatistique ou bioinformatique
- Programmation en R
- Analyse de données RNAseq

Contact:
Ce projet est une collaboration entre Guillem Rigaill (équipe Stat et Génome, LaMME) et
Etienne Delannoy (IPS2, équipe expression génomique des organites).
Les personnes intéressées peuvent envoyer un CV avec si possible le nom et contact de
quelques références à guillem.rigaill@inrae.fr et etienne.delannoy@inra.fr

Bibliographie:
* B. Malbert, G. Rigaill, V. Brunaud, C. Lurin et E. Delannoy. Bioinformatic Analysis of Chloroplast Gene
Expression and RNA Post-transcriptional Maturations Using RNA Sequencing. Methods Mol Biol, 2018
*A. Barkan, M. Rojas, S. Fujii, A. Yap, Y. S. Chong, C. S. Bond, et I. Small, A combinatorial amino acid
code for RNA recognition by pentatricopeptide repeat proteins, PLoS Genet,, 2012.
* Y. Yagi, S. Hayashi, K. Kobayashi, T. Hirayama, et T. Nakamura. Elucidation of the rna recognition code
for pentatricopeptide repeat proteins involved in organelle RNA editing in plants. PLoS One, 8(3), 2013.
* I.D. Small, O. Rackham, et A. Filipovska. Organelle transcriptomes : products of a
deconstructedgenome.Current opinion in microbiology, 2013.
* D.B Stern, M. Goldschmidt-Clermont, et M.R. Hanson. Chloroplast rna metabolism.Annual review of
plant biology, 2010

Equipe adhérente personne morale SFBI
Equipe Non adhérente