Maintenance

En raison d'une opération de maintenance chez notre hébergeur, le site de la SFBI sera interrompu du 6 octobre au 8 octobre.

Développement d'outils pour l'analyse des lncRNA de poissons

 Stage · Stage M2  · 6 mois    Bac+5 / Master   MIAT INRAE · Auzeville-Tolosane (France)

 Date de prise de poste : 1 février 2026

Mots-Clés

lncRNA annotation de génome chaîne de traitement

Description

Analyse des ARN longs non codants de génomes de poissons à partir des données RNA-Seq du projet PhyloFish

L’une des catégories d’ARN qui a évolué le plus, en nombre, dans les dernières années est celle des ARN longs non codants. Ceci vient de leur faible expression, faible conservation et de leur nombre élevé qui fait qu’il existe quasiment un ARN long non codant (LncRNA) par gène codant pour des protéines (mRNA, cf. annotation de génome humain https://www.ensembl.org/Homo_sapiens/Info/Annotation ). Même si leur conservation est faible on s’attend à ce que leurs profils d’expression tissulaire soient semblables entre espèces en partant du principe qu’ils régulent l’expression des mêmes mRNA.
Avec la mise à disposition d’un grand nombre d’assemblages de génomes de bonne qualité il est possible de réutiliser des données d’expression assez anciennes pour faire de nouvelles analyses. Le sujet de ce stage est d’analyser les LncRNA d’une quinzaine de poissons à partir des séquences RNA-Seq produites dans le cadre du projet PhyloFish https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-016-2709-z (21 poissons en tout mais pas encore d’assemblage de référence pour tous).
La·e stagiaire développera une une chaîne de traitement permettant de récupérer les données RNA-Seq du projet PhyloFish depuis l’EBI ou le NCBI et les assemblages correspondants dans la base RefSeq à partir du nom de l’espèce, puis d’annoter chacun des assemblages avec l’outil egapx et de rechercher les LncRNA avec FeelNC. Pour chacun des LncRNA l’outil inférera sa potentielle orthologie en utilisant les gènes de protéines l’encadrant ou les motifs protéiques contenus et produira les profils d’expression des mRNA et des LncRNA pour les 12 tissus de chaque espèce.
La·e stagiaire développera un environnement de visualisation permettant de valider l’orthologie établie à l’aide des profils d’expression tissulaire des orthologues d’un même groupe.
Elle·il produira les fichiers d’annotation des mRNA et des LncRNA incluant, si pertinents, les structures en exon-intron avec leur caractéristiques (tableau de synthèse) et le fichier des orthologues putatifs ou validés par leurs profils d’expression.

Compétences : utilisation de la ligne de commande Unix et d’un cluster de calcul sous SLURM, programmation python, connaissance des fichiers fasta, fastq, bam, gtf, utilisation de R ou de python+JavaScript pour présenter les résultats sous forme de graphiques interactifs.

Ce stage de M2 (6 mois) aura lieu à l’INRAE de Toulouse, sur le site d’Auzeville dans l’unité MIAT et sera encadré par Christine Gaspin et Christophe Klopp avec l’appui de Sandrine Lagarrigue et Fabien Degalez (Agro Campus Ouest Rennes) et Julien Bobe et Yann Guiguen (LPGP Rennes).

Candidature

Procédure : Envoyer un CV et e-mail/lettre de motivation aux adresses indiquées

Date limite : 31 décembre 2025

Contacts

 Christine Gaspin
 chNOSPAMristine.gaspin@inrae.fr

 Christophe Klopp
 chNOSPAMristophe.klopp@inrae.fr

Offre publiée le 1 octobre 2025, affichage jusqu'au 31 décembre 2025