Revenir à la liste des offres d'emplois Développement d'outils pour l'analyse des lncRNA de poissons Stage · Stage M2 · 6 mois Bac+5 / Master MIAT INRAE · Auzeville-Tolosane (France) Date de prise de poste : 1 février 2026 Mots-Clés lncRNA annotation de génome chaîne de traitement Description Analyse des ARN longs non codants de génomes de poissons à partir des données RNA-Seq du projet PhyloFish L’une des catégories d’ARN qui a évolué le plus, en nombre, dans les dernières années est celle des ARN longs non codants. Ceci vient de leur faible expression, faible conservation et de leur nombre élevé qui fait qu’il existe quasiment un ARN long non codant (LncRNA) par gène codant pour des protéines (mRNA, cf. annotation de génome humain https://www.ensembl.org/Homo_sapiens/Info/Annotation ). Même si leur conservation est faible on s’attend à ce que leurs profils d’expression tissulaire soient semblables entre espèces en partant du principe qu’ils régulent l’expression des mêmes mRNA. Avec la mise à disposition d’un grand nombre d’assemblages de génomes de bonne qualité il est possible de réutiliser des données d’expression assez anciennes pour faire de nouvelles analyses. Le sujet de ce stage est d’analyser les LncRNA d’une quinzaine de poissons à partir des séquences RNA-Seq produites dans le cadre du projet PhyloFish https://bmcgenomics.biomedcentral.com/articles/10.1186/s12864-016-2709-z (21 poissons en tout mais pas encore d’assemblage de référence pour tous). La·e stagiaire développera une une chaîne de traitement permettant de récupérer les données RNA-Seq du projet PhyloFish depuis l’EBI ou le NCBI et les assemblages correspondants dans la base RefSeq à partir du nom de l’espèce, puis d’annoter chacun des assemblages avec l’outil egapx et de rechercher les LncRNA avec FeelNC. Pour chacun des LncRNA l’outil inférera sa potentielle orthologie en utilisant les gènes de protéines l’encadrant ou les motifs protéiques contenus et produira les profils d’expression des mRNA et des LncRNA pour les 12 tissus de chaque espèce. La·e stagiaire développera un environnement de visualisation permettant de valider l’orthologie établie à l’aide des profils d’expression tissulaire des orthologues d’un même groupe. Elle·il produira les fichiers d’annotation des mRNA et des LncRNA incluant, si pertinents, les structures en exon-intron avec leur caractéristiques (tableau de synthèse) et le fichier des orthologues putatifs ou validés par leurs profils d’expression. Compétences : utilisation de la ligne de commande Unix et d’un cluster de calcul sous SLURM, programmation python, connaissance des fichiers fasta, fastq, bam, gtf, utilisation de R ou de python+JavaScript pour présenter les résultats sous forme de graphiques interactifs. Ce stage de M2 (6 mois) aura lieu à l’INRAE de Toulouse, sur le site d’Auzeville dans l’unité MIAT et sera encadré par Christine Gaspin et Christophe Klopp avec l’appui de Sandrine Lagarrigue et Fabien Degalez (Agro Campus Ouest Rennes) et Julien Bobe et Yann Guiguen (LPGP Rennes). Candidature Procédure : Envoyer un CV et e-mail/lettre de motivation aux adresses indiquées Date limite : 31 décembre 2025 Contacts Christine Gaspin chNOSPAMristine.gaspin@inrae.fr Christophe Klopp chNOSPAMristophe.klopp@inrae.fr Offre publiée le 1 octobre 2025, affichage jusqu'au 31 décembre 2025