Développement d’un Pipeline pour l’analyse de modifications épitranscriptomiques

 Stage · Stage M2  · 6 mois    Bac+5 / Master   MIVEGEC - IRD · Montpellier (France)  4.35€/h

 Date de prise de poste : 13 janvier 2025

Mots-Clés

Nextflow Pipeline Epitranscriptomique RNAseq

Description

Développement d’un Pipeline pour l’analyse de modifications épitranscriptomiques

// English below //

Contexte

L’édition de l’ARN est un mécanisme post-transcriptionnel clé qui modifie l’information génétique porté par la molécule d’ARN et qui influence la diversité du signal transcriptionnel. Dans les cas les plus concret, ce processus amène des mutations non-synonyme au niveau des codons qui peuvent affecter la fonction des protéines. Dans la majorité des cas ces mutations sont hors des régions traduite et peuvent affecter la régulation de l’expression des gènes. Malgré l’importance de ce phénomène il est encore peut étudier du fait de la difficulté d’utilisation des outils existants (portabilité, reproductibilité, parallélisation).

 

Dans ce contexte, nous proposons un stage visant à développer un pipeline bioinformatique utilisant Nextflow, afin d’intégrer et automatiser l’utilisation des différents outils pertinent existant et créer une combinaison des résultat sous forme de “meta-éditome”.

 

Objectif du stage

L’objectif principal du stage est de développer un pipeline complet en Nextflow qui permettra d’analyser facilement les données de séquençage ARN pour détecter les événements d’édition d’ARN. Ce pipeline devra être reproductible, portable, et facile à exécuter sur diverses plateformes de calcul (locaux ou HPC). Il intégrera des outils bioinformatique couramment utilisés pour :

  • La préparation et le contrôle qualité des données de séquençage ARN.
  • L’alignement des lectures ARN sur le génome de référence.
  • L’identification des sites d’édition à partir de données RNA-seq.
  • L’annotation et l’interprétation des sites d’édition identifiés, avec possibilité de comparaison inter-espèces et inter-conditions.
  • Tester et valider le pipeline sur des jeux de données publics.
  • Documenter le pipeline, y compris la configuration, les étapes du workflow, et les instructions pour l’exécuter.

 

Profil recherché

  • Étudiant(e) en Master 2 (bioinformatique, biologie computationnelle, ou domaine connexe).
  • Compétences en bioinformatique, notamment en analyse de données de séquençage ARN.
  • Expérience préalable avec des workflows bioinformatiques (Nextflow, Snakemake, etc.) est un plus.
  • Bonne maîtrise d’un ou plusieurs langages de scripting (Bash, Python, Perl, R).
  • Connaissance des outils d’analyse RNA-seq et des bases de données biologiques.

 

Encadrement

Jacques Dainat  Ph.D. - Ingénieur De Recherche en Bioinformatique.

 

Lieu

Institut de recherche pour le développent (IRD), Unité MiVEGEC, Montpellier.

 

Durée

Stage de 6 mois, à partir de janvier, avec possible extension.

 

Candidature

Merci d’envoyer votre CV, une lettre de motivation, relevé de notes et nom de référents à l’adresse jacques.dainat@ird.fr.

------------------------------------------------------------------

Development of a Pipeline for the Analysis of Epitranscriptomic Modifications

 

Context

RNA editing is a key post-transcriptional mechanism that modifies the genetic information carried by the RNA molecule and influences the diversity of the transcriptional signal. In more concrete cases, this process leads to nonsynonymous mutations at the codon level, which can affect protein function. In most cases, these mutations occur outside of translated regions but can still impact the regulation of gene expression. Despite the importance of this phenomenon, it remains understudied due to the challenges associated with using existing tools (portability, reproducibility, parallelization).

 

In this context, we propose an internship aimed at developing a bioinformatics pipeline using Nextflow, to integrate and automate the use of various existing relevant tools and to combine their outputs into a “meta-editome.”

 

Objective of the Internship

The main goal of this internship is to develop a complete pipeline in Nextflow that will facilitate the analysis of RNA sequencing data to detect RNA editing events. This pipeline must be reproducible, portable, and easy to execute on various computing platforms (local or HPC). It will integrate commonly used bioinformatics tools for:

  • Preparation and quality control of RNA sequencing data.
  • Alignment of RNA reads to the reference genome.
  • Identification of editing sites from RNA-seq data.
  • Annotation and interpretation of identified editing sites, with options for cross-species and cross-condition comparisons.
  • Testing and validating the pipeline on public datasets.
  • Documenting the pipeline, including configuration, workflow steps, and execution instructions.

 

Candidate Profile

  • Master’s student in their second year (bioinformatics, computational biology, or related field).
  • Skills in bioinformatics, especially in RNA sequencing data analysis.
  • Prior experience with bioinformatics workflows (e.g., Nextflow, Snakemake) is a plus.
  • Good proficiency in one or more scripting languages (e.g., Bash, Python, Perl, R).
  • Familiarity with RNA-seq analysis tools and biological databases.

 

Supervision

Jacques Dainat, Ph.D. - Research Engineer in Bioinformatics

 

Location

French National Research Institute for Sustainable Development (IRD), MiVEGEC Laboratory, Montpellier.

 

Application

Please send your CV, cover letter, transcript of records, and names of referees to jacques.dainat@ird.fr.

Candidature

Procédure : Merci d’envoyer par mail votre CV, une lettre de motivation, relevé de notes et nom de référents

Date limite : 18 décembre 2024

Contacts

 Jacques Dainat

 jaNOSPAMcques.dainat@ird.fr

Offre publiée le 5 décembre 2024, affichage jusqu'au 18 décembre 2024