Stage M2 - Développement et automatisation d’un pipeline pour l’analyse de séquences d'anticorps

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Centre de Résonnance Magnétique des Systèmes Biologiques · Bordeaux (France)

 Date de prise de poste : Jan. 1, 2026

Mots-Clés

Pipeline NGS Athérosclérose Anticorps Théranostic

Description

Contexte :

Dans le cadre du projet européen ABCardionostics, l’objectif est de concevoir de nouveaux outils pour la détection précoce des plaques d’athérome instables, à l’origine de pathologies cardiovasculaires majeures comme l’infarctus ou les AVC. Ce projet vise également à offrir des solutions thérapeutiques personnalisées, reposant notamment sur l’ingénierie d’anticorps humains. Les anticorps au format scFv (combinaison des régions variables VH et VL des chaînes lourdes et légères des anticorps) ont été sélectionnés in vivo et séquencés grâce à la technologie NGS PacBio. Ces régions variables, VH (Variable Heavy) et VL (Variable Light), sont essentielles pour la reconnaissance des antigènes. Elles se distinguent par leur organisation structurale en segments spécifiques, définis selon les standards d’annotation d’IMGT (International ImMunoGeneTics Information System). Le stage s’inscrit dans cette démarche, en se concentrant sur l’analyse des séquences obtenues afin d’identifier les anticorps pertinents, spécifiques des plaques d’athérome.

Objectifs du projet :

Automatiser et développer un pipeline pour l’analyse des séquences d’anticorps scFv (~1000 paires de bases par séquence) intégrant plusieurs fonctionnalités basées sur les standards IMGT (https://www.imgt.org/HighV-QUEST/, définition des CDR, FR, mutations…). Des scripts Python et Bash sont déjà existant pour effectuer certaines analyses des séquences scFv mais le workflow n’est pas automatisé. Le premier travail du stagiaire sera d’automatiser ces scripts. De plus, des étapes supplémentaires d’analyse devront être implémentées via des scripts Python et/ou Bash. Le stagiaire devra aussi développer des scirpts permettant de répondre à des questions plus exploratoires des biologistes. La mise en œuvre de ce pipeline nécessitera le développement de scripts capables de gérer de grandes quantités de données de séquençage. Enfin, l’étudiant pourra tester le pipeline implémenté sur divers jeux de séquences et pourra approfondir son travail en développant des visualisations pertinentes pour l’interprétation des résultats. A terme, cet outil devra permettre une analyse fine des séquences d’anticorps en facilitant leur exploration, leur classification, et leur mise en relation avec des données biologiques ou cliniques. Il contribuera ainsi à l’avancée des thérapies ciblées et personnalisées pour les pathologies cardiovasculaires. Le projet repose sur une étroite collaboration avec IMGT et avec la doctorante en Bio-informatique de l’équipe.

Méthode :

  1. Automatisation du pipeline existant via un gestionnaire de workflow.
    • Prendre en main les scripts actuellement utilisés dans l’équipe et analyser leur enchaînement logique.
    • Concevoir et implémenter un workflow reproductible et modulaire avec un gestionnaire adapté (Nextflow ou Snakemake).
    • Gérer la parallélisation des tâches si elle est possible, la reprise en cas d’erreur et la portabilité du pipeline (exécution locale, cluster ou cloud).
    • Documenter l’utilisation du workflow pour faciliter sa réutilisation par d’autres membres de l’équipe.
  2. Développement du pipeline avec d’autres étapes d’analyse.
    • Intégrer des modules complémentaires pour le traitement et la manipulation de chaînes CIGAR issues des alignements (en collaboration avec IMGT).
    • Automatiser l’extraction et la transformation d’informations contenues dans des fichiers tabulés (format TSV/CSV).
    • Implémenter des outils de contrôle qualité pour vérifier la cohérence et la complétude des données traitées.
  3. Développement de modules pour répondre à des questions exploratoires.
    • Concevoir des scripts ou modules spécifiques permettant de détecter et caractériser des séquences particulières, telles que des chimères de scFv.
    • Mettre en place une stratégie flexible permettant d’adapter le pipeline à d’autres types de questions biologiques exploratoires.
    • Comparer et valider les résultats obtenus à l’aide de jeux de données tests ou de références.
  4. Mise en place de visualisations pertinentes pour l’interprétation des résultats.
    • Développer des graphiques et représentations claires (R, Python, ou outils de visualisation interactifs) pour faciliter l’analyse des données produites par le pipeline.
    • Proposer des dashboards ou rapports automatisés permettant une interprétation rapide et intuitive des résultats.
    • Adapter les visualisations aux besoins spécifiques des biologistes de l’équipe afin de favoriser la prise de décision scientifique.

Précisions sur l’encadrement :

Le (la) stagiaire(e) aura accès à toutes les compétences, méthodologies et appareils disponibles au sein de l’Unité CRMSB. Lors de son arrivée au sein du laboratoire, l’étudiant(e) rencontrera l’ensemble des personnels afin de pouvoir s’intégrer rapidement. À la suite de cette première prise de contact avec le laboratoire et dans le but de lui permettre de s’approprier rapidement son sujet de recherche, une réunion de démarrage de projet aura lieu. Lors de celle-ci, lui seront présentés tous les tenants et aboutissants scientifiques du stage ainsi que son organisation temporelle. A ce stade, la bibliographie nécessaire à la compréhension du sujet lui sera fournie (revues générales lui permettant de s’approprier les concepts de bases et de comprendre le rationnel associé, mais également les articles de recherche originaux).

Profil et compétences recherchées :

Etudiant(e) de master 2 de bioinformatique ou immunologie (avec une forte inclination pour la bioanalyse), disposant des compétences suivantes :
- Connaissance des technologies d’analyses biochimique et immunologiques classiques serait un plus
- Connaissances en bioanalyse, (bio)statistique et immunologie
- Maîtrise de l’environnement linux/unix
- Maîtrise du langage R et d’un langage de programmation (Python)
- Motivation pour évoluer dans un environnement pluridisciplinaire
- Rigueur et esprit de synthèse, ainsi que capacité à travailler en équipe

Candidature

Procédure : Envoyer un CV et une lettre de motivation à marie-josee.jacobin-valat@rmsb.u-bordeaux.fr et yaelle.guiberteau@rmsb.u-bordeaux.fr

Date limite : Nov. 15, 2025

Contacts

 Jacobin-Valat Marie-Josée
 maNOSPAMrie-josee.jacobin-valat@rmsb.u-bordeaux.fr

 Yaëlle Guiberteau
 yaNOSPAMelle.guiberteau@rmsb.u-bordeaux.fr

Offre publiée le Oct. 1, 2025, affichage jusqu'au Nov. 15, 2025