BENCHVIR : Benchmark de pipelines bioinformatiques pour l’exploration du virome respiratoire.

 Stage · Stage M2  · 6 mois    Bac+5 / Master   Laboratoire Virologie et Pathologie humaine · Lyon (France)  552 euros/mois

Mots-Clés

virome respiratoire métagénomique métatranscriptomique prédiction des virus benchmark bioinformatique

Description

BENCHVIR : Benchmark de pipelines bioinformatiques pour l’exploration du virome respiratoire.
Lieu : HCL GENEPII (Lyon, Croix rousse)
Durée : 6 mois, dès janvier-février 2026
Co-Encadrement : Vincent Navratil (UCBL, PRABI) vincent.navratil@univ-lyon1.fr ; Laurence Josset (CIRI, HCL) laurence.josset@chu-lyon.fr ; Hussein Anani (CIRI, HCL) hussein.anani@chu-lyon.fr
Mots clés : benchmar, outils de prédiction, bioinformatique, données massives, métagénomique, virome

1. Contexte scientifique et local du projet

Le séquençage métagénomique et métatranscriptomique a profondément transformé l’étude des écosystèmes microbiens, en permettant le séquençage sans a priori de l’ensemble des ADN et ARN présents dans un échantillon. Cette approche, désormais utilisée en diagnostic clinique pour identifier de nouveaux pathogènes ou détecter des agents infectieux rares, offre également une vision globale du microbiome, incluant le virome, le bactériome et d’autres composantes microbiennes (Wahl et al., 2022). Cependant, l’analyse bioinformatique de ces données complexes repose sur une multitude d’outils et de pipelines, dont les performances varient considérablement selon les jeux de données, les types de virus (ADN ou ARN) et les stratégies d’assemblage employées (Koonin et al., 2021; Gregory et al., 2023). Les virus à ADN et virus à ARN présentent des caractéristiques génomiques très distinctes, en taille, en composition et en taux de mutation, ce qui rend leur détection et leur classification particulièrement difficiles. Les outils existants peuvent, par exemple, montrer une sous-détection des virus à ARN en raison de leur plus grande variabilité génétique ou de l’absence de régions conservées facilement identifiables (Zayed et al., 2022). De même, la redondance des bases de données, la qualité variable des assemblages métagénomiques et l’absence de référence pour de nombreux virus inconnus compliquent encore la prédiction et la taxonomie virale (Paez-Espino et al., 2019).
Dans ce contexte, la mise en place d’un benchmark rigoureux des pipelines bioinformatiques est indispensable pour évaluer de manière objective leurs performances en matière de détection et de caractérisation des virus. Le projet BENCHVIR s’inscrit dans cette dynamique en comparant plusieurs approches récentes afin d’identifier les outils les plus efficaces et complémentaires pour analyser le virome respiratoire. Cette évaluation vise à renforcer la fiabilité des analyses viromiques et à optimiser les stratégies diagnostiques basées sur le séquençage haut débit. L’approche méthodologique repose sur l’assemblage de novo des génomes viraux à partir de données métagénomiques et métatranscriptomiques, une technique puissante qui permet de reconstruire des séquences complètes sans dépendre de bases de données de référence. Cette technique offre la possibilité de détecter des virus inédits ou fortement divergents, de révéler des pathogènes respiratoires qui auraient échappé aux outils classiques et d’explorer la « matière noire virale », c’est-à-dire l’ensemble des séquences encore non caractérisées issues de la métagénomique. Parallèlement, de nouveaux pipelines bioinformatiques ont été développés pour améliorer la découverte, la classification et l’annotation fonctionnelle des génomes viraux, intégrant souvent des approches d’intelligence artificielle et d’apprentissage automatique. Ces avancées permettent d’approfondir la compréhension des interactions entre virus, microbiote bactérien et hôte humain au sein des voies respiratoires, et contribuent ainsi à élucider le rôle du virome dans les processus infectieux, inflammatoires et chroniques du système respiratoire.

Objectifs scientifiques du projet

Le projet BENCHVIR a pour objectif principal de comparer les performances de différents pipelines bioinformatiques dédiés à la détection et à la caractérisation des virus respiratoires. Il s’agit d’évaluer leur sensibilité et leur spécificité dans l’identification des virus, tout en confrontant les approches actuellement utilisées sur notre plateforme à des outils récents issus de la littérature. L’étude analysera également la complémentarité et les limites de ces méthodes, dans le but d’identifier les outils les plus performants et synergiques pour le décryptage du virome respiratoire et l’amélioration des approches diagnostiques. Ces nouvelles stratégies pourront également être testées sur des prélèvements respiratoires humains afin de mieux annoter le virome respiratoire, en comparaison des analyses réalisées en routine sur la plateforme de séquençage GENEPII.
Le·la candidat·e travaillera en collaboration étroite avec les responsables scientifiques du stage pour développer ses compétences à l’interface de la virologie, de la bioinformatique et de la métagénomique/métatranscritpomique. Il.elle pourra bénéficier d’un support technique de la plateforme GENEPII (https://teamhcl.chu-lyon.fr/genepii) pour être guidé au mieux dans les choix méthodologiques et leur mise en œuvre (bonnes pratiques de développement, infrastructure de calcul). Les bases de données, les jeux de données, l’infrastructure informatique et les outils bioinformatiques nécessaires à la bonne réalisation des tâches listées ci-dessus seront disponibles dès le début du projet.

2. Valorisation scientifique

Les résultats obtenus issus de ce master peuvent être valorisé dans un article scientifique.

3. Compétences recherchées

Nous recherchons un·e candidat·e de niveau bac + 4 en bioinformatique. Il·elle devra être capable d’interagir avec différents chercheurs et ingénieurs du projet pour développer et mettre en place des méthodes innovantes en sciences de la vie.
Compétences souhaitées :
- R, Shell, Python, algorithmes bioinformatiques
- Traitement des données de séquençage (lectures de séquençage brutes)
- Comprendre les technologies de séquençage
- Versioning sous git
- Fortes capacités relationnelles et d’organisation, autonomie
- Capacités rédactionnelles, esprit d’analyse et de synthèse
-
4. Informations pratiques

Le stagiaire sera hébergé sur la plateforme GENEPII afin de favoriser les échanges interdisciplinaires. Ce stage bénéficiera d’une gratification de 6 mois à partir de janvier-février 2026 (552 euros/mois). Pour tout renseignement ou candidature, merci d’adresser un CV et une lettre de motivation le plus rapidement possible pour démarrage début 2026 à l’attention de : Vincent Navratil (UCBL, PRABI) vincent.navratil@univ-lyon1.fr ; Laurence Josset (CIRI, HCL) laurence.josset@chu-lyon.fr ; Hussein Anani (CIRI, HCL) hussein.anani@chu-lyon.fr.

5. Bibliographie
Wahl, A., Huptas, C. & Neuhaus, K. Comparison of rRNA depletion methods for efficient bacterial mRNA sequencing. Sci. Rep. 12, 5765 (2022).
Paez-Espino, D., Zhou, J., Roux, S., Nayfach, S., Pavlopoulos, G. A., Schulz, F., McMahon, K. D., Walsh, D., Woyke, T., Ivanova, N. N., Eloe-Fadrosh, E. A., Tringe, S. G., & Kyrpides, N. C. (2019). Diversity, evolution, and classification of virophages uncovered through global metagenomics. Microbiome, 7, 157.
Koonin E.V., Kuhn J.H., Dolja V.V., Krupovic M. (2024). Megataxonomy and global ecology of the virosphere. The ISME Journal, 18(1): wrad042.
Gregory A.C., et al. (2023). The global virome: How much diversity and how many independent origins? Environmental Microbiology, 25(1): 40‑44. https://doi.org/10.1111/1462‑2920.16207
Zayed A.A., Wainaina J.M., Dominguez‑Huerta G., Pelletier E., Pons J.C., et al. (2022). Expansion of the global RNA virome reveals diverse clades of bacteriophages and eukaryotic viruses. Cell, 185(21): 4023‑4038.e18. https://doi.org/10.1016/j.cell.2022.09.031

Candidature

Procédure : Pour tout renseignement ou candidature, merci d’adresser un CV et une lettre de motivation le plus rapidement possible pour démarrage début 2026 à l’attention de : Vincent Navratil (UCBL, PRABI) vincent.navratil@univ-lyon1.fr ; Laurence Josset (CIRI, HCL) laurence.josset@chu-lyon.fr ; Hussein Anani (CIRI, HCL) hussein.anani@chu-lyon.fr.

Contacts

Offre publiée le 21 octobre 2025, affichage jusqu'au 19 décembre 2025