Thèse en métagénomique virale : séquençage long reads, analyse taxonomique, épidémiologie.

 CDD · Thèse  · 36 mois    Bac+5 / Master   Ecole Nationale Vétérinaire de Toulouse · Toulouse (France)

 Date de prise de poste : 1 novembre 2025

Mots-Clés

virus metagénomique taxonomie épidémiologie

Description

Mots clés
Virologie, bioinformatique, métagénomique, oxford nanopore

Profil et compétences recherchées

Les candidat(e)s titulaires d’un M2 en bioinformatique, microbiologie, virologie, évolution, ou de diplômes équivalents (ingénieurs en biologie) sont bienvenus. Dans tous les cas, une expérience et une appétence pour la bioinformatique sont requis.
Des aptitudes avancées à la compréhension et l’expression écrite en Français et en Anglais sont attendues.

Niveau de français requis: Avancé: Vous pouvez parler la langue de manière plus complexe, spontanée et sur des sujets variés.

Niveau d’anglais requis: Avancé: Vous pouvez parler la langue de manière plus complexe, spontanée et sur des sujets variés.

Résumé du projet de thèse

Les maladies virales représentent un risque sanitaire de premier plan, chez l’homme et l’animal, incluant notamment la menace zoonotique. L’identification et le typage rapide et robuste des agents viraux est une priorité scientifique et médicale et fait appel à des « pipelines » d’analyse qui associent les technologies de séquençage innovantes aux algorithmes bioinformatiques pour assembler, annoter et comparer les génomes viraux.

Le projet METAVIRAL vise à développer et évaluer un système de surveillance des émergences basé sur des protocoles de métagénomique clinique faisant appel aux technologies de séquençage de 3ème génération, depuis la prise en charge d’échantillons biologiques issus de différentes matrices jusqu’à la validation biologique des résultats. Le projet de thèse (laboratoires IHAP et MIAT) portera sur l’identification sans a priori de virus et sur l’évaluation de leurs capacités d’émergence.

Thématiques Domaine

La métagénomique consiste à analyser massivement les éléments génétiques présents dans une matrice biologique, ce qui renseigne sur les microorganismes présents dans l’échantillon (Chiu 2019). La 3ème génération des “nouvelles générations de séquençage” permet de générer en masse des séquences de grande taille (jusqu’à plusieurs kb), ce qui facilite l’assemblage de génomes et l’analyse de polymorphismes :
● La technologie Oxford Nanopore (ONT) repose sur la lecture de brins d’ADN/ARN lors de leur passage à travers un pore, sans limitation théorique de taille de lecture. Grâce à ses caractéristiques (portabilité, temps de séquençage court et possibilité d’analyse des données en temps réel), cette technologie agile est très facilement déployable en cas d’urgence et ouvre la voie au diagnostic « en temps réel » (Buddle 2024).
● La technologie PacBio (Single molecule real time sequencing - SMRT) permet le séquençage de longs fragments d’acides nucléiques avec une très grande exactitude (>99,9%) grâce à l’alignement de séquences consensus circulaires. Elle permet la caractérisation du spectre des variants constitutifs de la population virale, l’identification de variants minoritaires, la détermination de la proportion des différents variants, et la discrimination entre la présence de mutations sur un même brin génomique ou sur des génomes distincts.
Le projet METAVIRAL se positionne sur une recherche méthodologique et clinique, dans un cadre « One health » et transdisciplinaire, en associant étroitement virologistes humains, vétérinaires et bioinformaticiens.

Objectif et contexte
Le projet METAVIRAL vise à développer et évaluer des protocoles de métagénomique clinique faisant appel aux technologies de séquençage de 3ème génération, depuis la prise en charge d’échantillons biologiques issus de différentes matrices jusqu’à la validation biologique des résultats. In fine, l’objectif sera de proposer des pipelines robustes d’identification sans a priori de virus animaux et humains.

Le projet METAVIRAL se positionne sur une recherche méthodologique et clinique, dans un cadre « One health » et transdisciplinaire, en associant étroitement virologistes humains, vétérinaires et bioinformaticiens :
● L’interdisciplinarité entre virologues et bioinformaticiens : si les virologues mobilisent dans leurs propres équipes des compétences en bioinformatique, la collaboration avec une équipe de recherche spécialisée en bioinformatique est indispensable pour mobiliser les fronts de science, dans un champ disciplinaire extrêmement évolutif et compétitif. L’association entre les équipes de virologistes et de bioinformaticiens, visant à exploiter des innovations récentes de l’algorithmique du texte afin de répondre à des défis d’identification de variants à potentiel émergent, dans un contexte de métagénomique clinique, représente une démarche particulièrement originale. Cette approche intégrée, mêlant optimisation de pipelines existants, adaptation d’algorithmes spécialisés pour les étapes critiques et validations par des experts des résultats via des bases de données spécialisées, permettra notamment de réaliser des analyses robustes sur un plus grand nombre d’échantillons. Cette approche transdisciplinaire augmentera la capacité des programmes de surveillance d’émergences virales.

● La collaboration « One Health » entre virologistes humains et vétérinaires : si le champ disciplinaire des 2 laboratoires INFINITy et IHAP est très proche, les communautés sont extrêmement différentes et le rapprochement des cultures un vrai enjeu. Le contexte local est très favorable, puisque des collaborations non formalisées existent depuis plus de 10 ans, autour de l’étude du virus de l’hépatite E dans son réservoir animal (Izopet 2012; Lhomme 2013), les virus grippaux (Mengelle 2013, Bourret 2015) ou le virus SARS-CoV-2 agent du COVID-19. La formalisation d’une collaboration entre les 2 entités est une priorité de leurs responsables et répond à la priorité nationale de développer des approches « One Health » en décloisonnant santé humaine, animale et environnementale.

● Au plan technologique, les 2 équipes de virologie ont fait le choix d’investir dans une plateforme de séquençage dite de 3ème génération ou « longs fragments » : l’équipe du CHU-INFINITy a opté pour la plateforme PacBio qui permet de produire des séquences de grande qualité permettant une analyse détaillée des populations virales chez un individu infecté ; l’équipe ENVT-IHAP a opté pour la technologie Oxford Nanopore (ONT) qui permet également de produire des séquences de longue taille, avec davantage de portabilité et de flexibilité que PacBio, mais avec une fidélité de séquence qui reste moins performante. L’équipe IHAP est reconnue pour la valorisation de la technologie ONT en virologie clinique vétérinaire, pour le séquençage de poxvirus, d’adénovirus, de virus influenza ou de Monkeypox virus en collaboration avec le CHU.

Méthode

Le projet exploitera la complémentarité de ces plateformes pour instruire des questions de recherche portant sur 3 verrous majeurs :
● Phase préanalytique : nous évaluerons les méthodes de prélèvement, la conservation et l’extraction des acides nucléiques à partir de différentes matrices : fluides biologiques ou prélèvements d’environnement (poussières, eaux usées, eaux de surface).
● Phase analytique : Les protocoles de “multiplexage” - traitement de plusieurs échantillons en simultané sur une même réaction de séquençage - seront notamment évalués ainsi que des protocoles permettant de déterminer les seuils de détection de métagénomique « shotgun ».
● Phase d’analyse bioinformatique (majoritaire) : elle regroupe toutes les étapes d’analyse des données brutes à l’identification des espèces virales présentes dans l’échantillon. Un fois des protocoles de séquençage robustes validés, il restera à déterminer quels pipelines ou outils existants répondent le mieux aux besoins pour l’assemblage de novo, l’annotation et l’affiliation taxonomique. Ces différentes étapes seront encapsulées sous forme de composants nextflow couplés à des containers permettant leur réutilisation, une meilleure reproductibilité et portabilité. A terme, une intégration au workflow d’analyse de données de métagénomique metagWGS sera envisagée pour analyser finement le microbiote bactérien et viral d’un même échantillon.

Le programme de travail sera structuré de la manière suivante :
1. Un premier lot de travail consistera à effectuer une analyse bibliographique des solutions disponibles et déjà évaluées par la communauté scientifique.
2. Des protocoles sélectionnés seront évalués à l’aide de matrices « dopées » avec des acides nucléiques connus et dosés. Les pipelines bioinformatiques seront par ailleurs évalués in silico, c’est-à-dire avec des jeux de données de séquences simulés.
3. Après validation expérimentale, les protocoles retenus seront évalués sur des jeux de donnés cliniques, avec un focus sur les syndromes respiratoires aigus, chez l’animal et l’homme.
4. L’analyse bioinformatique est souvent basée sur des modèles phylogénétiques mobilisant d’importantes ressources computationnelles, limitant leur application en clinique. Récemment, une méthode d’algorithmique du texte avancée, les phylo-k-mers combinés au placement phylogénétique, a permis d’ouvrir de nouvelles échelles dans l’identification taxonomique. Déjà appliquée dans l’identification des sous-types viraux et dans la détection de recombinaison (Linard 2019; Scholz 2020; Romashchenko 2023), elle n’a toutefois été appliquée que sur des jeux de séquences associés à une espèce virale unique. Elle sera adaptée aux données de la métagénomique virale, pour filtrer in silico les séquences de l’hôte et identifier les communautés virales.

Résultats attendus

Le projet permettra d’améliorer les protocoles de métagénomique clinique, applicables à terme en médecine humaine et en surveillance des maladies animales. Des informations biologiques seront également produites à partir des jeux de données explorés : identification de virus émergents et de variants d’intérêt pour l’adaptation virale.

Précision sur l’encadrement

Le/la doctorant(e) recruté(e) sera co-encadré(e) par les équipes IHAP et MIAT, avec une codirection portée par les 2 unités (JL. Guérin et B. Linard) et la contribution d’autres collègues à l’encadrement. Il/elle bénéficiera du dispositif de formation doctorale proposé dans le cadre de l’Ecole Universitaire de Recherche « UNTEID – Maladies infectieuses émergentes @ Toulouse ».

Conditions scientifiques matérielles (conditions de sécurité spécifiques) et financières du projet de recherches

Type de financement du projet doctoral : Financement acquis EMERGENCE (volet 2) et Université de Toulouse (EUR UNITEID).

Le doctorant recruté bénéficiera du dispositif de formation doctorale proposé dans le cadre de l’Ecole Universitaire de Recherche « UNTEID – Maladies infectieuses émergentes @ Toulouse ».
Aucune contrainte spécifique de sécurité n’a été identifiée pour ce projet.

Objectifs de valorisation des travaux de recherche du doctorant : diffusion,publication et confidentialité, droit à la propriété intellectuelle,…

Les objectifs prioritaires de ces travaux seront une valorisation sous forme d’articles internationaux et de communications à des congrès en bioinformatique, virologie et maladies infectieuses émergentes.

Collaborations envisagées
Collaborations renforcées entre les unités IHAP et MIAT et le CHU de Toulouse. Ces travaux s’inscriront dans le réseau collaboratif des 3 unités, en France et à l’étranger. Ils seront également intégrés dans le projet ‘Élevages durables’ porté par l’Agence de programme Agralife.

Ouverture Internationale
Ces travaux s’inscriront dans le réseau collaboratif des 3 unités en Europe, notamment au sein du partenariat européen pour la santé et le bien-être animal (PAHW).

Références bibliographiques
• Perlas A, Reska T, Croville G, Tarrés-Freixas F, Guérin JL, Majó N, Urban L.Improvements in RNA and DNA nanopore sequencing allow for rapid genetic characterization of avian influenza. Virus Evol. 2025 Feb 18;11(1):veaf010.
• Croville G, Walch M, Sécula A, Lèbre L, Silva S, Filaire F, Guérin JL. An amplicon-based nanopore sequencing workflow for rapid tracking of avian influenza outbreaks, France, 2020-2022. Front Cell Infect Microbiol. 2024 Jan 22;14:1257586
• Croville G, Le Loc’h G, Zanchetta C, Manno M, Camus-Bouclainville C, Klopp C, Delverdier M, Lucas MN, Donnadieu C, Delpont M, Guérin JL.Rapid whole-genome based typing and surveillance of avipoxviruses using nanopore sequencing. J Virol Methods. 2018 Nov;261:34-39
• Scholz GE, Linard B, Romashchenko N, Rivals E, Pardi F. Rapid screening and detection of inter-type viral recombinants using phylo-k-mers. Bioinformatics. 2021 Apr 1;36(22-23):5351-5360.
• Linard B, Swenson K, Pardi F. Rapid alignment-free phylogenetic identification of metagenomic sequences. Bioinformatics. 2019 Sep 15;35(18):3303-3312.

Candidature

Procédure : Contact et candidature via le site de l'ED : https://ed-sevab.univ-toulouse.fr/as/ed/voirproposition.pl?langue=&matricule_prop=67158&site=edsevab

Date limite : 15 septembre 2025

Contacts

 Jean-Luc Guerin
 jeNOSPAMan-luc.guerin@envt.fr

 Benjamin Linard
 beNOSPAMnjamin.linard@inrae.fr

 https://ed-sevab.univ-toulouse.fr/as/ed/voirproposition.pl?langue=&matricule_prop=67158&site=edsevab

Offre publiée le 27 août 2025, affichage jusqu'au 15 septembre 2025