M2 - Analyse métagénomique de la diversité génétique de pathogènes zoonotiques dans les eaux usées: Cas du SARS-CoV-2 en Guyane française

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

Place Eugène Bataillon
34095 Montpellier
France

Contacts
Emira Cherif
Email du/des contacts
emira.cherif@ird.fr
Description

Contexte :

Entre 1940 et 2004, plus de 330 maladies émergentes ont été identifiées chez l’homme à travers le monde dont 177 représentent de nouveaux agents infectieux reconnus par la science. De façon similaire, d’autres maladies infectieuses émergentes sont aussi apparues dans les milieux naturels ainsi que dans la production animale et les plantations. Nous savons à présent que les facteurs socio-économiques et environnementaux qui augmentent les contacts entre l’homme et de nouveaux pathogènes, tel que la déforestation, l’agriculture, l’aquaculture ou encore les introductions d’espèces favorisent l’émergence ou la ré-émergence de nombreux agents infectieux. En fait, plus de la moitié des maladies animales qui sont apparues chez l’homme depuis 1940 proviennent des changements de l’utilisation des terres dus à l’agriculture ou à d’autres types de production alimentaire, ou bien de la chasse ou de la pêche. Ces activités humaines augmentent les fréquences de contacts entre l’homme et l’animal, mais aussi changent considérablement l’équilibre de la biodiversité, qui peut être un facteur critique soutenant l’émergence des pathogènes des milieux naturels vers ceux domestiqués. L’émergence récente de la pandémie de Covid-19 causée par le SARS-CoV-2 un virus à ARN de la famille des Coronaviridae en est un exemple concret mettant en lumière les innombrables conséquences des activités humaines sur la stabilité d’une société mondiale complexe et interconnectée.

Un aspect majeur sous-jacent au potentiel d’émergence et de transmission de ces pathogènes notamment dans les populations humaines repose sur leur virulence, et donc sur la disponibilité d’une grande diversité de variants génétiques permettant leur sélection et leur adaptation à de nouveaux environnements. Au cours d’émergences infectieuses il est donc primordial d’analyser la diversité de souches/variants génétiques afin de mieux comprendre et de mieux anticiper leurs dynamiques épidémiologiques. Le séquençage du génome entier (WGS) et particulièrement le WGS en temps réel constitue un outil puissant pour comprendre cette dynamique. La technologie de séquençage Oxford Nanopore (ONT) a été utilisée dans les récentes flambées de virus Usutu, Ebola, Zika et fièvre jaune en raison de la facilité d'utilisation et d’un coût relativement faible. La robustesse de cette méthode a été récemment validée à l'aide du virus Usutu (cf Munnink et al.,2020).

Objectifs :
L’objectif de ce stage est d’analyser les données issues du séquençage en temps réel (ONT) et d’étudier la diversité génétique des souches/variants du SARS-CoV-2 présents dans les eaux usées et cours d’eau de Guyane française.

• Reconstituer les génomes de SARS-CoV-2 en Guyane.
• Évaluer la diversité génétique du SARS-CoV-2 de Guyane et la replacer dans un contexte mondial afin d’établir le/les voies d’introduction du virus en Guyane.
• Comparer la diversité génétique des souches de SARS-CoV-2 présentes dans l’environnement et celles issues des cas cliniques.

Méthodologie :
Les données traitées seront issues du WGS en temps réel (ONT) et des short-reads (Illumina) obtenues à partir d’échantillons environnementaux et cliniques.
Durant le stage l’étudiant(e) aura pour tâches :
• L’analyse des données de WGS en temps réel notamment en utilisant et optimisant pour des données environnementales les outils disponibles.
• Traitement des données NGS (Nanopore/Illumina)
• Assemblage des génomes de SARS-CoV-2 (Medkka ; Canu/ONT ; Megahit/Illumina ...)
• Reconstruction des haplotypes de SARS-CoV-2 par clustering (K-mers).
• Phylogénies des souches de SARS-CoV-2 de Guyane (alignements multiples, modèles de mutations...).
• Évaluation et optimisation des outils bioinformatiques développés pour l’analyse des données SARS-CoV-2 issues du séquençage Nanopore (ARTIC-bioinformatics pipeline, RAMPART) et comparaison avec des outils génériques (CulebrONT).

Durant son stage l’étudiant(e) aura notamment à mener une étape de veille technologique et à évaluer la pertinence des logiciels utilisés pour répondre au mieux aux questions scientifiques posées. Pour ce faire il/elle aura à utiliser différents langages de programmation informatique tels que Python, R, C++ et JavaScript etc. Lors de ce stage l’étudiant(e) sera encadré(e) et formé(e) au sein de l’équipe. Il/elle fera partie de l’équipe multidisciplinaire (bioinformaticiens, microbiologistes, écologistes, modélisateurs et généticiens) impliquée dans le projet ANR EPI-COV (Épidémiologie Environnementale du COVID-19 en Guyane Française) dans lequel s’intègre ce stage. Il/elle aura accès aux clusters de calcul des plateformes I-SEM et MBB (Montpellier Bioinformatics Biodiversity). L’étudiant(e) sera associé(e) aux publications issues de ce travail.
Disponibilité des données :

Au sein de l’équipe nous effectuons des prélèvements en routine sur le terrain. En octobre et novembre nous allons collecter des échantillons d’eaux usées et de cours d’eau en Guyane. Le séquençage (ONT) sera réalisé dans la foulée. Les données seront ainsi disponibles pour le début du stage.
Compétences requises:
• Intérêt pour l’analyse des données de séquençage haut-débit
• Maîtrise d’au moins un des principaux langages informatiques du domaine (Python, C++, R...)
• Intérêt pour la diversité des génomes et leur évolution
• Curiosité, Rigueur, esprit d’initiative, capacité de rédaction (en français et anglais) et de communication des résultats.

Références bibliographiques relatives au sujet proposé:
Munnink, B. B. O., Nieuwenhuijse, D. F., Stein, M., O’Toole, Á., Haverkate, M., Mollers, M., ... & van der Linden, A. (2020). Rapid SARS-CoV-2 whole-genome sequencing and analysis for informed public health decision-making in the Netherlands. Nature medicine, 1-6. https://doi.org/10.1038/s41591-020-0997-y
To, K. K. W., Hung, I. F. N., Ip, J. D., Chu, A. W. H., Chan, W. M., Tam, A. R., ... & Lee, L. L. Y. (2020). COVID-19 re-infection by a phylogenetically distinct SARS-coronavirus-2 strain confirmed by whole genome sequencing. Clinical Infectious Diseases. https://doi.org/10.1093/cid/ciaa1275
St Hilaire, B. G., Durand, N. C., Mitra, N., Pulido, S. G., Mahajan, R., Blackburn, A., ... & Gnirke, A. (2020). A rapid, low cost, and highly sensitive SARS-CoV-2 diagnostic based on whole genome sequencing. bioRxiv. https://doi.org/10.1101/2020.04.25.061499 
Street, R., Malema, S., Mahlangeni, N., & Mathee, A. (2020). COVID-19 wastewater surveillance: An African perspective. Science of the Total Environment, 140719. https://doi.org/10.1016/j.scitotenv.2020.140719
Ahmed, W., Angel, N., Edson, J., Bibby, K., Bivins, A., O'Brien, J. W., ... & Tscharke, B. (2020). First confirmed detection of SARS-CoV-2 in untreated wastewater in Australia: A proof of concept for the wastewater surveillance of COVID-19 in the community. Science of The Total Environment, 138764.https://doi.org/10.1016/j.scitotenv.2020.138764

Equipe adhérente personne morale SFBI
Equipe Non adhérente