Stage de M1 de Bioinformatique: analyses pangénomiques de génomes bactériens

 Stage · Stage M1  · 4 mois    Bac+4   MAIAGE · Jouy-en-Josas (France)  Indemnité de stage règlementaire

 Date de prise de poste : 1 avril 2026

Mots-Clés

pangénomique génomique comparative Enterococcus cecorum tests d'association

Description

Titre

Analyses pangénomiques de génomes bactériens pour l’identification des gènes modulant l’infection par des phages

Description

Enterococcus cecorum (Ec) est un pathogène responsable d’environ 15 % de pertes dans les élevages de poulets de chair. L’unité Micalis de INRAE en partenariat avec l’unité MaIAGE de INRAE propose de développer une approche innovante qui consiste à utiliser des phages contre les infections à Ec dans un contexte prioritaire de santé globale et de lutte non antibiotique contre un pathogène majeur en aviculture.

L’objectif principal du stage est d’identifier les gènes bactériens qui modulent la sensibilité aux phages en utilisant des approches pangénomiques. Nous disposons d’une collection de plus de 170 souches Ec séquencées et représentatives de la diversité génétique de Ec, et près de 400 génomes sont disponibles en considérant les banques de données.

En préambule, il sera demandé au stagiaire d’annoter la collection de génomes d’Ec disponibles à l’aide d’outils d’annotation standardisée de génomes prokaryotes tels que Prokka [1] ou Bakta [2] puis de mener des analyses de génomiques comparatives sur ces génomes afin d’identifier des opérons qui pourraient être impliqués dans le processus infectieux. Dans ce contexte, des approches de pangénomiques avec des outils tels que Roary [3] ou PPanGGOLiN [4] seront utilisés afin de mettre en évidence des gènes spécifiques d’une part et le core-génome d’autre part.

Les analyses d’association pangénomiques (GWAS) ont montré leur efficacité pour établir la relation génotype-phénotype chez les bactéries. Les données expérimentales de spectres d’hôte de deux phages virulents qui caractérisent la sensibilité à l’infection seront analysées afin de déterminer les gènes statistiquement associés à la sensibilité du phage. Le stage consistera à mettre en œuvre les analyses GWAS en utilisant la méthode développée dans le logiciel Scoary2 [5] et permettra de caractériser les gènes de Ec impliqués dans la modulation de l’infection ‘sensible’ ou ‘résistant’ à chacun des phages. Afin d’aller plus loin, un modèle de prédiction basé sur des méthodes d’apprentissage automatique pourra être construit à partir d’un sous-ensemble de gènes annotés et expertisés comme présentant un intérêt majeur dans l’infection. Les résultats obtenus permettront de mieux comprendre les mécanismes de résistance et d’anticiper la sensibilité de nouvelles souches Ec.

Bibliographie

[1] Prokka : Seemann T. Prokka: rapid prokaryotic genome annotation Bioinformatics 2014 Jul 15;30(14):2068-9. PMID:24642063 DOI:10.1093/bioinformatics/btu153 CFF
[2] Bakta : Schwengers O., Jelonek L., Dieckmann M. A., Beyvers S., Blom J., Goesmann A. (2021). Bakta: rapid and standardized annotation of bacterial genomes via alignment-free sequence identification. Microbial Genomics, 7(11). https://doi.org/10.1099/mgen.0.000685
[3] Roary : Andrew J. Page, Carla A. Cummins, Martin Hunt, Vanessa K. Wong, Sandra Reuter, Matthew T. G. Holden, Maria Fookes, Daniel Falush, Jacqueline A. Keane, Julian Parkhill, “Roary: Rapid large-scale prokaryote pan genome analysis”, Bioinformatics, 2015;31(22):3691-3693 doi:10.1093/bioinformatics/btv421
[4] PPanGGOLiN: Depicting microbial diversity via a partitioned pangenome graph Gautreau G et al. (2020) PLOS Computational Biology 16(3): e1007732. doi: 10.1371/journal.pcbi.1007732
[5] Scoary2 : Roder, T. et al. Scoary2: rapid association of phenotypic multi-omics data with microbial pan-genomes. Genome Biol 25, 93 (2024). https://doi.org/10.1186/s13059-024-03233-7

Dates de stage

À partir du 1er avril 2026, durée de 2 à 4 mois (selon la formation)

Profil

Étudiant-e en Master 1 de Bioinformatique/Biostatistique

Compétences

Maîtrise de l’environnement Linux, utilisation et interprétation de logiciels d’analyse bio-informatique sont demandés.
Maitrise d’un langage de programmation, R et/ou python
Connaissances de base en statistique
Intérêt pour les applications en biologie

La faculté à travailler en équipe, à communiquer avec des interlocuteurs variés, la rigueur, l’autonomie et la curiosité sont des qualités indispensables à la réussite du stage.

Equipe d’accueil

Le-la stagiaire sera accueilli-e dans l’unité de recherche MaIAGE sur le campus INRAE à Jouy-en-Josas, dans un environnement pluridisplinaire (bioinformatique, statistique, gestion des données, développement informatique). Un poste de travail performant sera mis à la disposition du stagiaire et les analyses seront effectuées sur le cluster de calculs de la plateforme de bioinformatique de MIGALE au sein de l’unité MAIAGE.

Encadrement

Christelle Hennequet-Antier (Statistique) et Nacer Mohellibi (Bioinformatique)

Localisation

Unité MaIAGE (Mathématiques et Informatique Appliquées du Génome à l’Environnement)
Centre INRAE - Domaine de Vilvert - Bat 233 - 78350 Jouy-en-Josas, FRANCE

Candidature

Procédure : Envoyer CV et lettre de motivation à christelle.hennequet-antier@inrae.fr et nacer.mohellibi@inrae.fr avec pour objet : Candidature stage M1 – pangénomique Ec

Date limite : 1 avril 2026

Contacts

 Christelle Hennequet-Antier
 chNOSPAMristelle.hennequet-antier@inrae.fr

 Nacer Mohellibi
 naNOSPAMcer.mohellibi@inrae.fr

Offre publiée le 8 janvier 2026, affichage jusqu'au 1 avril 2026