Maintenance

Due to a planned maintenance at our hosting facility, the SFBI website will be stopped from October 6 to October 8

Exploration du pangénome pour délimiter automatiquement les éléments mobiles ICE et IME

 Stage · Stage M2  · 6 mois    Bac+5 / Master   INRAE MaIAGE · Jouy-en-Josas (France)

Mots-Clés

pangénome éléments mobiles génomique comparée annotation fonctionnelle

Description

Stage M2: Exploration du pangénome pour délimiter automatiquement les éléments mobiles ICE et IME

(english version below)

Présentation d’INRAE et MaIAGE :

INRAE est un institut de recherche public, parmi les leaders mondiaux en sciences du végétal, de l’animal et en agro-alimentaire. Sous l’angle microbiologique, l’institut étudie les microbes des aliments, ceux liés à la santé globale, ainsi que ceux présents dans les milieux environnementaux (sols, eaux, effluents). Ces recherches s’appuient notamment sur les méta-omiques, la bioinformatique à grande échelle, l’expérimentation contrôlée et la modélisation pour comprendre, surveiller et piloter le fonctionnement des communautés microbiennes.
Dans ce cadre, l’unité INRAE MaIAGE (Mathématiques et Informatique Appliquées du Génome à l’Environnement) développe des méthodes et logiciels pour l’analyse microbiologique : IA pour la prédiction fonctionnelle et l’estimation d’incertitudes, inférence de réseaux et dynamique de communautés écologiques, pangénomes et flux de gènes mobiles.

Contexte scientifique, missions et activités :

Les éléments intégratifs et conjugatifs (ICE) et les éléments intégratifs et mobilisables (IME) contribuent au transfert horizontal de gènes chez les bactéries. Détecter et annoter ces éléments mobiles dans les chromosomes est difficile car leur intégration peut donner lieu à des structures complexes (accrétion, matriochka). DynAMic et MaIAGE ont développé ICEscreen, un outil de détection des ICE et des IME dans les génomes de Bacillota [1]. ICEscreen détecte les protéines signatures et les assemble en structures, mais la recherche des limites d’intégration reste un défi et la communauté scientifique bénéficierait d’une approche automatique et générique. La délimitation des ICE et des IME permettrait ensuite l’annotation fonctionnelle des gènes cargo qu’ils portent (par exemple résistance aux antibiotiques). Comme les ICE et les IME se transfèrent horizontalement et ciblent parfois spécifiquement des gènes conservés pour leur intégration, nous souhaitons exploiter le pangénome pour faciliter leur délimitation automatique. PPanGGOLiN [2] est un outil de construction de pangénomes qui partitionne les familles de gènes en différentes catégories de prévalence.
Votre mission pour ce stage est d’identifier la meilleure approche pangénome pour approximer les limites des éléments ICE et IME. Pour évaluer les différentes approches, le jeu de référence Firmidata [3] sera utilisé.

Vos principales activités seront :

  • Participer à l’expression du besoin et au cahier des charges.
  • Développer et tester les scripts pour générer et visualiser les données d’intérêts du projet.
  • Analyser les résultats générés par le projet et rédiger des rapports.
  • Documenter et mettre à disposition les développements de façon reproductible et en assurant le suivi des versions.

Liens utiles / bibliographie :

  • [1] Lao J. et al. ICEscreen: a tool to detect Firmicute ICEs and IMEs, isolated or enclosed in composite structures. NAR Genomics and Bioinformatics, Volume 4, Issue 4, December 2022, lqac079, https://doi.org/10.1093/nargab/lqac079
  • [2] Gautreau G. et al. PPanGGOLiN: Depicting microbial diversity via a partitioned pangenome graph. PLOS Computational Biology, 16(3), 2020: e1007732. doi: 10.1371/journal.pcbi.1007732
  • [3] Guédon G. et al. FirmiData: a set of 40 genomes of Firmicutes with a curated annotation of ICEs and IMEs. BMC Res Notes. 2022 May 10;15(1):157. doi: 10.1186/s13104-022-06036-w. PMID: 35538580; PMCID: PMC9092696.

Formations et compétences recherchées :

Formation recommandée : Master 2 en bioinformatique, ou licence en bioinformatique avec une expérience avérée en développement informatique.

Connaissances souhaitées :

  • Langage de programmation Python
  • Environements Unix, Git, cluster de calcul
  • Maîtrise du français et de l’anglais

Expérience appréciée :

  • Bibliothèques Pandas, Matplotlib, Seaborn
  • Projets pluridisciplinaires si possible en génomique comparée et annotation fonctionelle de génome

Aptitudes recherchées :

  • Travaille en équipe interdisciplinaire (biologistes, bioinformaticiens, statisticiens)
  • Capacité d’analyse et de synthèse
  • Rigueur scientifique
  • Adaptabilité aux défis

Modalités d’accueil et informations pratiques :

  • Durée du stage : 5 à 6 mois
  • Début du stage : Janvier / Février 2026
  • Unité de rattachement (lieu d’exercice) : UR1404 MaIAGE (Mathématiques et Informatique Appliquées, du Génome à l’Environnement), Centre INRAE, Domaine de Vilvert, bât 233, 78350 Jouy-en-Josas
  • Equipe de rattachement : StatInfOmics (bioinformatique et statistique des données “omiques”). L’équipe StatInfOmics développe et met en oeuvre des méthodes statistiques et bioinformatiques dédiées à l’analyse de données “omiques”.
  • Encadrant·e·s : Thomas Lacroix, Guillaume Gautreau, Hélène Chiapello
  • Gratification selon la règlementation en vigueur

Modalités pour postuler :

  • Envoyer un CV détaillé et une lettre de motivation expliquant en quoi votre profil correspond au projet de stage
  • Par courriel à Thomas Lacroix (thomas.lacroix@inrae.fr) et Guillaume Gautreau (guillaume.gautreau@inrae.fr)
  • Date limite pour candidater : 28 novembre 2025

En savoir plus :

+++++++++++++++++++++++ english version

Master2 internship: Exploring the pangenome to automatically delimit ICE and IME mobile elements

Keywords: pangenome, mobile elements, comparative genomics, functional annotation

Presentation of INRAE ​​and MaIAGE:

INRAE ​​is a public research institute, among the world leaders in plant, animal, and agri-food sciences. From a microbiological perspective, the institute studies microbes related to food, global health, and the environment (soil, water, effluents). This research aims to understand, monitor, and manage microbial communities. It relies in particular on meta-omics, large-scale bioinformatics, controlled experimentation, and modeling.
In this context, the INRAE ​​MaIAGE team (Applied Mathematics and Computer Science from Genome to the Environment) develops methods and softwares for microbiological analysis: AI for functional prediction, network inference and dynamics of ecological communities, pangenomes, and mobile genetic elements.

Scientific context, missions, and activities:

Integrative and conjugative elements (ICEs) and integrative and mobilizable elements (IMEs) contribute to horizontal gene transfer in bacteria. Detecting and annotating these mobile elements in chromosomes is challenging as their integration can result into complexes structures (accretion, matryoshka). DynAMic and MaIAGE have developed ICEscreen, a tool for detecting ICEs and IMEs in Bacillota genomes [1]. ICEscreen detects signature proteins and assembles them into structures but searching for integration boundaries remains a challenge. In this regard, the scientific community would benefit from an automated and generic approach. The delineation of ICEs and IMEs would then allow for the functional annotation of the cargo genes they carry (e.g., antibiotic resistance). As ICEs and IMEs transfer horizontally and sometimes specifically target highly conserved genes for their integration, we aim to leverage pangenome analysis to facilitate their automatic delineation. PPanGGOLiN [2] is a pangenome construction tool that partitions gene families into different prevalence categories (persistent, shell and cloud genomes).
Your mission for this internship is to identify the best pangenome approach to approximate the boundaries of ICE and IME elements. To evaluate the different approaches, the Firmidata [3] benchmark set will be used.

Your main responsibilities will be:

  • Participate in the formulation of needs and specifications.
  • Develop and test scripts to generate and visualize data relevant to the project.
  • Analyze the results generated by the project and write reports.
  • Document and make developments available in a reproducible manner, ensuring version control.

Useful links / bibliography:

  • [1] Lao J. et al. ICEscreen: a tool to detect Firmicute ICEs and IMEs, isolated or enclosed in composite structures. NAR Genomics and Bioinformatics, Volume 4, Issue 4, December 2022, lqac079, https://doi.org/10.1093/nargab/lqac079
  • [2] Gautreau G. et al. PPanGGOLiN: Depicting microbial diversity via a partitioned pangenome graph. PLOS Computational Biology, 16(3), 2020: e1007732. doi: 10.1371/journal.pcbi.1007732
  • [3] Guédon G. et al. FirmiData: a set of 40 genomes of Firmicutes with a curated annotation of ICEs and IMEs. BMC Res Notes. 2022 May 10;15(1):157. doi: 10.1186/s13104-022-06036-w. PMID: 35538580; PMCID: PMC9092696.

Education and background:

Master’s degree in bioinformatics, or a bachelor’s degree in bioinformatics with experience in software development.

Required skills:

  • Python programming language
  • Unix, Git, computer clusters
  • Ability to work in both French and English environments

Desired Skills:

  • Pandas, Matplotlib, and Seaborn libraries
  • Experience in comparative genomics or functional genome annotation

Competencies:

  • Ability to work in an interdisciplinary team (biologists, bioinformaticians, statisticians)
  • Analytical and summarizing skills
  • Scientific rigor
  • Adaptability to challenges

Practical Information:

  • Internship duration: 5 to 6 months
  • Internship start date: January/February 2026
  • Laboratory’s location: UR1404 MaIAGE (Mathématiques et Informatique Appliquées, du Génome à l’Environnement), Centre INRAE, Domaine de Vilvert, bât 233, 78350 Jouy-en-Josas
  • Research team: StatInfOmics (bioinformatics and statistics of “omics” data). The StatInfOmics team develops and implements statistical and bioinformatics methods dedicated to the analysis of “omics” data.
  • Supervisors: Thomas Lacroix, Guillaume Gautreau, Hélène Chiapello
  • Compensation according to current regulations

Application Instructions:

  • Send a detailed CV and a cover letter explaining how your profile fits the internship’s project
  • By email to Thomas Lacroix (thomas.lacroix@inrae.fr) and Guillaume Gautreau (guillaume.gautreau@inrae.fr)
  • Application deadline: November 28, 2025

Learn more:

Candidature

Procédure : Envoyer un CV détaillé et une lettre de motivation expliquant en quoi votre profil correspond au projet de stage par courriel à Thomas Lacroix (thomas.lacroix@inrae.fr) et Guillaume Gautreau (guillaume.gautreau@inrae.fr).

Date limite : Nov. 28, 2025

Contacts

 Thomas Lacroix
 thNOSPAMomas.lacroix@inrae.fr

 Guillaume GAUTREAU
 guNOSPAMillaume.gautreau@inrae.fr

Offre publiée le Oct. 8, 2025, affichage jusqu'au Nov. 28, 2025