Taxonomie et comparaison de génomes de levures par des approches sans alignement de séquence

 Stage · Stage M2  · 6 mois    Bac+5 / Master   UMR SPO, INRAE · Montpellier (France)  Gratification stage de M2 (~500 EUR/mois)

 Date de prise de poste : 15 janvier 2022

Mots-Clés

Genomes taxonomie phylogénomique levures k-mers alignment-free.

Description

Context :

Ces dernières années, le développement des technologies de séquençage haut-débit ainsi que la baisse de leurs coûts ont permis d’obtenir les séquences génomiques de nombreuses espèces animales et végétales. Aujourd’hui, en particulier dans le monde de la microbiologie, il est envisageable de séquencer les génomes de l’ensemble des espèces d’un genre et même de nombreuses souches d’une même espèce.

Parallèlement à l'essor du séquençage, des études récentes ont montré l’intérêt des approches dites sans alignements de séquence (alignment-free) notamment pour la comparaison de génomes entiers ou encore des approches de taxonomies. Ces méthodes permettent notamment de prendre en compte l’ensemble de l’information génomique contrairement aux approches plus classiques se focalisant sur un nombre limité de gènes ou de marqueurs taxonomiques.

C’est dans ce contexte que s’inscrit ce stage. Les approches sans alignement ont fait leurs preuves, particulièrement dans la phylogénomique des Procaryotes. Nous souhaitons ici évaluer leur intérêt et leurs performances dans le cadre de l’analyse des génomes de levures, des organismes unicellulaires Eucaryotes dont les génomes sont plus grands et plus complexes que ceux des Procaryotes.

Objectif :

Au cours de ce stage, un état de l’art des approches alignment-free sera réalisé avec une attention particulière pour les applications autour de la phylogénomique. Cette première étape permettra de sélectionner un certain nombre de méthodes qui seront alors éprouvées sur les données originales de séquences de levures du CIRM-Levures (plus de 100 génomes). Il sera possible, selon les besoins et les résultats, d’élargir le jeu de données aux séquençages de levures disponibles dans les bases de données publiques. Avec ce stage, nous souhaitons notamment évaluer :

  • La possibilité de travailler directement avec les données brutes de séquençage et non les assemblages des génomes.
  • Les performances de ces outils selon les échelles de comparaisons (souches, espèces, genres, etc.)
  • Les performances de ces outils par rapport aux outils classiques, notamment en taxonomie de la levure.

Encadrement :

Ce stage sera déroulera au sein de l’Unité Mixte de Recherche Science Pour l’Oenologie (SPO, UMR 1083, INRAE, Université de Montpellier et l’institut Agro | Montpellier SupAgro) sous l’encadrement du Dr Jean-Luc Legras, Ingénieur de recherche, responsable du CIRM-Levures et du Dr Hugo Devillers, Ingénieur de recherche en Bioinformatique dans l’équipe ADEL.

Profil recherché :

Étudiant(e) de Master II (bac+5) ou en dernière année d’école d'ingénieur. Une formation avec une forte dominante en bio-informatique et/ou en bio-analyse est souhaitée. Une bonne connaissance de l'environnement linux (BASH et manipulation de lignes de commande) est fortement recommandée. La maîtrise d’un langage de programmation (ex., Perl, Python, R, etc.) sera un plus.

Candidature

Procédure : Veuillez envoyer vos candidatures à Jean-Luc Legras (jean-luc.legras@inrae.fr) et à Hugo Devillers (hugo.devillers@inrae.fr). Pensez à joindre à votre candidature un CV ainsi qu’une lettre de motivation.

Date limite : 15 décembre 2021

Contacts

Hugo DEVILLERS

 huNOSPAMgo.devillers@inrae.fr

Offre publiée le 26 octobre 2021, affichage jusqu'au 31 décembre 2021