Doctorat Graphes de Wheeler et structures d'auto-indexation (URGENT)
CDD · Thèse · 36 mois Bac+5 / Master Équipe Traitement de l'Information en Biologie Santé - LITIS EA4108 · Rouen (France)
Date de prise de poste : 1 décembre 2021
Mots-Clés
BWT FM-index Graphes de Wheeler placement de lectures sur des séquences de référence
Description
URGENT
Suite au désistement tardif d'un sujet mieux classé, le projet présenté ci-dessous est financé, sous réserve d'un début de doctorat au 1er décembre 2021.
Me contacter (Laurent.Mouchard@univ-rouen.fr) pour plus d'informations si nécessaire
Contexte scientifique :
Dans le contexte évolutif des technologies de séquençage à haut (et à très haut) débit, un grand nombre d'algorithmes de placement de lectures sur des séquences de références utilisent des structures d'auto-indexation, telles la BWT, le SA et le FM-index (les historiques BWA, Bowtie et autres en sont des exemples).
Plus récemment, la structure de graphe de Wheeler a été proposée (https://www.sciencedirect.com/science/article/pii/S0304397517305285) ainsi qu'une représentation compacte de cette structure.
Objectifs du projet :
Le principal objectif du projet est l'étude de cette structure et le développement d'algorithmes permettant, par exemple, de prendre en charge le séquençage à haut débit en fragments longs.
Des contacts avec les auteurs des articles séminaux permettront d'affiner le sujet exact du doctorat dès la fin d'année 2021, à la suite de la nécessaire phase d'étude et de prise en main de la structure.
Équipe d'accueil :
L’équipe TIBS du LITIS, hébergée au sein d'un tout récent bâtiment dédié à la recherche et à l'innovation en Biologie situé sur le campus de Mt St Aignan sur les hauteurs de la charmante ville de Rouen, a travaillé sur les structures d'auto-indexation (BWT, SA et FM-index) sur plusieurs aspects :
- la dynamicité des structures (quel est le nombre minimal d’opérations à faire pour mettre à jour une structure lorsque le texte qu'elle indexe est modifié sans avoir à la reconstruire en totalité, thèse Mikaël Salson, 2010)
- BWT, SA et FM-index d’un ensemble de textes plutôt qu’un ensemble de BWT, SA et FM-index (PHC STAR avec Seoul National University, 2016)
- la transformée de Burrows-Wheeler pour la recherche d’un motif dans une séquence consensus avec pondération (Collaboration avec l’Université de Stellenbosch, Afrique du Sud et Aberystwyth University, Pays de Galles).
Profil pour la candidature :
Idéalement un Master 2 de Bioinformatique, avec un appétit et des compétences pour l'algorithmique, un Master 2 en Informatique/Sciences des données (avec une bonne compréhension de ce qu'est le séquençage à haut-débit et la génétique/génomique)
Candidature
Procédure : Un CV et une lettre de motivation contenant les noms de deux références académiques/industrielles doivent être envoyés à l'adresse mél du contact
Date limite : 24 novembre 2021
Contacts
Laurent Mouchard
LaNOSPAMurent.Mouchard@univ-rouen.fr
Offre publiée le 17 novembre 2021, affichage jusqu'au 30 novembre 2021