Mots-Clés
Bioinformatique
génétique des populations
évolution moléculaire
simulations
machine learning
Description
Diplôme préparé : Master 2 Bioinformatique parcours modélisation et statistiques – BIMS
Lieu d’apprentissage : Bat 650 Ada Lovelace, rue Raimond Castaing, 91190 Gif-sur- Yvette et Campus Mont Saint Aignan, Université de Rouen Normandie
Programme des cours:
http://masterbioinfo.univ-rouen.fr/
Apprentissage en laboratoire:
1- Présentation du service : Le Laboratoire Interdisciplinaire des Sciences du Numérique (LISN) est une nouvelle unité mixte de recherche (UMR9015), Université Paris-Saclay et CNRS, depuis le 1er janvier 2021, installée sur le plateau du Moulon dans 5 bâtiments (sur 2 sites) issus des ex-laboratoires LIMSI et LRI, à Gif-sur-Yvette et Orsay (91). Le laboratoire estprésent dans de nombreux projets nationaux et internationaux et ses thèmes de recherche couvrent un large spectre scientifique (informatique et mécanique énergétique). Il compte plus de 400 membres répartis dans 5 départements de recherche et 6 services de support et de soutien. L'équipe Bioinfo, du département des Sciences des données, a pour objectif de concevoir et de développer de nouvelles méthodes de calcul pour aborder efficacement les problèmes biologiques. Les compétences de ses membres couvrent l'algorithmique, la combinatoire, les automates stochastiques, l'apprentissage automatique, la représentation des connaissances et les bases de données. Elle appartient à la ligne d'action DataSense du labex DigiCosme. Elle entretient des collaborations étroites avec le groupe Bio-Informatique Moléculaire de I2BC et l’équipe TAO d’Inria (spécialisée dans le machine learning). Son programme scientifique est structuré en trois thèmes: Séquences et structures biologiques; Biologie des systèmes et biologie synthétique; et Intégration et analyse des données biologiques.
2- Présentation des membres du service ou équipe : L’équipe est composée de 3 professeur et professoresses de l’Université Paris- Saclay, 1 chercheuse CNRS ainsi que 4 maître et maîtresses de conférences. Il y a également 2 post-doc ; 1 ATER ; 7 doctorants et doctorantes et des stagiaires.
3- Présentation concise du projet: L’apprentissage se déroulera dans le domaine de la génomique des populations et évolution moléculaire qui est dans le thème « Séquences et structures biologiques ». La personne apprentie aura pour mission de concevoir, développer et conduire en spécialiste une approche informatique et statistique de préparation et d’analyses de données de grande dimension (big data) issues de la recherche en sciences du vivant.
4- Activités et actions menées : La personne recrutée effectuera des analyses de données séquençage NGS et étudiera le rôle les mécanismes évolutifs dans la variabilité génétique des levures en utilisant le logiciel d’analyses statistiques R. Elle sera amenée à déployer des logiciels de simulation tels que SLIM et de machine learning tels que spidna qui est codé en python et développé dans le laboratoire. Elle apprendra à les adapter aux spécificités du projet scientifique.