M2: Analyses multivariées de cubes de données omiques appareillées : Application à des données transcriptomiques multi-tissus

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Nom de la structure d'accueil
Adresse

Domaine de Vilvert
78350 Jouy en Josas
France

Contacts
Andrea Rau
Email du/des contacts
andrea.rau@inra.fr
Description

Les approches omiques cherchent à appréhender le vivant dans sa complexité, en intégrant des données de sources et de niveaux biologiques différents, comme la génomique, la transcriptomique, la protéomique et la métabolomique. Ces approches sont essentielles pour l’identification de biomarqueurs ou la mise en évidence de mécanismes impliqués dans des stress ou des maladies. Jusqu’à récemment, le coût élevé des technologies à haut-débit pour mesurer l’activité transcriptomique a fortement limité les plans d’expérience possibles, et la plupart des études réalisées se limitait à des comparaisons simples entre deux groupes (e.g., des individus sains versus malades). Aujourd’hui, les réduction de coûts et améliorations technologiques commencent à permettre des plans d’expérience de plus en plus sophistiquées pour répondre à des questions biologiques complexes. Un exemple notable est la réalisation des études transcriptomiques sur les mêmes individus à partir de différents organes, tissus, ou à différents temps, afin de pouvoir étudier la variabilité transcriptomique à des échelles spatiales, temporelles, et intra-individuelles. En particulier, ce type d’étude doit permettre d’appréhender les patrons d’expression des gènes, de leur dynamique et de leur complexité.

Du point de vue statistique, les données correspondantes à ce plan d’expérience sont organisées selon un cube, ou un tableau à trois dimensions: individus (n) × gènes (p) × tissus (k). L’analyse triadique partielle est une extension de l’analyse en composantes principales (ACP), qui a été développée pour l’analyse spécifique des cubes de données. Il s’agit d’une approche multivariée exploratoire, principalement utilisée en écologie ou en hydrologie, et dont l’application en génomique représente un point novateur. Le but de ce stage est d’étudier le potentiel de cette méthode pour évaluer la variabilité du transcriptome (notamment ressemblances et dissemblances entre tissus), et sa capacité à établir une typologie des tissus. Une attention particulière sera portée à l’étude de la plus-value de cette approche comparée à l’état de l’art en analyses génomiques (e.g., ACP, analyse factorielle multiple, analyses différentielles).

On s’appuiera sur deux ensembles de données existantes: (1) le transcriptome de 21 tissus chez la poule, en collaboration avec une biologiste dans notre équipe (T. Zerjal); et (2) le transcriptome de plusieurs dizaines de tissus différents chez l’humain du projet Genotype-Tissue Expression (GTEx; données publiques).

Equipe adhérente personne morale SFBI
Equipe Non adhérente