Mots-Clés
effet Warburg
data-mining
workflow
nextflow
Description
Caractérisation du jeu de gènes Warburg chez les invertébrés marins et identification de sa régulation environnementale
Contexte scientifique :
L’effet Warburg, décrit initialement chez les cellules cancéreuses, correspond à une reprogrammation métabolique vers une glycolyse aérobie, favorisant la croissance cellulaire rapide. Ce phénomène, bien étudié en santé humaine, a récemment été identifié chez l’huître Magallana gigas, ouvrant une nouvelle piste de recherche à l’interface entre écologie marine et biologie du cancer.
Objectifs du stage :
1. Identifier les gènes impliqués dans l’effet Warburg chez M. gigas en exploitant des données issues de deux sources :
- Données internes : Résultats d’expériences menées au LEMAR (transcriptomique, protéomique).
- Données publiques : Data mining dans des bases de données (NCBI, EBI, publications scientifiques) pour extraire des jeux de données environnementales pertinentes.
2. Analyser l’influence de facteurs environnementaux (température, salinité, stress chimique, pathogènes) sur l’expression de ces gènes.
3. Mettre en évidence des corrélations entre l’activation de l’effet Warburg et des conditions écologiques spécifiques.
4. Industrialiser et automatiser les analyses bioinformatiques : Développer un workflow (sous Nextflow) permettant d’intégrer les différentes étapes d’analyse. Ce pipeline visera à standardiser et accélérer les traitements, facilitant ainsi la réutilisation des analyses sur d’autres espèces ou jeux de données environnementales, et contribuant à la pérennisation des outils développés au laboratoire.
Missions concrètes :
• Revue bibliographique : Synthétiser les connaissances sur l’effet Warburg chez les invertébrés marins et les méthodes d’analyse des données omiques.
• Collecte et traitement des données :
- Données internes : Utiliser les résultats d’expériences réalisées au laboratoire (ex. : profils d’expression génique et protéique sous différents stress).
- Données externes : Extraire et organiser des données transcriptomiques et protéomiques issues de publications scientifiques (ex. : études sur les réponses de M. gigas à des variations environnementales).
• Analyse statistique :
- Intégrer et comparer deux types de données omiques (ARN et protéines) provenant des deux sources pour identifier des corrélations ou des décalages.
- Analyser l’impact des facteurs environnementaux sur l’expression des gènes Warburg (tests statistiques, analyses multivariées).
• Bioinformatique :
- Développer un workflow reproductible et modulaire sous Nextflow basé sur les analyses réalisées au cours du stage, du prétraitement des données à la détection et à la visualisation des gènes du jeu Warburg en lien avec les facteurs environnementaux.
- Standardiser et pérenniser les analyses afin de faciliter une réutilisation des analyses sur d’autres espèces.
Compétences mobilisées :
• Bioinformatique : Identification des gènes homologues, Manipulation de données omiques, data mining, utilisation de bases de données (NCBI, Uniprot), Workflow.
• Biostatistique : Tests statistiques, analyses multivariées (PCA, clustering).
• Synthèse scientifique : Rédaction de rapports, présentation orale.
• Autonomie et rigueur : Gestion d’un projet de recherche sur 6 mois.
Environnement de travail :
• Accès à des infrastructures de pointe en écologie marine et génomique.
• Collaboration avec une équipe pluridisciplinaire (biologistes, bioinformaticiens, écologistes).
• Dates flexibles selon les contraintes académiques.