Apprenti-ingénieur en analyse de données biologiques

 Apprentissage · Stage M2  · 12 mois    Bac+5 / Master   Institut de Recherche en Santé Digestive (IRSD), INSERM U1220, Toulouse · Toulouse Cedex 3 (France)  Selon grille académique

 Date de prise de poste : 1 septembre 2022

Mots-Clés

fine-mapping statistique, variant causal, maladie génétique complexe, relations régulatrices, enhancer

Description

Missions et activités
Les missions de l’apprenti-ingénieur se dérouleront dans le cadre du projet REGENCARD, qui
vise à utiliser la régulation complexe de l’expression des gènes pour mieux comprendre les
maladies cardiométaboliques (maladie coronarienne, diabète de type 2, hyperlipémie), en
collaboration avec l’équipe de génétique statistique de H. Aschard de l’institut Pasteur et avec
l’équipe du métabolisme des lipides dans les maladies cardiométaboliques de W. Le Goff de
l’université de la Sorbonne.
Si ces maladies ont une forte composante génétique et que des études ont déjà identifié de
nombreux variants associés à ces maladies, les variants réellement causaux et les gènes cibles
restent peu connus, freinant les avancées thérapeutiques et la médecine de précision de ces
maladies.
Ici nous souhaitons incorporer les toutes dernières connaissances en matière de régulation de
l’expression des gènes dans des programmes existants de fine mapping (c’est-à-dire
d’identification de variants causaux parmi les variants déjà identifiés comme statistiquement
associés à la maladie, le plus souvent par des approches Bayésiennes comme dans les
programmes PAINTOR ou CARMA) afin de mieux identifier les variants causaux et gènes cibles
de ces maladies.
Il s’agit donc d’un projet fortement pluridisciplinaire à l’interface entre la bioinformatique, la
génétique statistique et la biologie, dans lequel il faudra d’abord se familiariser avec les notions,
formats et outils des différents domaines. Il s’agira ensuite d’utiliser des outils existants tels que
ceux cités plus haut, sur des données d’association génétique publiques issues de grande
cohortes (en commençant par la maladie coronarienne) et sur des données bioinformatiques de
régulation de l’expression des gènes dans un grand nombre de types cellulaires, puis de porter
un regard critique sur les résultats obtenus.

Profil recherché
Master M2 en informatique ou statistique ou mathématiques appliquées, avec un goût pour les
applications en biologie et en santé. Nous recherchons une personne avec un bon bagage en
informatique (programmation ou au moins scripting en bash/awk ou python ou R, analyse de
données) et en statistique (principaux tests, statistiques Bayésiennes) mais qui soit aussi
curieuse de nouveaux domaines et attirée par la recherche et les explorations. Cette personne
doit également aimer communiquer sur ses résultats et maîtriser l’anglais, au moins à l’écrit.

Présentation de la structure d’accueil
L’IRSD, institut de recherche en santé digestive, est une unité mixte de recherche qui implique
l’INSERM, INRAE, l’ENVT et l’UPS (https://www.irsd.fr/).
Au sein de ce laboratoire, l’équipe <<Métabolisme du fer : de la régulation à la thérapie>>
s’intéresse aux maladies génétiques en lien avec le métabolisme du fer, et comporte une
composante de recherche en bioinformatique qui s’intéresse plus particulièrement à la
prédiction de relations régulatrices de l’expression des gènes et son utilisation pour mieux
comprendre les maladies génétiques complexes (https://www.irsd.fr/sarah-djebali.html)
 

Candidature

Procédure : Envoyer CV et lettre de motivation à sarah.djebali@inserm.fr. La lettre de motivation doit mettre en avant les compétences et goûts du candidat en lien avec les attentes du poste. Envoyer aussi si possible le contact d'une personne de référence (encadrant de stage passé par exemple).

Date limite : 29 juillet 2022

Contacts

Sarah Djebali

 saNOSPAMrah.djebali@inserm.fr

Offre publiée le 22 juin 2022, affichage jusqu'au 29 juillet 2022