Ingénieur de recherche - Génomique humaine et Intelligence artificielle

 CDD · IR  · 24 mois    Bac+5 / Master   Double affectation UMRS 1166 / UMR 1163 · Paris (France)

 Date de prise de poste : 1 septembre 2021

Mots-Clés

analyses bioinformatiques génomique humaine séquençage copy number variant, loss of function intelligence artificielle approches innovantes

Description

Description des équipes :

L’équipe 1 de l’UMR_S 1166 (https://recherche-cardiovasculaire-metabolique.fr/) est impliquée dans la recherche des causes génétiques et cellulaires des pathologies cardiovasculaires tant sur des modèles animaux et humains (tissus cardiaques, cellules pluripotentes induites (iPSC) ou bien modèle murin) que sur des données génomiques chez l’homme, notamment par le biais d’analyses bioinformatiques.

Ces études portent principalement sur les cardiomyopathies qui constituent l’une des causes principales d’insuffisance cardiaque et de mort subite du sujet jeune.

Jusqu’à présent ces approches bio-informatiques ont principalement consisté en des analyses d’association génome entier (GWAS) sur des cohortes de cas sporadiques et des témoins, ou bien dans le séquençage d’exome à la recherche de variants pathogéniques impliqués dans les formes familiale. Ces approches ne suffisent cependant pas à identifier tous les facteurs génétiques impliqués.

Récemment, l’équipe a obtenu un nouveau financement via l’appel à projet « maladie rare_résoudre les impasses diagnostiques » financé par l'ITMO Génétique, Génomique et Bioinformatique (ITMO GGB) d’Aviesan dans le cadre du Programme Prioritaire de Recherche sur les maladies rares. Cet AAP a été demandé en collaboration avec d’autres équipes, dont celle d’Antonio Rausell (laboratoire de bioinformatique clinique, Institut Imagine, https://www.institutimagine.org/en/RausellLab), pour développer de nouvelles approches afin de résoudre ces impasses diagnostiques. Objectif et missions : Le poste s’adresse à un(e) candidat(e) motivé(e) par une activité de recherche qui aura la charge de mener ces analyses bioinformatiques innovantes, sur les données génomiques déjà constituées, grâce à des outils de détection récemment développés mais aussi via des approches innovantes basées sur l’intelligence artificielle (AI), afin d’identifier de nouveaux facteurs génétiques dans les régions codantes et non codantes du génome tels des variations du nombre de copies (CNV) ou des mutations pertes de fonction (LoF).

Le poste aura une double localisation à la faculté de médecine Sorbonne Université site de la Pitié Salpêtrière, au sein de l’UMR_S 1166 (91 boulevard de l’Hôpital, 75013 Paris) et à l’Institut Imagine (24 Boulevard du Montparnasse, Hôpital Necker AP-HP, 75015 Paris).

Activités principales :

- Réaliser les contrôles qualité sur les données génomiques et cliniques afférentes aux différents projets des équipes

- Analyser les données génomiques de séquençage haut-débit, de puces à ADN, des outils de détection des CNV et de LoF produites dans les deux équipes

- Participer au développement et à la réalisation des approches d’IA développées par le laboratoire de bioinformatique clinique de l’institut Imagine

- Concevoir ou développer de nouveaux outils bioinformatiques pour répondre aux besoins rencontrés par les chercheurs de l'unité

- Interagir étroitement avec les biologistes de l'unité responsable des divers projets génomiques menés afin d’optimiser le procès d’interprétation de l’impact moléculaire et cellulaire des variants identifiés, sa cohérence avec les signes clinique des patients, ainsi que son rapport avec la pathophysiologie des maladies étudiés

Connaissances :

- Analyses bioinformatiques et statistiques de données de puces à ADN

- Analyses bioinformatique des données de séquençage (notamment exome/génome et ARN messager) dans le cadre de la recherche clinique

- Connaissances dans le domaine du machine learning

- Expérience dans l’analyse statistique de donnés

- Connaissances générales en biologie moléculaire (génétique) afin de comprendre et analyser le problème scientifique posé et de pouvoir interagir aux mieux avec les chercheurs des unités

- Langue anglaise : B2 à C1

Compétences opérationnelles :

- Maitriser des techniques de programmation sous environnement Unix/Linux ainsi que des langages de programmation Python et R

- Maîtriser des logiciels d’analyse des données de puces d’ADN (Plink, etc …) et des analyses de type GWAS ou d’imputation

- Maîtriser l’analyse d’exomes / génomes y compris l’annotation des effets de variants et la priorisation à l’aide de scores de pathogénicité

- Maitriser l'utilisation des clusters/grilles de calculs pour le calcul scientifique haute-performance et le calcul en parallèle.

- Maitriser les bases de données publiques en génomique (NCBI, GenCode, Biomart, etc)

- Savoir gérer le stockage et la manipulation des données de grandes dimensions

- Rédiger des rapports de synthèse et les présenter oralement (anglais et français) lors de réunion de travail.

Compétences comportementales :

- Rigueur scientifique et expérimentale

- Capacité à travailler en équipe

Expérience souhaitée :

- Débutant(e) accepté(e)

Formation souhaitée :

- Diplôme d’ingénieur(e) ou thèse

Niveau de recrutement :

- Selon les grilles de rémunération de Sorbonne Université

CDD de 2 ans avec une double affectation dans l’équipe 1 de l’UMR_S 1166 ICAN et au Laboratoire de bioinformatique clinique de l’Institut Imagine (UMR 1163)

Candidature

Procédure : Envoyer CV et lettre de motivation par email à Sophie Garnier, sophie.garnier@sorbonne-universite.fr

Date limite : None

Contacts

Sophie Garnier

 soNOSPAMphie.garnier@sorbonne-universite.fr

Offre publiée le 28 juin 2021, affichage jusqu'au 24 août 2021