Poste d'ingénieur-e Inserm ouvert à mobilité en bioinformatique/analyse de données

 CDI · IR   Bac+8 / Doctorat, Grandes Écoles   Laboratoire de Biologie et Modélisation de la Cellule - U1293/UMR 5239 · Lyon (France)

Mots-Clés

NGS, omiques, modélisation, IA, épigénétique, Hi-C

Description

Structure d’accueil

Le Laboratoire de Biologie et Modélisation de la Cellule (U1293/UMR 5239) comprend 100 personnes et est structuré en 17 équipes de recherche. Il est situé sur le site Monod de l’Ecole Normale Supérieure de Lyon. La stratégie globale du laboratoire consiste en l’étude quantitative des processus biologiques par des approches interdisciplinaires combinant biologie expérimentale et modélisation mathématiques et physique. Une grande majorité des équipes du LBMC mobilise des approches basées sur du séquençage à haut-débit (ChIP-Seq, RNA-Seq, Hi-C, ...). C’est dans ce contexte que le LBMC a créé un « Biocomputing hub » fédérant les activités computationnelles développées au sein du LBMC et à laquelle sera intégré l’agent qui sera recruté afin de participer aux projets de différentes équipes et d’assurer la transmission et l’appropriation de nouvelles compétences au sein des équipes.

Description du poste

Mission principale

La personne recrutée rejoindra le « Hub BIO-COMPUTING », structure transversale du laboratoire, sous la responsabilité du Directeur du LBMC, D. Auboeuf en liaison avec les responsables scientifiques (D. Jost, F. Mortreux) et opérationnels (L. Modolo) de cette structure. La mission principale de l’agent sera de participer au développement de méthodologies adaptées à la recherche du LBMC, en particulier en lien avec le traitement et l’analyse de données omiques et/ou la modélisation et l’IA, sur des thématiques portées par les équipes du laboratoire incluant l’organisation 3D du génome, l’épigénétique et le métabolisme des ARNs. L’ingénieur-e accompagnera les chercheurs tout au long du processus de production de données (traitement et analyse, modélisation, stockage et data management) ainsi que les personnels du LBMC afin qu'ils puissent améliorer leurs bonnes pratiques liées au bio-computing .

Activités principales

- En fonction du profil du candidat en « traitement et analyse de données omiques » et/ou« modélisation et IA », les activités principales seront :
  o Développer des outils et mettre en place des procédures standardisées de traitement des données de transcriptomique, génomique et épigénomique depuis leur production sur les séquenceurs haut débit (ex : RNA-seq, Mnase-seq, ChIP-seq,
ATAC-seq, Hi-C) jusqu’à leur dépôt sur les entrepôts de données (ex : NCBI/EBI) en passant par le prétraitement bioinformatique, l’analyse et la modélisationbiostatistique des données.
  o Réaliser des développements méthodologiques et traitement de données biologiques (ex : omiques, imagerie, single-cell) pour la modélisation mathématique, physique ou statistique (AI) et la simulation numérique des systèmes biologiques.
- Assurer le déroulement de la chaine de traitement et/ou modélisation des données sur les infrastructures de calculs régionales (Mésocentre CBPsmn).
- Améliorer les méthodologies de développement logiciels des différentes équipes dulaboratoire : conteneurisation (ex : packaging de codes R, conda), organisation de travail (ex : Agile, DevOps, GitHub Actions), qualité de code (ex : sonarqube, codecov), intégration continue.
- Participer à la formation interne des membres du laboratoire à ces nouvelles méthodologies.
- Former les chercheurs aux procédures existantes et assurer le support technique et la formation aux outils développés.
- Participer à l'activité du réseau bio-informatique au niveau local et national en mettant à disposition les outils et interfaces générées et en participant à des formations.
- Accompagner les équipes de recherche : conseils méthodologiques, assistance, formation, aide à la rédaction d’articles ou de demandes de financement.
- Participer à des co-encadrements d’étudiants sur des projets de recherche en collaboration avec des bio-informaticiens ou avec des biologistes.
- Faire de la veille technologique sur le développement méthodologique en lien avec les recherches du LBMC et l’entretien de workflows.
- Assurer le respect des normes qualité et des réglementations en vigueur pour garantir la reproductibilité des analyses effectuées (ex : Git, Notebook RMarkdow, Quarto)

Spécificité(s) et environnement du poste

Le candidat rejoindra le hub Biocomputing du LBMC, qui est en charge d’animer et de
promouvoir la biologie computationnelle au sein du laboratoire.

Connaissances

- En fonction du profil du candidat en « traitement et analyse de données omiques » et/ou « modélisation et IA », les connaissances requises sont : Ingénieur-e biologiste en analyse de données Institut national de la santé et de la recherche médicale 3
  o Maîtrise de logiciels requis pour l’analyse de données en (épi)génomique (ex : DESeq2, TopHat, STAR, samtools, bedtools, danpos, Seurat, etc.).
  o Connaissances en machine-learning, IA/calcul sur GPU (cuda, PyTorch, Keras) ou simulations numériques, ainsi qu’en bio-statistique avec maitrise de concepts utilisés communément dans le milieu de la biologie (modèles linéaires, GLMs, modèles mixtes).
- Utilisation de plusieurs langages de programmation (ex : Python, R, Bash), une connaissance de langages compilés serait un plus, et des systèmes Unix/Linux.
- Connaissance d'outils pour la gestion de codes (git), l’amélioration de la qualité des codes (intégration continue) et la reproductibilité de ses projets (ex : conteneurisation par docker, singularity, etc.).
- Connaissances générales en biologie cellulaire et moléculaire.

Savoir-faire

- Expertise portant sur les entrepôts de données, le stockage (court, moyen et long terme) et le dépôt de données.
- Utilisation d’infrastructures et de clusters de calculs pour l’analyse des données et l’exploration numérique des modèles.
- Développement de pipelines bioinformatiques pour le pré-traitement, l’analyse et la modélisation de données biologiques.
- Mise en place de bonnes pratiques sur l’utilisation des données (approche FAIR : Findable, Accessible, Interoperable, Reusable)

Aptitudes

- Maîtriser l’anglais scientifique à l’oral et à l’écrit. Les candidats seront capables, en anglais, de s'exprimer, de suivre une présentation scientifique ou une réunion de laboratoire, de lire des publications et d’aider à la rédaction de travaux de recherche.
- Encadrer du personnel de recherche et le former de manière pédagogique.
- Travailler en équipe et être force de proposition.
- Dialoguer avec les différentes équipes de recherche sur leurs besoins.
- Gérer de manière autonome les aspects biocomputing de projets de recherche.

Expérience(s) souhaitée(s)

Expérience professionnelle réussie en recherche et support à la recherche en biocomputing

 

Plus d'information sur le site de l'offre

 

Candidature

Procédure : Merci de contacter directement Daniel Jost (daniel.jost@ens-lyon.fr) pour plus de précisions. Les agents intéressés doivent constituer un dossier en ligne via l'application Gaia de l'Inserm accessible à l'adresse https://www.gaia2.inserm.fr/login

Date limite : 1 novembre 2024

Contacts

Daniel Jost

 daNOSPAMniel.jost@ens-lyon.fr

 https://rh.inserm.fr/nous-rejoindre/Lists/Mobilit%20ITA/Attachments/2519/U1293%20-%20IR%20-%20Inge%CC%81nieur-e%20biologiste%20en%20analyse%20de%20donne%CC%81es%20-%20V2.pdf

Offre publiée le 17 avril 2024, affichage jusqu'au 16 août 2024