Modélisation de la connaissance biologique avec grands modèles de langage

 CDD · Thèse  · 36 mois    Bac+5 / Master   Laboratoire de biologie computationelle · Quebec (Canada)

 Date de prise de poste : 2 septembre 2024

Mots-Clés

Grand modèles de langages Intelligence Artificielle Graphes de connaissances Langages Naturelles

Description

Au sein de ce projet financé par le laboratoire ADlab (Arnaud Droit Lab, compbio.ca), l’objectif principal sera de transformer l’accès et l’analyse des bases de données de connaissances biologiques (BKD) grâce à l’intégration de ces bases dans un graphe de connaissances et à l’utilisation de grands modèles de langage (LLMs). Cette initiative vise à faciliter une interrogation naturelle des données biologiques, rendant la recherche plus accessible aux biologistes sans expertise spécifique en programmation ou en analyse de données. Les principaux objectifs comprennent :

  • Construire un graphe de connaissances biologiques intégrant de multiples BKD pour améliorer leur cohésion et extraire des informations précieuses.
  • Développer et entraîner des LLMs spécifiques capables d’interpréter et de questionner ce graphe en langage naturel.
  • Créer et évaluer un agent conversationnel basé sur ces LLMs, pour permettre une interrogation intuitive des BKD en utilisant des requêtes en langage naturel.

 

Responsibilities:

Le candidat sélectionné sera responsable de :

  • Conduire des recherches approfondies pour intégrer efficacement les BKD dans un graphe de connaissances cohérent.
  • Programmer et entraîner des modèles de langage à grande échelle pour l’interrogation naturelle des données biologiques.
  • Rédiger des articles scientifiques pour documenter les avancées et les découvertes réalisées au cours du projet.
  • Écrire une thèse de doctorat présentant les contributions significatives à la communauté scientifique.
  • Présenter les résultats de recherche dans des conférences nationales et internationales, contribuant ainsi à l’avancement du domaine.

Qualifications:

Les candidats idéaux pour ce poste devront posséder :

  • Un MSc en Bioinformatique, Informatique, Intelligence Artificielle, ou dans un domaine connexe.
  • De solides compétences en programmation, notamment en Python et R, sont essentielles pour le développement et l’entraînement des modèles.
  • Une expérience préalable avec les bases de données, les graphes de connaissances, et/ou les grands modèles de langage est fortement recommandée.
  • Un vif intérêt pour la biologie moléculaire, la bioinformatique et la recherche biomédicale.

Additional Information:

Réussir un doctorat nécessite plus que des compétences techniques et académiques ; cela demande aussi :

  • Une forte motivation et une passion pour la recherche et l’innovation dans le domaine de la bioinformatique et de l’intelligence artificielle.
  • La capacité à travailler de manière autonome tout en collaborant efficacement au sein d’une équipe multidisciplinaire.
  • Une excellente capacité d’organisation et de gestion du temps pour équilibrer les multiples aspects du projet de recherche.
  • De solides compétences en communication, tant à l’écrit qu’à l’oral, pour présenter les résultats de manière claire et convaincante.
  • Une persévérance et une résilience pour surmonter les défis de recherche et contribuer significativement au domaine.

Candidature

Procédure : Envoyer avec votre CV et lettre de motivation

Date limite : 5 août 2024

Contacts

Arnaud Droit

 arNOSPAMnaud.droit@crchuq.ulaval.ca

Offre publiée le 3 avril 2024, affichage jusqu'au 5 août 2024