2 Ingénieurs de recherche en Intelligence Artificielle

 CDD · IR  · 36 mois    Bac+8 / Doctorat, Grandes Écoles   IRD / UMI UMMISCO · Paris (France)

Mots-Clés

Intelligence artificielle

Description

La structure que vous allez rejoindre
L'Unité Mixte Internationale de Modélisation Mathématique et Informatique des Systèmes Complexes
(UMMISCO UMI 209) rassemble des chercheurs, enseignants-chercheurs et personnels administratifs
dynamiques et passionnés. Ils travaillent au Nord (France) comme au Sud, dans nos centres au Sénégal,
Maroc, Cameroun et Vietnam. Ils développent et utilisent des approches de pointe en mathématiques
(Systèmes Dynamiques, EDO, EDP, etc.) et en informatique (IA, Modélisation à base d’agents, Machine
Learning, etc.) répondant à des questions liées à la science de la durabilité. UMMISCO est spécialisée
dans la modélisation dont les applications stimulantes s’inscrivent dans les domaines de la santé et de
l’environnement durable (pêche durable, pollution, biodiversité, sol, etc.).


Une mission attractive
Vous êtes recruté dans le cadre d’un projet scientifique mené conjointement avec la Direction des
Collections du Muséum National d’Histoire Naturelle (MNHN), l’équipe Informatique et Systématique
(LIS) de l’Institut de Systématique, Evolution, Biodiversité (UMR ISYEB), et d’autres partenaires. Le
projet consiste à enrichir et valoriser les collections numérisées du MNHN (corpus d’images 2D, 3D
surfaciques et 3D tomographiques, et de sons, d’une taille totale de 2,3 Po).
UMMISCO et le LIS sont conjointement chargées de l’indexation du corpus et de l’interface de
navigation et de recherche. Vous réaliserez ce travail en équipe avec un ingénieur recruté par le LIS, sous
la conduite de chercheurs, enseignants-chercheurs et ingénieurs d’UMMISCO et du LIS.
Vos activités seront les suivantes :
Evaluer les besoins des utilisateurs du corpus de données en matière de recherche et de
navigation
Réunir et préparer un ensemble de descriptions phénotypiques d’espèces, et en extraire des
relations espèces-descripteurs
A l’aide d’outils d’annotation et de la communauté de naturalistes amateurs animée par le
MNHN, réaliser une annotation du corpus des collections numérisées
Compléter l’annotation du corpus à l’aide des relations spécimens-espèces et des relations
espèces-descripteurs
Utiliser l’annotation pour entraîner des algorithmes d’apprentissage profond à reconnaître des
descripteurs dans les spécimens numérisés
A l’aide de ces algorithmes réaliser une extraction systématique des descripteurs de l’ensemble
des spécimens numérisés, non encore annotés
Utiliser les descripteurs extraits pour indexer l’ensemble du corpus
S’appuyer sur cette indexation pour développer l’interface de navigation et de recherche au sein
du corpus

Votre future équipe

L’agent recruté intègre un groupe transdisciplinaire au sein d’UMMISCO spécialisé en apprentissage
automatique et analyse de données, composé d’ingénieurs et de chercheurs. Ce groupe collabore dans
ce projet en étroit partenariat avec le LIS, spécialisé dans les descriptions numérisées de taxons et de
spécimens, qui collabore aussi avec le Laboratoire Informatique de Paris 6 (LIP6) de Sorbonne
Université sur la fouille de textes et l’analyse d’images.


Le profil que nous recherchons
Vous avez développé les compétences suivantes :
des compétences en analyse statistique et de bonnes connaissances en intelligence artificielle
(IA numérique et IA symbolique)de solides compétences en apprentissage profond sur une
diversité d’architectures et problématiques appliquées aux données (images, texte, signaux, etc)
des compétences en analyse statistique en intelligence artificielle (IA numérique et IA
symbolique)
des compétences en bases de données relationnelles et NoSQL massives
des compétences dans l’utilisation du calcul scientifique à haute performance et l’analyse des
donnés massives
des compétences en développement d’applications web
En outre, vous avez :
une bonne compréhension de la représentation des connaissances (IA symbolique), y compris
de la logique des propositions valuées, et si possible une expérience en représentation et
utilisation des connaissances en logique des propositions valuées
une pratique courante : des langages R et Python, des suites logicielles bio-informatiques, des
bases de données, des Work Flows
si possible le goût et/ou une expérience des problématiques de biodiversité
une capacité de créativité
une capacité d’autonomie
une bonne capacité rédactionnelle, de synthèse et de communication

Candidature

Procédure : envoyer un mail à Eric chenin : eric.chenin@ird.fr et Régine Vignes Lebbe: regine.vignes_lebbe@sorbonne-universite.fr

Date limite : None

Contacts

Eric Chenin

 erNOSPAMic.chenin@ird.fr

Offre publiée le 22 décembre 2021, affichage jusqu'au 20 février 2022