développement d'application Spark

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

24 Chemin de Borde Rouge
31320 Castanet Tolosan
France

Contacts
Jerome Gouzy
Email du/des contacts
jerome.gouzy@inrae.fr
Description

L'équipe bioinformatique du Laboratoire des Interactions Plantes Microorganismes INRAE/CNRS recrute un(e) ingénieur(e) en développement informatique dans le cadre du projet Plant2Pro ATLAS (2019-2021).

Dans un premier temps ce projet de pangénomique vise à développer une architecture 'big data' (écosystème Apache Spark/MapR) pour construire le catalogue exhaustif des séquences des allèles des gènes du Tournesol en exploitant plusieurs génomes de références PacBio et les données de reséquençage (PacBio, illumina) de plusieurs centaines de génotypes.

La personne recrutée s'intègrera dans une équipe projet de 5 ingénieurs et aura pour missions:
- d'implanter ou de développer en Scala pour Spark les logiciels d'analyse de séquences (binding C/C++ pour les parties les plus couteuses en calcul).
- de mettre en place, d'exécuter et de formaliser les différents benchmarks sur un cluster Spark de 600 hyperthreads et sur le cloud.

La formation recherchée est de niveau Bac+5 en informatique ou bioinformatique

Compétences requises:
• gout avéré pour le développement
• maîtrise d'au moins un des langages de programmation: scala/C++/C/java
• bonne connaissance du système Linux/Unix et d'au moins un logiciel de versioning git/svn
• connaissances en administration système et Spark appréciées
• curiosité et envie d'acquérir de nouvelles compétences techniques.
• rigueur et capacité à formaliser et diffuser ses connaissances

Le contrat portera sur une durée de 18 mois pour un salaire NET de 1600€ (IE, Master) ou 1800€ (IR, Ingénieur, PhD) majorable selon l'expérience.

La date de prise de fonction souhaitée (mais négociable) serait début avril 2020

Pour candidater, envoyez une lettre de motivation et votre CV à jerome.gouzy@inrae.fr avant le 31 janvier 2020

Un peu de lecture sur Spark et Scala appliqué à la génomique: http://lipm-bioinfo.toulouse.inrae.fr/download/SPARK-ICS/INRA-SPARK-ICS… Et sur les travaux de l'équipe en bioinformatique et génomique: http://lipm-bioinfo.toulouse.inrae.fr/bibteam/

Equipe adhérente personne morale SFBI
Equipe Non adhérente