Mots-Clés
protein structure
bioinformatics
machine learning
effect of mutations
gene variability
hereditary diseases
Description
Aujourd'hui, le déluge de données biologiques révolutionne les sciences de la vie et la médecine. L'une des principales sources de données est le séquençage du génome à haut débit. La croissance spectaculaire des données génomiques présente de nouveaux défis pour les scientifiques : donner un sens à des millions de séquences de protéines nécessite des informations sur leur structure et leur fonction 3D. AlphaFold, une approche d'apprentissage automatique récemment développée, a fait une percée dans le domaine de la prédiction de la structure des protéines. En conséquence, la bioinformatique liée à l'analyse séquence-structure-fonction des protéines joue un rôle de plus en plus important dans la recherche biologique. Dans le même temps, la croissance des données de séquençage liées aux informations cliniques crée une base pour l'application de la bioinformatique en médecine de précision.
Mon équipe utilise des méthodes de bioinformatique et de biologie computationnelle pour comprendre les principes de la structure des protéines et des interactions biomoléculaires (https://www.crbm.cnrs.fr/andrey-kajava/?lang=en). Nos progrès, avec une annotation structurale à grande échelle et de haute qualité des protéomes (https://bioinfo.crbm.cnrs.fr/index.php?route=home), combinée à des informations sur les mutations de l'individu, ouvrent une voie pour la compréhension des maladies héréditaires. En outre, cette approche peut découvrir les raisons moléculaires pour lesquelles les patients peuvent réagir différemment au même médicament. Croiser les informations sur la variabilité des gènes humains et les données issues de notre annotation structurale et fonctionnelle des protéomes sera l'objectif de ce projet de thèse.
Profil du candidat: Un étudiant très motivé avec des connaissances en biologie, en statistiques et de solides compétences en programmation (C++, Java, Python) et une compréhension de la structure des protéines, ainsi qu'une expérience de travail avec des bases de données (Mysql).
Publications: https://scholar.google.com/citations?user=8-zOXuUAAAAJ&hl=en