SaAB

Acronyme ou nom de la structure
Nom complet (en toutes lettres)
Statistiques et Algorithmique pour la Biologie
Tutelle(s) institutionnelle(s) et affiliation/labelisation
Prénom et nom du responsable de l'équipe
Simon de Givry
E-mail de contact
simon.de-givry@inra.fr
Adresse

Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT)
Inra
Chemin de Borde Rouge
BP 52627

31326 CASTANET-TOLOSAN cedex

France

Coordonnées GPS
43.5175552, 1.4881572
Téléphone
0561285074
Description

L'équipe a pour objectif de développer et de mettre à disposition des biologistes des méthodes mathématiques, statistiques et informatiques permettant de contribuer à la compréhension du vivant. 

Problèmes bioinformatiques abordés

L'équipe s'intéresse à la localisation et l'identification d'éléments fonctionnels dans les génomes des bactéries, plantes et animaux, et de façon croissante aux interactions qui existent entre ces différents éléments :

  • au niveau génétique : un génome est essentiellement perçu au travers de petites régions caractérisées (les marqueurs moléculaires) qui forment des balises. Il s'agit alors de positionner ces balises sur les chromosomes (cartographie génétique et d'hybrides irradiés : Carthagène) pour ensuite localiser des régions liées à des caractères d'intérêt (résistances aux maladies, rendement...) par rapport à ces balises (localisation de QTL ou Quantitative Trait Loci par analyse de la transmission allélique : MCQTL et par modélisation du déséquilibre de liaison : HAPimClustHaplo ). Ces données peuvent être ensuite utilisées en sélection de variétés combinant plusieurs caractères désirables.
  • au niveau molécule ADN/ARN: c'est directement les séquences d'ADN d'un génome et les transcrits ARNs qui sont analysés pour les décoder et identifier les régions fonctionnelles dans la séquence et leurs interactions (hybridation, régulation épigénétique...). Il peut s'agir de gènes codant pour des protéines (dans des génomes bactériens : FrameD ou eucaryotes : EuGène) ou de gènes non traduits et correspondant à des ARNs fonctionnels (DARN!ApolloRNA,RNAspace). La comparaison de génomes et l'analyse des événements fondamentaux qui les séparent (polymorphisme, remaniements) peuvent permettre le transfert d'information entre génomes. Des analyses évolutives et phylogénétiques sont mises en oeuvre pour mieux comprendre la dynamique évolutive des éléments régulateurs fonctionnels dans des espèces d'intérêt.
  • au niveau molécule de protéine: une protéine, définit par une séquence d'acides aminés, se replie dans l'espace sur la base des interactions (électrostatiques...) qui existent entre les atomes qui la forme. Sa structure tridimensionnelle définit sa fonction. Le problème du design de protéine consiste à déterminer une bibliothèque de séquences d'acides aminés qui se replie selon une structure donnée, en permettant la conception de nouvelles enzymes catalysant de nouvelles réactions (biocarburants, cosmétiques, médicaments...)
  • au niveau de l'expression de gènes : l'utilisation de données de type "puce à ADN" ou RNA-seq permet de partiellement observer l'activité cellulaire à un instant donné. Sur la base de ces informations, en les croisant avec d'autres informations (génétiques, métabolomique, phénotypiques, environnementales...) il devient possible d'inférer des réseaux de régulation génique ou des réseaux de co-expression génique. Nous nous intéressons en particulier à la combinaison de données d'expression et de polymorphisme (SNP) sur une collection d'individus apparentés (issue d'un pédigree), permettant l'observation de différents modes de fonctionnement du réseau (génomique génétique) et à l'intégration d'informations extérieures (phénotypiques, ontologiques, métabolomiques) dans l'inférence et l'analyse de ces réseaux de gènes (intégration de données).


Des liens solides lient l'équipe aux laboratoires proches d'Interactions Plantes/Micro-organismes et de Génétique Animale du centre de recherches INRA de Toulouse.

Description (English)

The team develops mathematical, statistical and computational methods to address life science research problems. These methods are usually directly made available to biologists through dedicated software.

Bioinformatics problems addressed

The topics addressed in the team concern the localization and identification of functional elements in bacterial, plant and animal genomes. Three investigation levels are considered.     

  • Genetical level A genome is essentially seen through molecular markers whose locations on a chromosome are highly informative in genetics investigation. Localizing these markers on the chromosomes (genetic mapping and radiated hybrid mapping: Carthagène) in order to subsequently locate the regions linked to quantitative traits of interest (disease resistance, yield ...) with respect to those markers (QTL or quantitative trait loci localization by analyzing allelic transmission: MCQTL and by modelling linkage disequilibrium: HAPim). These QTLs can then be used in selecting varieties that combine several desirable traits.
  • Molecular level At the molecular level, the DNA sequence of the genome is directly analyzed to decode and identify functional regions in the sequence. These may be genes coding for proteins (in bacterial genomes and EST cclusters FrameD or in eukaryotic genomes: EuGène) or non coding genes corresponding to functional RNAs (MilPat, DARN!, ApolloRNA, RNAspace). The comparison of genomes of different species and identification of key events that separate them (recombination) can enable the transfer of information between genomes.
  • Gene expression level The use of DNA microarrays allows to partially observe the cellular activity at a given time. It is then possible to establish a link between the contextual conditions of the cell at observation time (disease, polluted environment) and the genes that are over (or under) expressed. This link may help trace the genes related to disease or allow for a diagnosis.

To go beyond the localization of isolated functional elements, we are are now increasingly interested in approaches aiming at the inference of gene regulatory networks. We are currently studying the simultaneous analysis of expression data and polymorphism data (such as SNP) on a collection of individuals. This allows to observe different perturbated modes of operation of the network to better infer gene network structures.

English keywords
genetical and radiated hybrids mapping, QTL mapping, sequence annotation, ncRNA search, inference of gene regulatory network
Type de structure
Equipe de recherche
Adhésion en tant que personne morale
Désactivé