Symbiont - Méthodes symboliques pour les réseaux biologiques
Coordinateur : Thomas Sturm, Directeur de Recherche, Inria Centre Nancy Grand Est
Équipe : CFHP du Groupe Thématique : CO2
Partenaires : AICES, Université de Lille, CRIStAL, François Boulier, Professeur Université de Lille, DIMNP, Inria Saclay - Ile-de-France - Equipe LIFEWARE, Institut für Informatik 2, Institut für Mathematik, Lehrstuhl für Mathematik A, LORIA.
PRCI - Projets de recherche collaborative - International
Recherche fondamentale
Dates : 06/18 - 06/21
Résumé :
SYMBIONT est un projet interdisciplinaire allant des mathématiques, via l’informatique, à la biologie des systèmes et à la médecine systémique. Le projet met clairement l’accent sur la recherche mathématique et informatique fondamentale. Du coté des applications nous développerons des logiciels prototypes qui seront testés sur des modèles issus de bases de données de la biologie computationnelle.
Les modèles computationnels en biologie des systèmes sont construits à partir de réseaux d’interactions moléculaires et de paramètres cinétiques conduisant à des grands systèmes d’équations différentielles. Ces réseaux sont à la base de la médecine systémique et personnalisée. Les approches numériques utilisées actuellement seront complétées par nos nouvelles méthodes algorithmiques symboliques, qui aborderont les problèmes fondamentaux dans ce domaine. Un problème important est le coût en termes de temps de calcul de l’estimation statistique et surtout l’impossibilité d’identifier de nombreux paramètres de grands modèles à partir des données expérimentales. En outre, il existe généralement une incertitude considérable sur la forme exacte du modèle mathématique lui-même. L’incertitude paramétrique (avec des grandes variations potentielles de paramètres sur plusieurs ordres de grandeur) conduit à des limitations sévères des approches numériques, même pour les modèles de taille moyenne. De plus, les méthodes numériques d’inférence et d’analyse de modèles souffrent de la malédiction de la dimension qui établit une limite supérieure d’une dizaine de variables aux modèles tractables. Pour ces raisons, la déduction formelle des propriétés essentielles des grands et très grands modèles est d’une très grande importance.
L’objectif principal de SYMBIONT est de combiner des méthodes symboliques avec des méthodes de réduction de modèles pour l’analyse de réseaux biologiques. Nous proposons des nouvelles méthodes d’analyse symbolique, qui permettront de surmonter les obstacles susmentionnés et pourront donc être appliquées aux grands réseaux. Afin de faire face plus efficacement au problème de l’incertitude des paramètres, nous imposons un paradigme entièrement nouveau permettant de paramétrer les modèles par des ordres de grandeur. Nos méthodes de calcul sont diverses et impliquent diverses branches des mathématiques telles que la géométrie tropicale, la géométrie algébrique réelle, les théories des perturbations singulières, des variétés invariantes et des symétries des systèmes différentiels. Les fondements et la validité de nos méthodes seront soigneusement justifiés par des recherches mathématiques.
Les problèmes algorithmiques associés sont NP-durs mais l’expérience prouve leur applicabilité : des facteurs de complexité, tels que la largeur arborescente ou le nombre de régimes métastables distincts croissent lentement avec la taille des modèles qu’on trouve dans les bases de données. Nous exploiterons cette observation pour résoudre des challenges tels que la réduction de modèles, la détermination de régions paramétriques garantissant l’existence et la stabilité d’attracteurs et la caractérisation de la dynamique qualitative des réseaux non-linéaires de grande taille.
Les méthodes développées dans ce projet seront comparées à des modèles biologiques existants et aussi à des modèles plus complexes, proches des besoins de la médecine systémique et de précision qui seront générés à partir de bases de données biologiques.
Abstract
SYMBIONT is an interdisciplinary project ranging from mathematics via computer science to systems biology and systems medicine. The project has a clear focus on fundamental research on mathematical methods, and prototypes in software, which is in turn benchmarked against models from computational biology databases.
Computational models in systems biology are built from molecular interaction networks and rate parameters resulting in large systems of differential equations. These networks are foundational for systems medicine. The currently prevailing numerical approaches shall be complemented with our novel algorithmic symbolic methods, which will address fundamental problems in this area. One important problem is that statistical estimation of model parameters is computationally expensive and many parameters are not identifiable from experimental data. In addition, there is typically a considerable uncertainty about the exact form of the mathematical model itself. The parametric uncertainty (with wide potential variations of parameters by several orders of magnitudes) leads to severe limitations of numerical approaches even for rather small and low dimensional models. Furthermore, extant model inference and analysis methods suffer from the curse of dimensionality that sets an upper limit of about ten variables to the tractable models. For those reasons, the formal deduction of principle properties of large and very large models has a very high relevance.
The main goal of SYMBIONT is to combine symbolic methods with model reduction methods for the analysis of biological networks. We propose new methods for symbolic analysis, which overcome the above mentioned obstacles and therefore can be applied to large networks. In order to cope more effectively with the parameter uncertainty problem we impose an entirely new paradigm replacing thinking about single instances with thinking about orders of magnitude. Our computational methods are diverse and involve various branches of mathematics such as tropical geometry, real algebraic geometry, theories of singular perturbations, invariant manifolds and symmetries of differential systems. The foundations and validity of our methods will be carefully secured by mathematical investigation. Corresponding computer algebra problems are NP-hard, but experiments point at their feasibility for biological networks. We have already shown that complexity parameters such as treewidth or number of distinct metastable regimes grow only slowly with size for models available in existing biological databases. We will exploit this observation to solve challenging problems in network analysis including determination of parameter regions for the existence and stability of attractors, model reduction, and characterization of qualitative dynamics of nonlinear networks. The methods developed in this project will be benchmarked against existing biological models and also against more challenging models, closer to the needs of systems and precision medicine that will be generated using biological pathways databases.