BACCARAT

BACCARAT - Apprentissage bayésien pour les modèles coûteux, avec applications à la biologie cellulaire

Coordinateur : Monsieur Rémy Bardenet CNRS CRIStAL

Équipe : SIGMA du Groupe Thématique : DatInG.

Dates : 01/20 - 09/25

Résumé :

Méthodes Monte Carlo à convergence rapide

Les biologistes développent des modèles complexes de cellules, les écologistes modélisent la dynamique des écosystèmes à l’échelle mondiale. Une seule évaluation de ces modèles complexes prend des minutes ou des heures sur le matériel informatique actuel et l’adaptation de modèles probabilistes aux données biologiques peut nécessiter des millions d’évaluations en série. Les méthodes de Monte Carlo, par exemple, sont omniprésentes dans l’inférence statistique des données scientifiques, mais elles nécessitent un grand nombre d’évaluation du modèle étudié. Par ailleurs, l’utilisation d’architectures informatiques parallèles pour les méthodes Monte Carlo est souvent limitée à l’exécution de copies indépendantes du même algorithme. L’objectif de Baccarat est de fournir des méthodes de Monte Carlo qui débloquent l’inférence pour les modèles coûteux en biologie en s’attaquant directement à la lenteur de la convergence et à la parallélisation des méthodes de Monte Carlo.

Abstract

Biologists develop intricate models of cells, ecologists model the dynamics of ecosystems at a world scale. A single evaluation of such complex models takes minutes or hours on today’s hardware and fitting probabilistic models to biological data can require millions of serial evaluations. Monte Carlo methods, for example, are ubiquitous in statistical inference for scientific data, but they scale poorly with the number of model evaluations. Meanwhile, the use of parallel computing architectures for Monte Carlo is often limited to running independent copies of the same algorithm. The aim of Baccarat is to provide Monte Carlo methods that unlock inference for expensive-to-evaluate models in biology by directly addressing the slow rate of convergence and the parallelization of Monte Carlo methods.