Thesis of Patrick Saux

Mathématiques de la prise de décision séquentielle statistique : concentration, aversion au risque et modélisation pour les bandits stochatiques, et applications à la chirurgie bariatrique

Cette thèse porte sur l’étude des défis mathématiques liés à l’analyse d’algorithmes de prise de décision séquentielle pour le suivi postopératoire de patients. Les bandits stochastiques (multi-bras, contextuels) modélisent l’apprentissage d’une suite d’actions (politique) par un agent évoluant dans un environnement incertain afin de maximiser les récompenses observées. Afin d’apprendre de telles politiques optimales, les algorithmes de bandits se confrontent au dilemme de l’exploitation de l’information déjà acquise et de l’exploration d’actions incertaines. De tels algorithmes ont été amplement étudiés et déployés dans le cadre d’applications industrielles faisant intervenir de grands jeux de données, un faible risque pour chaque décision, ainsi que des hypothèses de modélisation bien définies, comme par exemple la maximisation du taux de clic dans la publicité en ligne. A l’inverse, le problème des recommandations de santé requiert un tout nouveau paradigme de petits échantillons, d’aversion au risque et de modélisation complexe et non paramétrique. Dans cette optique, nous avons développé de nouvelle bornes de concentration uniforme en temps (Bregman, Chernoff empirique), introduit un nouveau cadre de bandits contextuels conscients des risques (au moyen de mesure de risque élicitable), et analyser une nouvelle classe d’algorithmes de bandits non paramétriques sous des hypothèses faibles (échantillonnage de Dirichlet). Outre des garanties théoriques, ces résultats sont étayés par des observations empiriques. Nous avons enfin développé, en coordination avec une équipe de médecins et chirurgiens dans le cadre d’un projet de suivi postopératoire, un modèle interprétable par apprentissage automatique de prédiction de la trajectoire de poids à long terme de patients après chirurgie bariatrique.

Jury

M. Philippe PREUX Université de Lille Directeur de thèse, Mme Myriam MAUMY-BERTRAND Université de Technologie de Troyes Rapporteure, M. Adrien SAUMARD ENSAI Rapporteur, M. Odalric-Ambrym MAILLARD Inria Co-directeur de thèse, Mme Julie JOSSE Inria Examinatrice, M. Peter GRüNWALD CWI Examinateur, M. Rodolphe THIéBAUT Université de Bordeaux Examinateur, M. François PATTOU Université de Lille Invité.

Thesis of the team SCOOL defended on 30/01/2024