Thesis defense of Penanklihi Cyrille Kone

Exploration pure multi-objectif en bandits: Identification de front de Pareto et applications aux essais cliniques précoces

on December 9, 2025 at 3:00 pm at Amphi IRCICA

Cette thèse porte sur l’exploration pure multiobjectif dans le cadre des bandits stochastiques. L’objectif est de concevoir des algorithmes capables d’identifier l’ensemble des bras Pareto-optimaux; ceux qu’il est impossible d’améliorer sur un objectif sans en détériorer un autre, tout en minimisant le nombre d’échantillons nécessaires pour atteindre un niveau de confiance donné. Après une revue de la littérature sur les bandits classiques et multiobjectifs, nous introduisons le problème d’Identification de l’Ensemble de Pareto (IEP) et les outils théoriques qui le sous-tendent. Nous progressons des méthodes basées sur des intervalles de confiance offrant des garanties en temps fini vers des approches asymptotiquement optimales, tout en préservant l’efficacité computationnelle. Les algorithmes proposés sont évalués de manière systématique sur des jeux de données synthétiques et réels, afin d’analyser finement leurs performances empiriques. La première partie traite l’IEP dans le cas non structuré et présente l’algorithme EGE, qui identifie efficacement l’ensemble de Pareto lorsque le budget d’échantillons est fixé. Revisitant les travaux sur l'IEP à confiance fixée, nous introduisons APE, une procédure adaptative $delta$-correcte reposant sur des intervalles de confiance. APE fournit de fortes garanties en nombre fini d’échantillons et de très bonnes performances pratiques. Des applications à des jeux de données issus d’essais vaccinaux multicritères illustrent EGE et APE peuvent guider la sélection de stratégies thérapeutiques optimisant simultanément plusieurs marqueurs immunologiques. Nous étendons ensuite l’IEP au cas structuré, où les moyennes des bras dépendent linéairement de descripteurs connus via une matrice de régression inconnue. L’algorithme GEGE exploite cette structure pour réduire la complexité d’échantillonnage et atteint des bornes inférieures dépendantes de l’instance. Le chapitre suivant identifie les limites de ces approches et introduit PSIPS, premier algorithme à la fois asymptotiquement optimal et sans projection pour l’IEP avec objectifs corrélés. Basé sur un échantillonnage a posteriori pour le choix des bras et la règle d’arrêt, PSIPS élimine la nécessité de fixer à l’avance le paramètre de confiance $delta$. Il atteint la borne inférieure théorique sur la complexité d’échantillonnage et se montre très compétitif, y compris sur des données réelles comme COV-BOOST, tout en étant bien plus rapide que les méthodes à base de gradient. Enfin, le dernier chapitre traite du cas contraint, où seuls les bras respectant certains critères doivent être considérés pour le calcul de l'ensemble de Pareto. Un algorithme doit donc apprendre simultanément les bras viables et déterminer leur optimalité. Nous proposons cAPE, un algorithme qui généralise celui du chapitre 3 et établit des bornes théoriques pour l’IEP sous contraintes. Dans l’ensemble, cette thèse fait progresser les fondements théoriques et algorithmiques de l’exploration pure multiobjectif. En combinant les outils issus de statistiques, conception expérimentale optimale et principes bayésiens, elle montre qu’il est possible de concilier optimalité théorique et efficacité pratique. Les idées développées ouvrent la voie à une théorie générale de l’apprentissage séquentiel multiobjectif, avec des applications aux essais cliniques adaptatifs, à l’apprentissage par renforcement et plus globalement à la décision multicritère sous incertitude.

Jury

Mme Emilie KAUFMANN Université de Lille Directrice de thèse, Mme Laura RICHERT Université de Bordeaux Co-directrice de thèse, M. Antoine CHAMBAZ Université Paris Cité Examinateur, M. Clayton SCOTT University of Michigan Examinateur, M. Peter AUER University of Leoben Examinateur, M. Wouter KOOLEN University of Twente Rapporteur, M. Vianney PERCHET CREST, ENSAE Rapporteur, Mme Sarah ZOHAR HeKA - Inria - Inserm - Université Paris Cité Invitée.

  • Lebrun Fabien December 2, 2025 at 1:00 pm

  • December 5, 2025 at 12:15 pm

  • December 15, 2025

  • December 15, 2025

  • Polaris Colloquium

    Sarah Cohen-Boulakia December 18, 2025 at 2:00 pm

  • Seminar

    Léodasce Sewanou January 20, 2026 at 10:15 am

  • January 26, 2026

More news