De nos jours, il est courant de traiter des problèmes à grande échelle et si nous prenons en compte la structure du problème, cela pourrait nous aider à améliorer les performances d'apprentissage. Dans ce travail, nous avons proposé des approches qui tiennent compte de la structure dans deux contextes: (i) les problèmes d'apprentissage par renforcement basés sur des modèles où nous avons réduit le regret (ii) les problèmes d'estimation de moyenne personnalisée en ligne où nous avons réduit la complexité de l'échantillon pour l'estimation moyenne.
M. Marc TOMMASI Université de Lille Directeur de thèse M. Hachem KADRI Aix-Marseille Université Rapporteur M. Matthieu GEIST Université de Lorraine Rapporteur Mme Ciara PIKEBURKE Imperial College of London Examinatrice M. Aurélien BELLET Inria Examinateur Mme Laetita JOURDAN Université de Lille Examinatrice M. Odalric-Ambrym MAILLARD Inria Invité
Thesis of the team MAGNET defended on 25/11/2022