Inria Bât. A, Haute Borne 03 59 57 7908
Voir mon site web perso.
Apprentissage par démonstrations : transfert des motivations humaines aux algorithmes Soutenue le 14 décembre 2022
Apprendre à agir, agir pour apprendre. De l'Interactivité et de l'action dans l'apprentissage par renforcement Soutenue le 28 septembre 2021
Apprentissage par renforcement pour l'optimisation combinatoire : exploiter l'incertitude, les structures et les connaissances à priori Soutenue le 15 juin 2023
Vérification du biais des algorithmes d'apprentissage automatique à l'aide de l'échantillonnage adaptatif et de l'apprentissage en ligne
Apprentissage par Renforcement Profond Efficace pour le Contrôle, l’Exploration et la Sûreté Soutenue le 6 octobre 2021
De l'importance des actions: assignation de crédit et interprétabilité dans l'apprentissage par renforcement Soutenue le 4 juillet 2022
Mathématiques de la prise de décision séquentielle statistique : concentration, aversion au risque et modélisation pour les bandits stochatiques, et applications à la chirurgie bariatrique Soutenue le 30 janvier 2024
Théorie des bandits pour le suivi personnalisé de patients
Apprentissage par renforcement (RL) à l'aide de réseaux de neurones sur graphes pour l'optimisation combinatoire
Multi-armed bandits with unconventional feedback Soutenue le 14 novembre 2017
Compromis entre Confidentialité et Utilité dans la Prise de Décision Séquentielle dans l’incertain Soutenue le 26 novembre 2024
Vers la réduction du fossé entre l'induction et la déduction : le cas de l'apprentissage par renforcement
On Recommendation Systems in Sequential Context Soutenue le 2 décembre 2016
Usages of Graphs and Synthetic Data for Software Propagation Analysis Soutenue le 3 novembre 2016
Apprentissage par renforcement basé sur des modèles appliqués au contrôle avancé des procédés industriels
Représentations sémantiques pour l'apprentissage par renforcement interprétable