SCOOL is a research group in machine learning.
SCOOL is dedicated to the study of the problem of sequential decision making in an uncertainty environment. We mostly focus on bandit and reinforcement learning problems. We aim at designing mathematically sound algorithms which performance enjoy formal properties, while taking into account the constraints due to realistic applications.
Regarding applications, we favor those related to health, sustainable development, in particular agriculture and agro-ecology. Our activities span the whole spectrum from fundamental research to transfer, through collaborations and contracts with private and academic partners.
Philippe Preux
Vérification du biais des algorithmes d'apprentissage automatique à l'aide de l'échantillonnage adaptatif et de l'apprentissage en ligne
Apprentissage par renforcement (RL) à l'aide de réseaux de neurones sur graphes pour l'optimisation combinatoire
Apprentissage par renforcement basé sur des modèles appliqués au contrôle avancé des procédés industriels
Apprentissage par renforcement sous contraintes
Apprentissage par renforcement continu en environnement dynamique
Représentations sémantiques pour l'apprentissage par renforcement interprétable
Algorithmes de bandit pour les essais cliniques précoces en vaccinologie
Vers la réduction du fossé entre l'induction et la déduction : le cas de l'apprentissage par renforcement
Tests adaptatifs sous contraintes de frugalité
Défis réels pour la théorie de l'apprentissage par renforcement
Compromis entre Confidentialité et Utilité dans la Prise de Décision Séquentielle dans l’incertain 26/11/2024
Résoudre les problèmes d'exploration pure avec l'approche Top Two 14/06/2024
Apprentissage par démonstrations : transfert des motivations humaines aux algorithmes 14/12/2022
Algorithmes non paramétriques pour bandits multi-bras 05/12/2022
Exploration d’états buts pour l’apprentissage par renforcement 06/07/2022
Exploration en apprentissage par renforcement : au-delà des espaces d'états finis 18/03/2022
Sample-Efficient Deep Reinforcement Learning for Control, Exploration and Safety 06/10/2021
Méthodes adaptatives pour l’optimisation dans un environnement stochastique 29/09/2021
Apprentissage automatique séquentiel pour les systèmes éducatifs intelligents 15/12/2020