Professeur

Chef d'équipe (SCOOL)

Inria Bât. A, Haute Borne 03 59 57 7908

Equipe(s)

SCOOL

Mes liens

Mon site web

Présentation

Voir mon site web perso.

Thèses dirigées ou co-encadrées au sein de CRIStAL

Léonard Hussenot Desenonges

Apprentissage par démonstrations : transfert des motivations humaines aux algorithmes Soutenue le 14 décembre 2022

Mathieu Seurin

Apprendre à agir, agir pour apprendre. De l'Interactivité et de l'action dans l'apprentissage par renforcement Soutenue le 28 septembre 2021

Nathan Grinsztajn

Apprentissage par renforcement pour l'optimisation combinatoire : exploiter l'incertitude, les structures et les connaissances à priori Soutenue le 15 juin 2023

Ayoub Ajarra

Vérification du biais des algorithmes d'apprentissage automatique à l'aide de l'échantillonnage adaptatif et de l'apprentissage en ligne

Yannis Flet-Berliac

Apprentissage par Renforcement Profond Efficace pour le Contrôle, l’Exploration et la Sûreté Soutenue le 6 octobre 2021

Johan Ferret

De l'importance des actions: assignation de crédit et interprétabilité dans l'apprentissage par renforcement Soutenue le 4 juillet 2022

Patrick Saux

Mathématiques de la prise de décision séquentielle statistique : concentration, aversion au risque et modélisation pour les bandits stochatiques, et applications à la chirurgie bariatrique Soutenue le 30 janvier 2024

Nicolas Michalak

Théorie des bandits pour le suivi personnalisé de patients

Mickael Basson

Apprentissage par renforcement (RL) à l'aide de réseaux de neurones sur graphes pour l'optimisation combinatoire

Pratik Gajane

Multi-armed bandits with unconventional feedback Soutenue le 14 novembre 2017

Achraf Azize

Compromis entre Confidentialité et Utilité dans la Prise de Décision Séquentielle dans l’incertain Soutenue le 26 novembre 2024

Matheus Medeiros centa

Vers la réduction du fossé entre l'induction et la déduction : le cas de l'apprentissage par renforcement

Frédéric Guillou

On Recommendation Systems in Sequential Context Soutenue le 2 décembre 2016

Vincenzo Musco

Usages of Graphs and Synthetic Data for Software Propagation Analysis Soutenue le 3 novembre 2016

Yann Berthelot

Apprentissage par renforcement basé sur des modèles appliqués au contrôle avancé des procédés industriels

Hector Kohler

Représentations sémantiques pour l'apprentissage par renforcement interprétable

Publications