Thesis defense of Yann Berthelot

Apprentissage par renforcement profond efficace pour le controle de procédés industriels

June 19, 2026 at 2 PM (INRIA Lille)

Saint-Gobain Research Paris et l’équipe Scool souhaitent collaborer pour développer des activités de recherche fondamentale concernant le contrôle avancé des procédés industriels. L’objectif plus particulier de la thèse est d’étudier les capacités des approches d’ARBM à répondre aux exigences pratiques pour le contrôle d’un procédé industriel, et de réaliser celui-ci avec de meilleures performances que les stratégies de contrôle actuellement utilisées, comme la commande prédictive. En pratique, les agents de contrôle développés au cours de la thèse chercheront à répondre aux objectifs suivants : - Tirer profit des données historiques existantes pour le système à contrôler (actionneurs et observables) et des principes physiques dirigeant leurs interactions (conservation de la masse, de l’énergie, causalité). - Apprendre la stratégie de contrôle en équilibrant les objectifs d’exploration et d’exploitation. - Réaliser un contrôle robuste vis-à-vis de l’approximation des fonctions de transition et de retour afin de conserver une conduite correcte du procédé au cours des phases d’exploration. - Apporter des garanties de robustesse pour la conduite du procédé et intégrer des limitations liées au contexte industriel (zones d’explorations limitées). - Être stable vis-à-vis du bruit de mesure des capteurs et être capable de s’adapter aux modifications apparaissant dans le temps (data drifts et concept drifts). - Tirer profit de l’entraînement d’un agent de contrôle réalisé sur une ligne de production pour apprendre plus efficacement sur une autre ligne (transfer learning). En particulier, l’impossibilité de disposer d’un modèle parfait de la ligne de production implique une nécessité pour l’agent de contrôle Si la plupart de ces objectifs sont génériques et propres à l’utilisation d’une approche ARBM pour le contrôle, certaines sont directement reliés à des problématiques spécifiques au contexte industriel qui seront précisées au chapitre suivant. Par conséquent, une part importante du travail réalisé pourra faire l’objet de résultats diffusés ouvertement afin de faire profiter toute la communauté de recherche des résultats génériques. Une part du travail sera en revanche plus spécifique au cas d’étude industriel particulier, de manière à tester ces méthodes dans un environnement au plus proche de la réalité.

Jury

M. Philippe PREUX Professeur des universités Université de Lille Directeur de thèse, Mme Ann NOWé Full professor Vrije Universiteit Brussel Examinatrice, M. Antoine CANAGUIER-DURAND Docteur Saint-Gobain Research Paris Co-directeur de thèse, M. Bruno SCHERRER Chargé de recherche Inria Rapporteur, M. Sylvain LAMPRIER Professeur des universités Université d’Angers Rapporteur, M. Riad AKROUR Inria Invité, M. Adam WHITE University of Alberta Invité.

Voir l'agenda complet »