on January 24, 2025 at 10:00 am at Visioconférence
Les technologies actuelles ne permettant le stockage que par des moyens coûteux et peu efficaces, l’électricité reste difficile à stocker à grande échelle. Pour le bon fonctionnement du réseau, il est ainsi important qu’à tout instant, l’électricité injectée dans le réseau soit égale à l’électricité consommée. Historiquement et encore aujourd'hui, pour maintenir cet équilibre, les moyens de production sont planifiés par anticipation de la demande; d'où l'importance de prévoir aussi précisément que possible la consommation électrique. Avec l’intégration massive des énergies renouvelables dont la production est intermittente et dépendante des conditions météorologiques, la production devient de plus en plus instable et la gestion de l'équilibre se complexifie : des prévisions des productions éolienne et photovoltaïque sont désormais indispensables. Les prévisions de consommation et de production sont réalisées à l'aide de modèles d'apprentissage statistique, qui modélisent le signal en se basant sur ses valeurs passées et des données de variables dites explicatives. Pour construire un modèle performant, il est nécessaire de choisir les variables explicatives considérées, le type de modèle ainsi que sa paramétrisation. Au vu du très grand nombre de signaux à prévoir, il pourrait être intéressant d’automatiser ces choix pour créer automatiquement des modèles compétitifs. Le textit{Machine Learning} automatisé, également appelé AutoML pour textit{Automated Machine Learning}, est le processus d'automatisation de la génération de modèles d'apprentissage optimisés en fonction du cas d'usage. De nombreux outils d’AutoML ont été développés depuis une dizaine d'années, mais la plupart se concentrent sur l’optimisation de modèles de classification ou de régression sur des données tabulaires, ou sur l’optimisation d’architectures de réseaux de neurones pour le traitement d’images ou de textes. Ils ne sont donc pas forcément adaptés à la prévision de séries temporelles telles que la consommation ou production électrique. Cette thèse est un premier pas vers l’automatisation de la génération de modèles pour les prévisions des séries temporelles nécessaires à la gestion du système électrique. Les travaux de recherche se sont concentrés sur le développement du textit{package} Python DRAGON, qui propose divers outils pour optimiser des modèles bien particuliers, mais largement utilisés: les réseaux de neurones. Le textit{package} rend possible la création d'espaces de recherche plus ou moins flexibles, englobant une grande diversité d’architectures et qui permettent d'optimiser à la fois l’architecture et les hyperparamètres. Ces espaces de recherche sont encodés par des graphes acycliques dirigés, où les nœuds sont des opérations, paramétrées par divers hyperparamètres, et les arêtes sont les connexions entre ces nœuds. Afin de naviguer dans ces espaces de recherche à base de graphes et d’en optimiser les structures, divers algorithmes de recherche à base de métaheuristiques et de bandits sont proposés dans le textit{package}. Après une présentation de DRAGON, cette thèse détaille comment ce textit{package} est utilisé pour les prévisions de consommation et de production électrique et permet de générer des modèles à l’état de l’art dans ces deux cas d'usage industriels.
M. Florian ZIEL Universität Duisburg-Essen Rapporteur, M. Marius LINDAUER Leibniz University Hannover Rapporteur, Mme Carola DOERR Sorbonne Université Examinatrice, M. Ludovic MACAIRE Université de Lille Examinateur, Mme Margaux BRéGèRE EDF R&D, Sorbonne Université Examinatrice, Mme Claire MONTELEONI INRIA Paris, University of Colorado Boulder Invitée, M. El-Ghazali TALBI Université de Lille Invité.