Soutenance de thèse de Chiara Daini

Inférence CNN Prévisible et Ordonnancement Temps Réel sur Plateformes Embarquées Multicœurs

le 18 novembre 2025 à 13:30 à Bâtiment ESPRIT - Atrium

Les systèmes embarqués modernes intègrent des fonctionnalités sophistiquées telles que le traitement d’images et le machine learning (ML). Un nombre croissant de ces applications sont soumises à des contraintes temporelles strictes, dont l'exécution en temps réel est essentielle au bon fonctionnement du système. Dans les véhicules autonomes, par exemple, le traitement en temps réel des images et des données capteurs est crucial pour prendre des décisions opportunes concernant la vitesse, la direction et le freinage. Malgré leur coût de calcul élevé et leur consommation énergétique importante, les algorithmes de ML sont généralement exécutés onéreux sur du matériel de pointe comme les GPU et les TPU. Exécuter ces algorithmes sur des plateformes embarquées représente un défi, mais aussi une opportunité. Cela permet de déployer des algorithmes complexes sur des dispositifs à faible consommation, avec des gains significatifs en efficacité énergétique, latence, confidentialité et coût. Parmi les algorithmes de ML les plus populaires figurent les Convolutional Neural Networks (CNNs), largement employés pour des tâches de traitement d’images et de vidéos telles que la détection d’objets et la classification d’images. Les CNNs sont réputés pour exiger d'importantes ressources de calcul et de mémoire, nécessaires au stockage des paramètres du modèle et des résultats intermédiaires. Cela rend leur exécution particulièrement ardue sur des systèmes embarqués aux ressources limitées. La plateforme d’exécution joue également un rôle crucial. De nombreux systèmes embarqués reposent sur des architectures multicœurs qui permettent d’exécuter plusieurs tâches en parallèle. Celles-ci introduisent cependant des défis liés à la contention des ressources, notamment pour l’accès mémoire et la cohérence du cache. Pour répondre à ces enjeux, les architectures dotées de mémoires scratchpad sont souvent privilégiées, car elles offrent des temps d’accès déterministes et suppriment les interférences typiques des systèmes à base de cache. Elles sont donc particulièrement adaptées aux applications temps réel, garantissant le respect des contraintes temporelles. Dans cette thèse, nous nous intéressons à l'exécution en temps réel de l'inférence de CNN sur des systèmes multicœurs équipés de mémoires scratchpad. Nous proposons d'abord un modèle formel qui capture les caractéristiques des tâches d'inférence, en considérant leurs patrons de dépendances de données et de connexions. Ce modèle repose sur un graphe de tâches où les opérations de calcul et les transferts de données sont modélisés par des nœuds, et leurs dépendances par des arêtes. Notre première contribution consiste à exploiter ce modèle pour développer une formulation Integer Linear Programming (ILP) qui alloue de manière optimale les tâches de calcul et les transferts de données entre les cœurs, tout en respectant les contraintes temporelles et de mémoire. Toutefois, la résolution de l'ILP s'avère rapidement coûteuse en temps de calcul et difficilement scalable. Pour surmonter cette limite, notre seconde contribution est un algorithme heuristique qui approxime la qualité de partitionnement de l'ILP tout en étant nettement plus efficace et scalable. L'heuristique met l'accent sur la localité des données et la minimisation des communications inter-cœurs, des facteurs clés pour préserver les performances temps réel sur les systèmes multicœurs. Enfin, nous intégrons cette heuristique dans un cadre complet, incluant le codage des précédences de tâches et une analyse d'ordonnançabilité. Ce cadre permet ainsi la co-planification de l'inférence de CNN avec d'autres tâches temps réel sporadiques sur des plateformes multicœurs. Les résultats expérimentaux, menés sur des CNN représentatifs et des charges de travail mixtes, démontrent l'efficacité et la pertinence pratique des méthodes proposées sur des systèmes embarqués réalistes.

Jury

M. Giuseppe LIPARI Université de Lille Directeur de thèse, M. Houssam Eddine ZAHAF Nantes Université Co-encadrant de thèse, M. Gilles GRIMAUD Université de Lille Examinateur, Mme Mitra NASRI Eindhoven University of Technology Examinatrice, Mme Claire PAGETTI ONERA/DTIM Rapporteure, M. Frank SINGHOFF Université de Brest/CNRS Rapporteur.

Plus d'actualités