July 6, 2026 at 12 AM (INRIA Lille)
Les smartphones produisent des quantités de données phénoménales notamment grâce à un ensemble de capteurs, intégrés ou connectés, qui capturent les détails de l'environnement des utilisateurs ainsi que leurs routines. Cependant, ces flux continus de données contiennent inévitablement des informations sensibles pouvant mettre en péril la vie privée des utilisateurs s'ils sont analysés par des partis malintentionnés. Alors que les algorithmes d'apprentissage automatique sont très largement déployés aujourd'hui pour traiter de grands volumes de données et en déduire des informations exploitables, ils requièrent souvent de regrouper les données brutes en un seul et même endroit, induisant ainsi une menace pour la vie privée des utilisateurs partageant leurs données. Pour relever ce défi, les algorithmes d'apprentissage automatique distribués (DML) revisitent les algorithmes classiques d'apprentissage automatique afin de renforcer la protection de la vie privée, parmi d'autres propriétés. Alors que la plupart des contributions scientifiques dans le domaine restent à un niveau théorique, leur implémentation ainsi que leur déploiement sur le terrain demeure un problème épineux pour la plupart des applications modernes. Parmi d'autres difficultés, les ressources limitées des smartphones ainsi que leur connectivité pair-à-pair (D2D) limitée rend difficile l'adoption d'algorithmes DML pour le grand public. Néanmoins, nous soutenons que l'exploitation de flottes de smartphones peut offrir des possibilités prometteuses pour les algorithmes DML dans le contexte des systèmes logiciels de crowdsourcing mobile. Nous pensons que les algorithmes d'apprentissage automatique non supervisés (tels que le clustering) et les algorithmes d'apprentissage fédérés en particulier peuvent bénéficier de la proximité des appareils pour raisonner sur un ensemble réduit d'échantillons pertinents, capturés par des appareils proches. Comme le préconisent les approches DML, l'agrégation de ces modèles in situ peut contribuer efficacement à fournir des résultats personnalisés (par exemple, des recommandations) aux utilisateurs sans exposer leur vie privée.
M. Romain ROUVOY Professeur des universités Université de Lille Directeur de thèse, Mme Hélène COULLON Maîtresse de conférences IMT Atlantique Rapporteure, M. Antoine BOUTET Maître de conférences INSA Lyon Rapporteur, Mme Sonia BEN MOKHTAR Directrice de recherche CNRS Examinatrice, M. Stéphane DELBRUEL Maître de conférences Université de Bordeaux Examinateur, M. François TAÏANI Professeur des universités IRISA/INRIA Co-directeur de thèse, M. Davide FREY IRISA / Inria Invité, M. Adrien LUXEY-BITRI Université de Lille Invité.