Thesis of Maryam Rahmani

Prévision de la Pollution de l'Air de Nouvelle Génération: Intégration de l'IA, des Dynamiques Spatiotemporelles et des Approches Garantissant la Confidentialité pour les Zones Urbaines

La qualité de l’air est un problème mondial, la pollution de l’air posant de sérieux risques environnementaux et pour la santé publique, surtout dans les zones urbaines où les particules fines (PM), notamment le PM2.5, sont parmi les polluants les plus nocifs. Malgré des avancées dans la surveillance de la qualité de l’air, des défis comme la variabilité des données, les exigences computationnelles, la scalabilité, et les préoccupations en matière de confidentialité limitent l’efficacité des systèmes de prévision actuels. Cette thèse présente une approche novatrice pour prédire la pollution de l’air dans les zones urbaines en intégrant IA, modélisation spatiotemporelle, et techniques de collecte de données préservant la vie privée. La première contribution majeure est le développement de PMForecast, un modèle de prédiction temporelle conçu pour prévoir les niveaux de PM2.5. En utilisant des techniques avancées d’apprentissage automatique et des mécanismes d’attention temporelle, PMForecast capture efficacement les dépendances temporelles des polluants, conduisant à des prévisions précises pour le court et le long terme. De plus, le modèle démontre des capacités multitâches, atteignant une précision de 99.7% pour les prévisions à 1 heure et de 73.5% pour celles à 12 heures, représentant des améliorations par rapport aux modèles existants. Le modèle spatiotemporel intègre des données de réseaux de capteurs souterrains pour prédire les concentrations de PM2.5 à travers différentes régions. Le modèle GT-LSTM utilise des réseaux de GCN pour capturer les interactions entre les sources de pollution et les conditions atmosphériques, tout en utilisant des LSTMs pour modéliser les dépendances temporelles. Cette approche permet une compréhension approfondie de la dispersion des polluants dans le temps et l’espace. En utilisant des résolutions fixes correspondant aux ressources de données, le modèle assure des prévisions précises et localisées. La troisième contribution est la conception d’une architecture d’apprentissage fédéré appelée FedAirNet, visant à améliorer la prédiction de la qualité de l’air avec des données de capteurs mobiles tout en préservant la vie privée. Les stations de surveillance traditionnelles, limitées par une couverture spatiale et des coûts élevés, voient en revanche les capteurs mobiles une source de données flexible. Cependant, la collecte de données de capteurs mobiles soulève des préoccupations de confidentialité.FedAirNet distribue le processus d’apprentissage sur plusieurs appareils, garantissant que les données sensibles restent locales tout en contribuant aux mises à jour du modèle global. Cette approche décentralisée améliore non seulement la précision des prévisions, mais atténue aussi les risques liés à la collecte centralisée. Les modèles présentés dans cette thèse ont été testés dans des environnements réels, montrant leur potentiel à transformer les systèmes de surveillance de la pollution. Le modèle PMForecast fournit des prévisions robustes de PM2.5, essentielles pour les interventions en santé publique.Le modèle spatiotemporel enrichit notre compréhension en analysant le comportement des polluants, tandis que l’architecture FedAirNet protège la vie privée à mesure que l’utilisation de capteurs mobiles se généralise. Cette recherche représente une avancée significative dans la prédiction de la pollution de l’air en intégrant des perspectives basées sur l’IA avec des techniques de collecte de données préservant la vie privée. Les travaux futurs devraient se concentrer sur l’incorporation de sources de données supplémentaires et l’affinement de modèles hybrides combinant données temporelles, spatiales et de détection mobile, contribuant à des systèmes de prévision plus précis, opportuns et sécurisés, afin de réduire les effets nocifs de la pollution sur la santé humaine et l’environnement.

Jury

M. Romain ROUVOY Université de Lille Directeur de thèse, Mme Suzanne CRUMEYROLLE Université de Lille Co-directrice de thèse, Mme Sophie CHABRIDON Institut Télécom SudParis Rapporteure, M. Matthieu PUIGT Université du Littoral Côte d'Opale (ULCO) Rapporteur, Mme Nadège MARTINY Université de Bourgogne Examinatrice, M. Sébastien PAYAN Sorbonne University Examinateur.

Thesis of the team Spirals defended on 11/12/2024