L’intelligence des données s’intéresse à la manière dont des données sont acquises, manipulées, gérées, enrichies, traitées afin d’en extraire ou de révéler l’information qu’elles contiennent, cela dans le but de prendre une décision ou d’aider à la prise de décision. Le mot « donnée » doit être entendu dans un sens très large ; les données proviennent de sources de différents types (capteurs, bases de données, réseaux sociaux, etc), combinant des informations de différents types (images, textes en langue naturelle, nombres, etc). Dans ce contexte, les données doivent être organisées ; des volumes de données énormes doivent être pris en compte ; les données sont souvent disponibles sous forme de flux dont les caractéristiques peuvent changer au cours du temps ; l’information utile doit être extraite de ce flux de données. Le champ d’applications est extrêmement étendu : si les mondes des affaires et de la finance sont bien connus, les applications abondent dans les sciences (physique, astronomie, biologie, médecine, …).
Dans CRIStAL, le groupe « intelligence des données » (DatInG) est composé de 3 équipes de recherche : MAGNET, SCOOL et SIGMA. DatInG combine des compétences fortes en apprentissage automatique, fouille de données et traitement de signal. MAGNET s’intéresse à l’apprentissage automatique de confiance (confidentialité, équité, apprentissage décentralisé/fédéré) et au traitement du langage naturel. SIGMA s’intéresse aux signaux, i.e. des entités mathématiques issues de capteurs physiques. SCOOL étudie la prise de décision séquentielle dans des conditions d’incertitude, principalement des problèmes de bandit et d’apprentissage par renforcement.
Ensemble, ces 3 équipes de recherche étudient les étapes les plus importantes du pipeline de l’intelligence des données. Les activités dans DatInG vont de la recherche fondamentale aux applications, notamment en collaboration avec des entreprises.
MSV : Modélisation pour les Sciences du Vivant Image GL : Génie Logiciel ToPSyS : Tolérance Pronostic Système de Systèmes CO2 : Control and scientific Computing I2C : Interaction et Intelligence Collective SISE : Systèmes Informatiques Sûrs et Efficaces OPTIMA : OPTImisation : Modèles et Applications