Coordinateur : Patrick Bas, Directeur de Recherche CNRS
Équipe : SIGMA du Groupe Thématique : DatInG
Partenaires : Université de Lille, CRIStAL, Patrick Bas, Université de Technologie de Troyes (UTT), Institut Charles Delaunay, Université de Montpellier, LIRMM
ASTRID (Accompagnement spécifique de travaux d’intérêt défense)
Dates : 01/19 - 12/21
Résumé :
Le projet ALASKA s’intéresse à la détection d’informations cachées dans les images numériques. Cette technique, appelée stéganographie, peut être utilisée à des fins malveillantes par des groupes criminels ou terroristes. En conséquence, le développement d’outils de stéganalyse, c’est à dire de détection d’informations cachées, est un enjeu important pour les opérationnels de la défense nationale.
Si de nombreux travaux de recherches se sont intéressés à la stéganalyse durant la dernière décennie, la plupart de ces travaux se positionnent dans un cadre expérimental académique très restreint ; en fait, leur application pratique n’a pratiquement jamais été étudiée. Il n’existe actuellement aucun travail explorant la détection d’informations cachées dans les médias dans un contexte opérationnel. C’est pour cette raison que, malgré l’état de l’art fourni sur le sujet de la stéganalyse dans des conditions laboratoire « in vitro » , il demeure actuellement impossible de développer des outils pratiques de détection pour la stéganalyse dans un cardre « in vivo ».
Le but du présent projet ALASKA est de combler le fossé entre les travaux de recherche académiques et les besoins pratiques des services de sécurité en renforçant les liens tissés entre ces deux communautés. Les recherches qui seront menées dans ce projet s’articuleront donc autour des applications pratiques des avancées académiques en stéganalyse.
L’objectif général est de concevoir des méthodes d’analyse et de détection applicables à des images pouvant être interceptées ou saisies dans le cadre des investigations numériques. Pour aller dans cette direction pratique et opérationnelle, le projet ALASKA est divisé en quatre tâches qui traitent chacune d’une problématique majeure, et jusqu’à présent peu étudiée, de la stéganalyse pratique.
La première concerne la conception de méthodes de stéganalyse pour des bases d’images très hétérogènes ; deux approches complémentaires seront étudiées : la première, dite ciblée, cherchant à regrouper les images similaires au sein d’ensembles homogènes qui peuvent être inspectés plus aisément ; la seconde visant, au contraire, à tirer profit de cette diversité pour discriminer au mieux les traces spécifiques de la stéganographie.
La seconde tâche vise à développer les récentes techniques d’apprentissage profond (deep learning) pour la stéganalyse dans un cadre pratique, le principal enjeu étant de pouvoir reproduire les performances, très prometteuses en termes de détection, de ces approches dans un contexte plus proche de l’opérationnel.
Le troisième volet a pour objectif de concevoir des méthodes de détection "à valeur probatoire", notamment avec une probabilité de fausse alarme maîtrisée et une valeur de résultat quantitative. Il est en effet primordial, pour permettre une utilisation à grande échelle, d’assurer une probabilité de faux positif très faible.
Enfin, le quatrième axe est la création d’un concours international de stéganalyse pour d’une part motiver la communauté de recherche à étudier les problèmes d’application de la stéganalyse dans un contexte opérationnel et d’autre part tirer les bénéfices des travaux des participants internationaux. Le concours sera conçu pour mettre en avant les difficultés pratiques, notamment celles abordées dans les trois premiers axes. Les avancées proposées par les participants seront analysées et, le cas échéant, développées par les partenaires du projet.
Le consortium de ce projet regroupe trois équipes présentant de compétences complémentaires couvrant l’ensemble des thématiques scientifiques abordées et possédant une expertise largement reconnue à l’échelle internationale.
Abstract
The present ALASKA project studies the detection of data hidden within digital images. This technique, referred to as steganography, can be leveraged by criminal rings or terrorist groups. Therefore, developing steganalysis tools, that is for hidden data detection, is crucial for national defense and intelligence forces.
While numerous research works addressed the problem of steganalysis over the last decades, a vast majority of them rely on an experimental academic framework which is very restrictive ; in fact, their application in practical setup has never been studied. There is almost no prior works dealing with hidden data detection for the purpose of uses by agencies operational. This is the main reason why, despite a substantial number of prior works from state of the art that relies on academic setup, it remains currently impossible to develop a practical detection tool for steganalysis dedicated to meet the need of intelligence operations.
The goals of present ALASKA project are towards filling the gap between research works and practical needs of intelligence agencies by strengthening the ties built between those two communities. The research works conduct under the umbrella of this project will focus on applications, in practical setup, of advances proposed in the field of steganalysis.
The overall aim is to design media analysis and steganalysis detection methods that can be used over images that can be intercepted or seized whithin digital investigations. To move forward in this practical and operational direction, the ALSKA project is divided into four works packages each dealing with one of the main issues, and yet seldom addressed until now, towards practical steganalysis.
The first one focuses on the design on steganalysis methods for highly heterogeneous image datasets ; two complementary approaches will be studied : the first one, referred to as targeted, seeks at gathering similar images within homogeneous groups that can be exploited for inspection ; the second one that, on the opposite, aims at leveraging this diversity for discriminating more accurately specific footprints of data hiding.
The second work package aims at developing recent advances using deep learning techniques for steganalysis in a practical framework ; the main challenge being to be able to reproduce the performance, very promising in terms of detection accuracy, of those approaches within a context closer to the operational one.
The third work package is devoted to the design of detection method associated with "probative value", especially with a bounded false alarm probability and quantitative results. It is indeed crucial, for allowing a large scale application, to ensure a very low false positive rate.
Eventually, the fourth and last work package deals with the organization of an international steganalysis contest with the goal, on the one hand, to motivate the research community to look into the direction of practical applications in operational context and, on the other hand, to benefit from contribution of the international challengers. This contest will be designed to highlight the main challenge in practical applications, especially those described in the three previous points. The progress made by the challengers will be analyzed and will be developed by the partners whenever appropriate.
The consortium of ALASKA project gathers three teams having complementary knowledges and skills filling all the scientific fields addressed and all having expertises widely acknowledged internationally.