L’apprentissage automatique est un domaine en forte croissance à la fois dans le nombre de méthodes employées mais aussi dans le nombre de bases de données à disposition des utilisateurs et dans les usages de ces derniers. La classification, qui est une tâche essentiellement abordée par l’apprentissage automatique, est ainsi affectée par cette évolution. Par exemple, la problématique de l’apprentissage décentralisé (données réparties en sous-ensembles distincts sur des noeuds en réseau) incite à créer des systèmes globaux basés sur des comités de classifieurs. Pour cette raison, on traite dans cette thèse la problématique des systèmes multi-classifieurs ou bien les comités de classifieurs. L'objectif de mes travaux de recherche est alors la conception des systèmes multi-classifieurs qui assurent un certain niveau de robustesse (performances au moins équivalente au meilleur classifieur du comité mais dans un contexte d'utilisation plus large). A cette fin, nous proposons deux solutions qui sont les principales contributions de la thèse. La première est une approche possibiliste basée sur une combinaison des distributions de possibilité calculées à partir des matrices de confusion à l'aide d'un fonction Tnorme, tandis que la deuxième est une approche probabiliste basée sur une combinaison de probabilités conditionnelles à l'aide d'une fonction Copule. En réglant l’unique hyperparamètre de chacun de ces fonctions de combinaison par recherche par quadrillage (grid search), nous sommes capables soit de capturer explicitement une partie de la relation de dépendance statistique entre les prédictions des classifieurs du comité soit de contourner l’hypothèse d’indépendance entre ces derniers ce qui est un point clé dans l’obtention de la robustesse souhaitée.
Rapporteurs: Sylvie le Hégarat, Laurent Heutte Examinateurs: Benjamin Guedj, Didier Coquin Directeurs de thèse: John Klein et Olivier Colot
Thesis of the team SIGMA defended on 11/10/2018