Thèse de Amel Aissaoui

Reconnaissance bimodale de visages par fusion de caractéristiques visuelles et de profondeur.

Ce travail s'inscrit dans la thématique de la reconnaissance de visages. Il s'agit de décider de manière automatique de l'identité d'une personne en fonction des traits caractéristiques de son visage. Nous présentons une approche bimodale 2D-3D qui combine des caractéristiques visuelles et de profondeur, afin d'améliorer la précision et la robustesse de la reconnaissance par rapport aux approches monomodales classiques. Dans un premier temps, une méthode d'acquisition 3D par reconstruction stéréoscopique dédiée aux visages est proposée. Cette méthode s'appuie sur un modèle actif de forme permettant de tenir compte de la topologie du visage. Ensuite, un nouveau descripteur DLBP (Depth Local Binary Patterns) est défini pour caractériser les informations de profondeur. Ce descripteur étend aux images de profondeur les LBP traditionnels utilisés pour décrire les textures. Enfin, une stratégie de fusion bi-niveaux est proposée, permettant une combinaison à la fois précoce et tardive des deux modalités. Des expérimentations menées sur différentes collections publiques de tests, ainsi que sur une collection spécialement élaborée pour les besoins de l'évaluation, ont permis de valider les contributions proposées dans le cadre de ce travail. En particulier, les résultats ont montré d'une part la qualité des données obtenues à l'aide de la méthode de reconstruction, et d'autre part un gain de précision obtenu en utilisant le descripteur DLBP et la fusion bi-niveaux.

Jury

Directeur de Thèse : M. Chaabane DJERABA, M. Jean MARTINET (co-encadrant) Rapporteurs : Mme Jenny BENOIS-PINEAU, M. Peter VEELAERT Membres : Mme Sophie TISON, M. Slimane LARABI

Thèse de l'équipe FOX soutenue le 23/06/2014