Thèse de Boris Baldassari

Maisqual : Amélioration de la qualité logicielle par fouille de données.

Les référentiels utilisés dans le développement logiciel offrent une quantité importante d'information sur les outils, méthodes et pratiques de développement. Cette information est globalement peu utilisée car elle est difficile d'accès (référentiels répartis, issus d'une grande variété d'outils différents), elle est de nature spécifique (semi-structurée, distributions non normales, données incomplète ou incohérente au premier abord..), et son interprétation est soumise à nombre de contraintes et connaissances propres au domaine. L'effort de recherche fait au sein de Maisqual s'attaque à ces problèmes, en utilisant les techniques issues de la fouille de données pour apporter des éléments de réponses objectifs aux interrogations et difficultés rencontrées lors du développement logiciel et lors de l'évaluation de qualité pour les systèmes et produits logiciels. Nous avons donc identifié et formalisé quelques-unes de ces problématiques courantes, et répertorié les méthodes de fouille de données pouvant apporter des éléments de réponse. Plusieurs projets logiciels libres ont été analysés, en travaillant à la fois sur les métriques issues du code source du produit et sur les informations issues du processus de développement (gestion de configuration, listes de diffusion). De par la nature des données et les volumes considérés, il appert que certaines techniques sont plus appropriées que d'autres, notamment les techniques de classification non supervisées, l'analyse par régression, et la détection d'outliers. Pour une même méthode, certains algorithmes sont également plus robustes ou plus précis en fonction des données considérées. Les résultats de ce travail sont perceptibles à plusieurs niveaux. Premièrement, nous avons établi un lien entre recherche académique et industrie : certaines techniques ont directement été intégrées au produit SQuORE ou ont été mises à disposition sous forme de scripts utilisables par les consultants lors des missions en clientèle. Le travail effectué sur l'extraction et l'analyse des métriques logicielles et sur les modèles de qualité a également contribué à la pertinence de l'outil SQuORE. Le cadre méthodologique développé pour nos analyses, permettant de garder une sémantique sûre malgré la transformation métrologique, est un autre apport au domaine. Enfin plusieurs data sets logiciels complets ont été produits et publiés sous licence libre pour que les communautés scientifique et industrielle en bénéficient.

Jury

Monsieur Philippe PREUX, Professeur à l’Université de Lille 3, Directeur de thèse Monsieur Benoît BAUDRY, Chargé de recherche à l’INRIA de Rennes, HDR Madame Laurence DUCHIEN, Professeur à l’Université de Lille 1 Monsieur Flavien HUYNH, Ingénieur logiciels à Squoring Technologies SAS de Toulouse, Docteur Madame Pascale KUNTZ, Professeur à l’Université de Nantes Monsieur Martin MONPERRUS, Maître de conférences à l’Université de Lille 1

Thèse de l'équipe soutenue le 01/07/2014