info453 - Fouille de données

-
Nombre de crédits
- 5
- Pré-requis
- (Licence mention informatique),
303
- Parcours
- optionnelle pour la mention informatique du master science
-
Objectifs
- Apprendre à retirer de l'information d'une masse de
données :
-
Quelle information peut-on espérer trouver ?
- Quelles sont les techniques utilisables, leur coût, leur
rendement ?
- Quelle démarche suivre ?
À la fin du cours, les étudiants doivent être capables de définir et
implémenter des algorithmes de fouilles de données, disponibles dans
les suites logicielles du marché (SQL Server, Oracle, BO...), en
présenter les principes et les résultats aux utilisateurs terminaux.
- Organisation
- Cours : 20h, Travaux dirigés : 10h, Travaux pratiques : 14h,
Conférences : 6 heures (3 conférences)
- Volume de travail personnel étudiant estimé
- environ 50h
- Contrôle et validation des connaissances
-
Examen sur le contenu du cours.
- Note de travaux pratiques : illustration de techniques.
- Description du contenu
-
Définition de la fouille de données.
- Le cycle de la recherche de connaissances.
- Les données : sources, formats, vérification, nettoyage,
transformations.
- Les entrepôts de données : Structures, modèles,
alimentation, utilisation.
- L'analyse en ligne : OLAP, MOLAP, ROLAP...
- Les différentes méthodes de recherche de connaissances :
-
Les règles d'association.
- Les méthodes de classification :
-
Arbres de décision.
- Réseaux de neurones.
- Segmentation, apprentissage non supervisé.
- La recherche des anomalies.
- Aperçu des nouveaux domaines d'application (Web, images,
textes, données hétérogènes...)
- Bibliographie
-
-
Data Mining, Concepts & Techniques Jiawei Han &
Micheline Kamber
- Data Mining Ian Witten & Eibe Frank
- Responsable(s)
- Francesco De Comité
fichier source pour édition/modification