Thèse de Azadeh Khaleghi

Sur Quelques Problèmes non supervisés impliquant des séries temporelles hautement dépendantes

Cette thèse est consacrée a l'analyse théorique de problèmes non supervises impliquant des séries temporelles hautement dépendantes. Nous abordons les deux problèmes fondamentaux que sont le problème d'estimation des points de rupture et le partitionnement de séries temporelles. Ces problèmes sont abordes dans un cadre extrêmement général ou les données sont générées par des processus stochastiques ergodiques stationnaires. Il s'agit de l'une des hypothèses les plus faibles en statistiques, comprenant non seulement, les hypothèses de modèles et les hypothèses paramétriques habituelles dans la littérature scientifique, mais aussi des hypothèses classiques d'indépendance, de contraintes sur l'espace mémoire ou encore des hypothèses de mélange. Aucune restriction n'est faite sur la forme ou la nature des dépendances, de telles sortes que les échantillons peuvent être arbitrairement dépendants. Pour chaque problème aborde, nous proposons de nouvelles méthodes non paramétriques et nous prouvons de plus qu'elles sont, dans ce cadre, asymptotiquement consistantes. L'analyse statistique dans le cadre stationnaire ergodique est extrêmement difficile. De manière générale, il est prouve que les vitesses de convergence sont impossibles a obtenir. Des lors, pour deux échantillons générés indépendamment par des processus ergodiques stationnaires, il est prouve qu'il est impossible de distinguer le cas ou les échantillons sont générés par le même processus de celui ou ils sont générés par des processus différents. Ceci implique que des problèmes tels le partitionnement de séries temporelles sans la connaissance du nombre de partitions ou du nombre de points de rupture ne peut admettre de solutions consistantes. En conséquence, une tache difficile est de découvrir les formulations du problème qui en permettent une résolution dans ce cadre général. La principale contribution de cette thèse est de démontrer (par construction) que malgré ces résultats d'impossibilités théoriques, des formulations naturelles des problèmes considérés existent et admettent des solutions consistantes dans ce cadre général. Ceci inclut la démonstration du fait que le nombre de points de rupture corrects peut être trouve, sans recourir a des hypotheses plus fortes sur les processus stochastiques. Les résultats présentés dans ce travail formulent les fondations théoriques pour l'analyse des données séquentielles dans un espace d'applications bien plus large.

Jury

Directeur de Thèse : Daniil RYABKO Rapporteurs : Francis BACH, Jean-Philippe VERT Membres du Jury: Olivier CATONI, Patrick GALLINARI, Christophe BIERNACKI

Thèse de l'équipe soutenue le 18/11/2013