Thèse Filtrage des Matrices de Covariance Dynamiques Au-Delà de l'Invariance par Rotation H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Paris-Saclay GS Sciences de l'ingénierie et des systèmes École doctorale : Interfaces : matériaux, systèmes, usages Laboratoire de recherche : Mathématiques et Informatique pour la Complexité et les Systèmes - EA 4037 Direction de la thèse : Damien CHALLET ORCID 0000000154571077 Début de la thèse : 2026-10-01 Date limite de candidature : 2026-05-21T23:59:59 L'estimation des matrices de corrélation est essentielle dans de nombreux domaines, car elles capturent les interactions et la structure collective de systèmes multivariés au deuxième ordre. Cela est particulièrement important en finance, où les corrélations déterminent le risque et la construction de portefeuille, mais aussi en biologie, en écologie et dans d'autres systèmes complexes. La principale difficulté réside dans le régime de grande dimension, où le nombre de variables est comparable, voire supérieur, à la taille de l'échantillon disponible. Dans ce cas, les matrices de corrélation empiriques sont fortement affectées par le bruit. En finance, cette difficulté est aggravée par la non-stationnarité : les fenêtres courtes sont bruitées, tandis que les fenêtres longues deviennent rapidement obsolètes.
Le shrinkage non linéaire est devenu l'approche de référence pour traiter ce problème. Il repose sur les estimateurs invariants par rotation [1], qui conservent les vecteurs propres empiriques et ne régularisent que les valeurs propres. Bien que ce cadre soit asymptotiquement optimal sous l'hypothèse de stationnarité, des résultats récents suggèrent qu'il est trop restrictif dans des contextes financiers réalistes [2]: lorsque la structure de dépendance évolue dans le temps, même des corrections plus simples peuvent surpasser le shrinkage non linéaire. En outre, les estimateurs optimaux pour la reconstruction de la matrice ne sont pas nécessairement les meilleurs pour les décisions de portefeuille [3].
Ce projet de doctorat vise à développer une approche qui tient compte de la rotation des vecteurs propres dans l'estimation dynamique des corrélations. L'idée centrale est que l'information prédictive peut résider non seulement dans les valeurs propres, mais aussi dans la géométrie des vecteurs propres, dans la structure mésoscopique et dans des motifs persistants d'ordre supérieur, tels que les hiérarchies et les relations triadiques.
La première partie du projet s'appuiera sur des données financières réelles afin d'identifier quelles caractéristiques structurelles demeurent stables dans le temps et lesquelles permettent de prédire les rotations futures de la matrice de corrélation. L'apprentissage profond sera utilisé comme outil de découverte afin de mettre en évidence ces régularités latentes.
L'objectif final n'est pas de construire un prédicteur de type boîte noire, mais d'élaborer un nouveau cadre mathématique pour une estimation qui tient compte de la rotation des vecteurs propres. L'apprentissage automatique servira à mettre au jour les symétries pertinentes et les principes structurels fondamentaux, qui seront ensuite incorporés dans une théorie interprétable, guidée par les données et dépendante du temps. L'application principale sera l'optimisation de portefeuille, pour laquelle de meilleures estimations de la structure future de dépendance devraient améliorer la robustesse et réduire le risque réalisé.
References
[1] Bun, J., Allez, R., Bouchaud, J. P., & Potters, M. (2016). Rotational invariant estimator for general noisy matrices. IEEE Transactions on Information Theory, 62(12), 7475-7490.
[2] Bongiorno, C., Challet, D., & Loeper, G. (2023). Filtering time-dependent covariance matrices using time-independent eigenvalues. Journal of Statistical Mechanics: Theory and Experiment, 2023(2), 023402.
[3] Bongiorno, C., & Challet, D. (2023). Non-linear shrinkage of the price return covariance matrix is far from optimal for portfolio optimization. Finance Research Letters, 52, 103383.
L'estimation des matrices de corrélation est essentielle dans de nombreux domaines, car elles capturent les interactions et la structure collective de systèmes multivariés au deuxième ordre. La principale difficulté réside dans le régime de grande dimension, où le nombre de variables est comparable, voire supérieur, à la taille de l'échantillon disponible. Dans ce cas, les matrices de corrélation empiriques sont fortement affectées par le bruit. En finance, cette difficulté est aggravée par la non-stationnarité : les fenêtres courtes sont bruitées, tandis que les fenêtres longues deviennent rapidement obsolètes.
L'apprentissage profond a montré son efficacité dans filtrage des valeurs propres [1]. Cela dit, il n'existe pas de travaux qui proposent une architecture adaptée aux filtrage des vecteurs propres.
[1] Bongiorno, Christian, Efstratios Manolakis, and Rosario Nunzio Mantegna. 'End-to-end large portfolio optimization for variance minimization with neural networks through covariance cleaning.' The Journal of Finance and Data Science (2026): 100179.
1. Identifier les régularités empiriques concernant la rotation des vecteurs propres dans le cadre dynamique des données financières
2. Utiliser des méthodes d'apprentissage automatique pour identifier la structure, potentiellement hiérarchique, sous-jacente aux vecteurs propres.
3. Application à l'optimisation de portefeuille, qui a l'avantage de procurer un mesure objective du gain de performance apporté par les méthodes proposes.
4. Formulation d'une boîte à outil statistique explicite pour d'une part la modélisation de la dynamique des vecteurs propres, et d'autre part pour l'inférence de leur dynamique.
Le profil recherché
M2 de recherche en mathématiques appliquées, physique statistique, systèmes complexes