Prédiction Boursière à partir de données textuelles (FinLDA)
Objectifs
Développer FinLDA, une extension de LDA intégrant les séries financières. L'objectif est d'exploiter les textes (articles) pour prévoir les mouvements du marché boursier avec une précision supérieure aux modèles traditionnels, validant ainsi l'approche intégrée NLP/Finance.
Méthodes & Analyse
Traitement et nettoyage de 37,949 articles CNN et association minutieuse avec les données S&P 500 à la minute. Il a fallu construire un modèle graphique probabiliste modifié et réduire la dimensionnalité via PCA avant d'appliquer des régressions (SVR, Régression Linéaire).
Mon Rôle
Data Scientist R&D
Résultats & Commentaires
Le modèle FinLDA (combiné avec PCA, SVR et Régression Linéaire) a démontré une supériorité claire sur le LDA standard (amélioration RMSE, MAE). Cette approche novatrice établit une nouvelle méthode en combinant NLP et analyse quantitative applicable au trading.