Credit score classification

Machine LearningXGBoostLightGBMData PreprocessingMulticlass Classification

Objectifs

Construire un modèle de classification multiclasse capable de prédire la catégorie de crédit d'un individu (Good, Standard, Poor) en fonction de ses caractéristiques financières. L'objectif est de réaliser le pipeline complet Data Science, du nettoyage approfondi à l'optimisation des hyperparamètres.

Méthodes & Analyse

Traiter 100 000 lignes de données financières brutes : correction d'anomalies, imputation des valeurs manquantes, création de features temporelles (Credit_History_Age). L'exploration a permis de tester une panoplie d'algorithmes (Régression Logistique, Random Forest, SVM, Gradient Boosting).

Mon Rôle

Data Scientist Expert Risque

Résultats & Commentaires

Le modèle Gradient Boosting (XGBoost/LightGBM) s'est imposé avec une Accuracy, un Recall et un F1-Score de l'ordre de ~90%, ainsi qu'un AUC-ROC exceptionnel de ~0.96. L'historique de paiement (32%) a été identifié comme le facteur déterminant de solvabilité.

Voir le Projet