Credit score classification
Objectifs
Construire un modèle de classification multiclasse capable de prédire la catégorie de crédit d'un individu (Good, Standard, Poor) en fonction de ses caractéristiques financières. L'objectif est de réaliser le pipeline complet Data Science, du nettoyage approfondi à l'optimisation des hyperparamètres.
Méthodes & Analyse
Traiter 100 000 lignes de données financières brutes : correction d'anomalies, imputation des valeurs manquantes, création de features temporelles (Credit_History_Age). L'exploration a permis de tester une panoplie d'algorithmes (Régression Logistique, Random Forest, SVM, Gradient Boosting).
Mon Rôle
Data Scientist Expert Risque
Résultats & Commentaires
Le modèle Gradient Boosting (XGBoost/LightGBM) s'est imposé avec une Accuracy, un Recall et un F1-Score de l'ordre de ~90%, ainsi qu'un AUC-ROC exceptionnel de ~0.96. L'historique de paiement (32%) a été identifié comme le facteur déterminant de solvabilité.