Objectifs
Permettre à Home Credit d'étendre l'inclusion financière aux personnes sans historique de crédit en prédisant la probabilité de défaut de paiement d'un client. L'objectif est de minimiser les risques tout en élargissant l'accès au crédit pour la population non bancarisée.
Méthodes & Analyse
Ingénierie de variables avancée sur un dataset massif (356k lignes) : création de ratios métiers (credit_annuity_ratio, etc.) et encodage complexe. Il a fallu implémenter une stratégie d'Ensemble Learning hiérarchisée combinant LightGBM et XGBoost, tout en gérant le fort déséquilibre des classes via une validation croisée stratifiée.
Mon Rôle
Risk Data Scientist
Résultats & Commentaires
L'Ensemble Blend (50/50 LightGBM et XGBoost) a surpassé les modèles individuels, atteignant une AUC-ROC Out-Of-Fold de 0.76318. Ce projet démontre une approche complète de classification binaire, de la création de plus de 125 variables jusqu'à la génération des probabilités de défaut.