data-portfolio

Prédiction de churn — Télécoms MTN Nigeria

Question métier

Quels clients ont le plus de chance de churner au prochain trimestre, et quelles features pilotent leur risque ? Un classifieur binaire ordonne les clients par probabilité de churn pour que les campagnes de rétention ciblent le segment à plus haut risque.

(Compagnon du projet 08, qui modélise les mêmes données comme un problème de survie — mêmes données, deux angles analytiques, tous deux utiles.)

Données

Source : MTN Nigeria Customer Churn (Kaggle) — 974 clients, 17 features (âge, État, forfait, satisfaction, ancienneté, revenu, usage data, label de churn).

Lancer python download_data.py.

Cibles d’EDA

Équilibre des classes (~29 % de churn)
Signaux de hasard univariés : faible satisfaction, faible ancienneté, type de forfait
Différences au niveau État

Modélisation

Famille	Modèle
Linéaire	Régression logistique avec pénalité L2 (baseline interprétable)
Arbres	Random Forest, Gradient Boosting (XGBoost)

Validation

Découpage stratifié 80/20
Métriques : ROC-AUC, PR-AUC, F1, exactitude équilibrée
Tracé de calibration pour le meilleur modèle

Déploiement

API POST /churn-score retournant probabilité + bande de décile + top contributions de features style SHAP
File de rétention priorisée par probabilité de churn × revenu

Résultat métier

Dépenses de rétention allouées là où le ROI est le plus élevé (clients à forte probabilité de churn × fort revenu)
Les drivers (par ex. note de satisfaction, type de forfait) alimentent la roadmap produit/tarification
Le même pipeline s’applique à toute activité par abonnement

This site is open source. Improve this page.