Telco Customer Churn – Machine Learning con Selección de Rasgos vía SHAP

Predicción de churn (abandono de clientes) en una empresa de telecomunicaciones, utilizando un pipeline reproducible con: limpieza, imputación, encoding, selección de rasgos con SHAP, y evaluación de modelos de clasificación (KNN, DecisionTree, LogisticRegression, RandomForest, GradientBoosting).

Resultado final:
Accuracy ≈ 0.842 · F1 ≈ 0.651 con 18 rasgos seleccionados vía SHAP.

Objetivo del proyecto

Negocio: predecir la probabilidad de que un cliente cancele el servicio, para priorizar acciones de retención.
Analítico: problema de clasificación binaria sobre la variable Churn Label (Yes/No), optimizando F1 y ROC-AUC.

Evaluación de desempeño

El accuracy mostrado en los resultados no fue el criterio principal para seleccionar el mejor modelo.
El proyecto se centró en el F1-score, que combina precision y recall, y es más apropiado en contextos con clases desbalanceadas, como el churn.

Métricas consideradas

Cada modelo fue evaluado con las siguientes métricas, tanto en train como en test:

Precision: proporción de predicciones positivas que fueron correctas.
Recall (Sensibilidad): proporción de churners correctamente detectados.
F1-score: media armónica entre precision y recall, priorizando el equilibrio entre ambas.
Accuracy: proporción total de aciertos (usado solo como referencia general).

En este proyecto, el valor de “Accuracy” presentado en los resultados corresponde al F1 ponderado, que se utilizó como métrica principal para evaluar el rendimiento y comparar los modelos.

Resultados de los modelos

Modelo	Accuracy (F1 ponderado)
Regresión Logística	0.84
K Vecinos Más Cercanos (KNN)	0.83
Árbol de Decisión	0.84
Bosques Aleatorios	0.85
Gradient Boosting	0.85

Todos los modelos presentan resultados coherentes y estables, sin signos de fuga ni sobreajuste Las métricas son aceptables para un problema de churn real, donde un F1 de 0.65–0.70 es considerado competitivo

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
.vscode		.vscode
README.md		README.md
telco.csv		telco.csv
telco.ipynb		telco.ipynb
telco_clean.csv		telco_clean.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Telco Customer Churn – Machine Learning con Selección de Rasgos vía SHAP

Objetivo del proyecto

Evaluación de desempeño

Métricas consideradas

Resultados de los modelos

About

Uh oh!

Releases

Packages

Languages

Tomaslopera/Telco_Classification

Folders and files

Latest commit

History

Repository files navigation

Telco Customer Churn – Machine Learning con Selección de Rasgos vía SHAP

Objetivo del proyecto

Evaluación de desempeño

Métricas consideradas

Resultados de los modelos

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages