Publicación: Modelo de aprendizaje automático y análisis de factores de abandono de clientes para mejorar su retención en el sector de comercio electrónico
Portada
Citas bibliográficas
Código QR
Director
Fecha
Resumen en español
Este proyecto de investigación busca desarrollar un modelo de aprendizaje automático que permita predecir el abandono de clientes (churn) en el sector de comercio electrónico minorista de moda. Debido a que el abandono no se evidencia de forma explícita ni de manera inmediata en este tipo de comercio, el estudio busca analizar cuáles son las variables que tienen un mayor impacto en el abandono, con el fin de diseñar estrategias que optimicen los recursos de las campañas de retención. La metodología propuesta empleará datos fidedignos provenientes de mencionado sector y luego de anonimizarlos se procederá a emplear tres algoritmos de aprendizaje automático: Regresión Logística, Random Forest y XGBoost, ampliamente utilizados en diversos estudios. Realizada la validación experimental de mencionados algoritmos, el modelo que obtuvo los mejores valores en las métricas de desempeño fue el XGBoost, con una exactitud (Accuracy) del 96 %, un F1-Score de 97 % y un ROC-AUC de 99,33 % demostrando una alta capacidad para pronosticar el abandono; respecto al Random Forest que obtuvo una exactitud del 95 % y finalmente la Regresión Logística con una exactitud del 90 %. La precisión y sensibilidad sobresaliente del XGBoost evidencian su gran robustez brindando un soporte sólido y confiable para la formulación o diseño de estrategias de retención traduciéndolo en optimización de costos y aumento en la rentabilidad.
Resumen en inglés
This research project aims to develop a machine learning model capable of predicting customer churn in the retail fashion e-commerce sector. Since churn does not manifest explicitly or immediately in this type of business, the study seeks to analyze which variables have the greatest impact on customer attrition, with the purpose of designing strategies that optimize retention campaign resources. The proposed methodology will employ reliable data from the mentioned sector, which will be anonymized before applying three machine learning algorithms: Logistic Regression, Random Forest, and XGBoost, all widely used in previous studies. After conducting experimental validation of these algorithms, the model that achieved the best performance metrics was XGBoost, with an accuracy of 96%, an F1-score of 97%, and a ROC-AUC of 99.33%, demonstrating a high capacity to forecast churn. In comparison, Random Forest achieved 95% accuracy, and Logistic Regression reached 90%. The outstanding precision and recall of XGBoost highlight its robustness, providing solid and reliable support for the formulation of retention strategies, ultimately leading to cost optimization and increased profitability.

PDF
FLIP 
