Publicación: Predicción de quiebras empresariales en turismo colombiano mediante k-NN funcional y una métrica de distancia personalizada (1995–2023)
Portada
Citas bibliográficas
Código QR
Autores
Director
Fecha
Resumen en español
Esta investigación doctoral desarrolla como aporte metodológico original una métrica funcional multivariada personalizada para comparar trayectorias financieras multivariadas de empresas. Esta métrica permite evaluar la similitud entre entidades a partir de la evolución de sus indicadores financieros durante cinco años, incluso en presencia de datos faltantes o escalas heterogéneas. Al integrarse en un clasificador k-vecinos más cercanos (k-NN), el modelo resultante ofrece un equilibrio entre rendimiento predictivo e interpretabilidad, permitiendo visualizar y analizar los vecinos más cercanos en el espacio funcional. Para su validación empírica, se aplicó la metodología al problema de predicción de quiebra en empresas del sector turismo en Colombia, un segmento estratégico para la economía nacional que ha mostrado alta vulnerabilidad ante crisis financieras y operativas. Se construyó una base longitudinal con más de 5.000 empresas (1995–2023) y se identificaron eventos de quiebra mediante criterios financieros y operativos. A pesar del auge reciente de técnicas de aprendizaje automático aplicadas a este problema, persisten limitaciones clave: muchos modelos avanzados operan como “cajas negras” difíciles de interpretar, no permiten visualizar la similitud concreta entre empresas y tienden a ignorar la estructura dinámica de las trayectorias financieras multivariadas. El modelo funcional fue evaluado con validación cruzada estratificada, alcanzando un F1-score promedio de 0,9802, una sensibilidad del 96,35% y una precisión del 99,76%, resultados que lo posicionan como una alternativa competitiva frente a modelos más complejos como XGBoost, redes LSTM o arquitecturas hibridas. Si bien no supera a todos en desempeño, su principal fortaleza radica en la posibilidad de identificar empresas similares (vecinas) de manera explicita y explicar la relevancia de cada indicador mediante los pesos optimizados en la métrica, lo que lo convierte en un complemento valioso para sistemas de alerta temprana y análisis financiero. Además del desarrollo metodológico, se construyó un aplicativo computacional interactivo que permite estimar el riesgo de quiebra de una empresa y mostrar sus vecinos financieros más cercanos en función de la métrica propuesta. Esta herramienta refuerza la aplicabilidad del modelo al proporcionar trazabilidad, explicaciones claras y posibilidades reales de uso por parte de analistas, supervisores o gestores no técnicos. La hipótesis de este trabajo plantea que un modelo k-NN funcional basado en una métrica de distancia personalizada, diseñada para trayectorias financieras multivariadas, puede alcanzar un desempeño competitivo frente a modelos avanzados, manteniendo interpretabilidad y capacidad de visualización de similitudes.
Resumen en inglés
This doctoral research proposes an original methodological contribution: a custom multivariate functional distance metric for comparing financial trajectories of firms. This metric allows assessing the similarity between entities based on the evolution of their financial indicators over five years, even in the presence of missing data or heterogeneous scales. When integrated into a k-nearest neighbors (k-NN) classifier, the resulting model offers a balance between predictive performance and interpretability, enabling the visualization and analysis of nearest neighbors in the functional space. For empirical validation, the methodology was applied to the problem of bankruptcy prediction in firms from Colombia’s tourism sector, a strategic segment for the national economy that has shown high vulnerability to financial and operational crises. A longitudinal database of over 5,000 firms (1995–2023) was built, identifying bankruptcy events through financial and operational criteria. Despite the recent surge of machine learning techniques applied to this problem, key limitations persist: many advanced models operate as black boxes, are difficult to interpret, do not allow for concrete similarity visualizations, and often ignore the dynamic structure of multivariate financial trajectories. The functional model was evaluated through stratified cross-validation, achieving an average F1-score of 0.9802, a sensitivity of 96.35%, and a precision of 99.76%. These results position it as a competitive alternative to more complex models like XGBoost, LSTM networks, or hybrid architectures. While it does not outperform all others in accuracy, its main strength lies in the explicit identification of similar (neighboring) firms and the explanation of each indicator’s relevance through optimized weights in the metric. This makes it a valuable complement to early warning systems and financial analysis tools. In addition to the methodological development, an interactive web application was built. It allows users to estimate a firm’s bankruptcy risk and display its closest financial neighbors according to the proposed metric. This tool reinforces the model’s applicability by providing traceability, clear explanations, and real usability for analysts, supervisors, or non-technical managers. The hypothesis of this study posits that a functional k-NN model based on a custom distance metric tailored for multivariate financial trajectories can achieve competitive performance compared to advanced models while maintaining interpretability and the ability to visualize similarities.

PDF
FLIP 
