Publicación: Detección de anomalías en la facturación electrónica de la DIAN usando Machine Learning
| dc.contributor.advisor | León Velásquez, Elizabeth | |
| dc.contributor.author | Parrado Velásquez, Fabio Andrés | |
| dc.creator.id | 79899809 | |
| dc.date.accessioned | 2025-07-22T16:08:24Z | |
| dc.date.issued | 2025-06-14 | |
| dc.description.abstract | Este estudio propone un modelo basado en Machine Learning para detectar anomalías y fraudes en la facturación electrónica recibida por la DIAN, optimizando la eficacia en la fiscalización tributaria. El enfoque de investigación es cuantitativo, con diseño no experimental y transversal, aplicando técnicas avanzadas de aprendizaje automático como Autoencoders y Isolation Forest. Se emplea un muestreo aleatorio estratificado, considerando un ingreso diario promedio de 25 millones de facturas, tomando una muestra significativa y manejable correspondiente a una semana específica (aproximadamente 175 millones de registros). Los resultados serán validados mediante validación cruzada y métricas estándar como precisión, recall y F1-Score. | spa |
| dc.description.abstract | This study proposes a machine learning-based model to detect anomalies and fraud in electronic invoicing received by the DIAN, optimizing the effectiveness of tax audits. The research approach is quantitative, with a non-experimental and cross-sectional design, applying advanced machine learning techniques such as Autoencoders and Isolation Forest. Stratified random sampling is used, considering an average daily inflow of 25 million invoices, taking a meaningful and manageable sample corresponding to a specific week (approximately 175 million records). The results will be validated using cross-validation and standard metrics such as precision, recall, and F1-score. | eng |
| dc.description.degreelevel | Especialización | spa |
| dc.description.degreename | Especialista en Machine Learning | spa |
| dc.description.tableofcontents | N° Contenido Página 1 Resumen 4 2 Palabras clave 4 3 Planteamiento del Problema 5 3.1 Antecedentes del problema 6 3.2 Descripción del problema 7 3.3 Pregunta de investigación 8 4 Objetivos 9 4.1 Objetivo general 9 4.2 Objetivos específicos 10 5 Conveniencia de la investigación 11 6 Marco teórico e institucional 12 6.1 Antecedentes 13 6.2 Facturación electrónica y su implementación 14 6.3 Técnicas tradicionales en detección de fraude fiscal 15 6.4 Teorías sobre la detección de fraudes 16 6.5 Modelos de Machine Learning aplicados a la auditoría 17 6.6 Técnicas avanzadas de detección de fraude fiscal 18 6.7 Marco legal en Colombia 20 6.8 Análisis comparativo internacional 21 6.9 Aplicación de IA en fiscalización tributaria 22 7 Metodología 23 7.1 Enfoque, alcance y diseño de la investigación 25 7.2 Definición conceptual y operacional de las variables 27 7.3 Población y muestra 30 7.4 Técnicas, instrumentos y modelos utilizados 32 7.5 Proceso de análisis de datos 34 8 Resultados preliminares 36 8.1 Análisis estadístico preliminar 38 8.2 Interpretación de los resultados 39 9 Propuesta preliminar de validación 40 9.1 Análisis estadístico preliminar esperado 41 9.2 Propuesta para la validación futura del modelo 42 10 Conclusiones 42 11 Referencias 43 | |
| dc.format | ||
| dc.format.extent | 47 páginas | |
| dc.format.medium | Recurso electrónico | spa |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | instname:Universidad Ean | spa |
| dc.identifier.reponame | reponame:Repositorio Institucional Biblioteca Digital Minerva | spa |
| dc.identifier.repourl | repourl:https://repository.ean.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10882/14943 | |
| dc.language.iso | spa | |
| dc.publisher.faculty | Facultad de Ingeniería | spa |
| dc.publisher.program | Especialización en Machine Learning | spa |
| dc.relation.references | 1. Departamento Nacional de Planeación de Colombia (DNP). (2013). Estrategia para la masificación de la factura electrónica en Colombia (Documento CONPES 3786). Departamento Nacional de Planeación. https://colaboracion.dnp.gov.co/CDT/Conpes/Económicos/3786.pdf 2. Ley 223 de 1995. Congreso de Colombia. Normativa sobre racionalización tributaria. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_0223_1995.html 3. Ley 962 de 2005. Congreso de Colombia. Sobre racionalización de trámites administrativos. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_0962_2005.html 4. Decreto 1929 de 2007. Ministerio de Hacienda y Crédito Público. Sobre facturación electrónica. Recuperado de: https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=26968 5. Ley 1231 de 2008. Congreso de Colombia. Unificación de la factura como título valor. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_1231_2008.html 6. Resolución DIAN 000042 de 2020. Régimen de Facturación Electrónica. DIAN. Recuperado de: https://www.dian.gov.co/normatividad/Paginas/Inicio.aspx 7. OECD. (2024). Designing a National Strategy against Tax Crime. OECD Publishing. Recuperado de: https://doi.org/10.1787/0e451c90-en (Indexado en Scopus y WOS) 8. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2021). Fighting tax crime: The ten global principles (Second Edition). OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2021/06/fighting-tax-crime-the-ten-global-principles-second-edition_1f0b22cf/006a6512-en.pdf 9. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2024). Designing a national strategy against tax crime. OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2024/05/designing-a-national-strategy-against-tax-crime_4741d536/0e451c90-en.pdf 10. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications, with special reference to the tax inspection procedure. World Tax Journal, 13(4), 575–608. 11. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2023). Tax fraud and evasion: Global trends and responses. OECD Publishing. 12. Rodríguez, L., & García, M. (2022). Artificial Intelligence for Financial Fraud Detection: A Systematic Review. Journal of AI Research, 45(2), 23-37. 13. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications. World Tax Journal, 13(4), 575–608. (Indexado en Scopus y WOS) 14. OECD. (2021). Fighting Tax Crime: The Ten Global Principles (Second Edition). OECD Publishing. Recuperado de: https://doi.org/10.1787/006a6512-en (Indexado en Scopus y WOS) 15. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications. World Tax Journal, 13(4), 575–608. (Indexado en Scopus y WOS) 16. OECD. (2021). Fighting Tax Crime: The Ten Global Principles (Second Edition). OECD Publishing. Recuperado de: https://doi.org/10.1787/006a6512-en 17. Hodge, F. D., Mendoza, K., & Sinha, R. K. (2021). Detecting Fraud in Organizations: An Examination of AI Approaches. Journal of Forensic Accounting Research, 6(1), 1-18. 18. Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys (CSUR), 41(3), 15. (Indexado en Scopus) 19. Goldstein, M., & Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PLOS ONE, 11(4), e0152173. (Indexado en Scopus) 20. Guo, H., Liu, Y., Li, J., & Prasetyo, P. K. (2020). Financial fraud detection using deep learning approaches. Journal of Big Data, 7(1), 1-19. (Indexado en Scopus) 21. Nguyen, N., & Duong, T. (2021). Fraud detection using Isolation Forest and Autoencoder. Expert Systems with Applications, 176, 114858. 22. Aggarwal, C. C. (2015). Outlier Analysis. Springer International Publishing. 23. An, J., & Cho, S. (2015). Variational autoencoder based anomaly detection using reconstruction probability. Technical Report. Seoul National University. 24. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 25. Hawkins, D. M. (1980). Identification of Outliers. Springer, Dordrecht. 26. Mishra, A., & Sharma, S. (2019). Application of Machine Learning Techniques in Tax Compliance: A Review. Journal of Tax Administration, 5(2), 23-39. 27. Gao, Y., & Ye, Y. (2021). Machine Learning for Fiscal Audit: International Experience and Recommendations. Journal of Taxation and Public Finance, 8(3), 209-223. 28. Ramírez, J. A., & López, A. (2019). Aplicación de inteligencia artificial en la detección de fraude tributario en América Latina. Revista Internacional de Tecnología e Innovación, 6(2), 56-70. 29. McKinsey & Company. (2022). Artificial intelligence in tax administration: Global trends and best practices. Technical report. 30. Bergmann, A., & Martin, M. (2021). Comparative Analysis of AI Adoption in Fiscal Systems in OECD Countries. OECD Working Papers on Public Governance. | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 2.5 Colombia | |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | |
| dc.subject.lemb | Evaluación de proyectos | spa |
| dc.subject.lemb | Aprendizaje automático | spa |
| dc.subject.lemb | Cambio tecnológico | spa |
| dc.subject.lemb | Facturas electrónicas | spa |
| dc.subject.lemb | Mejoramiento de procesos | spa |
| dc.subject.proposal | Machine Learning Detección de anomalías Facturación electrónica Fiscalización tributaria Fraude fiscal | spa |
| dc.title | Detección de anomalías en la facturación electrónica de la DIAN usando Machine Learning | spa |
| dc.title | Anomaly detection in DIAN electronic invoicing using machine learning | eng |
| dc.type | Trabajo de grado - Especialización | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.other | Trabajo de grado - Especialización | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dspace.entity.type | Publication | |
| person.affiliation.name | Especialización en Machine Learning |
Archivos
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.92 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
