Publicación:
Detección de anomalías en la facturación electrónica de la DIAN usando Machine Learning

dc.contributor.advisorLeón Velásquez, Elizabeth
dc.contributor.authorParrado Velásquez, Fabio Andrés
dc.creator.id79899809
dc.date.accessioned2025-07-22T16:08:24Z
dc.date.issued2025-06-14
dc.description.abstractEste estudio propone un modelo basado en Machine Learning para detectar anomalías y fraudes en la facturación electrónica recibida por la DIAN, optimizando la eficacia en la fiscalización tributaria. El enfoque de investigación es cuantitativo, con diseño no experimental y transversal, aplicando técnicas avanzadas de aprendizaje automático como Autoencoders y Isolation Forest. Se emplea un muestreo aleatorio estratificado, considerando un ingreso diario promedio de 25 millones de facturas, tomando una muestra significativa y manejable correspondiente a una semana específica (aproximadamente 175 millones de registros). Los resultados serán validados mediante validación cruzada y métricas estándar como precisión, recall y F1-Score.spa
dc.description.abstractThis study proposes a machine learning-based model to detect anomalies and fraud in electronic invoicing received by the DIAN, optimizing the effectiveness of tax audits. The research approach is quantitative, with a non-experimental and cross-sectional design, applying advanced machine learning techniques such as Autoencoders and Isolation Forest. Stratified random sampling is used, considering an average daily inflow of 25 million invoices, taking a meaningful and manageable sample corresponding to a specific week (approximately 175 million records). The results will be validated using cross-validation and standard metrics such as precision, recall, and F1-score.eng
dc.description.degreelevelEspecializaciónspa
dc.description.degreenameEspecialista en Machine Learningspa
dc.description.tableofcontentsN° Contenido Página 1 Resumen 4 2 Palabras clave 4 3 Planteamiento del Problema 5 3.1 Antecedentes del problema 6 3.2 Descripción del problema 7 3.3 Pregunta de investigación 8 4 Objetivos 9 4.1 Objetivo general 9 4.2 Objetivos específicos 10 5 Conveniencia de la investigación 11 6 Marco teórico e institucional 12 6.1 Antecedentes 13 6.2 Facturación electrónica y su implementación 14 6.3 Técnicas tradicionales en detección de fraude fiscal 15 6.4 Teorías sobre la detección de fraudes 16 6.5 Modelos de Machine Learning aplicados a la auditoría 17 6.6 Técnicas avanzadas de detección de fraude fiscal 18 6.7 Marco legal en Colombia 20 6.8 Análisis comparativo internacional 21 6.9 Aplicación de IA en fiscalización tributaria 22 7 Metodología 23 7.1 Enfoque, alcance y diseño de la investigación 25 7.2 Definición conceptual y operacional de las variables 27 7.3 Población y muestra 30 7.4 Técnicas, instrumentos y modelos utilizados 32 7.5 Proceso de análisis de datos 34 8 Resultados preliminares 36 8.1 Análisis estadístico preliminar 38 8.2 Interpretación de los resultados 39 9 Propuesta preliminar de validación 40 9.1 Análisis estadístico preliminar esperado 41 9.2 Propuesta para la validación futura del modelo 42 10 Conclusiones 42 11 Referencias 43
dc.formatpdf
dc.format.extent47 páginas
dc.format.mediumRecurso electrónicospa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad Eanspa
dc.identifier.reponamereponame:Repositorio Institucional Biblioteca Digital Minervaspa
dc.identifier.repourlrepourl:https://repository.ean.edu.co/
dc.identifier.urihttps://hdl.handle.net/10882/14943
dc.language.isospa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.programEspecialización en Machine Learningspa
dc.relation.references1. Departamento Nacional de Planeación de Colombia (DNP). (2013). Estrategia para la masificación de la factura electrónica en Colombia (Documento CONPES 3786). Departamento Nacional de Planeación. https://colaboracion.dnp.gov.co/CDT/Conpes/Económicos/3786.pdf 2. Ley 223 de 1995. Congreso de Colombia. Normativa sobre racionalización tributaria. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_0223_1995.html 3. Ley 962 de 2005. Congreso de Colombia. Sobre racionalización de trámites administrativos. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_0962_2005.html 4. Decreto 1929 de 2007. Ministerio de Hacienda y Crédito Público. Sobre facturación electrónica. Recuperado de: https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=26968 5. Ley 1231 de 2008. Congreso de Colombia. Unificación de la factura como título valor. Recuperado de: http://www.secretariasenado.gov.co/senado/basedoc/ley_1231_2008.html 6. Resolución DIAN 000042 de 2020. Régimen de Facturación Electrónica. DIAN. Recuperado de: https://www.dian.gov.co/normatividad/Paginas/Inicio.aspx 7. OECD. (2024). Designing a National Strategy against Tax Crime. OECD Publishing. Recuperado de: https://doi.org/10.1787/0e451c90-en (Indexado en Scopus y WOS) 8. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2021). Fighting tax crime: The ten global principles (Second Edition). OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2021/06/fighting-tax-crime-the-ten-global-principles-second-edition_1f0b22cf/006a6512-en.pdf 9. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2024). Designing a national strategy against tax crime. OECD Publishing. https://www.oecd.org/content/dam/oecd/en/publications/reports/2024/05/designing-a-national-strategy-against-tax-crime_4741d536/0e451c90-en.pdf 10. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications, with special reference to the tax inspection procedure. World Tax Journal, 13(4), 575–608. 11. Organización para la Cooperación y el Desarrollo Económico (OCDE). (2023). Tax fraud and evasion: Global trends and responses. OECD Publishing. 12. Rodríguez, L., & García, M. (2022). Artificial Intelligence for Financial Fraud Detection: A Systematic Review. Journal of AI Research, 45(2), 23-37. 13. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications. World Tax Journal, 13(4), 575–608. (Indexado en Scopus y WOS) 14. OECD. (2021). Fighting Tax Crime: The Ten Global Principles (Second Edition). OECD Publishing. Recuperado de: https://doi.org/10.1787/006a6512-en (Indexado en Scopus y WOS) 15. Serrano Antón, F. (2023). Artificial intelligence and tax administration: Strategy, applications and implications. World Tax Journal, 13(4), 575–608. (Indexado en Scopus y WOS) 16. OECD. (2021). Fighting Tax Crime: The Ten Global Principles (Second Edition). OECD Publishing. Recuperado de: https://doi.org/10.1787/006a6512-en 17. Hodge, F. D., Mendoza, K., & Sinha, R. K. (2021). Detecting Fraud in Organizations: An Examination of AI Approaches. Journal of Forensic Accounting Research, 6(1), 1-18. 18. Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly detection: A survey. ACM Computing Surveys (CSUR), 41(3), 15. (Indexado en Scopus) 19. Goldstein, M., & Uchida, S. (2016). A comparative evaluation of unsupervised anomaly detection algorithms for multivariate data. PLOS ONE, 11(4), e0152173. (Indexado en Scopus) 20. Guo, H., Liu, Y., Li, J., & Prasetyo, P. K. (2020). Financial fraud detection using deep learning approaches. Journal of Big Data, 7(1), 1-19. (Indexado en Scopus) 21. Nguyen, N., & Duong, T. (2021). Fraud detection using Isolation Forest and Autoencoder. Expert Systems with Applications, 176, 114858. 22. Aggarwal, C. C. (2015). Outlier Analysis. Springer International Publishing. 23. An, J., & Cho, S. (2015). Variational autoencoder based anomaly detection using reconstruction probability. Technical Report. Seoul National University. 24. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press. 25. Hawkins, D. M. (1980). Identification of Outliers. Springer, Dordrecht. 26. Mishra, A., & Sharma, S. (2019). Application of Machine Learning Techniques in Tax Compliance: A Review. Journal of Tax Administration, 5(2), 23-39. 27. Gao, Y., & Ye, Y. (2021). Machine Learning for Fiscal Audit: International Experience and Recommendations. Journal of Taxation and Public Finance, 8(3), 209-223. 28. Ramírez, J. A., & López, A. (2019). Aplicación de inteligencia artificial en la detección de fraude tributario en América Latina. Revista Internacional de Tecnología e Innovación, 6(2), 56-70. 29. McKinsey & Company. (2022). Artificial intelligence in tax administration: Global trends and best practices. Technical report. 30. Bergmann, A., & Martin, M. (2021). Comparative Analysis of AI Adoption in Fiscal Systems in OECD Countries. OECD Working Papers on Public Governance.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.subject.lembEvaluación de proyectosspa
dc.subject.lembAprendizaje automáticospa
dc.subject.lembCambio tecnológicospa
dc.subject.lembFacturas electrónicasspa
dc.subject.lembMejoramiento de procesosspa
dc.subject.proposalMachine Learning Detección de anomalías Facturación electrónica Fiscalización tributaria Fraude fiscalspa
dc.titleDetección de anomalías en la facturación electrónica de la DIAN usando Machine Learningspa
dc.titleAnomaly detection in DIAN electronic invoicing using machine learningeng
dc.typeTrabajo de grado - Especializaciónspa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.otherTrabajo de grado - Especialización
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication
person.affiliation.nameEspecialización en Machine Learning

Archivos

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descripción: