Publicación:
Sistema de consulta (Chatbot) basado en RAG para usuarios cajas de compensación

dc.contributor.advisorPorras Vega, John Jairo
dc.contributor.authorMojica Tabares, Lucero Alexandra
dc.contributor.authorPinzón Nova, María Elizabeth
dc.contributor.authorBustamante Serrato, Cindy
dc.creator.id1016114194
dc.creator.id1099662790
dc.creator.id53116495
dc.date.accessioned2025-08-20T23:52:43Z
dc.date.issued2025-07-21
dc.description.abstractEste documento presenta una propuesta de automatización de procesos cuyo propósito será implementar un agente virtual (chatbot) basado en tecnología de Generación Aumentada por Recuperación (RAG por sus siglas en inglés), cuyo diseño permitirá consultar información en bases de datos sobre normativa específica de las cajas de compensación y generar respuestas precisas y adecuadas para el afiliado. El sistema integrará un motor de búsqueda apoyado con Inteligencia Artificial (IA) que permitirá extraer fragmentos relevantes de los documentos encontrados para la consulta del usuario. El Procesamiento del Lenguaje Natural (NLP por sus siglas en inglés) facilitará la estructuración y enriquecimiento del contexto de la respuesta con la información recuperada para hacerla más coherente, detallada y accesible para el usuario. Este agente será útil para la comunidad y brindará educación sobre los beneficios a los que tienen derecho los usuarios de las cajas de compensación y atención al cliente de una manera más oportuna y clara, garantizando que la información entregada en la respuesta para que no sea interpretada como genérica o errada y se proporcione información actualizada mejorando la experiencia del usuario al dar accesibilidad a los servicios.spa
dc.description.abstractThis document presents a process automation proposal aimed at implementing a virtual agent (chatbot) based on Retrieval Augmented Generation (RAG) technology. Its design will allow users to query information in databases on specific regulations of compensation funds and generate accurate and appropriate responses for the member. The system will integrate an Artificial Intelligence (AI)-powered search engine that will extract relevant fragments from the documents found for the user's query. Natural Language Processing (NLP) will facilitate the structuring and enrichment of the response context with the retrieved information, making it more coherent, detailed, and accessible to the user. This agent will be useful to the community and will provide education on the benefits to which compensation fund users are entitled, as well as customer service in a more timely and clear manner. It will ensure that the information delivered in the response is not interpreted as generic or erroneous, and that updated information is provided, improving the user experience by making services more accessible.eng
dc.description.degreelevelTrabajo de gradospa
dc.description.degreenameIngeniero de Sistemasspa
dc.description.tableofcontentsAbstract..................................................................................................................................6 Tecnología RAG al Servicio del Afiliado ............................................................................6 RAG Technology at your service ........................................................................................7 Introducción ...........................................................................................................................8 Objetivos..............................................................................................................................10 Objetivo General...............................................................................................................10 Objetivos Específicos........................................................................................................10 Definición del problema .......................................................................................................11 Justificación .........................................................................................................................13 Análisis de Requerimientos ..................................................................................................14 Marco de referencia..............................................................................................................16 Análisis de Restricciones......................................................................................................20 Metodología para la selección y desarrollo de la solución .....................................................22 Fases Metodológicas.........................................................................................................22 Definición del Problema y Restricciones........................................................................22 Generación y Selección Preliminar de Alternativas........................................................22 Verificación de Coherencia Lógica ............................................................................22 Identificación de Alternativas Viables........................................................................22 Alternativa 1...........................................................................................................22 Alternativa 2...........................................................................................................22 Alternativa 3...........................................................................................................23 Calidad de la Información ..........................................................................................23 Evaluación Detallada de Alternativas.............................................................................23 Coherencia Normativa ...............................................................................................23 Cumplimiento Ético y Legal ......................................................................................23 Experiencia de Usuario (UX) y Automatización Administrativa .................................23 Costos y Recursos Necesarios....................................................................................23 Escalabilidad y Mantenibilidad ..................................................................................23 Análisis Comparativo y Selección de la Solución Recomendada ................................... 23 Definición de Indicadores de Éxito............................................................................ 24 Rentabilidad .......................................................................................................... 24 Impacto Social....................................................................................................... 24 Impacto Medioambiental ....................................................................................... 24 Aplicación de la Metodología: Análisis de Alternativas ................................................ 24 Alternativa 1: Solución Cloud Integrada (Proveedor único - Azure/AWS)................. 24 Descripción........................................................................................................... 24 Evaluación Resumida ............................................................................................ 24 Coherencia Normativa ....................................................................................... 24 Cumplimiento Ético-Legal................................................................................. 24 UX y Automatización ........................................................................................ 24 Alternativa 2: Solución Open-Source Autogestionada (Cloud híbrida o On-Premise).24 Descripción........................................................................................................... 24 Evaluación Resumida ............................................................................................ 25 Coherencia Normativa ....................................................................................... 25 Cumplimiento Ético-Legal................................................................................. 25 UX y Automatización ........................................................................................ 25 Alternativa 3: Plataforma Híbrida con IA Especializada (Ej: IBM Watsonx, Google Dialogflow CX) ........................................................................................................ 25 Coherencia Normativa ....................................................................................... 25 Cumplimiento Ético-Legal................................................................................. 25 UX y Automatización ........................................................................................ 25 Comparativa de las alternativas..................................................................................... 25 Criterios de descarte de enfoques inviables................................................................... 28 Indicadores propuestos de rentabilidad, impacto social y medioambiental..................... 28 Rentabilidad (ROI y eficiencia)................................................................................. 28 Impacto social........................................................................................................... 29 Impacto medioambiental........................................................................................... 29 Indicador principal del proyecto................................................................................ 29 Arquitectura general de un sistema RAG................................................................... 29 Plan de Implementación y Evaluación .......................................................................... 29 Fase 1: Evaluación Funcional Inicial del Chatbot .......................................................30 Pruebas de Funcionalidad con Casos de Uso Reales ...............................................30 Documentación de Hallazgos y Definición de Mejoras...........................................30 Fase 2: Estrategia de Desarrollo Iterativo y Centrado en el Usuario ............................30 Iteraciones Ágiles de Mejora ..................................................................................30 Enfoque Adaptable y Retroalimentación Continua..................................................30 Fase 3: Adecuación y Carga del Corpus Normativo Específico...................................31 Recopilación y Estructuración del Corpus ..............................................................31 Ingesta en el Sistema y Validación de Indexación...................................................31 Fase 4: Despliegue y Configuración Inicial de la Solución Base................................ 31 Establecimiento del Entorno y Despliegue..............................................................31 Verificación del Funcionamiento Esencial..............................................................31 Fase 5: Esquema de Validación y Pruebas Detallado ..................................................31 Pruebas de Recuperación Normativa (Unitarias).....................................................31 Pruebas Funcionales de Generación (End-to-End)...................................................32 Pruebas de Rendimiento y Estrés............................................................................32 Pruebas de Usabilidad (UX) ...................................................................................32 Pruebas de Casos Límite y Éticos...........................................................................32 Presupuesto de Costos – Proyecto RAG para Cajas de Compensación Familiar.....................32 Fase de Prototipo...............................................................................................................32 Costos Directos.................................................................................................................33 Recursos Humanos........................................................................................................33 Servicios Azure (Costo estimado por 5 meses)...............................................................33 Costos Indirectos...........................................................................................................33 Resumen Fase de Prototipo............................................................................................33 Fase de Ambiente Productivo............................................................................................34 Costos Directos.............................................................................................................34 Servicios Azure .............................................................................................................34 Resumen Fase Productiva (mensual)..............................................................................34 Consideraciones Finales ................................................................................................34 Documentación de la ejecución de la metodología ................................................................35 Fase 1: Establecimiento de Iteraciones Ágiles de Mejora (Ejecución Inicial)..................... 35 Construcción del Backlog Inicial .................................................................................. 35 Definición de Ciclos de Actualización .......................................................................... 35 Fase 2: Adopción de un Enfoque Adaptable y Centrado en el Usuario (Ejecución Inicial) 35 Ejecución de Pruebas Iniciales (Pre-producción)........................................................... 35 Pruebas de Recuperación Normativa ......................................................................... 35 Pruebas Funcionales de Generación .......................................................................... 36 Fase 3: Carga y Estructuración del Corpus Normativo Específico..................................... 36 Construcción del Corpus............................................................................................... 36 Carga al Sistema y Validación de Resultados de Indexación ......................................... 36 Fase 4: Despliegue y Configuración Inicial de la Solución.................................................36 Establecimiento del Entorno y Despliegue .....................................................................36 Verificación del Funcionamiento Esencial.....................................................................36 Fase 5: Evaluación Funcional Inicial del Chatbot ............................................................. 37 Pruebas Básicas con Usuarios (Equipo de Proyecto) ..................................................... 37 Revisión y Documentación de Resultados......................................................................37 Conclusiones....................................................................................................................... 38 Aspectos Novedosos........................................................................................................ 38 Grado de Cumplimiento de los Objetivos......................................................................... 38 Metodología para la selección y desarrollo de la solución................................................. 39 Limitaciones del Proyecto ................................................................................................ 39 Proyecciones y Posibilidades Futuras............................................................................... 39 Referencias.......................................................................................................................... 40
dc.formatpdf
dc.format.extent42 páginas
dc.format.mediumRecurso electrónicospa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad Eanspa
dc.identifier.localBDM-FIS
dc.identifier.reponamereponame:Repositorio Institucional Biblioteca Digital Minervaspa
dc.identifier.repourlhttps://repository.ean.edu.co/
dc.identifier.urihttps://hdl.handle.net/10882/15089
dc.language.isospa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.programIngeniería de Sistemasspa
dc.relation.referencesAbdellatif, A., et al. (2022). Chatbot implementation challenges. Journal of Business Tech, 17(3), 45-67. Agrawal, A., Gans, J., & Goldfarb, A. (2018). Prediction machines: The simple economics of artificial intelligence. Harvard Business Press. Alavi, M., & Leidner, D. E. (2001). Knowledge management and knowledge management systems: Conceptual foundations and research issues. MIS Quarterly, 25(1), 107-136. https://doi.org/10.2307/3250961 Allen, J. F., Byron, D. K., Dzikovska, M., Ferguson, G., Galescu, L., & Stent, A. (2001). Toward conversational human-computer interaction. AI Magazine, 22(4), 27- 27. https://doi.org/10.1609/aimag.v22i4.1590 Birch, K. (2023, diciembre 19). How AWS makes data centres more efficient and sustainable. Bizclik Media Ltd. https://sustainabilitymag.com/net-zero/how-aws-makes-datacentres-more-efficient-and-sustainable Borgefalk, P., et al. (2023). Legal information retrieval using RAG architecture. Journal of Artificial Intelligence Research, 45(2), 123-145. Brynjolfsson, E., & McAfee, A. (2017). Machine, platform, crowd: Harnessing our digital future. W. W. Norton & Company. Chatbots para el gobierno - IBM watsonx Assistant. (s/f-a). Ibm.com. Recuperado el 27 de marzo de 2025, de https://www.ibm.com/es-es/products/watsonx-assistant/government Decreto 1377 de 2013. (2013). Por el cual se reglamenta parcialmente la Ley 1581 de 2012 sobre protección de datos personales. Presidencia de la República de Colombia. https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=53646 De documentos en las entidades públicas, I. de T. de R. S. L. P. la E. y. G. (s/f). Ingeniería Informática. Uva.es. Recuperado el 27 de marzo de 2025, de https://uvadoc.uva.es/bitstream/handle/10324/71509/TFMG1993.pdf;jsessionid=EFC94EDB66554A6732EBE569F4DBC2A2?sequence=1#:~:text=% EF%82%B7%20Fine,completamente%20malinterpretadas%20en%20su%20aplicaci%C3%B 3n 41 Floridi, L., et al. (2021). Ethical guidelines for trustworthy AI. AI Ethics Journal, 3(1), 56-78 Følstad, A., & Brandtzæg, P. B. (2017). Chatbots and the new world of HCI. Interactions, 24(4), 38-42. https://doi.org/10.1145/3085558 HeidiSteen. (s/f). RAG and generative AI - Azure AI Search. Microsoft.com. Recuperado el 27 de marzo de 2025, de https://learn.microsoft.com/enus/azure/search/retrieval-augmented-generation-overview Hislop, D. (2013). Knowledge management in organizations. Oxford University Press. ISO/IEC 27001. (2022). Information security, cybersecurity and privacy protection - Information security management systems - Requirements. International Organization for Standardization. Lewis, P., Oguz, B., Rinott, R., Riedel, S., & Stoyanov, V. (2020). Retrievalaugmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems, 33, 9450-9462. Llugsa, D. A. M., & Vaca, J. E. J. (2022). Chatbot una herramienta de atención al cliente en tiempos de COVID-19: Un acercamiento teórico. Uniandes Episteme, 9(3), 327- 350. Mercado laboral de Bogotá solo emplea formalmente al 40% de personas en edad de trabajar - Probogotá. (2023, mayo 3). Probogotá. https://www.probogota.org/comunicacion_c/mercado-laboral-de-bogota-soloemplea-formalmente-al-40-de-personas-en-edad-de-trabajar/ Merritt, R. (2025, enero 31). What Is Retrieval-Augmented Generation aka RAG. NVIDIA Blog. https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/ Nonaka, I., & Takeuchi, H. (1995). The knowledge-creating company: How Japanese companies create the dynamics of innovation. Oxford University Press. Piattini, M., & Velthuis, F. (2020). Challenges in managing regulatory compliance in organizations. Information Systems Journal, 30(2), 189-210. Pinzón, M. E., Mojica, L. A., & Jiménez, J. E. (2024). Seminario de investigación: Chatbot para la automatización de consultas normativas. Universidad EAN. (S/f-a). Aoc.cat. Recuperado el 27 de marzo de 2025, de https://www.aoc.cat/es/blog/2024/xatbot-aociagenerativa/#:~:text=La%20AOC%20est%C3%A1%20comprometida%20al,los%20derecho s%20de%20los%20usuarios 42 Servicio al Cliente, IA y Negocios. (s/f). Aivo.co. Recuperado el 27 de marzo de 2025, de https://es.aivo.co/blog Sharda, R., Delen, D., & Turban, E. (2021). Analytics, data science, & artificial intelligence: Systems for decision support (11th ed.). Pearson. Sirovy, L. (2023, junio 12). 10 métricas clave para evaluar el rendimiento de tu chatbot. Inbenta. https://www.inbenta.com/es/articles/10-key-metrics-to-evaluate-your-aichatbot-performance/ What is retrieval-augmented generation (RAG)? A practical guide. (s/f). K2view.com. Recuperado el 27 de marzo de 2025, de https://www.k2view.com/what-is-retrievalaugmented-generation Yang, J., Chen, Y.-L., Por, L. Y., & Ku, C. S. (2023). A systematic literature review of information security in chatbots. Applied Sciences, 13(11), 6355. https://doi.org/10.3390/app13116355
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.armarcAutomatizaciónspa
dc.subject.armarcInteligencia artificialspa
dc.subject.armarcProcesamiento de datos en líneaspa
dc.subject.armarcChatbotsspa
dc.subject.armarcSistemas de preguntas y respuestasspa
dc.subject.armarcSistemas informáticos interactivosspa
dc.subject.lembMejoramiento de procesosspa
dc.subject.proposalGeneración aumentada por recuperación (RAG)spa
dc.subject.proposalCajas de compensaciónspa
dc.subject.proposalInteligencia artificial (IA)spa
dc.subject.proposalAgente virtual (chatbot)spa
dc.subject.proposalProcesamiento del lenguaje natural (NLP)spa
dc.subject.proposalAutomatización de procesosspa
dc.subject.proposalAtención al clientespa
dc.subject.proposalExperiencia del usuariospa
dc.subject.proposalRecovery enhanced generation (RAG)spa
dc.subject.proposalCompensation fundseng
dc.subject.proposalArtificial intelligenceeng
dc.subject.proposalVirtual agent (chatbot)eng
dc.subject.proposalArquitectureeng
dc.titleSistema de consulta (Chatbot) basado en RAG para usuarios cajas de compensaciónspa
dc.titleRAG-based chatbot for compensation fund userseng
dc.typeTrabajo de grado - Pregradospa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.otherTrabajo de grado - Pregrado
dc.type.redcolhttp://purl.org/redcol/resource_type/TP
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication
person.affiliation.nameIngeniería de Sistemas - Virtual
person.affiliation.nameIngeniería de Sistemas - Virtual
person.affiliation.nameIngeniería Industrial - Virtual

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
MojicaLucero2025.pdf
Tamaño:
766.41 KB
Formato:
Adobe Portable Document Format
Descripción:
Trabajo de Grado
Cargando...
Miniatura
Nombre:
MojicaLucero_2025_Anexo.pdf
Tamaño:
203.32 KB
Formato:
Adobe Portable Document Format
Descripción:
Autorización Publicación

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descripción: