Publicación: Sistema de consulta (Chatbot) basado en RAG para usuarios cajas de compensación
| dc.contributor.advisor | Porras Vega, John Jairo | |
| dc.contributor.author | Mojica Tabares, Lucero Alexandra | |
| dc.contributor.author | Pinzón Nova, María Elizabeth | |
| dc.contributor.author | Bustamante Serrato, Cindy | |
| dc.creator.id | 1016114194 | |
| dc.creator.id | 1099662790 | |
| dc.creator.id | 53116495 | |
| dc.date.accessioned | 2025-08-20T23:52:43Z | |
| dc.date.issued | 2025-07-21 | |
| dc.description.abstract | Este documento presenta una propuesta de automatización de procesos cuyo propósito será implementar un agente virtual (chatbot) basado en tecnología de Generación Aumentada por Recuperación (RAG por sus siglas en inglés), cuyo diseño permitirá consultar información en bases de datos sobre normativa específica de las cajas de compensación y generar respuestas precisas y adecuadas para el afiliado. El sistema integrará un motor de búsqueda apoyado con Inteligencia Artificial (IA) que permitirá extraer fragmentos relevantes de los documentos encontrados para la consulta del usuario. El Procesamiento del Lenguaje Natural (NLP por sus siglas en inglés) facilitará la estructuración y enriquecimiento del contexto de la respuesta con la información recuperada para hacerla más coherente, detallada y accesible para el usuario. Este agente será útil para la comunidad y brindará educación sobre los beneficios a los que tienen derecho los usuarios de las cajas de compensación y atención al cliente de una manera más oportuna y clara, garantizando que la información entregada en la respuesta para que no sea interpretada como genérica o errada y se proporcione información actualizada mejorando la experiencia del usuario al dar accesibilidad a los servicios. | spa |
| dc.description.abstract | This document presents a process automation proposal aimed at implementing a virtual agent (chatbot) based on Retrieval Augmented Generation (RAG) technology. Its design will allow users to query information in databases on specific regulations of compensation funds and generate accurate and appropriate responses for the member. The system will integrate an Artificial Intelligence (AI)-powered search engine that will extract relevant fragments from the documents found for the user's query. Natural Language Processing (NLP) will facilitate the structuring and enrichment of the response context with the retrieved information, making it more coherent, detailed, and accessible to the user. This agent will be useful to the community and will provide education on the benefits to which compensation fund users are entitled, as well as customer service in a more timely and clear manner. It will ensure that the information delivered in the response is not interpreted as generic or erroneous, and that updated information is provided, improving the user experience by making services more accessible. | eng |
| dc.description.degreelevel | Trabajo de grado | spa |
| dc.description.degreename | Ingeniero de Sistemas | spa |
| dc.description.tableofcontents | Abstract..................................................................................................................................6 Tecnología RAG al Servicio del Afiliado ............................................................................6 RAG Technology at your service ........................................................................................7 Introducción ...........................................................................................................................8 Objetivos..............................................................................................................................10 Objetivo General...............................................................................................................10 Objetivos Específicos........................................................................................................10 Definición del problema .......................................................................................................11 Justificación .........................................................................................................................13 Análisis de Requerimientos ..................................................................................................14 Marco de referencia..............................................................................................................16 Análisis de Restricciones......................................................................................................20 Metodología para la selección y desarrollo de la solución .....................................................22 Fases Metodológicas.........................................................................................................22 Definición del Problema y Restricciones........................................................................22 Generación y Selección Preliminar de Alternativas........................................................22 Verificación de Coherencia Lógica ............................................................................22 Identificación de Alternativas Viables........................................................................22 Alternativa 1...........................................................................................................22 Alternativa 2...........................................................................................................22 Alternativa 3...........................................................................................................23 Calidad de la Información ..........................................................................................23 Evaluación Detallada de Alternativas.............................................................................23 Coherencia Normativa ...............................................................................................23 Cumplimiento Ético y Legal ......................................................................................23 Experiencia de Usuario (UX) y Automatización Administrativa .................................23 Costos y Recursos Necesarios....................................................................................23 Escalabilidad y Mantenibilidad ..................................................................................23 Análisis Comparativo y Selección de la Solución Recomendada ................................... 23 Definición de Indicadores de Éxito............................................................................ 24 Rentabilidad .......................................................................................................... 24 Impacto Social....................................................................................................... 24 Impacto Medioambiental ....................................................................................... 24 Aplicación de la Metodología: Análisis de Alternativas ................................................ 24 Alternativa 1: Solución Cloud Integrada (Proveedor único - Azure/AWS)................. 24 Descripción........................................................................................................... 24 Evaluación Resumida ............................................................................................ 24 Coherencia Normativa ....................................................................................... 24 Cumplimiento Ético-Legal................................................................................. 24 UX y Automatización ........................................................................................ 24 Alternativa 2: Solución Open-Source Autogestionada (Cloud híbrida o On-Premise).24 Descripción........................................................................................................... 24 Evaluación Resumida ............................................................................................ 25 Coherencia Normativa ....................................................................................... 25 Cumplimiento Ético-Legal................................................................................. 25 UX y Automatización ........................................................................................ 25 Alternativa 3: Plataforma Híbrida con IA Especializada (Ej: IBM Watsonx, Google Dialogflow CX) ........................................................................................................ 25 Coherencia Normativa ....................................................................................... 25 Cumplimiento Ético-Legal................................................................................. 25 UX y Automatización ........................................................................................ 25 Comparativa de las alternativas..................................................................................... 25 Criterios de descarte de enfoques inviables................................................................... 28 Indicadores propuestos de rentabilidad, impacto social y medioambiental..................... 28 Rentabilidad (ROI y eficiencia)................................................................................. 28 Impacto social........................................................................................................... 29 Impacto medioambiental........................................................................................... 29 Indicador principal del proyecto................................................................................ 29 Arquitectura general de un sistema RAG................................................................... 29 Plan de Implementación y Evaluación .......................................................................... 29 Fase 1: Evaluación Funcional Inicial del Chatbot .......................................................30 Pruebas de Funcionalidad con Casos de Uso Reales ...............................................30 Documentación de Hallazgos y Definición de Mejoras...........................................30 Fase 2: Estrategia de Desarrollo Iterativo y Centrado en el Usuario ............................30 Iteraciones Ágiles de Mejora ..................................................................................30 Enfoque Adaptable y Retroalimentación Continua..................................................30 Fase 3: Adecuación y Carga del Corpus Normativo Específico...................................31 Recopilación y Estructuración del Corpus ..............................................................31 Ingesta en el Sistema y Validación de Indexación...................................................31 Fase 4: Despliegue y Configuración Inicial de la Solución Base................................ 31 Establecimiento del Entorno y Despliegue..............................................................31 Verificación del Funcionamiento Esencial..............................................................31 Fase 5: Esquema de Validación y Pruebas Detallado ..................................................31 Pruebas de Recuperación Normativa (Unitarias).....................................................31 Pruebas Funcionales de Generación (End-to-End)...................................................32 Pruebas de Rendimiento y Estrés............................................................................32 Pruebas de Usabilidad (UX) ...................................................................................32 Pruebas de Casos Límite y Éticos...........................................................................32 Presupuesto de Costos – Proyecto RAG para Cajas de Compensación Familiar.....................32 Fase de Prototipo...............................................................................................................32 Costos Directos.................................................................................................................33 Recursos Humanos........................................................................................................33 Servicios Azure (Costo estimado por 5 meses)...............................................................33 Costos Indirectos...........................................................................................................33 Resumen Fase de Prototipo............................................................................................33 Fase de Ambiente Productivo............................................................................................34 Costos Directos.............................................................................................................34 Servicios Azure .............................................................................................................34 Resumen Fase Productiva (mensual)..............................................................................34 Consideraciones Finales ................................................................................................34 Documentación de la ejecución de la metodología ................................................................35 Fase 1: Establecimiento de Iteraciones Ágiles de Mejora (Ejecución Inicial)..................... 35 Construcción del Backlog Inicial .................................................................................. 35 Definición de Ciclos de Actualización .......................................................................... 35 Fase 2: Adopción de un Enfoque Adaptable y Centrado en el Usuario (Ejecución Inicial) 35 Ejecución de Pruebas Iniciales (Pre-producción)........................................................... 35 Pruebas de Recuperación Normativa ......................................................................... 35 Pruebas Funcionales de Generación .......................................................................... 36 Fase 3: Carga y Estructuración del Corpus Normativo Específico..................................... 36 Construcción del Corpus............................................................................................... 36 Carga al Sistema y Validación de Resultados de Indexación ......................................... 36 Fase 4: Despliegue y Configuración Inicial de la Solución.................................................36 Establecimiento del Entorno y Despliegue .....................................................................36 Verificación del Funcionamiento Esencial.....................................................................36 Fase 5: Evaluación Funcional Inicial del Chatbot ............................................................. 37 Pruebas Básicas con Usuarios (Equipo de Proyecto) ..................................................... 37 Revisión y Documentación de Resultados......................................................................37 Conclusiones....................................................................................................................... 38 Aspectos Novedosos........................................................................................................ 38 Grado de Cumplimiento de los Objetivos......................................................................... 38 Metodología para la selección y desarrollo de la solución................................................. 39 Limitaciones del Proyecto ................................................................................................ 39 Proyecciones y Posibilidades Futuras............................................................................... 39 Referencias.......................................................................................................................... 40 | |
| dc.format | ||
| dc.format.extent | 42 páginas | |
| dc.format.medium | Recurso electrónico | spa |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | instname:Universidad Ean | spa |
| dc.identifier.local | BDM-FIS | |
| dc.identifier.reponame | reponame:Repositorio Institucional Biblioteca Digital Minerva | spa |
| dc.identifier.repourl | https://repository.ean.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10882/15089 | |
| dc.language.iso | spa | |
| dc.publisher.faculty | Facultad de Ingeniería | spa |
| dc.publisher.program | Ingeniería de Sistemas | spa |
| dc.relation.references | Abdellatif, A., et al. (2022). Chatbot implementation challenges. Journal of Business Tech, 17(3), 45-67. Agrawal, A., Gans, J., & Goldfarb, A. (2018). Prediction machines: The simple economics of artificial intelligence. Harvard Business Press. Alavi, M., & Leidner, D. E. (2001). Knowledge management and knowledge management systems: Conceptual foundations and research issues. MIS Quarterly, 25(1), 107-136. https://doi.org/10.2307/3250961 Allen, J. F., Byron, D. K., Dzikovska, M., Ferguson, G., Galescu, L., & Stent, A. (2001). Toward conversational human-computer interaction. AI Magazine, 22(4), 27- 27. https://doi.org/10.1609/aimag.v22i4.1590 Birch, K. (2023, diciembre 19). How AWS makes data centres more efficient and sustainable. Bizclik Media Ltd. https://sustainabilitymag.com/net-zero/how-aws-makes-datacentres-more-efficient-and-sustainable Borgefalk, P., et al. (2023). Legal information retrieval using RAG architecture. Journal of Artificial Intelligence Research, 45(2), 123-145. Brynjolfsson, E., & McAfee, A. (2017). Machine, platform, crowd: Harnessing our digital future. W. W. Norton & Company. Chatbots para el gobierno - IBM watsonx Assistant. (s/f-a). Ibm.com. Recuperado el 27 de marzo de 2025, de https://www.ibm.com/es-es/products/watsonx-assistant/government Decreto 1377 de 2013. (2013). Por el cual se reglamenta parcialmente la Ley 1581 de 2012 sobre protección de datos personales. Presidencia de la República de Colombia. https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=53646 De documentos en las entidades públicas, I. de T. de R. S. L. P. la E. y. G. (s/f). Ingeniería Informática. Uva.es. Recuperado el 27 de marzo de 2025, de https://uvadoc.uva.es/bitstream/handle/10324/71509/TFMG1993.pdf;jsessionid=EFC94EDB66554A6732EBE569F4DBC2A2?sequence=1#:~:text=% EF%82%B7%20Fine,completamente%20malinterpretadas%20en%20su%20aplicaci%C3%B 3n 41 Floridi, L., et al. (2021). Ethical guidelines for trustworthy AI. AI Ethics Journal, 3(1), 56-78 Følstad, A., & Brandtzæg, P. B. (2017). Chatbots and the new world of HCI. Interactions, 24(4), 38-42. https://doi.org/10.1145/3085558 HeidiSteen. (s/f). RAG and generative AI - Azure AI Search. Microsoft.com. Recuperado el 27 de marzo de 2025, de https://learn.microsoft.com/enus/azure/search/retrieval-augmented-generation-overview Hislop, D. (2013). Knowledge management in organizations. Oxford University Press. ISO/IEC 27001. (2022). Information security, cybersecurity and privacy protection - Information security management systems - Requirements. International Organization for Standardization. Lewis, P., Oguz, B., Rinott, R., Riedel, S., & Stoyanov, V. (2020). Retrievalaugmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems, 33, 9450-9462. Llugsa, D. A. M., & Vaca, J. E. J. (2022). Chatbot una herramienta de atención al cliente en tiempos de COVID-19: Un acercamiento teórico. Uniandes Episteme, 9(3), 327- 350. Mercado laboral de Bogotá solo emplea formalmente al 40% de personas en edad de trabajar - Probogotá. (2023, mayo 3). Probogotá. https://www.probogota.org/comunicacion_c/mercado-laboral-de-bogota-soloemplea-formalmente-al-40-de-personas-en-edad-de-trabajar/ Merritt, R. (2025, enero 31). What Is Retrieval-Augmented Generation aka RAG. NVIDIA Blog. https://blogs.nvidia.com/blog/what-is-retrieval-augmented-generation/ Nonaka, I., & Takeuchi, H. (1995). The knowledge-creating company: How Japanese companies create the dynamics of innovation. Oxford University Press. Piattini, M., & Velthuis, F. (2020). Challenges in managing regulatory compliance in organizations. Information Systems Journal, 30(2), 189-210. Pinzón, M. E., Mojica, L. A., & Jiménez, J. E. (2024). Seminario de investigación: Chatbot para la automatización de consultas normativas. Universidad EAN. (S/f-a). Aoc.cat. Recuperado el 27 de marzo de 2025, de https://www.aoc.cat/es/blog/2024/xatbot-aociagenerativa/#:~:text=La%20AOC%20est%C3%A1%20comprometida%20al,los%20derecho s%20de%20los%20usuarios 42 Servicio al Cliente, IA y Negocios. (s/f). Aivo.co. Recuperado el 27 de marzo de 2025, de https://es.aivo.co/blog Sharda, R., Delen, D., & Turban, E. (2021). Analytics, data science, & artificial intelligence: Systems for decision support (11th ed.). Pearson. Sirovy, L. (2023, junio 12). 10 métricas clave para evaluar el rendimiento de tu chatbot. Inbenta. https://www.inbenta.com/es/articles/10-key-metrics-to-evaluate-your-aichatbot-performance/ What is retrieval-augmented generation (RAG)? A practical guide. (s/f). K2view.com. Recuperado el 27 de marzo de 2025, de https://www.k2view.com/what-is-retrievalaugmented-generation Yang, J., Chen, Y.-L., Por, L. Y., & Ku, C. S. (2023). A systematic literature review of information security in chatbots. Applied Sciences, 13(11), 6355. https://doi.org/10.3390/app13116355 | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.armarc | Automatización | spa |
| dc.subject.armarc | Inteligencia artificial | spa |
| dc.subject.armarc | Procesamiento de datos en línea | spa |
| dc.subject.armarc | Chatbots | spa |
| dc.subject.armarc | Sistemas de preguntas y respuestas | spa |
| dc.subject.armarc | Sistemas informáticos interactivos | spa |
| dc.subject.lemb | Mejoramiento de procesos | spa |
| dc.subject.proposal | Generación aumentada por recuperación (RAG) | spa |
| dc.subject.proposal | Cajas de compensación | spa |
| dc.subject.proposal | Inteligencia artificial (IA) | spa |
| dc.subject.proposal | Agente virtual (chatbot) | spa |
| dc.subject.proposal | Procesamiento del lenguaje natural (NLP) | spa |
| dc.subject.proposal | Automatización de procesos | spa |
| dc.subject.proposal | Atención al cliente | spa |
| dc.subject.proposal | Experiencia del usuario | spa |
| dc.subject.proposal | Recovery enhanced generation (RAG) | spa |
| dc.subject.proposal | Compensation funds | eng |
| dc.subject.proposal | Artificial intelligence | eng |
| dc.subject.proposal | Virtual agent (chatbot) | eng |
| dc.subject.proposal | Arquitecture | eng |
| dc.title | Sistema de consulta (Chatbot) basado en RAG para usuarios cajas de compensación | spa |
| dc.title | RAG-based chatbot for compensation fund users | eng |
| dc.type | Trabajo de grado - Pregrado | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.other | Trabajo de grado - Pregrado | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dspace.entity.type | Publication | |
| person.affiliation.name | Ingeniería de Sistemas - Virtual | |
| person.affiliation.name | Ingeniería de Sistemas - Virtual | |
| person.affiliation.name | Ingeniería Industrial - Virtual |
Archivos
Bloque original
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.92 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
