Publicación: Evaluación de la viabilidad de un modelo de machine learning para el análisis de sentimiento en la categoría calzado de descanso en Mercado Libre Colombia mediante Web Scraping
| dc.contributor.advisor | Bolívar Ramírez, Jorge Enrique | |
| dc.contributor.author | Arteaga Bermúdez, Carlos Mauricio | |
| dc.contributor.author | Olarte Delgado, María Alejandra | |
| dc.contributor.author | Perdomo Artunduaga, Joaquín Eduardo | |
| dc.contributor.author | Quitian Zaza, Lina Rocío | |
| dc.creator.id | 1019043066 | |
| dc.creator.id | 53000586 | |
| dc.creator.id | 1075210124 | |
| dc.creator.id | 53102162 | |
| dc.date.accessioned | 2025-08-23T02:02:10Z | |
| dc.date.issued | 2025-07-24 | |
| dc.description.abstract | Este estudio explora el potencial de la inteligencia artificial para comprender las percepciones de los compradores sobre productos adquiridos en línea, con un enfoque específico en la categoría de calzado de descanso (pantuflas, chanclas, sandalias) en Mercado Libre Colombia. Hoy en día, los compradores no solo adquieren productos en línea, también dejan comentarios y reseñas que reflejan su experiencia. Esta enorme cantidad de opiniones se ha convertido en una fuente valiosa de información para las marcas. Sin embargo, procesarla manualmente es un desafío y donde herramientas como el Web Scraping, el Machine Learning (ML) y el Procesamiento de Lenguaje Natural (NLP) se vuelven importantes, ya que permiten recopilar y analizar automáticamente lo que los clientes sienten y opinan sobre los productos. Se recolectaron más de 2.700 productos y cerca de 4.700 comentarios reales de clientes. Después de filtrar y organizar esos datos, se aplicaron varios modelos de inteligencia artificial para identificar si los comentarios eran positivos o negativos. Los modelos más destacados fueron CNN Ensemble y LSTM ensamble, ofreciendo un balance entre precisión y capacidad para detectar opiniones negativas sin caer en errores frecuentes. Los hallazgos mostraron que la mayoría de los comentarios son positivos, pero que los comentarios negativos tienden a ser más detallados. Así mismo, se identificó que las calificaciones de 3 estrellas, las cuales se tomarían como neutrales, en realidad suelen reflejar insatisfacción. También se observó que los productos más vendidos tienden a ser los menos costos. El estudio confirma que es viable aplicar modelos de ML para entender cómo se sienten los clientes y analizar la dinámica de mercado. Esta información puede convertirse en una herramienta poderosa para mejorar la experiencia de compra, fortalecer la reputación de marca y tomar decisiones comerciales más acertadas. | spa |
| dc.description.abstract | This study explores the potential of artificial intelligence to understand customer perceptions of products purchased online, with a specific focus on the comfort footwear category (slippers, flip-flops, sandals) on Mercado Libre Colombia. Today, buyers not only purchase products online but also leave comments and reviews that reflect their experience. This vast amount of feedback has become a valuable source of information for brands. However, processing it manually is challenging—this is where tools such as Web Scraping, Machine Learning (ML), and Natural Language Processing (NLP) become essential, as they enable the automated collection and analysis of customer sentiments and opinions about products. Over 2,700 products and around 4,700 real customer comments were collected. After filtering and organizing the data, several artificial intelligence models were applied to identify whether the comments were positive or negative. The most effective models were the CNN ensemble and LSTM ensemble, which offered a balance between accuracy and the ability to detect negative opinions without frequent misclassification. The findings revealed that most comments are positive, but negative ones tend to be more detailed. Additionally, 3-star ratings, which are typically considered neutral, were often found to express dissatisfaction. It was also observed that the best-selling products tend to be the least expensive. The study confirms that it is feasible to apply ML models to understand customer sentiment and analyze market dynamics. This information can become a powerful tool to improve the shopping experience, strengthen brand reputation, and support better business decisions. | eng |
| dc.description.degreelevel | Especialización | spa |
| dc.description.degreename | Especialista en Machine Learning | spa |
| dc.description.tableofcontents | Resumen 5 Planteamiento del Problema 5 Objetivos 8 General 8 Específicos 8 Justificación 9 Marco Teórico 10 Comercio electrónico y marketplaces 10 Importancia de la percepción del consumidor en marketplaces 11 Análisis de sentimiento en comercio electrónico 13 Aplicación de Machine Learning y Procesamiento del Lenguaje Natural (NLP) 14 Marco institucional 18 Enfoque, alcance y diseño de la investigación 20 Definición de variables 21 Población y Muestra 23 Metodología de la investigación 24 Selección de métodos para recolección de información 28 Técnicas de análisis de datos 29 Análisis y discusión de los resultados 30 Resultados descriptivos 30 Resultados del modelo 40 Conclusiones 48 Referencias 53 | spa |
| dc.format | ||
| dc.format.extent | 55 páginas | |
| dc.format.medium | Recurso electrónico | spa |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | instname:Universidad Ean | spa |
| dc.identifier.local | Especialización en Machine Learning | |
| dc.identifier.reponame | reponame:Repositorio Institucional Biblioteca Digital Minerva | spa |
| dc.identifier.repourl | repourl:https://repository.ean.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10882/15099 | |
| dc.language.iso | spa | |
| dc.publisher.faculty | Facultad de Ingeniería | spa |
| dc.publisher.program | Especialización en Machine Learning | spa |
| dc.relation.references | Asociación Española de la Economía Digital. (2012). Libro blanco del comercio electrónico. Madrid: Secretaría de Estado de Telecomunicaciones de España. | |
| dc.relation.references | Cortés Díaz, N. S. (2021). Uso del análisis de sentimientos para medir el posicionamiento de una marca a través de la información extraída de la plataforma twitter [Anteproyecto enviado en cumplimiento del requisito parcial para optar por el grado de Ingeniería Electrónica, Universidad Santo Tomás]. https://repository.usta.edu.co/items/bbc66e54-0596-443b-bd92-0f1591c710a2 | |
| dc.relation.references | Cumming, D., Johan, S., Khan, Z., & Meyer, M. (2023). E-Commerce Policy and International Business. Management International Review, 63, 3–25. https://link.springer.com/article/10.1007/s11575-022-00489-8 | |
| dc.relation.references | Daza, A., Rueda, N. D. G., Sánchez, M. S. A., Espíritu, W. F. R., & Quiñones, M. E. C. (2024). Sentiment Analysis on E-Commerce Product Reviews Using Machine Learning and Deep Learning Algorithms: A Bibliometric Analysisand Systematic Literature Review, Challenges and Future Works. International Journal of Information Management Data Insights, 4(2), 100267. https://doi.org/10.1016/j.jjimei.2024.100267 | |
| dc.relation.references | Elastic. (s.f.). ¿Qué es el análisis de sentimiento? Elastic. https://www.elastic.co/es/what-is/sentiment-analysis | |
| dc.relation.references | Espitaleta, J. A., Maza, J. G., & García, K. P. (2022). Análisis de sentimientos de reseñas para determinar la acogida de un producto utilizando técnicas de machine learning y data mining. [Articulo, Universidad del Norte]. https://manglar.uninorte.edu.co/handle/10584/11237?show=full | |
| dc.relation.references | Geetha, M. P., & Renuka, D. K. (2021). Improving the performance of aspect based sentiment analysis using fine-tuned Bert Base Uncased model. International Journal of Intelligent Networks, 2, 64-69. https://doi.org/10.1016/j.ijin.2021.06.005 | |
| dc.relation.references | Harunasir, M. F., Palanichamy, N., Haw, S. C., & Ng, K. W. (2023). Sentiment analysis of amazon product reviews by supervised machine learning models. Journal of Advances in Information Technology, 14(4), 857-862. doi: 10.12720/jait.14.4.857-862 | |
| dc.relation.references | Hernández Sampieri, R., Mendoza Torres, C. P., & Fernández Collado, C. (2021). Metodología de la investigación (6.ª ed.). McGraw-Hill Education. | |
| dc.relation.references | Jain, S. M. (2022). Introduction to Transformers for NLP (1st ed.). Apress Berkeley, CA. https://doi.org/10.1007/978-1-4842-8844-3 | |
| dc.relation.references | Kamath, U., Liu, J., & Whitaker, J. (2019). Deep Learning for NLP and Speech Recognition (1st ed.). Springer Cham. https://doi.org/10.1007/978-3-030-14596-5 | |
| dc.relation.references | Kaur, P. (2022). Sentiment analysis using web scraping for live news data with machine learning algorithms. Materials today: proceedings, 65, 3333-3341. https://doi.org/10.1016/j.matpr.2022.05.409 | |
| dc.relation.references | Mercado Libre. (2024, octubre). Mercado Libre consolida su liderazgo en Retail Media en Argentina y la región. https://news.mercadolibre.com/retail-media-ads-2024 | |
| dc.relation.references | Peña Garcia, N., Lozada Otalora, M., Pérez Auza, D., & Cruz, M. P. (2024). Reviews, trust, and customer experience in online marketplaces: the case of Mercado Libre Colombia. Frontiers in Communication, 9, 1-14. https://doi.org/10.3389/fcomm.2024.1460321 | |
| dc.relation.references | Pérez, M. (2021, 10 de febrero). Los colombianos caminaron en ‘chanclas’ durante el 2020. Portafolio. https://www.portafolio.co/negocios/los-colombianos-caminaron-en-chanclas-durante-el-2020-549023?utm_source=chatgpt.com | |
| dc.relation.references | Petrlik Azabache, I. C., Carranza Barrena, W., Torres Talaverano, L. E., & Coveñas Lalupu, J. (2024, Junio 22). Aplicación de la minería de datos en el marketing usando el análisis de sentimientos de los clientes e-commerce. Campus, 29 (37), 167-194. https://portalrevistas.aulavirtualusmp.pe/index.php/rc/article/view/2855 | |
| dc.relation.references | Ryali, N., Manne, N., Ravisankar, A., Tripathi, M. A., Tripathi, R., & Naresh, M. V. (2024, Marzo 12). Stage by stage E-Ecommerce market database analysis by using machine learning models. EAI Endorsed Transactions on Internet of Things, 10. 1-7. https://doi.org/10.4108/eetiot.5383 | |
| dc.relation.references | Saraswat, A., Kumar Azad, H., & Abhishek, K. (2022). Towards improving e-commerce customer review analysis for sentiment detection. Scientific Reports, 12(1): 1-15. https://doi.org/10.1038/s41598-022-26432-3 | |
| dc.relation.references | Stephen, A. T., & Toubia, O. (2010). Deriving Value from Social Commerce Networks. Journal of Marketing Research, 47(2), 215-228. https://doi.org/10.1509/jmkr.47.2.215 | |
| dc.relation.references | Vargas, B. H. (2020). Impacto del retail online en Colombia. [Trabajo de especializacion, Universidada Militar Nueva Granada ]. https://repository.unimilitar.edu.co/items/e2ba7f04-79ea-4b0e-b1b6-5e3acad9159a | |
| dc.relation.references | Vij, S. & Kaur, B. (2024), Measuring consumer perceptions towards S-commerce: scale development and validation. Rajagiri Management Journal. https://doi.org/10.1108/RAMJ-06-2024-01664 | |
| dc.relation.references | Zhang, X., Guo, F., Chen, T., & Pan, L. (2023, Diciembre 4). A Brief Survey of Machine Learning and Deep Learning Techniques for E-Commerce Research. Journal of Theoretical and Applied Electronic Commerce Research, 18 (4), 2188- 2216. https://doi.org/10.3390/jtaer18040110 | |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.local | Abierto (Texto Completo) | spa |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.armarc | ||
| dc.subject.armarc | Inteligencia artidicial | spa |
| dc.subject.armarc | Comercio electrónico | spa |
| dc.subject.armarc | Satisfacción del consumidor | spa |
| dc.subject.lemb | Aprendizaje automático (Inteligencia artificial) | spa |
| dc.subject.lemb | Mercado Libre | spa |
| dc.subject.lemb | Mercadeo | spa |
| dc.subject.proposal | Inteligencia artificial | spa |
| dc.subject.proposal | Análisis de sentimientos | spa |
| dc.subject.proposal | Calzado de descanso | spa |
| dc.subject.proposal | Mercado Libre | spa |
| dc.subject.proposal | Procesamiento de lenguaje natural | spa |
| dc.subject.proposal | Machine learning | spa |
| dc.subject.proposal | Comercio electrónico | spa |
| dc.subject.proposal | Artificial intelligence | eng |
| dc.subject.proposal | Sentiment analysis | eng |
| dc.subject.proposal | Comfort footwear | eng |
| dc.subject.proposal | Mercado Libre | eng |
| dc.subject.proposal | Natural language processing | eng |
| dc.subject.proposal | Machine learning | eng |
| dc.subject.proposal | Ecommerce | eng |
| dc.title | Evaluación de la viabilidad de un modelo de machine learning para el análisis de sentimiento en la categoría calzado de descanso en Mercado Libre Colombia mediante Web Scraping | spa |
| dc.title | Assessment of the feasibility of a machine learning model for sentiment analysis in the comfort footwear category on Mercado Libre Colombia through Web Scraping | eng |
| dc.type | Trabajo de grado - Especialización | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/bachelorThesis | |
| dc.type.other | Trabajo de grado - Especialización | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TP | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dspace.entity.type | Publication | |
| person.affiliation.name | Especialización en Machine Learning | |
| person.affiliation.name | Especialización en Machine Learning | |
| person.affiliation.name | Especialización en Machine Learning | |
| person.affiliation.name | Especialización en Gerencia de Proyectos - Virtual |
Archivos
Bloque original
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.92 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
