Publicación: Modelos de aprendizaje profundo y procesamiento de lenguaje natural para el análisis de tópicos y emociones en YouTube sobre el conflicto palestino-israelí
| dc.contributor.advisor | Luque Zabala, Carolina María | |
| dc.contributor.author | Yousef Novoa, Hannan Nayibe | |
| dc.contributor.jury | Grajales Medina, Diana María | |
| dc.contributor.jury | Mendoza Rodríguez, Estefanía | |
| dc.creator.id | 1032461090 | |
| dc.date.accessioned | 2025-09-07T18:33:36Z | |
| dc.date.issued | 2025-08-22 | |
| dc.description.abstract | Este estudio analiza las narrativas discursivas publicadas en YouTube por canales de distintas orientaciones informativas sobre el conflicto palestino-israelí, en el periodo comprendido entre el 7 de octubre de 2023 y el 27 de marzo de 2025. Se aplicó un enfoque de análisis no supervisado mediante embeddings generados con el modelo E5-Large-v2, una arquitectura basada en Transformers optimizada para tareas semánticas, junto con el algoritmo de agrupación K-means, para identificar tópicos temáticos diferenciados por categoría de canal. Adicionalmente, se llevó a cabo un fine-tuning de modelos de lenguaje basados en arquitecturas Transformer (RoBERTa, ELECTRA, DeBERTa y XLNet) para la clasificación de emociones personalizadas contextualizadas al conflicto. Los resultados revelan diferencias discursivas significativas entre fuentes informativas, así como la eficacia de modelos modernos como DeBERTa y RoBERTa para capturar matices emocionales complejos en contextos geopolíticos sensibles, alcanzando puntuaciones F1 de 0.89 y 0.87, respectivamente. Esta investigación aporta al análisis computacional del discurso y al estudio de las emociones en entornos digitales altamente complejos. | spa |
| dc.description.abstract | This study analyzes the discursive narratives published on YouTube by channels with different informational orientations regarding the Israeli–Palestinian conflict, during the period from October 7, 2023, to March 27, 2025. An unsupervised analysis approach was applied using embeddings generated with the E5-Large-v2 model, a Transformer-based architecture optimized for semantic tasks, along with the K-means clustering algorithm to identify thematic topics by channel category. Additionally, fine-tuning was performed on language models based on Transformer architectures (RoBERTa, ELECTRA, DeBERTa, and XLNet) for the classification of context-specific emotional categories. The results reveal significant discursive differences between sources, as well as the effectiveness of modern models such as DeBERTa and RoBERTa in capturing complex emotional nuances in geopolitically sensitive contexts, achieving F1 scores of 0.89 and 0.87, respectively. This research contributes to computational discourse analysis and the study of emotions in highly complex digital environments. | eng |
| dc.description.degreelevel | Maestría | spa |
| dc.description.degreename | Magíster en Ciencias de Datos | spa |
| dc.format | ||
| dc.format.extent | 155 páginas | |
| dc.format.medium | Recurso electrónico | spa |
| dc.format.mimetype | application/pdf | |
| dc.identifier.instname | instname:Universidad Ean | spa |
| dc.identifier.local | BDM-MGP | |
| dc.identifier.reponame | reponame:Repositorio Institucional Biblioteca Digital Minerva | spa |
| dc.identifier.repourl | repourl:https://repository.ean.edu.co/ | |
| dc.identifier.uri | https://hdl.handle.net/10882/15197 | |
| dc.language.iso | spa | |
| dc.publisher | Universidad Ean | |
| dc.publisher.faculty | Facultad de Ingeniería | spa |
| dc.publisher.program | Maestría en Ciencias de Datos | spa |
| dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
| dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | |
| dc.rights.creativecommons | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.license | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
| dc.rights.uri | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject.armarc | Análisis del discurso -- Procesamiento de datos | spa |
| dc.subject.armarc | Procesamiento de lenguaje natural (Computadores) | spa |
| dc.subject.armarc | Interacción hombre-computador | spa |
| dc.subject.armarc | Procesamiento electrónico de datos | spa |
| dc.subject.lemb | Lingüística computacional | spa |
| dc.subject.lemb | YouTube -- Investigaciones | spa |
| dc.subject.proposal | Conflicto palestino israelí | spa |
| dc.subject.proposal | YouTube | spa |
| dc.subject.proposal | Análisis de discurso | spa |
| dc.subject.proposal | Embeddings semánticos | spa |
| dc.subject.proposal | Clasificación de emociones | spa |
| dc.subject.proposal | Modelos transformer | spa |
| dc.subject.proposal | Procesamiento de lenguaje natural | spa |
| dc.subject.proposal | Israeli Palestinian conflict | eng |
| dc.subject.proposal | Discourse analysis | eng |
| dc.subject.proposal | Semantic embeddings | eng |
| dc.subject.proposal | Emotion classification | eng |
| dc.subject.proposal | Transformer models | eng |
| dc.subject.proposal | Natural language processing | eng |
| dc.title | Modelos de aprendizaje profundo y procesamiento de lenguaje natural para el análisis de tópicos y emociones en YouTube sobre el conflicto palestino-israelí | spa |
| dc.title | Deep learning and natural language processing models for topic and emotion analysis on YouTube regarding the israeli–palestinian conflict | eng |
| dc.type | Trabajo de grado - Maestría | spa |
| dc.type.coar | http://purl.org/coar/resource_type/c_bdcc | |
| dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
| dc.type.content | Text | |
| dc.type.driver | info:eu-repo/semantics/masterThesis | |
| dc.type.other | Trabajo de grado - Maestría | |
| dc.type.redcol | http://purl.org/redcol/resource_type/TM | |
| dc.type.version | info:eu-repo/semantics/acceptedVersion | |
| dspace.entity.type | Publication | |
| person.affiliation.name | Maestría en Ciencias de Datos |
Archivos
Bloque original
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.92 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
