Publicación: Modelos de aprendizaje profundo y procesamiento de lenguaje natural para el análisis de tópicos y emociones en YouTube sobre el conflicto palestino-israelí
Portada
Citas bibliográficas
Código QR
Autores
Director
Fecha
Resumen en español
Este estudio analiza las narrativas discursivas publicadas en YouTube por canales de distintas orientaciones informativas sobre el conflicto palestino-israelí, en el periodo comprendido entre el 7 de octubre de 2023 y el 27 de marzo de 2025. Se aplicó un enfoque de análisis no supervisado mediante embeddings generados con el modelo E5-Large-v2, una arquitectura basada en Transformers optimizada para tareas semánticas, junto con el algoritmo de agrupación K-means, para identificar tópicos temáticos diferenciados por categoría de canal. Adicionalmente, se llevó a cabo un fine-tuning de modelos de lenguaje basados en arquitecturas Transformer (RoBERTa, ELECTRA, DeBERTa y XLNet) para la clasificación de emociones personalizadas contextualizadas al conflicto. Los resultados revelan diferencias discursivas significativas entre fuentes informativas, así como la eficacia de modelos modernos como DeBERTa y RoBERTa para capturar matices emocionales complejos en contextos geopolíticos sensibles, alcanzando puntuaciones F1 de 0.89 y 0.87, respectivamente. Esta investigación aporta al análisis computacional del discurso y al estudio de las emociones en entornos digitales altamente complejos.
Resumen en inglés
This study analyzes the discursive narratives published on YouTube by channels with different informational orientations regarding the Israeli–Palestinian conflict, during the period from October 7, 2023, to March 27, 2025. An unsupervised analysis approach was applied using embeddings generated with the E5-Large-v2 model, a Transformer-based architecture optimized for semantic tasks, along with the K-means clustering algorithm to identify thematic topics by channel category. Additionally, fine-tuning was performed on language models based on Transformer architectures (RoBERTa, ELECTRA, DeBERTa, and XLNet) for the classification of context-specific emotional categories. The results reveal significant discursive differences between sources, as well as the effectiveness of modern models such as DeBERTa and RoBERTa in capturing complex emotional nuances in geopolitically sensitive contexts, achieving F1 scores of 0.89 and 0.87, respectively. This research contributes to computational discourse analysis and the study of emotions in highly complex digital environments.

PDF
FLIP 
