Publicación:
Modelos de aprendizaje profundo y procesamiento de lenguaje natural para el análisis de tópicos y emociones en YouTube sobre el conflicto palestino-israelí

dc.contributor.advisorLuque Zabala, Carolina María
dc.contributor.authorYousef Novoa, Hannan Nayibe
dc.contributor.juryGrajales Medina, Diana María
dc.contributor.juryMendoza Rodríguez, Estefanía
dc.creator.id1032461090
dc.date.accessioned2025-09-07T18:33:36Z
dc.date.issued2025-08-22
dc.description.abstractEste estudio analiza las narrativas discursivas publicadas en YouTube por canales de distintas orientaciones informativas sobre el conflicto palestino-israelí, en el periodo comprendido entre el 7 de octubre de 2023 y el 27 de marzo de 2025. Se aplicó un enfoque de análisis no supervisado mediante embeddings generados con el modelo E5-Large-v2, una arquitectura basada en Transformers optimizada para tareas semánticas, junto con el algoritmo de agrupación K-means, para identificar tópicos temáticos diferenciados por categoría de canal. Adicionalmente, se llevó a cabo un fine-tuning de modelos de lenguaje basados en arquitecturas Transformer (RoBERTa, ELECTRA, DeBERTa y XLNet) para la clasificación de emociones personalizadas contextualizadas al conflicto. Los resultados revelan diferencias discursivas significativas entre fuentes informativas, así como la eficacia de modelos modernos como DeBERTa y RoBERTa para capturar matices emocionales complejos en contextos geopolíticos sensibles, alcanzando puntuaciones F1 de 0.89 y 0.87, respectivamente. Esta investigación aporta al análisis computacional del discurso y al estudio de las emociones en entornos digitales altamente complejos.spa
dc.description.abstractThis study analyzes the discursive narratives published on YouTube by channels with different informational orientations regarding the Israeli–Palestinian conflict, during the period from October 7, 2023, to March 27, 2025. An unsupervised analysis approach was applied using embeddings generated with the E5-Large-v2 model, a Transformer-based architecture optimized for semantic tasks, along with the K-means clustering algorithm to identify thematic topics by channel category. Additionally, fine-tuning was performed on language models based on Transformer architectures (RoBERTa, ELECTRA, DeBERTa, and XLNet) for the classification of context-specific emotional categories. The results reveal significant discursive differences between sources, as well as the effectiveness of modern models such as DeBERTa and RoBERTa in capturing complex emotional nuances in geopolitically sensitive contexts, achieving F1 scores of 0.89 and 0.87, respectively. This research contributes to computational discourse analysis and the study of emotions in highly complex digital environments.eng
dc.description.degreelevelMaestríaspa
dc.description.degreenameMagíster en Ciencias de Datosspa
dc.formatpdf
dc.format.extent155 páginas
dc.format.mediumRecurso electrónicospa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad Eanspa
dc.identifier.localBDM-MGP
dc.identifier.reponamereponame:Repositorio Institucional Biblioteca Digital Minervaspa
dc.identifier.repourlrepourl:https://repository.ean.edu.co/
dc.identifier.urihttps://hdl.handle.net/10882/15197
dc.language.isospa
dc.publisherUniversidad Ean
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.programMaestría en Ciencias de Datosspa
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.licenseAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.armarcAnálisis del discurso -- Procesamiento de datosspa
dc.subject.armarcProcesamiento de lenguaje natural (Computadores)spa
dc.subject.armarcInteracción hombre-computadorspa
dc.subject.armarcProcesamiento electrónico de datosspa
dc.subject.lembLingüística computacionalspa
dc.subject.lembYouTube -- Investigacionesspa
dc.subject.proposalConflicto palestino israelíspa
dc.subject.proposalYouTubespa
dc.subject.proposalAnálisis de discursospa
dc.subject.proposalEmbeddings semánticosspa
dc.subject.proposalClasificación de emocionesspa
dc.subject.proposalModelos transformerspa
dc.subject.proposalProcesamiento de lenguaje naturalspa
dc.subject.proposalIsraeli Palestinian conflicteng
dc.subject.proposalDiscourse analysiseng
dc.subject.proposalSemantic embeddingseng
dc.subject.proposalEmotion classificationeng
dc.subject.proposalTransformer modelseng
dc.subject.proposalNatural language processingeng
dc.titleModelos de aprendizaje profundo y procesamiento de lenguaje natural para el análisis de tópicos y emociones en YouTube sobre el conflicto palestino-israelíspa
dc.titleDeep learning and natural language processing models for topic and emotion analysis on YouTube regarding the israeli–palestinian conflicteng
dc.typeTrabajo de grado - Maestríaspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.otherTrabajo de grado - Maestría
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dspace.entity.typePublication
person.affiliation.nameMaestría en Ciencias de Datos

Archivos

Bloque original

Mostrando 1 - 2 de 2
Cargando...
Miniatura
Nombre:
YousefHannan2025.pdf
Tamaño:
8.47 MB
Formato:
Adobe Portable Document Format
Descripción:
Tesis de Maestría
Cargando...
Miniatura
Nombre:
YousefHannan2025_Anexo.pdf
Tamaño:
191.21 KB
Formato:
Adobe Portable Document Format
Descripción:
AutorizaciónPublicación_2025.pdf

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.92 KB
Formato:
Item-specific license agreed upon to submission
Descripción: