Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca

Ayala-Yaguara, Holmes Yesid; Valenzuela-Sabogal, Gina Maribel; Espinosa-García, Alexander

Publicación:
Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca

Portada

Citas bibliográficas

Gestores Bibliográficos

Indexadores

Código QR

URI

https://hdl.handle.net/10882/18782

Autores

Ayala-Yaguara, Holmes Yesid

Valenzuela-Sabogal, Gina Maribel

Espinosa-García, Alexander

Fecha

2020-04-11

Resumen en español

En el presente artículo se describe la obtención de un modelo de minería de datos aplicado al problema de la deserción universitaria en el programa de Ingeniería de Sistemas de la Universidad de Cundinamarca, extensión Facatativá. El modelo se estructuró mediante la metodología de minería de datos KDD (knowledge discovery in databases) haciendo uso del lenguaje de programación Python, la librería de procesamiento de datos Pandas y de machine learning Sklearn. Para el proceso se tuvieron en cuenta problemas adicionales al proceso de minería, como, por ejemplo, la alta dimensionalidad, por lo cual se aplicaron los métodos de selección de las variables estadístico univariado, feature importance y SelectFromModel (Sklearn). En el proyecto se seleccionaron cinco técnicas de minería de datos para evaluarlas: vecinos más cercanos (K nearest neighbors, KNN), árboles de decisión (decision tree, DT), árboles aleatorios (random forest, RF), regresión logística (logistic regression, LR) y máquinas de vectores soporte (support vector machines, SVM). Respecto a la selección del modelo final se evaluaron los resultados de cada modelo en las métricas de precisión, matriz de confusión y métricas adicionales de la matriz de confusión. Por último, se ajustaron los parámetros del modelo seleccionado y se evaluó la generalización del modelo al graficar su curva de aprendizaje.

Resumen en inglés

This article describes how a data mining model was obtained and applied to the problem of university dropout in the Systems Engineering program of the University of Cundinamarca, in Facatativá. The model was structured by means of the KDD (knowledge discovery in databases) data mining methodology using Python programming language, Pandas data processing library, and the Sklearn machine learning. For the process, we took into account problems that are additional to the ones specific to the mining process, such as high dimensionality, reason why the methods of selection of the univariate statistical variables, feature importance, and SelectFromModel (Sklearn) were applied. In the project, five data mining techniques were selected for evaluation: nearest neighbors (KNN), decision tree (DT), random forest (RF), logistic regression (LR), and support vector machines (SVM). Regarding the selection of the final model, the results of each model were tested on the precision metrics, confusion matrix, and additional metrics of the confusion matrix. Finally, the parameters of the selected model were adjusted and the generalization of the model was evaluated by plotting its learning curve.

Editor

Universidad Ean

URL del Recurso

https://doi.org/10.21158/23823399.v7.n0.2019.2676

Identificador ISSN

2382-3399

Identificador DOI

10.21158/23823399.v7.n0.2019.2676

Colecciones

Revista Ontare

Página completa del ítem Ver Estadísticas de uso

Publicación:
Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca

Portada

Citas bibliográficas

Gestores Bibliográficos

Indexadores

Código QR

URI

Autores

Fecha

Resumen en español

Resumen en inglés

Autor corporativo

Recolector de datos

Otros/Desconocido

Director audiovisual

Editor

Citación

Título de serie/ reporte/ volumen/ colección

Es Parte de

Descripción

Notas

URL del Recurso

Identificador ISBN

Identificador ISSN

Identificador DOI

Página de inicio

Es Parte del Libro

Colecciones

Publicación: Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca

Portada

Citas bibliográficas

Gestores Bibliográficos

Indexadores

Código QR

URI

Autores

Fecha

Resumen en español

Resumen en inglés

Autor corporativo

Recolector de datos

Otros/Desconocido

Director audiovisual

Editor

Citación

Título de serie/ reporte/ volumen/ colección

Es Parte de

Descripción

Notas

URL del Recurso

Identificador ISBN

Identificador ISSN

Identificador DOI

Página de inicio

Es Parte del Libro

Colecciones

Publicación:
Obtención de un modelo de minería de datos aplicado a la deserción universitaria del programa de Ingeniería de Sistemas de la Universidad de Cundinamarca