Sánchez Trujillo, Magda Gabriela
Pérez Hernández, José Ángel
Show full item recordMetodología CRISP-DM en la gestión de proyecto de Data Mining. Caso enfermedades dermatológicas
Hoy en día todas las organizaciones y/o empresas almacenan una gran cantidad de información, que ha
llegado a exceder la habilidad del personal para analizar, resumir e interpretar los datos, dando lugar a la
técnica Data mining, con objeto de predecir de forma automatizada tendencias y comportamientos de
modelos. El caso se realiza en una clínica dermatológica en el estado de Hidalgo, México, la cual busca
determinar a partir de datos históricos el comportamiento de las enfermedades dermatológicas en los
próximos años, indicando el lugar donde se presentan el mayor número de casos, edad y sexo. Los datos
con los que se integra la gestión del proyecto abarcan los años 2013-2020, lugar de residencia de los
pacientes, padecimientos por entidad y municipio. Así, el propósito del presente caso es aplicar la
metodología de gestión de proyectos CRISP-DM (Cross Industry Standard Process for Data Mining), la
cual proporciona una idea clara de la estructura el ciclo de vida del proyecto de data mining en seis
fases, que interactúan entre ellas de forma iterativa durante el desarrollo del proyecto: análisis del
problema, análisis de datos, preparación de datos, modelado, evaluación y seguimiento, a fin de
planificar, dirigir y dar seguimiento al proyecto. Los resultados permiten identificar las enfermedades
dermatológicas con mayor incidencia en los próximos años (2021-2025) por diagnóstico, edad, sexo.
Today all organizations and / or companies store a large amount of information, which has exceeded the
ability of staff to analyze, summarize and interpret data, giving rise to the technique of data mining, in
order to predict in a way automated trends and model behaviors. The case is performed in a
dermatology clinic in the state of Hidalgo, Mexico, which seeks to determine from historical data the
behavior of dermatological diseases in the coming years, indicating the place where the largest number
present case, age and sex. The data with which the project management is integrated cover the years
2013-2020, place of residence of the patients, conditions by entity and municipality. Thus, the purpose of
this case is to apply the project management methodology CRISP-DM (Cross Industry Standard Process
for Data Mining), which provides a clear idea of the structure of the life cycle of the data mining project
in six phases, that interact with each other iteratively during the development of the project. analysis of
the problem, data analysis, data preparation, modeling, evaluation and monitoring, in order to plan,
manage and monitor the project. The results allow identifying the dermatological diseases with the
highest incidence in the coming years (2021-2025) by diagnosis, age, and sex.
- ICPM 2021 [12]