Abstract:
El presente proyecto de investigación cómo opción de grado del Programa de Ingeniería de Sistemas, es un estudio basado en el desarrollo de una herramienta que permita hacer la predicción temprana de sufrir de la hipertensión arterial, basándose en unas escalas de riesgos que van desde el menos probable de padecer esta patología, pasando por el de mediano nivel y finalmente identificando los pacientes que estén dentro de alto riesgo de contraerla. Para este estudio se utilizaron técnicas de aprendizaje profundo supervisado.
La metodología del proyecto esta soportada por tres fases estructuradas, la primera es la búsqueda de información relacionada con el tema del proyecto la cual permitió identificar que modelos de clasificación eran los más adecuados para la realización del proyecto, las cuales fueron, árbol de decisión y red neuronal, la segunda fase conlleva el tratamiento de los datos obtenidos del hospital municipal de Arjona Bolívar, dichos datos pasaron por varias técnicas de limpieza tales como: verificación y rellenado de datos faltantes, balanceo de los tres tipos de clases en la variable de respuesta (riesgo bajo, riesgo medio y riesgo alto), conversión de datos cadena a numéricos, de para después realizar la última fase que es el desarrollo del modelo donde se toma primeramente un modelo de predicción muy sencillo convencional, árbol de decisión, en este se tiene unos datos de entrada independiente que consta de alrededor de 40 variables independientes que permiten definir la correlación con la variable de respuesta como base para la predicción de tipo clasificación. Finalmente, y como modelo central del análisis general de la predicción para encontrar qué tan alto el nivel de riesgo una paciente que sufre de hipertensión arterial. El modelo fue construido con tres capas, donde la primera representa los datos de entradas, conformada por 60 neuronas y una función de activación igual a relu. La siguiente parte viene siendo la capa oculta quien cuenta con 30 neuronas y función de activación similar a la anterior capa, relu, y por último la de salida posee tres neuronas multiconectadas como las anteriores, finalmente en el resultado que arrojó se mostró una precisión y una actitud alrededor del 87% en la predicción final. Hay que tener en cuenta que para realizar la predicción final y verificación del modelo se tomó el 30% de la muestra de todos los datos disponibles