Aplicación de técnicas de machine learning en la predicción de hospitalizaciones y reingresos de pacientes con esquizofrenia en Castilla y León

  1. GÓNGORA ALONSO, SUSEL
Dirigida por:
  1. Isabel de la Torre Directora
  2. Manuel Ángel Franco Martín Codirector/a

Universidad de defensa: Universidad de Valladolid

Fecha de defensa: 17 de julio de 2023

Tribunal:
  1. Javier Escudero Rodríguez Presidente/a
  2. Jesús Poza Crespo Secretario
  3. José Alberto Benítez Andrades Vocal

Tipo: Tesis

Resumen

La esquizofrenia es un trastorno mental grave que se caracteriza por síntomas como las alucinaciones, delirios, trastornos del pensamiento y la conducta. Las personas con esquizofrenia se asocian con un mayor riesgo de abuso de sustancias, suicidio y mortalidad en comparación con la población general. Presentan tasas de hospitalización de un 20-40% en un año, lo que deriva en altos costes en el sistema sanitario y afecta la calidad de vida de los pacientes y los familiares. En España, la estancia hospitalaria corresponde al 37.6% de los costes sanitarios totales. El uso de técnicas de Machine Learning (ML), permite analizar patrones de los datos mediante métodos estadísticos, y crear modelos que aprenden y generalizan el comportamiento de los datos. En Castilla y León (CyL), reducir el número de hospitalizaciones y de reingresos es de suma importancia para los servicios de psiquiatría. Por tanto, en esta Tesis Doctoral se plantea la hipótesis que la aplicación de algoritmos de ML ayuda a identificar los factores de riesgo de hospitalización y predecir el reingreso de pacientes con esquizofrenia. En consecuencia, el objetivo principal de esta investigación es desarrollar y evaluar nuevos modelos predictivos utilizando algoritmos de ML, con el fin de ayudar en la predicción de hospitalizaciones y reingresos de pacientes con esquizofrenia en CyL. Para alcanzar este objetivo, se utilizaron 11 126 registros administrativos que corresponden a 5 412 pacientes hospitalizados con esquizofrenia, de 11 hospitales públicos de CyL, en dos períodos de tiempo diferentes. Los registros son datos globales, no están basados en la psicopatología clínica del paciente; incluyen información demográfica, características de episodios de hospitalización, diagnósticos y procedimientos referentes al paciente hospitalizado. Estos registros se analizaron automáticamente utilizando técnicas de clasificación de ML, y se crearon modelos predictivos para predecir el riesgo de reingreso de estos pacientes. En este sentido, se propuso un enfoque metodológico donde se aplica una fase de preprocesamiento y de selección de características donde se determinaron las variables predictivas de la investigación. El método de validación cruzada se utilizó en la validación de los modelos y las curvas ROC para su interpretación. Por último, se ha desarrollado una aplicación web que permite trasladar la principal contribución de esta Tesis Doctoral a la práctica clínica. Se compararon los diferentes modelos creados a partir de sus métricas de rendimiento, y se obtuvo que el algoritmo Random Forest (RF) es el que mejor predice el riesgo de reingreso de los pacientes con esquizofrenia en CyL. Este modelo RF alcanzó una exactitud (accuracy) de 0.817 y un área bajo la curva ROC (AUC) del 0.879. Estos valores sugieren que el modelo tiene una capacidad de discriminación razonable para predecir el reingreso de estos pacientes. Variables como la edad, la duración de la estancia, diagnósticos con códigos V, de abuso de sustancias y trastornos mentales, se identificaron como las variables más predictivas del modelo. Estas variables indican posibles factores de riesgo asociados al reingreso de pacientes con esquizofrenia. Por tanto, los resultados obtenidos en esta Tesis Doctoral sugieren que algoritmos de ML como el RF, tienen la capacidad de aprender características complejas de los datos y predecir el riesgo de reingreso de pacientes hospitalizados con esquizofrenia, en CyL. Se considera que los modelos desarrollados pueden ayudar a la toma de decisiones, mejorando la calidad de la atención al paciente y desarrollando tratamientos preventivos en función de reducir el número de hospitalizaciones. Además, la implementación de la aplicación web desarrollada en esta investigación, en los hospitales públicos de CyL, puede ser de gran utilidad al personal sanitario en función de reducir los costos asociados a estas hospitalizaciones.