El Big Data y la Inteligencia Artificial ya están presentes en nuestras experiencias cotidianas, con numerosas aplicaciones en el sector de la salud. Sin embargo, muchas veces ignoramos cómo se desarrolla un modelo, desde esa necesidad médica del profesional, pasando por la integración y tratamiento de los datos, hasta los resultados y la validación en hospitales y centros de salud.
Mostrar este proceso, en el que los datos son fundamentales, fue el objetivo del taller impartido por Cristina Pruenza, Data Scientist y Project Manager en el área Health Predictive Analytics del Instituto de Ingeniería del Conocimiento (IIC), en la VII Semana de la Informática de la UCM. La experta explicó dos proyectos de IA desarrollados en el IIC para el ámbito de la salud, además de las técnicas y herramientas utilizadas.
Análisis Big Data en salud
En el sector salud, disponemos de gran cantidad de datos que provienen de fuentes muy diversas y heterogéneas: dispositivos, wearables y, sobre todo, la propia Historia Clínica Electrónica (HCE).
Es posible unificar todos esos datos en un formato común, para analizarlos y, por ejemplo, detectar ciertas enfermedades de forma temprana o establecer mejores protocolos.
Según explicaba Cristina Pruenza, para ese análisis, hace falta primero almacenarlos, tratarlos y procesarlos. Porque solo así “podemos extraer ese valor de los datos, el conocimiento real que existe sobre esa enfermedad o el problema que queramos resolver”.
Así pues, todo parte de un gran conjunto de datos, que es lo más importante para desarrollar este tipo de proyectos de Inteligencia Artificial.
Después, existen diferentes niveles de analítica con los que extraer valor: descriptiva, predictiva y prescriptiva. Sin embargo, esta última no se puede llamar así en el ámbito de la salud, porque un sistema no puede tomar decisiones sobre la salud de las personas. “El proceso siempre está supervisado por un profesional médico y esa prescripción será más bien una recomendación para el clínico, que lo ayudará en la toma de decisiones”, explicó Pruenza. Veamos los dos proyectos que puso como ejemplo: Bisepro e Induccess.
“El sistema nunca puede tomar decisiones sobre la salud del paciente, el proceso siempre está supervisado por un profesional médico y esa prescripción será más bien una recomendación para el clínico, que lo ayudará en la toma de decisiones” Cristina Pruenza.
Bisepro: alertas inteligentes de sepsis
La herramienta Bisepro es un ejemplo de cómo se puede mejorar la detección precoz de sepsis a partir del conocimiento y experiencia de los médicos y el análisis de unos datos muy diferentes. Actualmente lleva instalado más de 2 años en el Hospital Universitario Son Llàtzer de Palma de Mallorca y su desarrollo se podría resumir en:
- Análisis descriptivo de gran cantidad de datos históricos heterogéneos de la historia clínica de los pacientes, para obtener información sobre la enfermedad y seleccionar las variables relevantes para su predicción. Antes, se llevó a cabo un pre-procesamiento de datos, para eliminar el ruido y trabajar con datos de calidad.
- Desarrollo del modelo y análisis predictivo. Se partió de un sistema de reglas médicas que ya tenían en funcionamiento en el hospital, y que se basaba en un número definido de pruebas clínicas para determinar si un paciente podría tener sepsis. Este se fue comparando con los algoritmos entrenados con los datos de calidad obtenidos, hasta conseguir mejorarlo.
- Puesta en producción, emisión de alertas y validación en el hospital. Una vez entrenado, Bisepro es capaz de predecir un posible caso de sepsis y alertar al médico a través de un código de colores, para priorizar a los pacientes. Los profesionales podrán después validar las alertas, para retroalimentar al sistema y mejorar sus resultados.
De hecho, Bisepro recibe datos continuamente para mejorar sus predicciones. Funciona en tiempo real, algo fundamental para una enfermedad tiempo-dependiente, y se basa en técnicas de Deep Learning y Procesamiento del Lenguaje Natural (PLN), pues hay que estructurar algunos textos médicos.
En cuanto a los resultados, el sistema alcanzó un acierto del 96%, reduciendo los falsos positivos a la mitad y adelantándose hasta 2 horas al profesional con las alertas. Actualmente se puede utilizar la plataforma para otras enfermedades, en el camino a la medicina personalizada y de precisión.
Induccess: mejora de los procesos médicos
De forma similar se desarrolló el sistema Induccess, para la predicción del éxito de la inducción al parto. Este proyecto surgió de la necesidad del hospital Universitario de Fuenlabrada de predecir cuál era la mejor manera de finalizar un parto y evitar complicaciones.
Hasta entonces, los profesionales médicos se basaban en variables estáticas, independientemente de las características de la paciente, y se vio la posibilidad de mejorar este proceso médico. Se trabajó en tres objetivos:
- Estructurar la información contenida en la Historia Clínica Electrónica (HCE), mucha de ella en texto libre, con técnicas de Procesamiento del Lenguaje Natural (PLN).
- Encontrar buenos factores predictivos de la inducción al parto, con el análisis descriptivo de los datos disponibles (10.500 embarazos).
- Desarrollar un nuevo modelo que mejorara el sistema de reglas médicas que ya manejaban, basado en 20 variables. Se demostró que existían redundancias y reglas innecesarias, reduciéndolas a 6 variables relevantes.
Estas nuevas reglas y variables sirven de entrada al modelo de Machine Learning, que terminará dando una recomendación al médico. Induccess consiguió un acierto del 90% y en su interfaz también puede verse la historia clínica de cada paciente y las variables a revisar. Funciona en tiempo real y se plantea desarrollar proyectos similares que ayuden a mejorar procesos en otros servicios del hospital.