Identificar los factores asociados a la enfermedad
Objetivo
Análisis de los datos de pacientes con artritis psoriásica para la identificación de variables con capacidad predictiva sobre la gravedad de la enfermedad.
La Fundación Española de Reumatología quería realizar una investigación sobre la artritis psoriásica, explotando los datos recogidos de los pacientes. Tenía el objetivo de identificar los factores asociados a ciertas características de la enfermedad, descritas mediante un conjunto de variables resultado.
En este contexto, pidió apoyo al IIC para realizar el análisis descriptivo de los datos de los que disponían, a partir del que desarrollar modelos predictivos. Con esto, se está trabajando en una serie de artículos científicos con los resultados.
Solución
Se utilizaron métodos estadísticos avanzados para analizar la información de la que disponía la Fundación, que proporcionó al IIC una base de datos de pacientes con más de 1500 variables. Mediante técnicas bivariantes, se seleccionaron los factores cuya asociación con la gravedad de la artritis psoriásica era significativa y, a posteriori, se realizó un análisis multivariante de confusión para descartar las variables con información redundante.
Con esto, se desarrollaron varios modelos de Inteligencia Artificial para predecir distintas características de la artritis psoriásica a partir de sus factores influyentes. Además, se trabajó para que estos modelos fueran interpretables y los profesionales médicos pudieran apoyarse en ellos para abordar los planes de tratamiento.
Beneficio
El análisis realizado facilita entender cómo influyen ciertos factores en el desarrollo de la artritis psoriásica.
En cuanto a los resultados, los métodos estadísticos permiten determinar qué variables están significativamente asociadas a las variables resultado, así como observar el grado y la dirección de tales asociaciones. La evaluación de los modelos de Inteligencia Artificial valida la capacidad predictiva a futuro de las variables identificadas como factores influyentes sobre la gravedad de la enfermedad. En este caso, se probaron modelos basados en árboles y en Gradient boosting, alcanzando más de un 80% de sensibilidad y especificidad.
Además, la metodología utilizada y los resultados son propicios para estudios científicos cuyo objetivo es la mejor comprensión de la enfermedad. Y la interpretabilidad de los modelos, por otro lado, favorece que la comunidad médica se apoye en los modelos predictivos para la toma de decisiones clínicas.