Ante la gran cantidad de información en texto que se genera en el sector salud, surgen aplicaciones para la extracción y relación de términos que faciliten el trabajo de lectura y obtención de conocimiento de los profesionales médicos.
En el Instituto de Ingeniería del Conocimiento (IIC), en colaboración con la Fundación Progreso y Salud, hemos desarrollado recientemente GER, una plataforma de búsqueda que permite detectar y relacionar genes y enfermedades raras en textos biomédicos.
A través de técnicas de Procesamiento del Lenguaje Natural (PLN) y con diferentes opciones de visualización, la aplicación permite encontrar rápidamente las relaciones entre enfermedades raras y genes de interés y agilizar la “lectura” de artículos científicos sobre la materia.
¿Cómo funciona GER?
En el vídeo-demostración de GER vemos cómo, tras realizar una búsqueda de una enfermedad rara, aparecen una serie de documentos que contienen el término introducido, ordenados de mayor a menor relevancia. Si entramos en un documento en concreto, encontramos destacados en rosa las enfermedades raras y en amarillo los genes relacionados con dicha enfermedad, pudiendo observar de un vistazo los que aparecen en el mismo texto y obteniendo textos más estructurados.
Además, se pueden ver estas relaciones en forma de grafo, ofreciendo una información más visual. Cada enlace entre gen y enfermedad rara indica que han aparecido al menos una vez en el mismo artículo biomédico.
PLN en genómica
Un potencial claro del PLN en salud se ve especialmente en el ámbito de la genómica. Al final, la información está escrita de alguna manera en papers o bases de datos y es muy difícil encontrar todos los detalles de manera manual. Gracias al PLN se puede llegar a ella más rápidamente entrenando un sistema que destaque lo que es relevante para el profesional o para cada caso.
De esta forma, análisis de datos y genómica se alían para entender mejor las enfermedades genéticas y poder relacionarlas con otras características de los pacientes, de forma que se les pueda ofrecer una medicina y tratamientos más personalizados. En el IIC, seguimos trabajando en el desarrollo de sistemas que identifican y relacionan términos genómicos en diferentes textos médicos (informes, artículos científicos o la propia historia clínica).