Los textos médicos son una fuente de información para los profesionales. Y el análisis de grandes volúmenes de estos textos, utilizando técnicas de procesamiento de lenguaje natural, se ha convertido en una oportunidad de extraer todo el valor posible a casos clínicos y otros documentos. Un proceso que necesita de la anotación previa de la información por parte de un equipo de lingüistas.
Este fue el tema a abordar en el Seminario sobre “Anotación semántica en corpus de dominio médico”, organizado en el marco de la Cátedra de Lingüística Computacional UAM-IIC y que contó con la experiencia del Dr. Leonardo Campillos-Llanos.
El investigador participó en un proyecto de anotación de un corpus médico en francés. En concreto, se seleccionaron 500 textos clínicos procedentes de la Unidad Médica de Nutrición del Hospital Universitario de Rouen.
Se trataba de un caso muy específico y difícil de generalizar, pero su metodología sí puede aplicarse en otros proyectos, al igual que el contexto en el que se trabaja. Dar a conocer el punto de partida y la forma de trabajo al anotar textos médicos fue el objetivo del seminario.
Algunas claves de la anotación semántica en textos médicos
El primer paso de cualquier proyecto de este tipo, por lo esencial que es la confidencialidad en temas médicos, es anonimizar los documentos seleccionados. No obstante, en este caso sí se intentó representar proporcionalmente al total de casos del hospital, por ejemplo, en cuanto al porcentaje de hombres y mujeres.
Además, se diseñaron unas guías de anotación que unificaran el trabajo de los lingüistas, en las que se acotaron:
- 12 tipos de entidades: persona (antecedentes), síntomas, enfermedades…
- 37 tipos de relaciones: causa, afecta…
- Anotaciones temporales: tarde, noche, frecuencia…
Sin embargo, también fue necesaria una revisión y el consenso posterior entre anotadores, menos frecuente y generalizado conforme avanza el proyecto y las reglas están más asumidas.
El consenso con más dificultades residiría en las relaciones que están basadas en un conocimiento médico, a la hora de determinar si un síntoma es “causa” de una enfermedad o de si esta “afecta” a una persona con determinadas características. Por ello, en algunos casos, se recurre a profesionales que resuelvan estas dudas.
Y es que al final, se trata de un trabajo de equipo, con tareas que se comparten: desde el establecimiento de las guías de trabajo hasta el acuerdo entre anotadores.