La histopatología constituye una fuente crucial de información para profesionales clínicos e investigadores. Se trata de las imágenes obtenidas a partir de muestras de tejido humano, que desempeñan un papel fundamental en el diagnóstico y tratamiento de diversas enfermedades, incluyendo el cáncer.
Tradicionalmente el análisis histopatológico ha sido realizado por patólogos humanos, quienes examinan una a una las imágenes generadas por el microscopio y emiten un diagnóstico basado en su experiencia y conocimiento. Sin embargo, este proceso es laborioso, subjetivo y está sujeto a posibles errores humanos, ya que depende en gran medida del experto.
En este contexto, la inteligencia artificial (IA) puede resultar de mucha ayuda para transformar esta práctica médica. En los últimos años, se ha demostrado que la aplicación de técnicas de aprendizaje automático en el análisis de imágenes médicas permite obtener resultados muy prometedores, aunque es cierto que, a pesar de los recientes avances, la implementación de algoritmos para el análisis concreto de imágenes histopatológicas es un campo aún en desarrollo.
Por ello, desde el IIC hemos investigado el rendimiento de los algoritmos de Deep Learning o aprendizaje profundo en el análisis de imágenes histopatológicas. Partiendo de que la IA es capaz de identificar patrones y características sutiles que a veces pueden escapar al ojo humano, esto puede suponer un apoyo y mejora en la toma de decisiones clínicas, un diagnóstico más rápido y preciso, así como una mayor objetividad en la interpretación de las imágenes.
Tres tareas para el análisis de imágenes
En el IIC, analizamos e interpretamos todo tipo de imágenes generadas en el sector salud. Para ello se deben considerar las tres principales tareas del análisis de imágenes: clasificación, detección y segmentación. Cada una de ellas aborda diferentes aspectos del análisis:
- La clasificación de imágenes consiste en asignar una etiqueta o categoría predefinida a una imagen completa. El objetivo es determinar a qué clase o categoría pertenece la imagen en su totalidad.
- La detección de imágenes se enfoca en identificar y localizar objetos o regiones de interés dentro de una imagen. A diferencia de la clasificación, donde el objetivo es etiquetar la imagen completa, la detección se centra en detectar la presencia de objetos individuales y dibujar un cuadro delimitador alrededor de ellos. Esto proporciona información precisa sobre la ubicación y clases asociadas a los objetos detectados.
- La segmentación de imágenes es una tarea más compleja que implica la asignación de etiquetas a píxeles individuales dentro de una imagen. El objetivo es determinar los contornos de los objetos presentes en la imagen.
Una vez aclarados los conceptos, en este artículo presentamos ejemplos de aplicaciones de estos tres tipos de tareas de análisis de imágenes histopatológicas mediante algoritmos de Deep Learning o aprendizaje profundo.
Clasificación de imágenes histopatológicas con Deep Learning
Para abordar la tarea de clasificación en imágenes histopatológicas se han utilizado bases de datos abiertas de cáncer de colon y cáncer de mama. El objetivo era predecir la presencia de cada tipo de cáncer en la imagen.
En primer lugar, se realiza una división de los datos en conjuntos de entrenamiento, validación y test. Y para mejorar la generalización del modelo, se aplica una técnica denominada data augmentation a los conjuntos de entrenamiento y validación. Esta técnica consiste en generar imágenes sintéticas mediante transformaciones aplicadas a las imágenes originales, como escalado, rotación o adición de ruido, y de esta forma contar con más datos para entrenar y probar al modelo. Es importante tener precaución, ya que transformaciones muy extremas podrían eliminar o distorsionar el área del tumor, lo que podría confundir al algoritmo.
Para el entrenamiento de la tarea de clasificación, se utiliza la red VGG16, empleando la técnica de fine tunning. Esta técnica implica utilizar los pesos pre-entrenados de las primeras capas de la red y entrenar únicamente las capas finales con las imágenes específicas del problema a resolver.
Para resolver la predicción de cáncer de colon se utilizaron imágenes de tres clases distintas: tumor, estroma asociado a cáncer y tejido normal. Durante el entrenamiento se obtuvo la siguiente curva de exactitud (accuracy):
Los resultados obtenidos para el conjunto de test fueron extremadamente buenos, rondando o superando el 95% de precisión en todas las clases, como se muestra en la siguiente imagen:
Asimismo, al evaluar el modelo entrenado con otra base de datos de cáncer de colon, para comprobar su extrapolabilidad, se obtuvieron también resultados bastante buenos, mayoritariamente por encima del 80% de acierto. Si bien estos resultados son algo peores que los anteriores, el modelo ha generalizado de manera sorprendentemente buena sobre un dataset con el que no había sido entrenado:
A continuación, se procedió también a la clasificación de imágenes de cáncer de mama. Para ello se utilizó una base de datos con imágenes etiquetadas según el grado del cáncer: cáncer de mama grado 1 (leve, bien diferenciado), grado 2 y grado 3 (el más grave, extendido y poco diferenciado). Las curvas de entrenamiento de la red convolucional muestran un buen aprendizaje, rápido, que se estabiliza en apenas 20 épocas:
Los resultados obtenidos para este problema de predicción mostraron un rendimiento general de en torno al 89%, llegando a superarse esos valores en algunos casos, como con las muestras de grado 2:
Esto revela una gran capacidad del algoritmo para detectar cáncer de mama en estadios tempranos de la enfermedad (grados 1 y 2), con el potencial preventivo que ello conlleva.
Detección de imágenes histopatológicas con Deep Learning
Tras el éxito observado en las pruebas de clasificación, pasamos a continuación a explorar problemas más complejos de detección de imágenes histopatológicas. Concretamente, se utilizó una base de datos abierta que contiene imágenes de células sanguíneas con el objetivo de localizar y clasificar las células en glóbulos rojos o glóbulos blancos. Para lograr la predicción, se dividieron los datos en entrenamiento, validación y test y se empleó la arquitectura de YOLO v5.
YOLO es una red neuronal cuya primera versión apareció en 2015 y que también hemos probado en el etiquetado automático de implantes en radiografías dentales. Se basa en los siguientes pasos:
- En primer lugar, se procesa la imagen con una red neuronal convolucional para extraer sus características.
- A la imagen procesada se le aplica una cuadricula de SxS casillas. En cada una de las celdas predice N posibles bounding boxes, y calcula la probabilidad de que en cada una de ellas se encuentre el objeto.
- Después de obtener estas predicciones se procede a eliminar las cajas que estén por debajo de un umbral.
- Se eliminan posibles objetos que fueron detectados por duplicado y así se dejan únicamente los más exactos.
La curva de precisión vs sensibilidad muestra un rendimiento muy alto, superior al 90% en glóbulos rojos y entorno al 87% para glóbulos blancos, como se puede ver a continuación:
Segmentación de imágenes histopatológicas con Deep Learning
Por último, para la tarea de mayor complejidad, la de segmentación de imágenes histopatológicas, se empleó nuevamente una base de datos de imágenes de cáncer de mama, con el objetivo de delimitar las regiones que contienen células tumorales. Para lograrlo se emplea también la red YOLO v5, esta vez en su versión para segmentación. Para esta tarea el funcionamiento es similar, pero en vez de predecir cajas, se predicen polígonos que delimiten la región de interés.
Como se puede ver, la curva de precisión vs sensibilidad muestra una tasa de acierto menor en esta tarea, debido en gran medida a su complejidad y al gran número de máscaras de superficie irregular a predecir:Algunos de los resultados obtenidos en la tarea de segmentación de las imágenes histopatológicas de cáncer de mama son los siguientes:
En la imagen de la izquierda se muestra la etiqueta de la segmentación del área tumoral objetivo. Por otra parte, la imagen de la derecha muestra la predicción realizada por el modelo YOLO v5. Dado que el modelo YOLO v5 realiza automáticamente la detección asociada a la segmentación, en la imagen se muestran sombreados en rosa los polígonos irregulares que el modelo ha predicho y se dibuja un recuadro alrededor de cada uno de estos polígonos predichos.
Resultados del análisis de imágenes histopatológicas
Tras las diferentes pruebas y aplicaciones del análisis de imágenes histopatológicas con Deep Learning, se destacan los resultados prometedores en las tareas de clasificación y detección, sin embargo, se encuentran dificultades en la segmentación precisa de regiones de interés.
En cuanto a la clasificación de imágenes, la utilización de redes neuronales convolucionales ha permitido obtener altas tasas de precisión y sensibilidad en la clasificación de imágenes cancerígenas. Además, se ha demostrado que los resultados son generalizables a otras bases de datos al obtenerse buenos resultados en la validación con imágenes pertenecientes a una base de datos distinta a la del entrenamiento. Estos resultados son esperanzadores, pues la clasificación precisa puede facilitar un diagnóstico temprano y un tratamiento efectivo.
Por otro lado, en la detección de regiones de interés dentro de las imágenes histopatológicas también se han obtenido buenos resultados. La aplicación del modelo YOLO v5 ha demostrado capacidad para identificar y localizar patrones y características específicas asociadas a las células sanguíneas.
Sin embargo, a pesar de los avances en clasificación y detección, la segmentación precisa de las imágenes histopatológicas sigue siendo un desafío. Los resultados obtenidos han mostrado dificultades para delinear con precisión los contornos de las regiones de interés, lo cual puede ser debido a la complejidad y variabilidad de las estructuras histológicas. No obstante, más investigación en este campo y el uso de otras herramientas más actualizadas, como una versión superior de YOLO v8 o el nuevo Segment Anything Model (SAM) de Meta AI, podrían contribuir a mejorar el rendimiento en tareas similares.
En resumen, se han demostrado el potencial y la aplicabilidad de las tareas de clasificación y detección en imágenes histopatológicas mediante el uso de algoritmos de aprendizaje automático, mientras que se requiere una mayor optimización en las tareas de segmentación aplicadas al diagnóstico patológico. Lo cual supone un reto que nos permite seguir investigando para avanzar en un diagnóstico más rápido y preciso de algunas enfermedades.