Anotación de corpus lingüísticos: metodología utilizada en el IIC

Dentro del marco de la Inteligencia Artificial (IA), el Procesamiento del Lenguaje Natural (PLN), sea en su forma escrita u oral, presta especial atención al estudio de los fenómenos lingüísticos, sobre todo en los datos no estructurados, y a la forma en la que se realiza la comunicación humana con el fin de desarrollar soluciones prácticas que simulen las capacidades humanas cognitivas, especialmente en lo que se refiere a la comprensión y la generación del lenguaje. Actualmente, los avances de PLN están estrechamente ligados a la Inteligencia Artificial y el entrenamiento de modelos de Machine Learning. Por ello, la demanda de corpus lingüísticos anotados que puedan servir de base para el entrenamiento de esos modelos está en auge. Con este white paper sobre anotación de corpus lingüísticos, pretendemos detallar la metodología utilizada en el Instituto de Ingeniería del Conocimiento (IIC) para la anotación de corpus. Primero, mediante la introducción, se define qué es un corpus anotado y las tipologías que existen. White Paper sobre «Anotación de corpus lingüísticos: metodología utilizada en el IIC» El siguiente apartado explica la metodología MATTER, conocida y seguida en muchos procesos de anotado. A continuación, nos acercamos a la construcción del modelo de anotación y … Sigue leyendo Anotación de corpus lingüísticos: metodología utilizada en el IIC