El Instituto de Ingeniería del Conocimiento (IIC) estuvo presente en la tercera edición de Tecnoling, sesión tecnológica organizada dentro del 39º Congreso de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN).
Este evento reunió en Jaén a 18 empresas punteras en el sector de la Inteligencia Artificial y el PLN para compartir sus avances y servicios. Marta Guerrero, coordinadora de los proyectos de PLN y lingüista computacional en el IIC, fue la encargada de presentar la última versión de nuestro modelo de lenguaje en español: RigoBERTa.
Nueva versión del modelo de lenguaje RigoBERTa
Dentro de una historia de más de diez años de experiencia en PLN, hace tres que en el IIC “emprendimos la aventura de los modelos de lenguaje en español”, apuntaba Marta Guerrero, hasta desarrollar uno propio. RigoBERTa está especializado en el análisis y la comprensión del lenguaje (NLU, Natural Language Understanding), pues en la mayoría de los casos, “las empresas buscan automatizar tareas de este tipo, como la clasificación de textos o la detección de entidades”, explicó Guerrero.
Ya en su versión 2.0, el equipo de data scientists y lingüistas computacionales del IIC ha comparado RigoBERTa con los modelos disponibles en español, poniéndolo a prueba en 22 tareas con corpus del estado del arte. Los resultados han sido positivos, superándolos en la mayoría de tareas y concluyendo que los modelos específicos que se adaptan a tareas y dominios concretos son más efectivos que la Inteligencia Artificial generativa.
Además, Marta Guerrero asistió al Congreso SEPLN como miembro de la junta directiva, en calidad de delegada para la relación con la industria. Desde el año pasado, aporta su experiencia en proyectos de PLN y es punto de unión entre la asociación científica y la industria, para seguir creando comunidad y promocionando la investigación y el desarrollo del PLN.
Impulsando el PLN en español
La iniciativa Tecnoling surge alineada con el PERTE de la Nueva Economía de la Lengua, para darlo a conocer a la vez que se pone en valor el trabajo de las empresas españolas en PLN. Cristina Gallach, Comisionada Especial para la Alianza por la Nueva Economía de la Lengua, puso precisamente el foco en aprovechar esta tecnología en auge, para lo que promueven diferentes acciones y ayudas.
Actualmente, desde el PERTE están trabajando, entre otras cosas, en analizar y ampliar los corpus en español y asegurar su conexión para acceder a los diferentes recursos. Además, se han propuesto impulsar la integración del PLN en las pymes, para lo que colaboran con Enisa.
Estos eventos han sido sin duda una buena oportunidad para mostrar el potencial del PLN en nuestro idioma, reunidas las empresas nacionales más importantes del sector de las tecnologías del lenguaje. Desde el IIC, seguimos trabajando para aportar a esta comunidad y avanzar juntos en un campo fundamental para la sociedad digital.