Desde el IIC, lanzamos por primera vez en abierto la nueva versión de nuestro modelo de lenguaje generativo: RigoChat-v2. Este está entrenado específicamente para el español y consigue, de media, mejoras apreciables en diferentes tareas de generación del lenguaje y, en especial, en los casos de uso con sistemas de RAG (Retriever Augmented Generation).
Acorde a nuestro compromiso con la investigación en Procesamiento del Lenguaje Natural (PLN), en su liberación, apostamos por un modelo open-weights de uso libre para fines de investigación y no comerciales. Del mismo modo, ofrecemos la opción de integrarlo en proyectos con objetivos comerciales a través de nuestra API. En este post, os contamos las ventajas que ofrece RigoChat-v2 y dónde está disponible.
Novedades de RigoChat-v2
En el IIC, llevamos desde 2020 desarrollando recursos de PLN en español y hace justo un año que apostamos por la IA generativa, lanzando nuestra propia línea de modelos de lenguaje adaptados a resolver tareas del español mediante instrucciones escritas en lenguaje natural. Hemos seguido trabajando en ello hasta llegar a RigoChat-v2, un modelo abierto de 7 mil millones de parámetros que ofrece varias mejoras:
- Mejora del rendimiento y la robustez del modelo en tareas de PLN generalistas en español.
- Mayor seguridad y reducción de las alucinaciones en los sistemas de RAG con textos en español.
- Posibilidad de utilizarlo en diferentes requisitos de hardware, especialmente en aquellos con capacidad computacional reducida.
Por otro lado, aunque esta segunda versión de RigoChat se puede utilizar en diversas aplicaciones de generación del lenguaje, recomendamos su uso especialmente en sistemas de RAG por su entrenamiento y adaptación específicos para esta tarea. En concreto, se han utilizado una combinación de corpus diseñados en el IIC tanto para la fase de entrenamiento como la de evaluación.
Primeros resultados de RigoChat-v2
Algunas de las evaluaciones que hemos hecho internamente para medir el rendimiento de RigoChat-v2 y, en comparación, de otros modelos públicos se pueden encontrar en el siguiente gráfico de barras.

CLICK PARA AMPLIAR LA TABLA. Tabla de evaluaciones para medir el rendimiento de RigoChat-v2 con otros modelos públicos. Para mayor claridad, el eje de puntuación va de 55 a 80.
Las primeras columnas hacen referencia al rendimiento medio que obtiene cada modelo, mientras que el resto son tareas específicas en español diseñadas en el IIC, siendo las dos primeras públicas (disponibles dentro de nuestro repositorio de Hugging Face) y el resto privadas. Vemos que RigoChat-v2 es, en términos generales, superior a otros modelos de tamaño similar.
¿Dónde está disponible RigoChat-v2?
Si te interesa probar nuestro modelo de lenguaje generativo RigoChat-v2, este está disponible en versión open-weights –limitada a fines de investigación y no comerciales – en el perfil público de Hugging Face del IIC. Si necesitas utilizarlo con fines comerciales, puedes ponerte en contacto con nosotros o utilizarlo a través del servicio que ofrecemos en AWS Marketplace.
Me interesa RigoChat-v2
Los modelos propios del IIC pueden adaptarse a distintos dominios y/o sectores para que sean más eficientes, reentrenándolos con corpus específicos y representativos. Ofrecemos nuestra metodología y experiencia en PLN para alinearlos según las necesidades de cada organización.