Una nueva tecnología para responder a instrucciones y preguntas de diferentes sectores
¿Qué es RigoChat?
RigoChat es la línea de modelos de lenguaje generativos en español del IIC, entrenados tanto para responder a instrucciones complejas como para mantener conversaciones coherentes y consistentes con el usuario.
Los modelos RigoChat son capaces de abordar distintas tareas de generación del lenguaje (Natural Language Generation, NLG) o implementación de chatbots, por ejemplo. Además, pueden adaptarse a distintos dominios para que sean más eficientes, reentrenándolos con corpus específicos y representativos a través de una metodología propia.
Desde el IIC, apostamos por la inteligencia artificial generativa partiendo de nuestra experiencia con el modelo de comprensión del lenguaje RigoBERTa y toda la investigación realizada en este ámbito desde 2020. Como centro de innovación, nuestro objetivo es contribuir al Procesamiento del Lenguaje Natural (PLN) en nuestro idioma, con el apoyo de la Cátedra UAM-IIC de Lingüística Computacional.
RigoChat ha sido entrenado con grandes cantidades de texto en español, lo que permite al modelo aprender patrones lingüísticos, estructuras gramaticales y diversos estilos de comunicación. Con este entrenamiento, RigoChat puede generar respuestas coherentes y pertinentes a una amplia gama de preguntas e instrucciones sobre diferentes temas.
El funcionamiento de RigoChat se basa en analizar y comprender el contexto de cada interacción. Cuando un usuario escribe una instrucción o realiza una pregunta, el modelo procesa el texto, evalúa su significado y genera una respuesta adecuada. Este proceso implica no solo reconocer las palabras y frases clave, sino también entender las intenciones subyacentes y las implicaciones contextuales.
¿Cómo funciona un modelo de lenguaje generativo?
Un modelo de lenguaje generativo, como RigoChat, funciona en base a algoritmos avanzados de inteligencia artificial y aprendizaje profundo.
¿Quieres que te contemos las posibilidades de RigoChat en tu organización?
Potencial y aplicaciones de RigoChat
Aunque las aplicaciones de RigoChat son prácticamente ilimitadas, aquí ofrecemos algunas de las posibles formas en que las organizaciones pueden utilizar y aportar valor a sus clientes con estos modelos de lenguaje generativos:
Automatización de respuestas en atención al cliente
RigoChat puede integrarse en sistemas de atención al cliente para proporcionar respuestas automáticas a preguntas frecuentes, reduciendo tiempos de espera y aumentando la eficiencia.
Integración en Sistemas de RAG para búsqueda de información interna
Ideal para empresas con grandes bases de datos o documentación extensa, RigoChat puede buscar y recuperar información específica, facilitando tareas como la localización de políticas internas o detalles de productos.
Chatbots personalizados para interacciones online
RigoChat puede ser la base para desarrollar chatbots personalizados que interactúen con clientes en sitios web corporativos, ofreciendo asistencia en tiempo real y guiándolos a través de procesos de compra o resolviendo dudas sobre los servicios.
Análisis y generación de informes
Utilizando RigoChat, las empresas pueden analizar comunicaciones o feedbacks de clientes para generar informes automatizados sobre tendencias, inquietudes comunes o áreas de mejora.
Búsqueda compleja de Información en sectores especializados
Combinado con modelos de búsqueda semántica, RigoChat puede realizar búsquedas, analizar y comprender una gran cantidad de documentación en sectores como el legal. Esto permite a los profesionales del derecho realizar consultas sobre casos que involucran múltiples documentos, interpretando y relacionando información de diferentes fuentes para ofrecer una visión más integral.
Desarrollo y resultados del modelo de lenguaje generativo: RigoChat
Con el fin de comparar el rendimiento de RigoChat con el de otros modelos similares del mercado, los hemos probado en dos tareas de respuesta generativa a preguntas para diferentes dominios (seguros y casos clínicos), ya que es una de las principales aplicaciones de este tipo de modelos.
Detrás del desarrollo de los modelos RigoChat está el equipo multidisciplinar del IIC, formado sobre todo por data scientists expertos en PLN y lingüistas computacionales, que se encargan de mantenerlo actualizado con las últimas investigaciones y técnicas.
Los resultados de la tabla muestran que, en general, los modelos RigoChat presentan un rendimiento elevado en ambas tareas, muy cerca del de GPT-4 e incluso superándolo en una de ellas.
Modelo | Seguros Vivienda QA | Casos Clínicos QA | Media |
---|---|---|---|
GPT-4 | 69% | 73% | 71% |
RigoInstructChat | 66% | 73% | 69.5% |
RigoChatQA | 62% | 73% | 67.5% |
ChatGPT (GPT-3.5-turbo) | 63% | 71% | 67% |
RigoInstructChat-long | 56% | 77% | 66.5% |
MetaChat-70B | 63% | 61% | 62% |
RigoInstruct | 60% | 54% | 57% |
lince-mistral-7b-it-es | 59% | 58% | 58.5% |
lince-zero | 54% | 37% | 45.5% |
Además, apostamos por que nuestros modelos puedan integrarse en los propios servidores e infraestructuras de las organizaciones que quieran darles uso, preservando así la confidencialidad y privacidad de sus datos.
RigoChat es el modelo de lenguaje generativo del IIC. Forma parte de la línea de modelos y recursos en la que empezamos a trabajar en 2020 para desarrollar y adaptar distintas soluciones de PLN en español.
RigoBERTa
Modelos del lenguaje fundacionales de comprensión del español.
RigoCORPUS
Gran corpus curado para entrenamiento de modelos fundacionales.
RigoCHAT
Modelos de lenguaje generativos en español.
RigoExtensions
Adaptaciones de RigoBERTa a dominios o casos de uso concretos y modelos de embeddings.