Modelo de lenguaje generativo en español: RigoChat

Modelo de lenguaje generativo en español: RigoChat

Una nueva tecnología para responder a instrucciones y preguntas de diferentes sectores

RigoChat
RigoChat

¿Qué es RigoChat?

RigoChat es la línea de modelos de lenguaje generativos en español del IIC, entrenados tanto para responder a instrucciones complejas como para mantener conversaciones coherentes y consistentes con el usuario.

Los modelos RigoChat son capaces de abordar distintas tareas de generación del lenguaje (Natural Language Generation, NLG) o implementación de chatbots, por ejemplo. Además, pueden adaptarse a distintos dominios para que sean más eficientes, reentrenándolos con corpus específicos y representativos a través de una metodología propia.

Desde el IIC, apostamos por la inteligencia artificial generativa partiendo de nuestra experiencia con el modelo de comprensión del lenguaje RigoBERTa y toda la investigación realizada en este ámbito desde 2020. Como centro de innovación, nuestro objetivo es contribuir al Procesamiento del Lenguaje Natural (PLN) en nuestro idioma, con el apoyo de la Cátedra UAM-IIC de Lingüística Computacional.

RigoChat ha sido entrenado con grandes cantidades de texto en español, lo que permite al modelo aprender patrones lingüísticos, estructuras gramaticales y diversos estilos de comunicación. Con este entrenamiento, RigoChat puede generar respuestas coherentes y pertinentes a una amplia gama de preguntas e instrucciones sobre diferentes temas.

El funcionamiento de RigoChat se basa en analizar y comprender el contexto de cada interacción. Cuando un usuario escribe una instrucción o realiza una pregunta, el modelo procesa el texto, evalúa su significado y genera una respuesta adecuada. Este proceso implica no solo reconocer las palabras y frases clave, sino también entender las intenciones subyacentes y las implicaciones contextuales.

Crear modelo del lenguaje

¿Cómo funciona un modelo de lenguaje generativo?

Un modelo de lenguaje generativo, como RigoChat, funciona en base a algoritmos avanzados de inteligencia artificial y aprendizaje profundo.

¿Quieres que te contemos las posibilidades de RigoChat en tu organización?

QUIERO SABER MÁS

Potencial y aplicaciones de RigoChat

Aunque las aplicaciones de RigoChat son prácticamente ilimitadas, aquí ofrecemos algunas de las posibles formas en que las organizaciones pueden utilizar y aportar valor a sus clientes con estos modelos de lenguaje generativos:

Automatización de respuestas en atención al cliente

RigoChat puede integrarse en sistemas de atención al cliente para proporcionar respuestas automáticas a preguntas frecuentes, reduciendo tiempos de espera y aumentando la eficiencia.

Integración en Sistemas de RAG para búsqueda de información interna

Ideal para empresas con grandes bases de datos o documentación extensa, RigoChat puede buscar y recuperar información específica, facilitando tareas como la localización de políticas internas o detalles de productos.

Chatbots personalizados para interacciones online

RigoChat puede ser la base para desarrollar chatbots personalizados que interactúen con clientes en sitios web corporativos, ofreciendo asistencia en tiempo real y guiándolos a través de procesos de compra o resolviendo dudas sobre los servicios.

Análisis y generación de informes

Utilizando RigoChat, las empresas pueden analizar comunicaciones o feedbacks de clientes para generar informes automatizados sobre tendencias, inquietudes comunes o áreas de mejora.

Búsqueda compleja de Información en sectores especializados

Combinado con modelos de búsqueda semántica, RigoChat puede realizar búsquedas, analizar y comprender una gran cantidad de documentación en sectores como el legal. Esto permite a los profesionales del derecho realizar consultas sobre casos que involucran múltiples documentos, interpretando y relacionando información de diferentes fuentes para ofrecer una visión más integral.

Desarrollo y resultados del modelo de lenguaje generativo: RigoChat

Con el fin de comparar el rendimiento de RigoChat con el de otros modelos similares del mercado, los hemos probado en dos tareas de respuesta generativa a preguntas para diferentes dominios (seguros y casos clínicos), ya que es una de las principales aplicaciones de este tipo de modelos.

Detrás del desarrollo de los modelos RigoChat está el equipo multidisciplinar del IIC, formado sobre todo por data scientists expertos en PLN y lingüistas computacionales, que se encargan de mantenerlo actualizado con las últimas investigaciones y técnicas.

Los resultados de la tabla muestran que, en general, los modelos RigoChat presentan un rendimiento elevado en ambas tareas, muy cerca del de GPT-4 e incluso superándolo en una de ellas.


ModeloSeguros Vivienda QACasos Clínicos QAMedia
GPT-469%73%71%
RigoInstructChat66%73%69.5%
RigoChatQA62%73%67.5%
ChatGPT (GPT-3.5-turbo)63%71%67%
RigoInstructChat-long56%77%66.5%
MetaChat-70B63%61%62%
RigoInstruct60%54%57%
lince-mistral-7b-it-es59%58%58.5%
lince-zero54%37%45.5%

Además, apostamos por que nuestros modelos puedan integrarse en los propios servidores e infraestructuras de las organizaciones que quieran darles uso, preservando así la confidencialidad y privacidad de sus datos.

RigoChat es el modelo de lenguaje generativo del IIC. Forma parte de la línea de modelos y recursos en la que empezamos a trabajar en 2020 para desarrollar y adaptar distintas soluciones de PLN en español.

RigoBERTa

Modelos del lenguaje fundacionales de comprensión del español.

RigoBERTa

RigoCORPUS

Gran corpus curado para entrenamiento de modelos fundacionales.

RigoCHAT

Modelos de lenguaje generativos en español.

RigoExtensions

Adaptaciones de RigoBERTa  a dominios o casos de uso concretos y modelos de embeddings.

Contacta con nosotros


    He leído y acepto las condiciones de uso y la política de privacidad*.

     Sí deseo recibir comunicaciones comerciales.

     

    Información básica sobre Protección de Datos

    • Responsable: Asociación para el Desarrollo de la Ingeniería del Conocimiento.

    • Dirección: Ctra. de Colmenar Viejo, km.15, Calle Francisco Tomás y Valiente 11; EPS, Edificio B, 5ª planta; 28049 Madrid.

    • Teléfono: 914972323

    • Correo electrónico: contacto.iic@iic.uam.es

    • Delegado de Protección de Datos: dpd@iic.uam.es


    En nombre de Asociación para el Desarrollo de la Ingeniería del Conocimiento, tratamos la información que nos facilita con el fin de dar respuesta a la solicitud realizada por usted en relación con los servicios que prestamos y los productos que suministramos. Los datos proporcionados se conservarán mientras se mantenga el contacto, siendo eliminados una vez finalizada la solicitud. Los datos no se cederán a terceros salvo en los casos en que exista una obligación legal. Usted tiene derecho a obtener confirmación sobre si en Asociación para el Desarrollo de la Ingeniería del Conocimiento estamos tratando sus datos personales, por tanto, tiene derecho a acceder a sus datos personales, rectificar los datos inexactos o solicitar su supresión cuando los datos ya no sean necesarios. Asimismo, podrá oponerse al tratamiento de sus datos, solicitar la limitación al tratamiento y la portabilidad de sus datos. Si considera que sus datos personales no han sido tratados conforme a la normativa, puede contactar con derechosrgpd@iic.uam.es. Asimismo, podrá presentar una reclamación ante la Agencia Española de Protección de Datos, especialmente cuando no haya obtenido la satisfacción en el ejercicio de sus derechos, a través de la sede electrónica en www.aepd.es.


    Asimismo, se desean utilizar sus datos para ofrecerle productos y servicios relacionados con los solicitados por Usted, por cualquier medio, incluido el electrónico, incluso una vez terminada la relación negocial/contractual.