RigoChat-v2: adaptando LLMs al español con fines prácticos y recursos limitados
De la necesidad de contar con grandes modelos de lenguaje (LLMs) competitivos en nuestro idioma, tanto de forma general como en dominios más específicos, surge RigoChat-v2, el modelo de lenguaje generativo en español del IIC. En su desarrollo, investigamos diferentes metodologías para adaptar modelos existentes a varios casos de uso, especialmente relacionados con sistemas de RAG. El objetivo era, a la vez, reducir el coste en tiempo y recursos que normalmente acompaña a la construcción de estos enormes modelos sin comprometer los resultados. A lo largo de este post y de una segunda entrega que destaca el trabajo con los corpus vamos a ir explicando algunos de los procesos que hemos seguido para obtener RigoChat-v2, y sobre todo los resultados finales de su evaluación en comparación con otros modelos de lenguaje del estado del arte. Sirva como adelanto del artículo científico que publicaremos próximamente y que explicará más rigurosamente estos y algunos pasos intermedios que no vamos a exponer aquí. ¿Por qué reentrenar modelos de lenguaje? El caso de RigoChat-v2 Desarrollar un modelo de lenguaje o LLM desde cero, o simplemente utilizarlo cuando queremos aplicarlo a un caso de uso concreto, puede presentar varias dificultades. El principal problema de los … Sigue leyendo RigoChat-v2: adaptando LLMs al español con fines prácticos y recursos limitados
Copia y pega esta URL en tu sitio WordPress para incrustarlo
Copia y pega este código en tu sitio para incrustarlo