La inevitable transformación digital, la integración de la tecnología en nuestro día a día, sus ventajas y la colaboración que permite han hecho que cada vez más investigadores y profesionales aprovechen también las capacidades de la nube. Además, la necesidad de algunas empresas e instituciones de extraer valor de grandes volúmenes de datos ha hecho aumentar la demanda de las tecnologías Cloud, viéndolas como una opción para no hacer grandes desembolsos en hardware.
Para mostrar las ventajas de la nube y algunos casos de éxito, Amazon Web Services (AWS) ha organizado varios seminarios bajo el título Acelerando la investigación e innovación con la nube de AWS. En el primero de ellos, sobre Los beneficios de la nube para la investigación, ha participado Rubén García, ingeniero de datos en el Instituto de Ingeniería del Conocimiento (IIC).
El experto expuso algunos casos de cómo utilizan los servicios y herramientas de AWS para desarrollar algunos de los proyectos e investigaciones del IIC, útiles cuando se trabaja con Big Data, analizando datos de muchos sectores y formatos. “La capacidad de nuestros servidores a veces no es suficiente para tratar y analizar tales volúmenes de datos y nos tenemos que apoyar en la nube de AWS para ayudarnos en algunas tareas”, explicó Rubén García.
Casos de uso de la nube AWS en el IIC
Los proyectos del IIC son un buen ejemplo de cómo la nube puede servir para la investigación y la innovación. Actualmente, por ejemplo, se trabaja en la investigación de modelos de lenguaje en español con RigoBERTa.
Modelo de lenguaje en español RigoBERTAEn este campo, y dada su gran evolución con los Transformers y BERT de Google, se necesitan modelos cada vez más grandes, con muchos parámetros, donde cada vez se necesitan mayores corpus, de más calidad y, por tanto, más hardware. Además, en el caso del IIC, se está apostando por la adaptación de estos modelos a diferentes dominios con corpus añadidos, como es el caso del primer modelo de lenguaje en español para el sector legal.
Por todo esto y el gran volumen de datos necesario, la nube es un buen apoyo en estos proyectos de investigación. Los expertos del IIC están utilizando para ello Amazon EMR en la limpieza de datos y EC2 para el entrenamiento de los modelos.
También los productos y servicios consolidados pueden pasarse a la nube. Es el caso de la predicción de producción de energía eólica que el IIC lleva tiempo ofreciendo a los agentes y operadores que necesitan saber cuánta energía van a generar para ofertarla al mercado eléctrico o acometer acciones de mantenimiento.
EA3 es un sistema que aprende de datos meteorológicos y de los parques eólicos, tanto históricos como recientes. Dado el crecimiento de estos datos, se ha migrado este servicio a la nube, por el ahorro de costes y la facilidad de gestión, pudiendo emitir las predicciones casi en tiempo real. En este caso, los expertos utilizan servicios serverless de AWS: RDS para trabajar con bases de datos relacionales y Lambda para no preocuparse por el hardware.