La incorporación de las nuevas tecnologías es una de las prioridades para muchas organizaciones. Entre los retos, hay que combatir su infrautilización, conociendo sus rangos de aplicación y las ventajas que puede aportar al negocio, y guiar al resto de la plantilla en la puesta en marcha de proyectos innovadores.
Conocer cómo funciona la Inteligencia Artificial, por ejemplo, es el primer paso para aplicarla con éxito en cualquier ámbito y aprovechar su potencial: desde la mejora de los procesos a las nuevas oportunidades de negocio.
Por ello, Álvaro Barbero, Chief Data Scientist en el Instituto de Ingeniería del Conocimiento (IIC), introdujo diferentes conceptos y compartió algunos casos de uso reales en la tercera sesión del curso Tech For Business organizado por APD. Una clase para entender las bases del algoritmo que derrotó al campeón de Go, del traductor de Facebook o de algunos coches autónomos.
¿Cómo funciona un sistema de Machine Learning?
La Inteligencia Artificial aprende con ejemplos. Más bien miles y miles de ejemplos que son la base de los sistemas de Machine Learning o aprendizaje automático. Estos modelos no necesitan reglas directas o una programación específica, sino que trabajan con datos que reflejan el problema que queremos resolver.
Con esta información, harán predicciones o tomarán decisiones. Por ello, los modelos serán aplicables a negocios de cualquier sector que dispongan de los datos necesarios.
La importancia de los datos en Machine Learning
Un proyecto de Machine Learning no puede arrancar sin preparar los datos, una fase que se lleva la mayor parte del tiempo. Tratar los datos, eliminar los antiguos, los incompletos o los erróneos es esencial, ya que es la información con la que va a aprender el modelo.
Tras la revisión de los datos, se organizan para facilitar ese aprendizaje automático. En concreto, se dan datos que reflejen las decisiones que se han tomado respecto a unas variables concretas. Es decir, se entrena el modelo con pares de entrada y salida del sistema, ejemplos de las decisiones que después tendrá que tomar automáticamente. Este modelo descubrirá patrones y relaciones que no son obvias entre los datos para tomar una decisión. Más técnicamente: este modelo será una función flexible que, dependiendo de los parámetros configurados, generará salidas distintas cuando reciba una misma entrada.
Es en la fase de entrenamiento cuando el sistema va a ir probando y cambiando esos parámetros con la información dada, para determinar qué combinación necesita para tomar las decisiones adecuadas.
Tras esta preparación, se puede plantear: ¿cuánto va a gastar un cliente en mis productos en base a su gasto pasado? Si recojo y preparo los datos adecuados, el modelo hará una predicción.
Sin embargo, el sistema puede pasarse de listo y aprender los datos y ejemplos de memoria. En este caso, denominado “sobreajuste”, cuando llega un cliente diferente, no sabe qué hacer y se equivoca. Para elegir el modelo adecuado, se lleva a cabo un proceso de validación en el que se utiliza solo una parte de los datos para crear el modelo y se guarda el resto para ponerlo a prueba, es decir, para ver cómo funciona e ir ajustándolo.
Y es que crear un sistema de Machine Learning no consiste en crear un solo modelo, sino que hay que ir probándolo para adaptarlo a los datos reales de cada organización y actualizándolo con nueva información para que aborde la problemática actual.
Modelos de caja negra en Machine Learning
Como vemos, un sistema de Machine Learning se basa en muchos y buenos datos y un modelo que se crea a partir de ejemplos. Sin embargo, la función generada puede ser tan complicada que muchas veces no la podemos explicar. Por ello, en ocasiones se los denomina “modelos de caja negra”.
La forma de conseguir un modelo se parece a la estadística clásica en muchos aspectos, aunque funciona a la inversa. En vez de partir de una hipótesis que se corrobora con datos, se utilizan estos directamente para determinar cuáles son las decisiones adecuadas en cada caso. Es decir, se parte de los datos de una tarea que queremos automatizar o un proceso de negocio para que el algoritmo determine qué tipo de público va a comprar un producto, por ejemplo.
Todo ello sin saber cómo obtiene estos resultados o por qué toma las decisiones que toma. Algo que parece ir en contra de los modelos explicables exigidos por regulación en algunos sectores a la hora de aplicar Inteligencia Artificial. En estos casos, hay que construir modelos más sencillos que puede que no obtengan el mejor resultado.
En esta disyuntiva, hay que tener en cuenta que no poder explicar las decisiones que toma una máquina no significa que no lo haga correctamente. La clave está en validar los resultados, probar el modelo con muchos datos para tener la garantía estadística de que funciona.
Aprendizaje profundo: un aprendizaje por capas
Las denominadas redes neuronales artificiales llevan este aprendizaje a otro nivel. Siendo una forma particular de Machine Learning –observan datos y variables para luego tomar una decisión o hacer una predicción–, podemos abordar problemas más complejos partiendo de todo tipo de datos: imágenes, texto, vídeos, etc.
El Deep Learning o aprendizaje profundo, basado en estas redes, es un aprendizaje por capas, que tiene en cuenta muchas más variables y patrones. Son varias las neuronas que procesan los datos de entrada para tomar una decisión, y es una segunda capa la que maneja estos resultados para tomar una decisión más compleja al tener en cuenta lo detectado por la anterior. Y así sucesivamente, independientemente del número de capas, obteniendo un resultado cada vez más preciso.
Ahora el sistema es mucho más complejo y tiene muchos parámetros que ajustar, pero el proceso de aprendizaje es el mismo: ir haciendo pequeñas modificaciones a los parámetros en aquella dirección que reduzca el error que pueda cometer la red neuronal en sus decisiones. Al final, todo consiste en redefinir, paso a paso, los modelos con información actualizada, para que sus predicciones sean mejores con los datos que tengo.
El aprendizaje automático y el aprendizaje profundo es base de aplicaciones de IA en diferentes sectores, que pueden convertirse en oportunidades de negocio. Desde un sistema para obtener la probabilidad de que un candidato pase un proceso de selección hasta el análisis de texto en el ámbito legal o el de la salud.
Recursos gráficos Freepik.