El Big data está cambiando nuestra forma de ver la vida, y, por extensión, la forma de tratar la información en las organizaciones. Los datos se están convirtiendo en un elemento clave: tratar y transformar los datos en valor está siendo cada vez un factor más determinante que diferenciará a las empresas de éxito frente a las que se quedan atrás.
El mapeo semántico y el aprendizaje profundo
A este respecto, una de las principales promesas de Big Data ha sido el poder de abordar fuentes heterogéneas de datos. Los datos no estructurados como imágenes, el lenguaje natural o los videos acabarían siendo analizados con la misma facilidad que los datos estructurados tradicionales. Pero los datos no estructurados no se pueden procesar directamente mediante el análisis de datos estándar y los métodos de aprendizaje automático, requiere un paso intermedio para transformarlo en una representación estructurada. Este paso intermedio suele depender de la aplicación que se le quiera dar, y requiere contar con el tiempo de expertos en imágenes, video o lenguaje para lograr resultados óptimos.
Una tendencia creciente en el aprendizaje automático para superar este problema es hacer uso del mapeo semántico. Técnicas como «word2vec», redes neuronales convolucionales profundas y redes recurrentes han producido resultados sorprendentes en la comprensión semántica de palabras, frases o documentos, y en tareas de muy alto nivel como la representación de estilos artísticos. Más importante aún, la mayoría de estas técnicas funcionan de manera no supervisada, permitiendo la creación de poderosos intérpretes semánticos de grandes corpus sin etiqueta de documentos o imágenes, encontrando aplicaciones prácticas en la traducción automática, la generación de lenguaje y los chatbots, o dando lugar a nuevas aplicaciones tan sorprendentes como la generación automatizada de subtítulos de imagen.
El IIC en Big Data Spain 2016
Con el objetivo de mostrar la capacidad de dar valor en tiempo real y de predecir y ahorrar costes y tiempo en otros procesos, se presentó en noviembre la quinta edición de Big Data Spain, donde participó Álvaro Barbero, Chief Data Scientist del Instituto de Ingeniería del Conocimiento e investigador del Grupo de Machine Learning de la Universidad Autónoma de Madrid, con la charla «From data to numbers to knowledge: semantic embeddings», en la explicó por qué el mapeo semántico y el aprendizaje profundo están cambiando cómo se procesan el texto y las imágenes.
Este evento contó con ponentes nacionales e internacionales, que pusieron al día a los asistentes sobre las últimas tendencias en Analítica, Cloud, IoT y Machine Learning. Big Data Spain convirtió a Madrid en capital del Big Data, y sirvió de punto de encuentro e intercambio de conocimiento para los expertos en tecnología, inversores, directivos, etc., que acudieron al evento, que tuvo lugar en Kinépolis Madrid en la Ciudad de la Imagen los días 17 y 18 de noviembre.