Mucho se habla en todos los sectores de los proyectos de Big Data e Ingeniería Algorítmica como método infalible para solucionar todos los problemas de las empresas y entidades administrativas. Y no les falta razón: en un mundo tan tecnificado, donde la digitalización está cambiando la manera de diferenciarse de los demás, se está procurando no enseñar las cartas a las empresas de la competencia para conseguir unos meses de ventaja, y más si se ha apostado por una determinada tecnología para un problema concreto.
Uso eficiente de los datos
En el IIC cada día vemos problemáticas diferentes, y se pueden sacar algunas reflexiones del uso eficiente de los datos. Es fácil encontrar empresas que, con tantas ofertas y proveedores, tengan dudas de dónde poner el foco de venta, qué tecnología usar, con qué colaborador llegar a acuerdos, si el presupuesto aplicado tendrá un retorno conforme a lo previsto, etc.
A la hora de realizar un proyecto Big Data, una vez elegido un objetivo, hay variables que van cambiando, como por ejemplo aquellos datos que se han considerado fiables y que en otros momentos empiezan a generar dudas en cuanto a si son falsos positivos y superan el 10% del total, o datos cuyo significado está en constante cambio.
¿Es fácil predecir cuáles son los datos válidos? Pues no. Por ejemplo, para un proyecto Big Data de mantenimiento preventivo, si contamos con un histórico de datos de entre 12 y 24 meses será más fácil ajustar las previsiones a los resultados reales.
Tres grandes fuentes de datos en proyectos Big Data
Las fuentes de datos dependen en gran medida del objetivo del proyecto, aunque generalmente puede considerarse que hay tres grandes fuentes de datos: los datos que puedan proveer las empresas de Telecomunicación (Telcos), los obtenidos por las redes sociales, y los que puedan aportar los bancos o entidades financieras.
1. Datos de las Telcos
En España han empezado a comercializarse los datos de las empresas de Telecomunicación, pero aún hay poca experiencia en este «mercado» de datos. Posiblemente la Ley de Protección de Datos (LOPD) tenga que ver con ello, aun así no deja de ser una garantía de cara al ciudadano.
2. Datos de redes sociales
Las redes sociales, normalmente de acceso público como Twitter y LinkedIn (la última con la privacidad que cada usuario quiera darle), incorporan una gran cantidad de información, en mayor medida de carácter personal y, al igual que en el caso de las Telcos, en el tratamiento de estos datos deben seguirse las leyes de protección de datos de carácter personal. Una delgada línea, por donde se puede colar algún dato personal, separa los datos que pueden considerarse de uso público de los que no y esto obliga a extremar las precauciones. Sin embargo, es indudable que los datos de redes sociales pueden llegar a ser una fuente útil de información, no solo para Marketing a la hora de lanzar los productos, sino que incluso permitirían localizar y estudiar el movimiento de los compradores.
3. Datos de bancos y entidades financieras
Este es un caso más complejo. Las grandes entidades financieras no permiten que se cedan los datos bancarios: sólo una API confeccionada al efecto permite que un usuario o colaborador pueda acceder a determinadas informaciones filtradas. Pero mucho tienen que decir las personas del Departamento Legal en este terreno pantanoso.
Lo que sí es cierto es que si se pudieran usar las tres fuentes de datos anteriores de manera libre, mejorarían mucho las soluciones en Marketing y la Administración Pública (la Atención al Ciudadano), e incluso podrían elaborarse estudios sociosanitarios para saber qué tipo de entorno puede ser el causante de determinadas enfermedades (por ejemplo, las líneas de alta tensión sobre los ciudadanos). Por supuesto que hay más fuentes de datos, pero aquí solo he querido incluir las que más guerra van a dar en los próximos meses.
Son muchas las variables que hay que tener en cuenta a la hora de afrontar un proyecto Big Data y no es fácil decidirse por ellas. Por eso, como consejo diría que es mejor confiar en empresas que lleven tiempo en el análisis de datos y que puedan aportar esa experiencia demostrada con proyectos Big Data que aporten los mejores beneficios.