Uno de los conceptos más de moda en el mundo 2.0 es el Big Data. Sin embargo, este concepto lleva muchos años entre nosotros. Seguro que has oído hablar del análisis de datos, o el procesamiento de la información. No podemos perder de vista el gran desconcierto que existe sobre «en qué consiste» eso del Big Data, así que si te suena y no tienes claro el significado, te ayudamos a entenderlo.
Pero primero, vamos a empezar desde la base, definiendo el concepto de Big Data.
¿Qué es el Big Data?
Big Data es un término aplicado a volúmenes de datos que superan la capacidad de análisis de un software convencional para ser capturados, gestionados y procesados en un tiempo razonable. En resumidas cuentas, es un volumen tan grande de datos que la herramienta Excel de Windows se queda pequeña.
Es una idea considerablemente nueva, pero cuyo auge está en aumento debido a la gran importancia e influencia en el mundo empresarial. Se dice que el Big Data es el “sistema nervioso de la tierra”, y tiene la capacidad de extractar y examinar todo lo que está ocurriendo en el mundo a tiempo real.
Actualmente, la gran mayoría de nosotros estamos conectados a nuestro Smartphone a diario, y todo el volumen de datos que generamos al usar una sola aplicación es infinito. Todos estos datos son rastreados, conectados y analizados para sacar conclusiones: cuáles son nuestros gustos, intereses, aficiones…
Tal y como lo conocemos hoy en día, el Big Data transformará, en un futuro no muy lejano, nuestras ciudades, gestionando el tráfico, nuestros hábitos de vida y nuestra manera de relacionarnos con el entorno que nos rodea.
¿Qué incluye el Big Data?
Ahora que ya sabemos lo que significa Big Data, debemos entender qué conlleva el análisis de datos y cuáles de estos datos pueden ser útiles para las compañías:
- Datos estructurados. Son datos personales que, por lo general, recoge una empresa a través de una transacción económica (por ejemplo, cuando recibimos nuestra nómina o sacamos dinero del cajero), contratación de un servicio (por ejemplo, cuando contratamos una tarifa especial cuando viajamos al extranjero). Son también datos estructurados aquellos que una empresa recoge cuando realiza una campaña de marketing. Son datos que se conocen de manera ordenada: nombre, fecha de nacimiento, dirección de nuestro domicilio, etc.
- Datos no estructurados. Son aquellos datos que no siguen ningún orden, pero que contienen una información muy valiosa, como son las interacciones que recibimos en nuestro perfil personal en las Redes Sociales: Me gusta que damos en Facebook a una publicación relacionada con nuestra serie de televisión favorita, perfiles a los que seguimos en Twitter (por ejemplo, si un porcentaje alto de las personas a las que sigues son jugadores de fútbol, puede decirse que te gusta dicho deporte); así igual si compartes, comentas, etc.
Así, vemos cómo toda la información que manejamos en Internet puede ser muy útil para las empresas, pudiendo llegar a conocer todo sobre nuestra personalidad y nuestros gustos.
Estrategia de Big Data para principiantes
Llegados a este punto, cualquier principiante (incluso compañía) que quiera llevar a cabo una estrategia de Big Data, debe saber identificar tres fases que han de cumplirse en estos procesos:
Almacenamiento de los datos
Esta fase incluye datos efectivos y necesidades futuras. Es importante completar este paso con datos rigurosos, es decir, procesados. Para ello, necesitamos tener un hardware y software que nos permita el almacenamiento de dichos datos con el fin de que sean accesibles y disponibles evitando posibles problemas de almacenaje.
Procesamiento de los datos
En este paso es necesario contar con herramientas de procesamiento de datos que permitan operar con grandes volúmenes de datos en tiempo real. Para ello, se debe llegar a un acuerdo en cuanto a la estructura de la organización, herramientas, tecnología y personas necesarias para ejecutar todo el procesamiento de la información. Debemos conocer muy bien nuestra empresa, y su capacidad de respuesta, antes de acometer un proyecto de este tipo. Para ello, debemos determinar unos objetivos para, posteriormente, analizar si se han cumplido: ¿Qué clase de estructura de datos queremos? ¿Cuántos niveles va a tener y en cuánto tiempo debe ser construido? Debemos crear un calendario, un período de tiempo tras el cual vamos a necesitar un nuevo dato.
Análisis de los datos recogidos
En este último paso, hay que prestar especial atención a los algoritmos, analíticas y métodos que utilizaremos en el procesamiento de la información. Debemos analizarlos para sacar información de valor para el negocio, sacar conclusiones y así poder tomar decisiones al respecto.
Las cuatro «V» del Big Data a tener en cuenta
Son muchas las teorías que hablan de las “V’s” del Big Data. Aunque en la actualidad no se sabe a ciencia cierta cuántas son, en este post nos centraremos en cuatro, aunque si deseas ampliar más información puedes leer Las 7 V del Big Data.
Volumen de la información
No te sorprendas cuando escuches que el Big Data no es más que Business Intelligence a lo grande. Sin las “V´s” restantes, seguiríamos hablando de inteligencia de negocio más tradicional, con una diferencia: cantidades de datos mucho mayores. En cualquier caso, los volúmenes de información disponible de los que disfrutamos actualmente suponen retos técnicos y analíticos.
Según las previsiones de Gartner, en 2020 más de 25 mil millones de dispositivos estarán conectados a Internet. Según los pronósticos, se multiplicarán por 10 en tan solo 4 años, un crecimiento exponencial del volumen de datos contenidos que dará lugar a una potenciación en el mundo del Big Data.
Variedad de los datos
Cuando hablamos de variedad de datos, nos referimos a los diferentes formatos de ficheros que podemos encontrar en un mismo almacenamiento de información. Hoy por hoy, cada acción de nuestros clientes, competidores o proveedores genera infinidad de información: desde datos estructurados y fáciles de tramitar hasta información no estructurada en forma de documentos, vídeos o mensajes de email.
Cada tipo de información demandará un procedimiento distinto y, probablemente, herramientas específicas, pero sin la capacidad de combinar y fusionar unos y otros, no tendremos una estrategia estable de Big Data.
Velocidad
Hace alusión al tiempo que se requiere para tener acceso a la información que generamos y posteriormente, almacenamos, sobre todo, por la velocidad con la que ocurre, tanto la generación de información en un periodo de tiempo muy corto, como la velocidad con la que hay que analizarla y, sobre todo, reaccionar.
Valor de los datos
Es el beneficio que resulta al procesar los volúmenes de información. Este aspecto tiene gran relevancia a nivel empresarial, ya que el análisis de la información contenida en el análisis de datos es el que necesitamos para gestionar nuestra toma de decisiones.
En un entorno Big Data, tener mayor variedad de datos implica mayor incertidumbre sobre la calidad de cada dato y su disponibilidad futura, así como sobre las nuevas fuentes de datos con las que tendremos que contar más adelante.
Esperamos que después de leer este post te hayamos despejado alguna duda y despertado alguna inquietud sobre el Big Data. No obstante, si eres principiante en esto del Big Data, nosotros te podemos ayudar en tus proyectos para analizar datos y tomar la mejor solución para tu negocio o empresa.
Me ha interesado mucho la explicacion de Big Data, me interesa aprender y conocer mas de esta herramienta. Que cursos se necesita incluir para especializarse en Big Data y como pueden asesorarme en ese campo. Soy de Ecuador pero necesito capacitarme en ese campo.
Buenos días German, nos alegra que te haya interesado nuestro artículo sobre «Big Data para principiantes». Nosotros no disponemos de formación en Big Data. Si te puedo recomendar que leas nuestros artículos sobre Master de Big Data en Madrid o este otro en el que hablamos de Formación Big Data a distancia. Muchas gracias por leernos.