El Big Data y la nube o los servicios Cloud necesariamente han de ir de la mano en el mundo de los datos. Muchos de los datos de los que disponemos son generados y creados en la web dentro de un modelo de computación en la nube.
La gran cantidad de datos generados por satélites, gobiernos, cámaras de vídeo vigilancia, smartphones, dispositivos del internet de las cosas (IoT) junto con datos generados en la redes sociales hacen necesarios los sistemas de Cloud.
Datos tan desorbitados como que en 2020 el universo digital puede llegar a 40 ZB o que cada día se generan más de 2.5 trillones de bytes de datos, nos hace pensar que es imposible no mirar a la nube como medio de almacenamiento y análisis de tal cantidad de datos.
La necesidad de las empresas de sacar valor a los datos ha hecho aumentar las necesidades de tecnologías Cloud o de computación en la nube. Entre estas tecnologías nos encontramos con la computación elástica, un sistema de computación similar al uso eficiente de electricidad. El servicio se da o no, dependiendo de la demanda de uso de un determinado recurso (hora valle o picos de uso). El sistema de computación elástico permite adaptar el uso de los recursos computacionales dependiendo del aluvión de datos, su tamaño, tipo, velocidad de estos, para dar una respuesta más efectiva.
No es lo mismo la fase en la que se recopilan los datos, que la fase en la que se tratan esos datos para generar informes de cara a sacar conclusiones clave beneficiosas para el negocio. Estos recursos de computación en la nube pueden ser gestionados con mayor eficiencia, dependiendo de cuando realicemos el análisis Big Data. De este modo se pueden liberar servicios para que otra empresa los pueda usar.
Modalidades de Cloud para Big Data
Este tipo de uso efectivo de los sistemas Cloud para Big Data permiten a las empresas ofrecer sus servicios en la nube en tres modalidades dependiendo de las necesidades de uso: infraestructura (IaaS), pre configurado (PaaS) y software (SaaS).
La modalidad infraestructura facilita el uso de servidores a bajo nivel controlando: sistema operativo, uso de memoria, tecnología de almacenamiento en disco etc. Con la modalidad de entorno pre configurado, el proveedor te ofrece en el servicio Cloud los lenguajes de programación que necesites: Java, Python, Ruby etc., así Apache Hadoop, Apache Spark. En esta modalidad solo te tienes que preocupar de recoger y analizar los datos. La última modalidad es la de software como servicio Cloud, que te proporciona un entorno para trabajar directamente con Big Data. Podemos hacer el procesamiento y análisis de los datos de una manera transparente en cuanto a detalles de infraestructura.
Otros servicios en la nube para Big Data
En cuanto a ubicación y nivel de seguridad, las empresas de servicios en la nube cuentan con varios servicios: Público, Privado dedicado o compartido e Híbrido (combinando entornos tradicionales y cloud).
En el servicio nube pública se tiene acceso general a servicios y recursos de computación Cloud mediante una conexión pública a través de Internet. Como hemos visto anteriormente, los recursos de uso de computación se asignarán de manera temporal dependiendo de su utilización. Cuando ya no son usados se asignan a otros usuarios.
El segundo tipo de servicio Cloud es el llamado de nube privada, donde los servicios y recursos de computación en la nube están en red privada, con acceso restringido a usuarios de tu empresa. Los sistemas de seguridad son más altos, debido al tipo de sensibilidad de los datos con los que trabajamos, siendo necesario mantener la confidencialidad, la privacidad y la integridad de los datos.
Por último el tercer tipo de servicio en la nube es el híbrido, nivel que combina las características de los servicios Cloud públicos y privados. Estos servicios se utilizan cuando existen datos Cloud privados que se ofertan en Cloud públicos o cuando existe una colaboración de distinto proveedores de servicios en la nube. Estos servicios ofrecen en general ahorro (más económico que la privada), seguridad, flexibilidad y escalabilidad.
Beneficios del Big Data en la nube
Cuando hablamos de beneficios del Big Data en la nube, el coste es el primero que aparece, aunque el servicio Cloud también nos proporciona comodidad, rapidez, seguridad, etc.
- Menos coste. Evitamos las inversiones de infraestructura tanto hardware como de licencias software, ya que, como hemos visto antes, no siempre se utilizan los recursos al 100%, sino que depende de la fase Big Data en la que nos encontremos.
- Rapidez. El acceso a la información, ficheros, base de datos etc, es mucho más rápido, además de ser más accesible.
- Comodidad. Dependiendo del servicio Cloud, no debes de preocuparte de versiones, actualizaciones o problemas de seguridad.
- Mayor personalización. Cada configuración está adaptada a las necesidades de cada cliente, pudiendo aumentar espacios o recursos dependiendo de las necesidades de demanda.
- Accesibilidad. Puedes acceder a la información desde varios dispositivos desde cualquier lugar con acceso a internet.
- Seguridad. Se contemplan protocolos de seguridad y servicios de copias de seguridad las veces que quieras.
Paralelamente al crecimiento de los datos, crecen las soluciones del Cloud Computing para Big Data, ya que se prevé que para el 2020 el mercado en este campo crezca con respecto a las soluciones que las empresas instalarán en sus sedes. En el 2019 prácticamente el 100% de las empresas adquirirán datos externos provenientes de la nube relacionados con su negocio. Para el 2025 crecerá el número de ciudades inteligentes, suponiendo gran cantidad de datos que habrá que alojar y analizar… ¿dónde? en servicios en la nube para Big Data.