Data Scientist, Data Analyst, Data Engineer, Big Data Architect… son perfiles profesionales relacionados con el mundo de los datos que cada vez nos suenan más, pero, ¿a qué se dedica cada uno? Desde el Instituto de Ingeniería del Conocimiento (IIC), quisimos aclararlo en la VII Semana de la Empleabilidad de la Universidad Autónoma de Madrid (UAM), para que los estudiantes conozcan las tareas y competencias asociadas a estos nombres.
En la charla «Trabajando con datos: ¿Quién, cómo, por qué y dónde?», Sergio-Nabil Khayyat, director del área de Ingeniería y Arquitectura de Datos del IIC, describió las funciones que normalmente desempeñan los diferentes perfiles profesionales en el campo de la Inteligencia Artificial. Además, Óscar Gómez, ingeniero de datos, contó su experiencia de estudiante a contratado por el IIC.
Perfiles profesionales en análisis de datos e Inteligencia Artificial
“Originariamente, cualquiera que trabajara con datos era científico de datos”, empezó contando Sergio-Nabil Khayyat. Esto ha ido cambiando y poco se han ido designando otros perfiles con tareas más específicas.
Y es que este campo está creciendo mucho. Según un artículo de Cinco Días, nuestro país necesitará más de 90.000 profesionales expertos en datos e inteligencia artificial durante los próximos tres años, para impulsar proyectos que puedan competir a nivel internacional.
Actualmente, si hablamos de perfiles profesionales, la distinción más común es la de científico de datos vs. ingeniero de datos, a la que se suman otros nombres como el de arquitecto de datos o el ingeniero de aprendizaje automático. ¿Cuáles son las diferencias?
Científico de datos
El científico de datos es el que se centra en una labor más de investigación. “Es un trabajo que se enfoca mucho en el ensayo y error. Hay que probar cosas con los datos hasta dar con aquello que funciona”, explicaba Khayyat.
En primer lugar, se encargan de manejar y analizar los datos en bruto para convertirlos en información y sacar conclusiones. Un paso más es el desarrollo de modelos predictivos que después se transformarán en soluciones.
De hecho, la ciencia de datos tiene mucho que ver actualmente con el Machine Learning. Por eso, existen perfiles más específicos bajo el paraguas del científico de datos: ingenieros de aprendizaje automático o incluso ingenieros de modelos predictivos.
En cuanto a formación, “son perfiles que suele tener cierta carga de matemáticas y estadística, que al final es la base de la IA”, comentaba Khayyat. También trabajan con software de visualización de datos y librerías hechas en Python, además de los notebooks como entorno para poder hacer pruebas.
Ingeniero de datos
La figura del ingeniero de datos surge en un momento de madurez del trabajo con datos. “Las empresas se empezaron a dar cuenta de que necesitaban que las pruebas que ya se estaban haciendo se convirtieran en productos y se pusieran en marcha para dar algún tipo de valor”, explicó Sergio-Nabil Khayyat.
Este perfil trabaja entre el científico de datos y el desarrollador de software. Según Khayyat, “hace falta alguien que entienda cómo se trabajan los datos y que a la vez sepa cómo se construye el software, para hacer de puente y aterrizar esos prototipos en productos”.
Más que con librerías, los ingenieros de datos trabajan con tecnologías y herramientas. Utilizan frameworks como Spark para el tratamiento masivo de datos, porque aquí es donde se empieza a hablar verdaderamente de Big Data y de cómo escalar las aplicaciones y soluciones en un entorno real de datos, una de sus tareas principales.
En este sentido, también trabajan con Docker o Kubernetes para empaquetar aplicaciones y ponerlas en marcha de una manera fiable. Y actualmente, empiezan a utilizar las tecnologías cloud, que ofrecen posibilidades destacadas para el escalado de soluciones. Con todo esto, el ingeniero de datos hace ese trabajo intermedio para “darle vida al modelo creado por los científicos de datos”, concluyó Khayyat.
Arquitecto de datos
En paralelo a la ingeniería de datos, surgen los perfiles de arquitectura, que se suelen dedicar más al diseño que a la implementación de soluciones. “Como el arquitecto de edificios, no es el que pone los ladrillos, sino más bien el que hace los planos”, explicó Sergio-Nabil Khayyat.
Encontramos varios tipos de arquitectos. Por ejemplo, el arquitecto cloud es experto en diseñar aplicaciones para ser desplegadas en cloud. En este caso, se les pide que conozcan las tecnologías propias de la nube y distintos proveedores (AWS, Azure o Google Cloud), además de algunas certificaciones.
Otro perfil es el arquitecto de datos, que se encarga del diseño y organización de los datos. El antes llamado administrador de bases de datos (BDA), ahora desempeña además otras tareas: gobierno de datos, políticas de uso de los datos, bajo qué reglas se permite el acceso, cómo son los sistemas que controlan ese acceso, etc.
Experiencias del trabajo con datos
El sector tecnológico y, en concreto, el de la ciencia de datos y la Inteligencia Artificial son muy cambiantes. Por ello, todos estos perfiles relacionados son perfiles que están todavía en creación. De hecho, cada día se necesita nombrar trabajos cada vez más específicos: analista de datos, especialista IoT, visualizador de datos, etc.
Según contaba Sergio-Nabil Khayyat, él empezó su carrera profesional como científico de datos, pero su trabajo no cuadraba con ese perfil investigador. “Me dedicaba a automatizar tareas, a empaquetar aplicaciones y escalarlas, y pasé a ser ingeniero y arquitecto de datos”.
Las experiencias son parte importante de estas charlas que el IIC suele organizar para orientar a los estudiantes en su futuro profesional. Más centrado en el primer contacto con las prácticas y la empresa, la experiencia reciente de Oscar Gómez fue también un ejemplo para los estudiantes que quieren empezar a hacer carrera en este campo.
Ahora trabaja como ingeniero de datos en el IIC, donde decidió hacer las prácticas. Él también empezó como científico de datos: creando modelos, investigando diferentes formas de colocar los datos para que el ingeniero lo automatice, usando nuevas herramientas e investigando otras. Antes de terminar la carrera, ya tenía un contrato. Después, se especializó en ciencia de datos con un máster y fue ascendido a ingeniero de datos.
En cuanto a consejos, Gómez recomendó a los estudiantes ser proactivos a la hora de buscar una empresa y tener en cuenta sus intereses, porque más allá del sueldo y el prestigio, hay compañerismo, beneficios sociales o flexibilidad. Y no especializarse demasiado. “No puedes ser experto en un lenguaje o una librería, sino buscar soluciones lo más eficientes posibles a los problemas. Yo aplico la lógica: necesito esto, tengo estos datos y tengo que automatizar este modelo… y te vas haciendo con los recursos”, explicó.