Por mucho que sea habitual que en los proyectos People Analytics o HR Analytics manejemos lo que hemos venido a llamar Smart Data, es innegable que el Big Data en RR. HH. irá calando cada vez más en la analítica de RR. HH., y el aspecto tecnológico al que hacíamos referencia entre las características diferenciales de los proyectos People Analytics tomará necesariamente la forma de herramientas y metodologías para tratar grandes volúmenes de datos.
Por ello, es oportuna la reflexión acerca de las oportunidades y riesgos que, relacionados con la irrupción del Big Data, emergen en el ámbito del People Analytics. Analicémoslo como proponen Wenzel & Van Quaquebeke (2017), al hilo de las famosas V del Big Data.
Volumen de datos en People Analytics
Manejar grandes volúmenes de datos para analizar los fenómenos organizacionales nos proporciona un contexto muy interesante para acercamos a:
- Hacer inferencias universales. Más allá de la inferencia obtenida partir del análisis de datos a partir de una muestra de empleados, la utilización de grandes volúmenes de datos nos acerca a realizar análisis sobre la población de empleados. Con ello, aumentan las posibilidades de generalización de los resultados obtenidos.
- Mejorar la detección de los efectos y las causas y realizar modelos que permitan expresar la “granularidad” de los fenómenos. Utilizar más datos es una oportunidad para obtener una información más precisa y rica sobre sobre la realidad. Y esa riqueza nos ayuda a afinar el estudio de las causas y efectos variados que existen sobre los fenómenos objeto de estudio, junto con la posibilidad de examinar dichos fenómenos a un nivel de granularidad mayor.
- Descubrir nuevas relaciones y elementos no contemplados previamente. La utilización de grandes volúmenes de datos nos lleva a hallar relaciones que no estaban previstas en los diseños. El análisis de carácter deductivo se complementa así con una aproximación inductiva en la que hay lugar para la sorpresa y para el descubrimiento.
Riesgos sobre el volumen de datos en RRHH
Sin embargo, también es necesario considerar la otra cara de la moneda, los riesgos asociados al Big Data en cuanto a volumen:
- Utilización de muestras sesgadas. En muchos casos, aunque manejemos muchos datos, estos son representativos únicamente de una pequeña parte de la población de la organización: aquella que por el motivo que sea está más comprometida con el uso tecnológico que deriva en la generación de más datos. La utilización de estas muestras sesgadas compromete las posibilidades de generalización y, en definitiva, la oportunidad de realizar inferencias universales.
- La complejidad de los datos, de las técnicas de análisis o de la arquitectura para soportar los datos supone un riesgo importante para el análisis de la granularidad. La toma de decisiones sobre qué herramientas y técnicas analíticas se utilizan no es baladí y requiere de un conocimiento profundo algo alejado de las capacidades actuales de los analistas en el campo de los RR. HH.
- Encontrar relaciones espurias. Encontrar relaciones entre los fenómenos objeto de estudio no es lo mismo que encontrar explicaciones e insights interesantes sobre ellos. A mayor volumen de datos, mayor probabilidad de encontrar relaciones; pero también, mayor posibilidad de que estas no tengan ningún significado según nuestros intereses analíticos.
Variedad de los datos en las organizaciones
El hecho de manejar datos que no provienen de una misma fuente o estructura, sino que son complejos en cuanto a formato: números, textos, relaciones, localizaciones, etc., aporta al menos dos extraordinarias ventajas:
- Triangular Información. La mayoría de los fenómenos organizacionales son complejos, y la posibilidad de acercarnos a la realidad a partir de distintos tipos de datos nos ayuda a analizarlos desde una perspectiva de mayor alcance.
- Capturar la información “in situ”. La variedad de datos también nos permite obtener una información menos procesada y más cercana a los fenómenos objeto de estudio. La huella digital es un gran ejemplo de ello. Si estamos interesados en conocer quiénes son “líderes de conocimiento” en nuestra organización, podemos utilizar la información que proviene de la huella que dejan los empleados en los sistemas de gestión de conocimiento y similares.
Riesgos sobre la variedad de datos en RRHH
Junto con estas oportunidades del Big Data en People Analytics, también encontramos riesgos asociados a la variedad de los datos:
- Manejar datos con una calidad engañosa. No todos los tipos de datos tienen la misma calidad. Cuando aumentamos la variedad, también aumentamos el riesgo de que alguno de ellos no refleje adecuadamente lo que se pretende estudiar o no sea fiable.
- Invadir la frontera de la privacidad. Muchos de los nuevos datos que incluimos en esta idea de variedad se obtienen del “día a día” de los empleados y su utilización debe ser extremadamente cuidadosa para atentar contra los derechos de los trabajadores. El famoso Reglamento General de Protección de Datos (RGPD) trata de lidiar con ello, pero no está de más la consideración de esta cuestión desde un punto de vista ético y del código de conducta de los profesionales.
Velocidad de los datos en People Analytics
En el terreno analítico de la fuerza de trabajo en las organizaciones, la velocidad asociada a la generación de datos en este entorno Big Data nos ofrece una buena oportunidad para mejorar el análisis causal y la visión temporal.
Los fenómenos objeto de estudio en el People Analytics tienen un componente temporal que rara vez se contempla, y es que es mucho más sencillo el estudio de una cuestión en un «momento determinado” que su aproximación a través de la idea de la serie temporal. El análisis de los datos generados de forma continua supone una oportunidad para desarrollar modelos más complejos que permitan ahondar en esta cuestión temporal y, como consecuencia, mejorar el análisis causal de los fenómenos.
Esta aproximación permite realizar una investigación más práctica al poder obtener datos “en el momento” en el que están sucediendo las cosas. Como contrapartida, hemos de considerar las restricciones computacionales que, a menudo, vienen aparejadas con datos generados en tiempo real, muy lejos de las actuales capacidades analíticas y de “arquitectura” de los profesionales.
Recursos gráficos Freepik.