El seminario «Data Science in Telecommunications» se celebró el 30 de septiembre en la Escuela Politécnica Superior (EPS) de la Universidad Autónoma de Madrid (UAM). En esta ocasión fue impartido por Rubén Lara, responsable del área de Big Data Analytics en el Grupo Vodafone. La charla, organizada por la cátedra UAM-IIC de Ciencia de datos y aprendizaje automático, estaba dirigida a profesionales del mundo de las telecomunicaciones interesados en el análisis de datos masivos y suscitó un enorme interés entre el gran número de asistentes.
El objetivo de la conferencia era mostrar las diferentes aplicaciones que los datos tienen tanto en el negocio principal de las compañías del sector de las telecomunicaciones como en el estudio de distintos fenómenos sociales. El sector de las telecomunicaciones ha crecido enormemente en la última década a raíz del uso cada vez más extendido de dispositivos y datos móviles en todos los contextos. Esto ha generado una inmensa cantidad de datos. La ciencia de datos o Data Science permite aplicar técnicas Big Data a estos datos para estudiar el comportamiento y las interrelaciones de cientos de millones de personas y empresas en todo el mundo.
La base de cualquier Data-Driven Home Research es el estudio y análisis de los datos reales con los que ya cuanta la organización. Si partimos de los datos que ya tenemos y los estructuramos y almacenamos anonimizados convenientemente, y añadimos después un paquete de datos externos que estén relacionados, habremos enriquecido nuestra base de datos lo suficiente como para empezar a obtener información de valor. Para lograrlo debemos echar mano de los avances tecnológicos para el análisis de datos o Big Data. Esta tecnología para almacenar y procesar datos está cada vez más accesible desde la proliferación de herramientas como las de los entornos Hadoop. Y contar con Data Scientists o científicos de datos, con una base sólida tanto teórica como práctica, que sepan cómo exprimir los datos utilizando estas herramientas es clave para cualquier organización que quiera desmarcarse de la competencia. En resumen, datos, tecnología, inversión y gente dispuesta son los pilares para empezar cualquier proyecto Data Science en telecomunicaciones que nos lleve a obtener un valor diferencial.
Big Data para medir la satisfacción del cliente
Durante la conferencia se incidió sobre la importancia de fijarse un objetivo antes de poner en marcha cualquier estrategia comercial basada en los datos. Rubén Lara aseguró que en el mundo de las telecomunicaciones el retorno de la inversión debe cuantificarse a partir de objetivos económicos y comerciales, pero también en términos de satisfacción del cliente como medida de expansión del negocio. Para ello es fundamental recurrir a los datos reales generados por los propios usuarios, por sus características personales, por su perfil de usuario, por el tipo de dispositivo que utiliza, por el uso que le da, por cómo interactúa y se relaciona con los demás usuarios, y por cómo habla del servicio y de la marca.
Mejorar el negocio de las telco pasa por encontrar la forma de anticipar el nivel de satisfacción del cliente. Para predecir es necesario conocer la opinión de los usuarios y analizar sus comentarios utilizando técnicas de procesamiento del lenguaje natural. Escuchar y analizar el sentimiento de los usuarios permite aprovechar mejor la información no estructurada. Para ello hay que automatizar tareas, probar diferentes parámetros y añadir una capa de inteligencia a los análisis tradicionales.
Además, predecir la satisfacción del cliente permite, entre otras cosas, predecir el abandono por parte de los usuarios de un servicio, es decir, las bajas. Somos animales sociales y las bajas son virales. Los usuarios son parte de comunidades y siembran en su red. Identificar el rol de los usuarios en la red de propagación del uso de un servicio es fundamental. Esta misma base sirve para predecir la adopción de un servicio, en otras palabras, potenciar los efectos de la homofilia incentiva la adopción de un servicio, las altas de nuevos usuarios. A este respecto se han hecho estudios muy interesantes sobre cómo el nivel socio–económico de un usuario determina el nivel de facturación social.
Analizar patrones de comportamiento para detectar el fraude
Asimismo se abordó el fraude en las telco. El tipo más particular es el de roaming, donde la latencia (de horas) da pie a que algunos usuarios concurran en gastos relacionados con servicios premium. Para tratar este y otros tipos nuevos de fraude, gracias al Big Data ahora podemos recurrir a la detección de anomalías. Este análisis de patrones de comportamiento permite obtener información que no es evidente y detectar antes el fraude.
Pero estudiar la actividad móvil tiene otras muchas aplicaciones útiles. Tal y como expuso Lara, en 2012, por ejemplo, sirvió para mostrar de una forma sencilla muy visual dónde se sintió más el terremoto de México a partir del fenómeno de propagación de llamadas. Ese mismo año, utilizar datos agregados de movilidad junto a información pública permitió poner en marcha un proyecto de intervención gubernamental para bien social al poder saber por dónde se movía la gente en función de su cobertura médica. Igualmente, esta misma base, el estudio de datos agregados, se utilizó en Londres para medir el impacto de cerrar ciertas estaciones de bomberos en función de la cantidad de gente que se movía por cada distrito. Y el gobierno galés utilizó esta misma estrategia basada en el análisis de los datos para saber cómo mejorar su red de carreteras.
El seminario concluyó destacando la figura del científico de datos como motor para impulsar estos proyectos, y con una serie de recomendaciones para abordar proyectos relacionados con el análisis de datos que permitan tomar mejores decisiones a las empresas del sector de las telecomunicaciones.