Se ha celebrado un seminario de la Cátedra de Ciencia de Datos y Aprendizaje Automático UAM-IIC, en el que la charla fue ofrecida por Daniel Villatoro, Chief Data Scientist en Openbank con el sugerente título de “How to do evil with Data”, o “Cómo hacer el mal con los datos”.
Con esta premisa, Villatoro ha hablado sobre la gran cantidad y variedad de datos a los que tienen acceso los científicos de datos, con los riesgos que esto implica. Es por ello que los profesionales que trabajan con datos deben prestar especial atención a las acciones y tratamiento de los datos.
Para saber cómo hacerlo bien, también debes saber qué se puede hacer mal. En esta interesante ponencia, Daniel Villatoro hizo de abogado del diablo y nos presentó en tono irónico todo un surtido de “las mejores prácticas para hacer el mal con los datos”, como, por ejemplo, promover el abandono de los clientes, reducir los beneficios de los productos o proporcionar el peor servicio.
8 errores a evitar si eres científico de datos
Para un científico de datos es relativamente fácil caer en errores de manera accidental. Para que esto no ocurra, el profesional debe pensar en su trabajo y sus consecuencias.
Por si no quieres pensar en ellas, el conferenciante nos dio una serie de consejos para hacer deliberadamente el mal con datos:
- Busca a los mejores compinches: malos data scientists. Busca un equipo de personas que ponga el foco en el conocimiento académico, olvidando la conexión comercial, el punto de vista del negocio.
- Olvida las preguntas y, si las hay, respóndelas sin datos. Básate en intuiciones, en lugar de en datos, para tomar decisiones.
- Confunde Correlación y Causalidad. Haz relaciones que no sean ciertas necesariamente, los datos de correlación le darán apariencia de verdad.
- Usa las peores visualizaciones y los dashboards más saturados. Confunde al cliente con visualizaciones incomprensibles y con proporciones que no se ajusten a los datos.
- No te fijes en el impacto. No pienses en el impacto negativo o en la irrelevancia que puedan tener tus resultados, ni en lo fácil que hubiera sido evitarlo con un análisis de Procesamiento de Lenguaje Natural.
- Olvida las consecuencias de tus análisis, promoviendo todo tipo de discriminación. Asegúrate de que tus análisis de datos favorecen los sesgos, y si usas datos históricos, refuerza los bias históricos.
- Revela al individuo y manipula su comportamiento. Utiliza, por ejemplo, datos de los taxis para saber dónde y cuándo se usan, y, finalmente, deducir quién los usa.
- Promueve el terror con titulares muy tendenciosos.
Tras la charla, se abrió el turno de preguntas, en el que Villatoro respondió sus dudas a los asistentes.
Daniel Villatoro tiene un doctorado en Inteligencia Artificial del IIIA-CSIC (dos veces premiado por IFAAMAS y la UAB). Le apasionan los datos y cómo su profundo análisis puede ayudarnos a comprender mejor la realidad. Sus herramientas de investigación son el análisis urbano, la economía del comportamiento, la teoría de redes y las herramientas Big Data.
Villatoro ha publicado numerosos artículos de investigación en revistas científicas, y es cofundador de la comunidad de entusiastas de datos Databeers. Ha trabajado en BBVA Data & Analytics, en Vodafone y actualmente es Chief Data Scientist en Openbank.