Seminario. Evolving Social Networks: trajectories of communities

El pasado 8 de junio tuvo lugar el seminario «Evolving Social Networks: trajectories of communities», organizado por la Cátedra de Ciencia de datos y aprendizaje automático UAM-IIC, en la Escuela Politécnica Superior (EPS) de la Universidad Autónoma de Madrid (UAM). En esta ocasión fue impartido por João Gama y estuvo dirigido a investigadores, tecnólogos y gestores interesados en los últimos avances realizados en el campo de las Redes Sociales o Social Networks.

Gama comenzó su exposición analizando el impresionante avance tecnológico en el campo de las redes sociales para analizar la cantidad de datos masivos generados por la evolución de este tipo de redes y sus distintas comunidades. Analizar su aparición, evolución, transformación y desaparición es posible utilizando métodos basados en probabilidades condicionales y clustering jerárquico destinados al análisis y comprensión de la evolución de los datos.

Para entender el comportamiento a lo largo del tiempo de un fenómeno cualquiera han ido apareciendo nuevos métodos e infraestructuras centrados en la evolución temporal de los datos y de los modelos. Lo interesante durante el seminario fue ver cómo se creó una metodología de trabajo efectiva a raíz de la combinación de diferentes técnicas matemáticas para entender laevolución o trayectoria de los clusters y comunidades que surgen como redes sociales.

Cuando no hay suficiente información sobre los nodos de una comunidad, cuando estos cambian continuamente (Evolving Social Data) o son diferentes en cada ocasión es complicado realizar una adecuada caracterización y clustering de los nodos de dicha comunidad. Sin embargo, partir de un análisis descriptivo adecuado, saber rastrearlos y mapearlos permite hallar una solución a problemas mucho más complejos.

Durante el seminario se presentaron de forma sencilla los elementos básicos para poder seguir con la investigación en métodos de análisis de datos evolutivos y se debatieron los retos y las oportunidades de negocio que abre entender la evolución de las comunidades en redes sociales.

Para más información puedes consultar un resumen más extenso del seminario y descargar la presentación «Evolving Social Networks: trajectories of communities» (PDF).

Ponente:

João Gama, Associate Professor en Universidade do Porto. J. Gama es vicedirector de LIAAD, grupo que pertenece a INESC TEC. Ingeniero por la Universidad de Oporto, ha trabajado en varios proyectos nacionales y europeos sobre los sistemas de aprendizaje adaptativo e incremental, el descubrimiento del conocimiento ubicuo y el aprendizaje de datos masivos, etc. Ha participado también en la programación de numerosos congresos (ECML'2005, DS'2009, ADMA'2009, IDA' 2011 y ECML/PKDD'2015). Asimismo ha organizado talleres sobre Knowledge Discovery from Data Streams with ECML/PKDD y Knowledge Discovery from Sensor Data with ACM SIGKDD. Gama es autor de varios libros sobre Minería de datos y un monográfico sobre Knowledge Discovery from Data Streams. Igualmente ha trabajado como revisor de más de 250 artículos relacionados con el aprendizaje automático, la minería de datos y los Data Streams. Es miembro del equipo editorial de revistas internacionales como ML, DMKD, TKDE, IDA, NGC y KAIS; y a lo largo de su trayectoria académica ha supervisado a más de 12 doctorandos y 50 estudiantes de máster. 

Postdoctoral fellowship in the Grupo de Aprendizaje Automático/Machine Learning Group

The Grupo de Aprendizaje Automático/Machine Learning Group at the Departamento de Universidad Autónoma de Madrid (http://arantxa.ii.uam.es/~gaa/) offers a postdoctoral position to work on acceleration methods for iterative model learning and the application of these methods as well as other complementary Machine Learning approaches to achieve better predictions in renewable energy.

Candidates should have a recent machine learning-related PhD in computer science or related areas, have good programming abilities in Python and C/C++, and be familiar with the scikit—learn libraries for Machine Learning. The position’s duration will be 18 months starting on April 1st, 2017 and is funded through the project FACIL--Ayudas Fundación BBVA a Equipos de Investigación Científica 2016. Applicants should send a CV and a statement of research interests to gaamlg@uam.es. This call will be open and applications reviewed until the position is filled.

 

Seminario. A Big-Data-based assessment of the forthcoming revolution in domestic energy

El pasado 17 de febrero tuvo lugar el seminario «A Big-Data-based assessment of the forthcoming revolution in domestic energy», organizado por la Cátedra de Ciencia de datos y aprendizaje automático UAM-IIC, en la Escuela Politécnica Superior (EPS) de la Universidad Autónoma de Madrid (UAM). En esta ocasión fue impartido por J. M. Leiva y estuvo dirigido a científicos, tecnólogos y profesionales involucrados en el análisis de datos, el uso de energía fotovoltaica para consumo doméstico y la explotación de predicciones de energía solar.

Se analizaron los últimos avances tecnológicos en el campo de la energía en cuanto al consumo de electricidad que realizamos. Se habló de la bajada de precios de las instalaciones fotovoltaicas, las diferentes soluciones comercializadas para el almacenamiento doméstico de energía (baterías tradicionales, de litio, tesla…) y el precio del kilovatio por hora.

Se mostraron las conclusiones de un estudio realizado para demostrar si las baterías domésticas son económicamente viables y si el uso de la energía de origen fotovoltaico sería eficaz de cara a optimizar las facturas de la luz de los clientes domésticos en función de sus patrones de consumo o su geolocalización. Para el estudio se habían utilizado datos de consumo eléctrico reales de 100.000 usuarios, datos de radiación solar, históricos de precios, un paquete de python y tecnología MapReduce para abordar el panorama energético actual.

Estimar la radiación solar es un problema complejo, tanto como estimar el rendimiento del módulo o panel fotovoltaico. Los análisis realizados estiman el coste de almacenar energía solar en una batería de litio en unos 15 cts/kWh. Partiendo de este dato un hogar inteligente podría jugar con la potencia contratada, la energía consumida, el precio de la energía y las horas valle para optimizar el rendimiento de su instalación fotovoltaica. En este caso, el margen de ahorro potencial para cada usuario dependería más del tamaño y precio de la instalación que del precio de la energía. 

En teoría podría reducirse la factura anual entre un 10 y un 15%, pero para ello habría que jugar mejor con la predicción que con la potencia. Las conclusiones del estudio aconsejan seguir conectados a la red porque faltan décadas para que el autoconsumo sea pleno. Mientras tanto, lo más eficaz para reducir el gasto parece ser hacer un uso inteligente de la energía y aumentar la generación de renovables. 

Para más información puedes consultar un resumen más extenso del seminario y descargar la presentación «A Big-Data-based assessment of the forthcoming revolution in domestic energy» (PDF). 

Ponente:

José Miguel Leiva, Data Scientist & Quantitative Analyst en Expert Timing Systems. J. M. Leiva es ingeniero en Telecomunicaciones por la Universidad de Málaga (2011) y doctor por la Universidad Carlos III de Madrid (2007). Realizó su postdoctorado sobre Sistemas Inteligentes en el Max Planck Institute bajo la supervisión del Dr. B. Schölkopf y ha sido docente en el Signal Processing Group de la Universidad Carlos III de Madrid.

 

Seminario. Predicción inmediata y a muy corto plazo de la radiación solar a partir de datos de satélite y modelos numéricos

El 11 de noviembre de 2016 se celebró en la Escuela Politécnica Superior (EPS) de la Universidad Autónoma de Madrid (UAM) el seminario «Predicción inmediata y a muy corto plazo de la radiación solar a partir de datos de satélite y modelos numéricos», organizado por la cátedra UAM-IIC de Ciencia de datos y aprendizaje automático. El ponente en esta ocasión fue Antonio Rodríguez Martínez, Jefe de Servicio de Desarrollos Medioambientales de la Agencia Estatal de Meteorología (AEMET)

El objetivo de la conferencia era mostrar el proyecto conjunto entre AEMET y el operador único del sistema eléctrico español, Red Eléctrica de España (REE), impulsado para mejorar la predicción de la radiación solar en los emplazamientos de las plantas solares españolas a través de técnicas de Nowcasting. Esta técnica para la predicción de radiación solar a muy corto plazo (normalmente hasta 6 horas) en una región geográfica específica tiene el potencial de disminuir los costes de generación de energía eléctrica.

Durante el seminario se presentó el estado actual de la herramienta que se está desarrollando en AEMET. Esta herramienta, que aplica técnicas de Nowcasting a los datos, es capaz de proporcionar cada 15 minutos la radiación solar horaria para las siguientes cuatro horas. Este modelo utiliza información satelital de la nubosidad (productos de nube del software SAFNWC/MSG), información sobre radiación generada a partir de modelos de predicción numérica (salidas de radiación de HARMONIE), o bien una combinación de ambas dependiendo del horizonte temporal de predicción.

Puedes leer el resumen extenso del seminario o descargar la presentación Predicción inmediata y a muy corto plazo de la radiación solar a partir de datos de satélite y modelos numéricos (PDF).

Biografía: Antonio Rodríguez Martínez trabaja para la AEMET desde 1985. Licenciado en Ciencias Físicas y Máster en Meteorología Física y Aplicada participa como desarrollador en el proyecto Nowcasting SAF de EUMETSAT de 2003 a 2013. Sus principales áreas de especialización incluyen el desarrollo y validación de productos de precipitación a partir de datos de satélite, así como una herramienta de predicción de la radiación solar a muy corto plazo a partir de la información proporcionada por los satélites y los modelos numéricos de predicción. Desde 2013 es el Jefe del Servicio de Desarrollos Medioambientales de AEMET.

Seminario. Data science in telecommunications

El 30 de septiembre se celebró el seminario «Data Science in Telecommunications» en la Escuela Politécnica Superior (EPS) de la Universidad Autónoma de Madrid (UAM). La charla, organizada por la cátedra UAM-IIC de Ciencia de datos y aprendizaje automático, estaba dirigida a profesionales del mundo de las telecomunicaciones interesados en el análisis de datos masivos. En esta ocasión el ponente fue Rubén Lara, responsable del área de Big Data Analytics en el Grupo Vodafone.

El objetivo de la conferencia era mostrar las diferentes aplicaciones que los datos tienen en el sector de las telecomunicaciones. El uso cada vez más extendido de dispositivos y datos móviles ha generado una inmensa cantidad de datos y ha hecho crecer enormemente este sector. La ciencia de datos o Data Science permite aplicar técnicas Big Data a estos datos para estudiar el comportamiento y las interrelaciones de los usuarios. Estos proyectos parten del estudio y análisis de los datos con los que ya cuanta la organización. Si los estructuramos y almacenamos anonimizados convenientemente, y añadimos datos externos relacionados, tendremos una base de datos lo suficientemente rica como para empezar a obtener información de valor. Si a esto añadimos las técnicas necesarias para un buen análisis de datos, el uso de herramientas como Hadoop y un equipo de científicos de datos bien preparados podremos exprimir los datos para desmarcarnos de la competencia.

Durante la conferencia Lara aseguró que en el mundo de las telecomunicaciones el retorno de la inversión debe medirse a partir de objetivos económicos y comerciales, pero también en términos de satisfacción del cliente. Para ello es necesario conocer la opinión de los usuarios y analizar el sentimiento añadiendo una capa de inteligencia a los datos. Además, es fundamental predecir tanto el abandono como la adopción de un servicio. Igualmente abordó el tema del fraude en las telco. Para tratar los casos relacionados con el roaming y otros tipos nuevos de fraude podemos recurrir a la detección de anomalías. Explicó cómo gracias al análisis de patrones de comportamiento podemos obtener más información y detectar el fraude en menos tiempo.

El seminario concluyó destacando la figura del científico de datos, y dando unas recomendaciones para abordar proyectos relacionados con el análisis de datos que permitan tomar mejores decisiones.

Ponente:

Rubén Lara, doctor en Informática por la UAM, ha sido también director del programa de postgrado en Big Data de la U-Tad y tiene una dilata experiencia en empresas como Etihad-Etisalat o Telefónica, tanto en el sector financiero como en el de las telecomunicaciones, como responsable de desarrollo de producto y analítica Big Data.