La monitorización de redes sociales es una de las estrategias actuales que permite conocer de qué se habla y cuál es la opinión de la población con respecto a un tema tratado en redes. El primer paso para monitorizar o escuchar un tema en las redes sociales es configurar unas consultas o queries que, junto con una herramienta de escucha, trabajan recabando datos sobre el tema concreto. Estas queries incluyen información, como:
- las fechas del periodo de tiempo a monitorizar
- las redes sociales que resultan de interés
- el idioma de la conversación
- la zona geográfica de interés
- los temas sobre los que se quiere escuchar.
Con los datos recogidos en la escucha de las redes sociales, se realizan análisis para extraer conclusiones e insights que permiten tomar decisiones y ganar conocimiento.
Algorlit: conocimiento y alfabetización algorítmica en la sociedad
ALGORLIT es un proyecto de investigación que busca capacitar a la sociedad sobre la presencia de los algoritmos. Se trata de un proyecto interdisciplinar e interuniversitario del que participan la Universidad CEU San Pablo, Universidad Rey Juan Carlos, Universidad Loyola de Andalucía, la Universidad Internacional de La Rioja, y el Instituto de Ingeniería del Conocimiento (IIC).
Entre los objetivos de ALGORLIT se encuentran:
- Conocer cuánto saben los españoles sobre algoritmos,
- Profundizar en las percepciones que tienen los ciudadanos sobre el uso de redes sociales, algoritmos e IA generativa en la industria
- Entender las opiniones y emociones que los ciudadanos expresan al respecto.
Además, con los resultados de esta investigación se busca dotar a la ciudadanía de un entendimiento básico sobre algoritmos, promover el pensamiento crítico y proporcionar herramientas que permitan protegerse de manipulaciones en entornos digitales.
IIC colabora en ALGORLIT
El Instituto de Ingeniería del Conocimiento (IIC) ha colaborado en el proyecto ALGORLIT, monitorizando la conversación sobre algoritmia y alfabetización digital en medios de comunicación, redes sociales, y foros. Es decir, el IIC ha realizado una escucha mediante palabras clave relacionadas con algoritmia en prensa, X, Tumblr, Foros, Blogs, Reseñas, Facebook, YouTube y Reddit para recoger la conversación de usuarios y medios a cerca de algoritmos, sus efectos positivos y negativos para la vida y la alfabetización digital.
Pasos de la monitorización de la conversación sobre algoritmia
El primer paso es una fase de consultoría de la monitorización de la conversación sobre algoritmia, se centra sobre las escuchas en las redes sociales y se comprende la problemática de los temas a tratar.
El segundo paso comprende el desarrollo de las queries. En este punto se parte de un listado de conceptos clave (73 conceptos) que se amplía y cura con la labor de las lingüistas computacionales. Con los conceptos ampliados, curados y validados (173 conceptos) se construye la query, teniendo en cuenta, además, filtros adicionales como las fechas de recogida de datos, el idioma de la escucha, las plataformas y redes de interés o las regiones a monitorizar.
- Fechas:
- Escucha histórica entre el 1 de marzo de 2024 al 28 de febrero de 2025
- Escucha a tiempo real entre el 1 de marzo de 2025 y el 31 de mayo de 2025.
- Idioma: Español
- Localización: España[1]
- Plataformas: X, Tumblr, Foros, Blogs, Reseñas, Facebook, YouTube y Reddit
El tercer y cuarto paso en el desarrollo del proyecto es la recogida de datos y la elaboración de un informe de conclusiones. El informe comprende los contenidos listados a continuación:
1. Volumen total de la conversación | 2. Volumen de menciones por plataforma |
3. Volumen de menciones por día | 4. Análisis del sentimiento |
5. Volumen de menciones por día de la semana y hora | 6. Análisis de la emoción |
7. Nube de palabras | 8. Top de Urls más compartidas |
9. Volumen de menciones por plataforma | 10. Top de sites más populares |
11. Análisis del sentimiento | 12. Top de autores más influyentes |
13. Análisis de la emoción | 14. Top de hashtags más frecuentes |
15. Volumen total de la conversación | 16. Segmentación de la conversación por sexo |
17. Volumen de menciones por día | 18. Análisis de comunidades (solo para X) |
19. Volumen de menciones por día de la semana y hora | 20. Análisis de temáticas por comunidad |
21. Nube de palabras |
Dentro de los análisis elaborados cabe destacar el papel del análisis de sentimiento, emociones, comunidades y temáticas.
Análisis del sentimiento sobre algoritmia
El análisis del sentimiento sobre algoritmia trata de una clasificación multiclase de tres categorías, es decir, a cada comentario se le asigna un máximo de una etiqueta. Las categorías de clasificación son:
- sin opinión
- opinión positiva y
- opinión negativa.
Este análisis es externo a la herramienta de escucha y se ha realizado con IA generativa, a través de prompting.
Gráfica de distribución de la opinión global para la escucha del periodo histórico.
Análisis de emociones sobre algoritmia
El análisis de emociones sobre algoritmia trata de una clasificación multietiqueta de menciones en 8 categorías. Es decir, cada comentario puede estar asociado a una o varias etiquetas. Las ocho categorías son: sin emoción, alegría, tristeza, ira, desprecio, miedo, sorpresa y asco. Estas categorías están basadas en el análisis de las emociones de Ekman (1992). Este análisis es externo a la herramienta de escucha, y está realizado con IA generativa y prompting.
Gráfica de distribución de la opinión global para la escucha del periodo histórico.
Análisis de las comunidades sobre algoritmia
El análisis de las comunidades sobre algoritmia es una segmentación de la conversación en comunidades que interactúan. Una comunidad es un grupo de usuarios con un alto nivel de interacciones entre sí respecto al resto de la red. Una interacción es una mención de un usuario a otro en un mensaje. Esta mención establece una conexión entre ambos usuarios. Ya que las interacciones entre usuarios juegan un papel crucial, este análisis se ha realizado sobre los datos de X. Para llevar a cabo este análisis se ha utilizado el algoritmo de Louvain.
Gráfica de distribución de comunidades en la escucha del periodo en tiempo real.
Extracción de temáticas sobre algoritmia
La extracción de temáticas sobre algoritmia es una clasificación no supervisada de temas de conversación ocultos en la escucha. Este análisis se ha llevado a cabo dentro de las propias comunidades surgidas del análisis anterior y se ha llevado a cabo mediante similaridad semántica.
Conclusiones sobre el análisis de la conversación sobre algoritmos y alfabetización
- El mayor volumen de conversación sobre algoritmos y alfabetización llega a través de los medios de comunicación (+ 500 K menciones), frente a reviews o Tumblr que recogen el menor volumen de conversación.
- El día de la semana donde mayor volumen de conversación se produce es el martes, frente al fin de semana, donde se dan menos menciones.
- En torno al 85 % de los datos no expresan una opinión, en líneas generales. El 13 % de los datos expresan una opinión negativa y, el resto, una positiva.
- En torno al 75 % de los datos no expresan una emoción, frente al 25 qué sí lo hacen. Dentro de este porcentaje de datos, las opiniones más frecuentes son la ira, el desprecio o la alegría.
- En términos generales, predomina más la participación masculina en la conversación que la femenina.
- Las comunidades ejercen el efecto cámara de eco, es decir, retroalimentan las temáticas que tratan. En el caso del periodo histórico, el 45% de la conversación queda recogido en 29 comunidades de usuarios. En el caso del periodo a tiempo real, el 26% de la conversación queda recogido en 13 comunidades de usuarios.
- Se obtienen 96 temáticas extraídas de cada comunidad por separado. Algunos de los temas que recogen mayor de conversación tienen que ver con la difusión de discursos polémicos y de odio, difusión de bulos y montajes, los sesgos con los que cuenta la IA o el impulso que el uso de IA da a la creatividad.
[1] Se especificó la localización en España para aquellas plataformas que permitían incorporar el filtro de localización.