Las palabras que utilizamos reflejan nuestras opiniones y emociones y, analizar esto masivamente puede llegar a darnos pistas de cómo evoluciona el lenguaje y, por tanto, nuestra sociedad. Para ello, las redes sociales pueden constituir un buen corpus en el que aplicar el análisis automático de sentimiento.
Por ejemplo, al monitorizar los mensajes que contienen la palabra feminismo en Twitter durante un periodo de tiempo, se ha obtenido que más de la mitad de estos tuits se asocian a sentimientos negativos, mientras que apenas un 17% remite a emociones positivas.
Esta es una de las conclusiones del estudio sobre lenguaje, feminismo e inclusividad realizado por la Fundación del Español Urgente (Fundéu BBVA) y el Instituto de Ingeniería del Conocimiento (IIC), en el que se han analizado casi 1.400.000 tuits de todos los países hispanohablantes a lo largo de veinte días de febrero de 2020.
Uso de la palabra feminismo en Twitter
Para este estudio, se ha utilizado Lynguo, la herramienta de análisis de redes sociales que el Instituto de Ingeniería del Conocimiento ha puesto a disposición de la Fundéu. En total, se han monitorizado las más de 14.000 menciones a feminismo encontradas en el total de los tuits elegidos al azar para la investigación.
Como resultado, el 51,8% de los tuits en los que se emplea la palabra feminismo son asociados a emociones negativas como la decepción, el lamento, la queja, el desinterés e incluso el odio. Por otro lado, el 17,2% de los tuits remiten a emociones positivas como el deseo, la admiración y la felicidad.
Sin embargo, hay que precisar que estas etiquetas pueden asociarse a mensajes en dos direcciones. En el caso de los tuits que la herramienta distingue como negativos, explica Judith González de Fundéu, “encontramos lamento por un logro feminista que se quiere alcanzar (hoy el aborto y el feminismo vuelven a las calles), pero también lamento por el feminismo en sí, a ojos de la persona que escribe (todo el feminismo no es más que un montón de insatisfechas…)”.
Este análisis de sentimiento sobre la palabra feminismo en Twitter es parte de un proyecto más amplio en el que se analizan otros aspectos relacionados con el uso del lenguaje, el feminismo y la inclusividad en Twitter (uso de femeninos plenos en los nombres de profesiones, empleo de marcas como la @, la e o la x como formas inclusivas…) que se irán dando a conocer próximamente.
¿En qué consiste el análisis de sentimiento?
El análisis del sentimiento de Lynguo utiliza tecnología de Procesamiento del Lenguaje Natural (PLN) para detectar automáticamente las emociones de los textos.
Para ello, se basa en recursos léxicos que recogen palabras y estructuras del lenguaje asociadas a opiniones o emociones concretas, para después detectar si aparecen en los tuits. Según explica Carmen Torrijos, lingüista computacional en el IIC, “el análisis automático de sentimiento es un procesamiento semántico que nos permite conocer la valoración del autor de un texto”.
Y así se etiquetan las diferentes emociones en el texto. Un mismo mensaje puede tener varias etiquetas: por ejemplo, a un tuit que diga «Eres un genio, que pena que te vayas», la herramienta le asignará las etiquetas Admiración (eres un genio) y Tristeza (que pena que te vayas).
Al final, en palabras de Carmen Torrijos, “esta herramienta permite analizar grandes cantidades de tuits y ver si los usuarios están expresando emociones positivas, negativas o neutras a través de las palabras que utilizan”.
Algunos datos sobre el estudio sobre feminismo en Twitter
Los datos del estudio proceden de Twitter, red social que ha sido monitorizada con la herramienta Lynguo del Instituto de Ingeniería del Conocimiento (IIC) durante 20 días, del 5 al 24 de febrero de 2020.
Las búsquedas realizadas arrojaban 40.000 comentarios a la hora, unos 960.000 comentarios al día y más de 28 millones en un mes. Por ello, en la presente investigación se ha trabajado con un subconjunto de estos datos, el 10 %, escogidos aleatoriamente. Por tanto, los datos de este informe se han extraído de 3 millones de tuits escogidos al azar de entre los publicados en la red social Twitter durante los 20 días del mes de febrero de 2020.
Respecto al origen geográfico de los tuits, los países que se han tenido en cuenta han sido Argentina, Bolivia, Chile, Colombia, Costa Rica, Cuba, EE. UU., Ecuador, El Salvador, España, Guatemala, Honduras, México, Nicaragua, Panamá, Paraguay, Perú, Puerto Rico, República Dominicana, Uruguay y Venezuela. Hay que tener en cuenta que, para mantener el rigor en la investigación, solo se han tomado datos de las cuentas que tienen el país verificado por el usuario en Twitter, esto es, en aquellas en las que es posible asegurar que el origen es, en efecto, el que se declara.
Te puede interesar el estudio sobre el uso de lenguaje inclusivo en Twitter, como son el uso de la @, la x y la e.