Métricas lingüísticas para evaluar la claridad del lenguaje
Con técnicas de PLN se analiza la claridad de los textos para clasificarlos de forma objetiva y cuantificable, a la vez que se dan recomendaciones para expresar las ideas de manera ordenada, sencilla y transparente.
¿Qué es el análisis automático de claridad de los textos?
La claridad de un texto se puede medir en base a los elementos lingüísticos que se utilizan en el mismo, como el uso de la voz pasiva, de los conectores, las siglas o los acrónimos, entre otros. Y este proceso se puede automatizar con distintas técnicas de Procesamiento del Lenguaje Natural (PLN) y Machine Learning.
En el IIC aplicamos estas técnicas del PLN para analizar la claridad de los textos y así poder clasificarlos de forma objetiva y cuantificable, a la vez que se dan recomendaciones para expresar las ideas de manera ordenada, sencilla y transparente.
Este análisis automático de claridad de los textos es un primer paso para mejorar el lenguaje utilizado y, por ende, la comunicación entre emisor y receptor. Algo especialmente necesario en los ámbitos en los que se utiliza el lenguaje escrito para atender a un cliente, resolver dudas o responder preguntas, sobre todo cuando no contamos con mucha información del interlocutor, salvo el propio texto de la solicitud.
El equipo multidisciplinar del IIC formado por lingüistas computacionales y expertos en Machine Learning trabajan juntos en el desarrollo de estos sistemas de análisis de claridad de textos, en los que se pueden implementar otras características, como que el propio software lance recomendaciones para mejorar la redacción del texto analizado.
¿Cómo se realiza el análisis automático de claridad de los textos?
El objetivo principal del análisis automático de claridad de los textos es determinar automáticamente si un texto es claro o no. Para ello, se vale de métricas lingüísticas específicamente diseñadas por el equipo del IIC, y con las que se entrenará al modelo de Machine Learning encargado de hacer la clasificación.
Selección del corpus
Los lingüistas computacionales son los encargados de hacer un primer análisis manual y etiquetar como “claros” o “no claros” una selección de textos reales que tengan que ver con el sector en cuestión.
Diseño de métricas lingüísticas
En base al corpus seleccionado, se establecen distintos indicadores lingüísticos determinantes para medir la claridad de los textos. Se tendrán en cuenta el uso de tecnicismos, de signos de puntuación o de la voz pasiva, entre otros.
Entrenamiento del modelo de Machine Learning
Los textos etiquetados y sus puntuaciones en las mediciones sirven de ejemplo al modelo, que luego será capaz de predecir el nivel de claridad de nuevos textos.
Evaluación de la claridad y clasificación de textos
Una vez entrenado, el modelo calcula la probabilidad de que un texto sea claro o no, pudiendo implementarse un software o servicio online en el que los usuarios introduzcan sus propios textos.
Lingüistas computacionales y expertos en Machine Learning del IIC, trabajan juntos en el desarrollo de estos sistemas de análisis de claridad de textos.
Beneficios del análisis de claridad de los textos
Optimizar
Optimizar la comunicación e identificar áreas de mejora.
Mejor atención al cliente
Mejor la atención al cliente por escrito, consiguiendo un servicio más rápido y eficiente.
Apoyo en la redacción
Apoyo a la redacción en tiempo real y ahorro de tiempo.
Confianza en la marca
Aumentar la confianza en la marca, al transmitir información más clara y transparente.
Recomendaciones
Obtener recomendaciones para escribir con un lenguaje claro.