Cada día estamos expuestos a grandes cantidades de información. Sin embargo, no siempre emitimos o recibimos mensajes claros, que podamos comprender sin esfuerzo: los escritos administrativos, médicos o legales suponen todo un reto para el público general y con frecuencia implican una mayor inversión de tiempo y esfuerzo de comprensión.
La comunicación clara tiene como objetivo facilitar la comunicación, fomentando que la información se transmita de forma directa, transparente, simple y eficaz. En otras palabras, la comunicación clara promueve que el público general pueda entender sin dificultades cualquier tipo de información.
Para facilitar esta tarea, y fruto de nuestra experiencia en comunicación clara[1] en el Instituto de Ingeniería del Conocimiento (IIC) hemos desarrollado LUCES – Analizador de la claridad para el español (Language Understanding and Clarity Evaluation for Spanish). LUCES es una herramienta cuya función principal es evaluar el grado de claridad de los textos en español. LUCES detecta automáticamente aspectos lingüísticos que restan o suman claridad a los textos. Ya está disponible en AWS Marketplace y en este post te contamos cómo funciona y los resultados que ofrece.

LUCES para promover la comunicación clara
Comunicarse de manera clara, simple y eficaz no es una tarea sencilla y menos si se trata del medio escrito, donde no contamos con la respuesta inmediata de nuestros interlocutores. Escribir de manera clara no es un asunto que afecte únicamente a la calidad de los escritos, sino que impacta directamente en que se transmita el mensaje (hacer llegar información, dar una orden, hacer una petición, etc.).
La tecnología puede ahora facilitar esta tarea y ayudar a autores, instituciones y creadores de contenido a redactar textos más claros. Un ejemplo es LUCES – Analizador de la claridad para el español (Language Understanding and Clarity Evaluation for Spanish). Este sistema de evaluación y asistente a la redacción de textos claros en español está basado en técnicas de procesamiento del lenguaje natural (PLN).
Comunicación clara vs. lectura fácil
La herramienta LUCES sigue la línea del analizador de lectura fácil en español ERAS, que también desarrollamos en el IIC. Ambos buscan mejorar la comunicación escrita y facilitar la comprensión y el acceso a la información, pero se dirigen a colectivos diferentes:
- LUCES está específicamente diseñado para evaluar y mejorar la claridad de los textos dirigidos a un público general en español.
- ERAS se centra en evaluar y facilitar la lecturabilidad de los textos para personas con dificultades asociadas al lenguaje.
Debido a que el público general y las personas con dificultades asociadas al lenguaje tienen necesidades diferentes, LUCES y ERAS cuentan con métricas y umbrales de evaluación diseñados específicamente para comunicación clara y lectura fácil, respectivamente.
¿Cómo funciona LUCES para evaluar la claridad de los textos?
El objetivo del analizador de la claridad LUCES es automatizar la evaluación de textos en español para identificar aspectos lingüísticos a mejorar con idea de maximizar el grado de claridad de un texto. Por este motivo, LUCES puede entenderse también como un asistente a la redacción de textos claros en español.
LUCES está basado en 3 índices y 13 subíndices lingüísticos específicos para comunicación clara que analizan algunos pilares básicos del lenguaje escrito: longitud oracional, léxico y complejidad oracional. Dichos índices provienen de la literatura sobre comunicación clara que investiga los mecanismos que hacen que un texto en español sea más sencillo de comprender para el público general. A continuación, se describe el acceso, la configuración y los distintos informes de resultados disponibles.
Acceso y configuración de LUCES
El analizador de la claridad de textos LUCES se encuentra disponible a través de AWS Marketplace. Para acceder a LUCES es necesario estar registrado en AWS. El registro se realiza con un email de contacto a través del que se reciben las credenciales de acceso. Una vez registrado, podrás suscribirte a LUCES y realizar las peticiones correspondientes.
La configuración de la herramienta y la carga de datos se llevan a cabo a través del JSON de configuración de input de la figura 1. Este JSON cuenta con varios campos:

Figura 1. Acceso, configuración y uso de LUCES en AWS Marketplace.
- “function”: Define el tipo de análisis a realizar. Este campo puede tomar los siguientes valores:
- “/analyze”: analiza y obtiene métricas para un único texto. Cuando se utiliza “/analyze”, el JSON cuenta con el campo “text” donde ha de introducirse el texto a analizar.
- ”/compare”: analiza y obtiene métricas para un par de textos. Cuando se utiliza “/compare”, el JSON cuenta con los campos “text1” y “text2” donde han de introducirse los textos a analizar.
- “/global_stat”: analiza y obtiene métricas para un máximo de textos[2]. Cuando se utiliza “/global_stat”, el JSON cuenta con el campo “texts” donde ha de introducirse una lista con los textos a analizar, por ejemplo, “/texts”: [“texto_1”, “texto_2”, …, “texto_50”].
- “mode”: Define el formato de resultados a obtener. Este campo puede tomar los siguientes valores
- “/report”: Genera un informe que contiene un resumen sobre LUCES, y gráficas y explicaciones en base al análisis global de los datos analizados, a los análisis de longitud oracional, léxico y complejidad oracional, además de las conclusiones de todo el análisis.
- “/metric”: Genera los valores de los índices para los textos analizados.
A continuación, se detalla el contenido que se incluye en el informe de evaluación de claridad generado con LUCES.
Resultados del análisis de evaluación de la claridad con LUCES
El informe del analizador de la claridad de textos en español del IIC está estructurado en tres partes:
- una breve introducción sobre LUCES, la comunicación clara y la interpretación de cada una de las gráficas contenidas en el informe,
- el análisis de los datos
- y algunos aspectos de mejora sobre los textos analizados como conclusión.
Para cada índice y subíndice de claridad presente en el informe, LUCES genera una puntuación entre 0 y 1, donde 0 significa que el texto no es claro y 1 que el texto es claro. Las puntuaciones cercanas a 0 permiten identificar aspectos que restan claridad para revisarlos y corregirlos con mayor agilidad. Veamos algunos ejemplos.

Figura 1. Análisis global de claridad generado con ”analyze” sobre un texto en LUCES.
La figura 1 ilustra el análisis global de claridad para los índices longitud oracional, léxico y complejidad oracional para un texto. Cada índice de claridad está representado por un color en la leyenda y una barra en el eje X. El eje Y representa una puntuación entre 0 y 1 con respecto al índice concreto a medir. La figura 1 muestra valores altos de claridad para los índices de longitud y complejidad oracionales. Sin embargo, el valor que LUCES obtiene para el índice de léxico indica que tal vez convendría revisar qué aspectos léxicos (subíndices) son potencialmente mejorables para conseguir una versión del texto más clara.
La figura 2 muestra el análisis de claridad para el índice de longitud oracional para cinco textos. Este índice está compuesto por dos subíndices: el número de palabras por texto y el número de palabras por oración. Cada texto está representado por una barra en el eje X, donde se le asigna un ID. El eje Y representa para cada texto una puntuación entre 0 y 1 con respecto al subíndice concreto a medir. En cuanto al número de palabras por texto, los textos 2 y 5 muestran valores de claridad muy bajos que contrastan con los valores de claridad obtenidos para los textos 1, 3 y 4. Sin embargo, todos los textos, excepto el texto 2, cuentan con valores cercanos a 1 en relación con el número de palabras por oración. A partir de este análisis es posible redactar el texto 2 más claro, revisando y ajustando la longitud total del texto, y tanto el texto 2 como el 5 mejorarían en claridad adaptando la longitud de las oraciones que los componen.
La figura 3 muestra el análisis de claridad para el índice de léxico para un par de textos. Este índice está compuesto por siete subíndices: diversidad léxica, frecuencia léxica, conectores discursivos, términos abstractos, tecnicismos, expresiones redundantes y palabras fuera de diccionario. Cada texto está representado por un color en la leyenda. El eje X contiene los subíndices de análisis. El eje Y muestra una puntuación entre 0 y 1 con respecto al subíndice concreto a medir. La gráfica muestra que el texto 1 es más claro que el texto 2 con respecto al uso de tecnicismos y palabras fuera de diccionario, aunque LUCES obtiene puntuaciones altas de claridad para ambos textos respecto a estos dos subíndices. El texto 2 es más claro que el texto 1 en cuanto al uso de términos abstractos, aunque, de nuevo, ambos textos son bastante claros a este respecto. Ambos textos son igual de claros en cuanto al uso de expresiones redundantes. Sin embargo, tanto el texto 1 como el texto 2 obtienen puntuaciones bajas de claridad en cuanto al uso de conectores discursivos, aspecto que cabría mejorar para obtener una versión más clara de los textos. Además, ambos textos podrían mejorar en claridad revisando la diversidad de palabras y el uso de términos poco comunes.
La figura 4 ilustra el análisis de claridad para el índice de complejidad oracional para un conjunto de 36 textos. Este índice está compuesto por cuatro subíndices: subjuntivos, negación, pasivas perifrásticas y complejidad cuantitativa. El eje X representa cada texto con una barra y el eje Y muestra una puntuación entre 0 y 1 con respecto al índice concreto a medir. La figura 4 muestra valores muy dispares con respecto al uso del subjuntivo. Por ejemplo, los textos 1, 5 y 21 obtienen la puntuación máxima de claridad a este respecto, mientras que textos como el 12, 13 y 15 no son claros a este respecto. LUCES muestra diferencias menos marcadas en cuanto al uso de la negación, aunque señala el texto 20 como un caso en el que el uso de la negación resta claridad al texto. Las diferencias que refleja LUCES con respecto al uso de pasivas son categóricas: los textos 10,12, 21, 25, 27, 32 y 34 no son claros frente al resto de textos que sí lo son. LUCES muestra grandes variaciones con respecto al subíndice de complejidad cuantitativa, por ejemplo, textos como el 1, 12 ó 36 son claros, mientras que textos como el 6, 15 ó 18 podrían mejorar simplificando el tipo de oraciones que los componen.
El informe incluye además una breve explicación sobre los índices y subíndices que se calculan en cada apartado, así como el racional que subyace a la confección de cada subíndice. En la sección de conclusiones del informe se incluye un resumen sobre los análisis realizados. En el caso de aplicar la evaluación de claridad sobre un texto o un par de textos de manera comparativa, se obtiene un listado de aspectos correctos y aspectos mejorables en términos de claridad.
En resumen, el analizador de la claridad LUCES es una herramienta que pretende detectar aspectos lingüísticos de mejora para maximizar el grado de claridad de un texto en español mediante la aplicación de técnicas de procesamiento del lenguaje natural (PLN). Desde el IIC, lo enmarcamos en una iniciativa para promover la claridad de los textos a través del desarrollo de proyectos y recursos que impulsan la comunicación clara.
[1] Publicaciones del IIC relacionadas con la comunicación clara:
Comunicación clara y personalizada desde la Administración Pública
Inteligencia Artificial para evaluar la comunicación clara
Análisis de la claridad de los textos
La Inteligencia Artificial mide la claridad del lenguaje
Casos de éxito de comunicación clara:
Análisis de la claridad de los textos
[2] El máximo de textos permitido viene determinado por el formato de resultados. Si se quiere obtener un informe (“mode”:”/report”), el máximo de textos permitidos es 100. Si se quieren obtener los valores asociados a las métricas (“mode”:”/metric”), no hay límite máximo de textos.