En la era de la información, el acceso a la misma es la llave para desarrollar una vida plena bajo prismas como el administrativo, el sanitario o el lúdico. No obstante, esto puede ser complicado para colectivos que presentan dificultades asociadas al lenguaje, y para los que la lectura fácil se hace indispensable.
Para agilizar la adaptación de estos textos, desde el Instituto de Ingeniería del Conocimiento (IIC) hemos desarrollado ERAS, un analizador de lectura fácil en español cuya función principal es evaluar el grado de complejidad de un texto en términos de lecturabilidad[1]. En concreto, esta detecta automáticamente aspectos lingüísticos a mejorar con el objetivo de asistir la redacción de estos textos y maximizar así el acceso a la información. Ya está disponible en AWS Marketplace y en este post te contamos cómo funciona y los resultados que ofrece.
Me interesa probar el analizador de lectura fácil para el español
ERAS para la adaptación de textos en lectura fácil
La adaptación de textos en lectura fácil es un proceso que conlleva una importante inversión de tiempo y recursos. En un marco en el que además se generan contenidos constantemente, se pueden ver afectadas la calidad, la tipología y la frecuencia de publicación de estos textos que facilitan el acceso a la información a muchas personas.
La tecnología puede ahora facilitar esta tarea y ayudar a generalizar los textos en lectura fácil. Un ejemplo es ERAS – Analizador de lectura fácil para el español (Easy Reading Analyzer for Spanish). Este sistema de evaluación y asistente a la redacción de textos en español adaptados a lectura fácil está basado en técnicas de procesamiento del lenguaje natural (PLN).
Lectura fácil vs. comunicación clara
La herramienta ERAS sigue la línea del analizador de la claridad de los textos LUCES, que también desarrollamos en el IIC. Ambos buscan mejorar la comunicación escrita y facilitar la comprensión y el acceso a la información, pero se dirigen a colectivos diferentes:
- ERAS se centra en evaluar y facilitar la lecturabilidad de los textos para personas con dificultades asociadas al lenguaje.
- LUCES está específicamente diseñado para evaluar y mejorar la claridad de los textos dirigidos a un público general en español.
Debido a que las personas con dificultades asociadas al lenguaje y el público general tienen necesidades diferentes, ERAS y LUCES cuentan con métricas y umbrales de evaluación diseñados específicamente para lectura fácil y comunicación clara, respectivamente.
¿Cómo funciona ERAS?
El objetivo del analizador de lectura fácil del IIC (ERAS) es automatizar la evaluación de textos adaptados a lectura fácil que permite identificar aspectos lingüísticos a mejorar para maximizar el grado de comprensibilidad de un texto. Por este motivo, ERAS puede entenderse también como un asistente a la redacción de textos en Lectura Fácil (LF).
ERAS está basado en 4 índices y 33 subíndices lingüísticos específicos para lectura fácil que analizan algunos pilares básicos del lenguaje escrito: longitud oracional, puntuación, léxico y complejidad oracional. Dichos índices provienen de la literatura que investiga los mecanismos que facilitan la comprensión de un texto. A continuación, se describe el acceso, la configuración y los distintos informes de resultados disponibles.
Acceso y configuración de ERAS
El analizador de Lectura Fácil ERAS se encuentra disponible a través de AWS Marketplace. Para acceder a ERAS es necesario estar registrado en AWS. El registro se realiza con un email de contacto a través del que se reciben las credenciales de acceso. Una vez registrado, podrás suscribirte a ERAS y realizar las peticiones correspondientes.

Figura 3. Acceso, configuración y uso de ERAS en AWS Marketplace.
La configuración de la herramienta y la carga de datos se llevan a cabo a través del JSON de configuración de input de la figura 3. Este JSON cuenta con varios campos:
- “function”: Define el tipo de análisis a realizar. Este campo puede tomar los siguientes valores:
- “/analyze”: analiza y obtiene métricas para un único texto. Cuando se utiliza “/analyze”, el JSON cuenta con el campo “text” donde ha de introducirse el texto a analizar.
- ”/compare”: analiza y obtiene métricas para un par de textos. Cuando se utiliza “/compare”, el JSON cuenta con los campos “text1” y “text2” donde han de introducirse los textos a analizar.
- “/global_stat”: analiza y obtiene métricas para un máximo de textos[2]. Cuando se utiliza “/global_stat”, el JSON cuenta con el campo “texts” donde ha de introducirse una lista con los textos a analizar, por ejemplo, “/texts”: [“texto_1”, “texto_2”, …, “texto_50”].
- “mode”: Define el formato de resultados a obtener. Este campo puede tomar los siguientes valores:
- “/report”: Genera un informe que contiene un resumen sobre ERAS, y gráficas y explicaciones en base al análisis global de los datos analizados, a los análisis de longitud oracional, puntuación, léxico y complejidad oracional, además de las conclusiones de todo el análisis.
- “/metric”: Genera los valores de los índices para los textos analizados.
En base al parámetro “mode” del JSON de configuración, ERAS permite obtener un informe con el análisis de los índices y subíndices de lectura fácil. A continuación, se detalla el contenido que se incluye en el informe generado.
Resultados del análisis de lectura fácil con ERAS
El informe del analizador de lectura fácil del IIC está estructurado en tres partes:
- una breve introducción sobre ERAS, la lectura fácil y la interpretación de cada una de las gráficas contenidas en el informe,
- el análisis de los datos
- y algunos aspectos de mejora sobre los textos analizados como conclusión.
Para cada índice y subíndice presente en el informe, ERAS genera una puntuación entre 0 y 1, donde 0 significa que el texto es complejo de entender y 1 que el texto es sencillo de comprender. Las puntuaciones cercanas a 0 permiten detectar aspectos mejorables y corregir los textos adaptados con mayor agilidad. Veamos algunos ejemplos.

Figura 4. Análisis global generado con ”global_stat” sobre 20 textos en ERAS.
La figura 4 ilustra el análisis global de los 4 índices de longitud, puntuación, léxico y complejidad oracional para un conjunto de 20 textos. Cada texto está representado por una barra en el eje X y obtiene una puntuación entre 0 y 1 con respecto al eje Y y al índice concreto a medir. En la gráfica se observa que los textos son bastante uniformes en cuanto al léxico, pero presentan diferencias más marcadas en cuanto a puntuación y complejidad oracional. Las diferencias más sustanciales vienen determinadas por la longitud oracional, cuyos valores se encuentran en torno al 0.5 en algunos casos. Estos bajos valores en cuanto a la longitud oracional apuntan a la necesidad de revisar la longitud de las oraciones de los textos, reformulándolas en los casos en los que sea conveniente.

Figura 5. Análisis global generado con ”compare” sobre 2 textos en ERAS.
La figura 5 es un ejemplo del análisis de longitud oracional para un par de textos: los colores de la leyenda identifican cada texto, el eje X recoge las métricas agrupadas para cada uno de los tres subíndices (número de palabras, número de caracteres y media de palabras en una oración), y el eje Y muestra el valor obtenido para cada subíndice. De nuevo, cada texto obtiene una puntuación entre 0 y 1 con respecto al subíndice concreto a medir. La gráfica 5 refleja que el texto 1 necesita algunas mejoras: es un texto demasiado largo, las palabras que componen sus oraciones también tienden a ser largas y, además, sus oraciones son más largas de lo deseado. Por otro lado, el texto 2 obtiene puntuaciones razonables en cuanto a la extensión de las oraciones y de la longitud de las palabras que las conforman. Sin embargo, necesita cierta revisión con respecto a la longitud global del texto.

Figura 6. Análisis global generado con ”analyze” sobre un texto en ERAS.
La figura 6 es un ejemplo del análisis de léxico para un texto: la gráfica muestra los valores obtenidos para cada uno de los 14 subíndices que componen el índice de léxico. En este caso, al tratarse de un análisis realizado sobre un único texto, cada barra en el eje X representa cada uno de los subíndices y, el eje Y representa la puntuación entre 0 y 1 obtenida. De la gráfica 6 se puede concluir que el texto cuenta con valores generales que facilitan la comprensión del texto a excepción de cuatro aspectos revisables: el uso de palabras poco frecuentes en castellano, la ausencia de conectores simples, el uso de palabras demasiado largas o el uso de palabras que contienen consonantes consecutivas.
El informe incluye además una breve explicación sobre los índices y subíndices que se calculan en cada apartado, así como el racional que subyace a la confección de cada subíndice en el contexto de lectura fácil. En la sección de conclusiones del informe se incluye un resumen sobre los análisis realizados, y, en el caso de aplicarlo sobre un texto o un par de textos de manera comparativa, se obtiene un listado de aspectos correctos y aspectos mejorables en términos de lectura fácil que ayudan a identificar más rápidamente aquellas cuestiones mejorables de los textos.
En resumen, el analizador de lectura fácil ERAS es una herramienta que pretende facilitar la adaptación de textos a lectura fácil mediante la aplicación de técnicas de procesamiento del lenguaje natural (PLN) en español. Desde el IIC, lo enmarcamos en una iniciativa para promover la lectura inclusiva a través del desarrollo de recursos que facilitan la accesibilidad y comprensión de la información.
[1] Se entiende por lecturabildad el grado de facilidad de lectura que presenta un texto con respecto a diversos aspectos como elementos lingüísticos, elementos visuales (imágenes o pictogramas), tipografía o maquetación.
[2] El máximo de textos permitido viene determinado por el formato de resultados. Si se quiere obtener un informe (“mode”:”/report”), el máximo de textos permitidos es 100. Si se quieren obtener los valores asociados a las métricas (“mode”:”/metric”), no hay límite máximo de textos.