Una gran cantidad de datos heterogéneos se genera y está disponible en todas las esferas de la actividad humana. También en forma de texto, que puede analizarse con técnicas de Procesamiento del Lenguaje Natural (PLN) para agilizar los procesos, extraer conclusiones y orientar las decisiones.
Estas aplicaciones del PLN tienen también resultado en el ámbito de la Seguridad y la Defensa, donde se recopilan y procesan grandes cantidades de información de un gran número de fuentes para crear y evaluar planes y ejecutar misiones.
¿Qué aporta el PLN al sector de Seguridad y Defensa?
El Procesamiento del Lenguaje Natural (PLN) permite analizar automáticamente cualquier tipo de texto en diferentes idiomas para detectar, clasificar y organizar el contenido. De esta forma, se procesa y gestiona la información de manera más eficiente y se simplifican procesos y tareas que se realizan manualmente.
Pero una de las principales ventajas aplicables al sector de la Seguridad y la Defensa es que el análisis automático de documentos permite detectar información implícita que podría ser relevante y, sin embargo, pasar desapercibida en un proceso manual.
La aplicación de técnicas lingüísticas permite descubrir patrones y conexiones en el texto que pueden no ser evidentes para los humanos, datos que agregan valor a la tarea. Los resultados de la búsqueda o clasificación automática de la información son mucho más completos, lo que facilita además la toma de decisiones, la planificación de recursos, o la personalización de algunos procesos.
Casos de uso del PLN en Seguridad y Defensa
En el Instituto de Ingeniería del Conocimiento (IIC), se utilizan técnicas de PLN en herramientas desarrolladas por lingüistas computacionales y data scientists que se adaptan a cada sector.
Algunos casos de uso concretos para tareas del sector de la Seguridad y la Defensa son:
- Clasificación de información sensible, como documentos que contengan información sobre negociaciones internacionales, asuntos militares o datos personales.
- Anonimización de documentos: borrar automáticamente los datos personales de un texto o documento.
- Extracción de información de fuentes públicas: detectar información específica en documentos de texto libre y estructurarla.
- Asignación automática del nivel de seguridad: etiquetado inteligente de documentos para guiar decisiones sobre información clasificada.
- Detección automática de entidades: identificar lugares, armas, testigos y otros detalles en informes policiales.
- Control de riesgos en tiempo real: análisis de datos en tiempo real en caso de amenazas o vulnerabilidades en el entorno digital, influencia de personas influyentes o la detección de palabras clave en las redes sociales.
- Análisis de sentimiento: detectar automáticamente las opiniones, emociones o calificaciones de las personas a partir de sus comentarios en las redes sociales o en los campos de texto libre de una encuesta.
Pablo Haya, director del área de Social Business Analytics del IIC, dio a conocer algunas de estas aplicaciones en el Defence and Security Innovation Brokerage organizado por TEDAE y AESMIDE, y con el amparo del Ministerio de Defensa, con su ponencia sobre “Procesamiento del Lenguaje Natural en Defensa y Seguridad”.
El evento buscaba promover la innovación tecnológica en el sector e intercambiar ideas y conocimiento al respecto. El uso de tecnologías lingüísticas, por ejemplo, ayuda a realizar una lectura automatizada para aprovechar todas las posibilidades que brindan los datos.