Después de nuestro primer post sobre Qué es el Procesamiento de Lenguaje Natural, en este segundo post, hablamos de algunas de las aplicaciones de PLN, donde el procesamiento automático nos resuelve o ayuda en tareas que implican conversar, leer o escribir en una lengua.
PLN para la Traducción Automática de textos (TA)
El sueño de un robot que traduce y habla un millón de formas de comunicación es muy anterior a la saga de La Guerra de las Galaxias. El multilingüismo es una barrera colosal para la globalización y la comunicación humana.
No se resuelve con conocer dos o tres lenguas (tarea costosa para la mayoría de las personas). Necesitamos traductores que nos acerquen los contenidos escritos en docenas de lenguas. Ante la falta de disponibilidad de traductores humanos para muchos pares de lenguas, la Traducción Automática nos proporciona un borrador del contenido de una página web o de un comentario sobre la habitación de un hotel.
Por supuesto, la traducción automática de textos no puede sustituir a los humanos en textos complejos y donde la fiabilidad sea crucial (ficción, textos legales, etc.). Sin embargo, se ha extendido en los contenidos de internet y las redes sociales. Sobre todo, porque es gratuita, instantánea y, en la mayoría de los casos, aceptable para nuestros intereses.
Sistemas conversacionales con PLN
Los primeros sistemas de tecnologías de habla reconocían un conjunto muy reducido de palabras (números aislados, generalmente). Luego pasaron a transcribir automáticamente mensajes de voz y llegaron los asistentes conversacionales como Siri, Cortana o Google Assistant.
La interacción entre humano y máquina por voz es uno de las aplicaciones más exitosas y sus usos son múltiples porque virtualmente cualquier artefacto (desde un coche hasta un frigorífico) llevará un pequeño ordenador con el que comunicar. El desafío ahora es que sean capaces de entablar una verdadera conversación con peticiones encadenadas.
PLN para la recuperación y extracción de información
Los buscadores de internet fueron la primera aplicación masiva del lenguaje natural en el mundo TIC. Con la aparición de Internet había demasiada información no accesible y hacía falta una herramienta que pudiera mostrar páginas mediante la búsqueda de palabras clave.
El siguiente paso es leer la información expresada en una lengua y extraer su contenido. La extracción de información es la base para clasificar, resumir y relacionar.
Etiquetado morfológico, sintáctico y semántico
Para procesar el contenido se usan etiquetadores que analizan los mensajes en diferentes niveles. Por ejemplo, anotan el infinitivo a todas las formas verbales o asignan las etiquetas de sujeto y objeto directo en la oración.
Estos anotadores son los que permiten realizar las tareas específicas que detallamos a continuación.
Procesamiento de lenguaje natural para respuestas automáticas a preguntas
El sistema Watson de IBM se hizo famoso por ganar a los dos mejores competidores del concurso televisivo Jeopardy.
Watson era más rápido y exacto a la hora de encontrar la relación entre preguntas y respuestas. Para ello, usa múltiples niveles de conocimiento y bases de datos donde se almacenan los contenidos.
Análisis del sentimiento de los textos
Las redes sociales han explotado en los últimos años. Todo el mundo quiere saber lo que se dice en Twitter o Facebook. Pero nuestra capacidad es muy limitada y se nos escapan infinidad de mensajes que nos interesan.
Aplicaciones como Lynguo, del IIC, escuchan las redes y analizan instantáneamente miles de mensajes para detectar opiniones acerca de un tema, una persona o un producto. Al tiempo, sirven para dibujar las comunidades de internautas, sus usuarios más influyentes y las relaciones entre ellos.
Detectar topics automáticamente con PLN
Un requisito para la clasificación es reconocer temas dentro de un documento. Los términos son la pieza básica, ya que nos informan de manera general del contenido y sirven para una tarea más compleja: establecer relaciones entre conceptos. A partir de estos recursos se realizan diferentes tareas de análisis textual.
Realización de resúmenes de textos automáticos
Miles de páginas se quedan sin leer por falta de tiempo o de acceso y los lectores interesados se pierden esos contenidos. El resumen automático es un paso intermedio entre el título y la totalidad del documento, para decidir si el contenido es relevante.
Clasificación de documentos por categorías
Otra tarea de gestión documental es la clasificación de diferentes textos por categorías. De esta manera, se redirige la información a los usuarios apropiados.
Beneficios del Procesamiento del Lenguaje Natural
La aplicación de PLN en las aplicaciones descritas es simplificar la comunicación con las máquinas, para dedicarse a tareas de más alto impacto.
- Ahorra tiempo al automatizar procesos que se realizan a mano. La clasificación documental o la traducción de documentos con información repetitiva se puede agilizar con programas especiales.
- Agiliza el trabajo de etiquetado manual. Se pueden leer grandes volúmenes de documentos para etiquetar su contenido de una manera más fiable si un programa automático filtra los conceptos.
- Permite de forma sencilla tomar decisiones relativas al negocio. Una crisis en un medio social se puede controlar más efectivamente si un sistema de escucha de opiniones en las redes detecta el problema rápidamente.
- Añade valor a tus soluciones incorporando el significado de los textos, reglas lingüísticas, diccionarios. Las tecnologías PLN permite visualizar información semántica para ayudar a su mejor compresión por los usuarios.
Ejemplos reales de Procesamiento del Lenguaje Natural
El lenguaje es una facultad universal en la especie y nuestro principal medio de comunicación intergrupal. Por ello, cualquier faceta de la comunicación humana puede ser objeto de uso de las herramientas de PLN.
Naturalmente, hay tareas más factibles al tratamiento computacional. En especial, aquellos mensajes o textos que están muy estructurados y con un estilo más uniforme y predecible.
Pero también son apropiados los grandes volúmenes de información que difícilmente se pueden procesar. Aquí citamos algunos ejemplos actuales:
- Historia clínica digital
- Clasificación de currículos
- Detección de nombres de personas, entidades, lugares, etc.
- Clasificación de incidencias
- Búsqueda en internet por voz
- Traducción automática de comentarios en foros
Si quieres consultar más información sobre el Procesamiento de Lenguaje Natural puedes ponerte en contacto con nosotros.
hola. cual es el desarrollo actual del procesamiento natual lenguaje ?
Hola Jesús, quizás este post se resuelva la dudad: https://www.iic.uam.es/innovacion/transformers-en-procesamiento-del-lenguaje-natural/ . Gracias por tu interés!