Análisis de expedientes judiciales

Análisis de expedientes judiciales

Clasificación de documentos legales y detección de entidades jurídicas

Objetivo

Optimizar el tiempo que los profesionales del sector legal dedican a la revisión de expedientes judiciales.

GARRIGUES

Como resultado de un proyecto de investigación conjunto entre el Instituto de Ingeniería del Conocimiento (IIC) y el despacho de abogados Garrigues, se desarrolló un nuevo sistema de inteligencia artificial para el sector legal: Mapa del Expediente.

Este se orientó al tratamiento y organización de expedientes judiciales automáticamente, con el objetivo de reducir el esfuerzo que los abogados dedican a la búsqueda de información entre grandes volúmenes de texto.

Solución

En Mapa del Expediente se utilizan principalmente técnicas de Procesamiento del Lenguaje Natural (PLN) y se incluye el primer modelo de lenguaje en español adaptado al sector legal. Sus funcionalidades principales son:

Clasificación de documentos

(partes, actas de declaración, diligencias, autos, etc.)

Detección de entidades jurídicas

(personas y organizaciones)

Visualización en grafos

(documentos, las entidades y sus relaciones)

Para desarrollar la herramienta, se trabajó con 79.6 GB de datos sin etiquetar, pertenecientes a 6 expedientes judiciales del despacho de abogados Garrigues. Para asegurar la calidad de los textos, hubo que incorporar algunas tareas adicionales: se utilizan técnicas OCR (Optical Character Recognition) para digitalizar los documentos, descartar páginas no informativas y detectar los límites de los documentos para dividirlos.

En cuanto al modelo de lenguaje, este se desarrolló con una metodología propia del IIC. Se hizo una adaptación en dos fases del modelo en español BETO: primero con un corpus legal-administrativo general y después con los datos del despacho de abogados, hasta obtener el modelo legal del IIC adaptado en este caso a Garrigues.

Diagrama MAPA EXPEDIENTE

Por último, hay que destacar la colaboración de los profesionales del despacho de abogados Garrigues, que estuvieron presentes en las fases de anotación y validación del modelo para enriquecer el proceso.

Beneficio

En primer lugar, Mapa del Expediente permite a los usuarios consultar de manera rápida los documentos relevantes o las personas y organizaciones involucradas en cada caso judicial, así como visualizar la red de relaciones entre estos. De esta forma, los profesionales del sector legal pueden automatizar la organización y estructuración de la información, concentrando su tiempo en tareas de más valor.

Además, se ha comprobado que el modelo legal del IIC, desarrollado específicamente para el caso, ofrece mejores resultados que el estado del arte en modelos de lenguaje en español. Este fue un paso significativo para el posterior desarrollo del modelo de lenguaje en español propio del IIC: RigoBERTa.

Proyectos relacionados