Análisis de expedientes judiciales

Análisis de expedientes judiciales

Clasificación de documentos legales y detección de entidades jurídicas

Objetivo

Optimizar el tiempo que los profesionales del sector legal dedican a la revisión de expedientes judiciales.

GARRIGUES

Como resultado de un proyecto de investigación conjunto entre el Instituto de Ingeniería del Conocimiento (IIC) y el despacho de abogados Garrigues, se desarrolló un nuevo sistema de inteligencia artificial para el sector legal: Mapa del Expediente.

Este se orientó al tratamiento y organización de expedientes judiciales automáticamente, con el objetivo de reducir el esfuerzo que los abogados dedican a la búsqueda de información entre grandes volúmenes de texto.

Solución

En Mapa del Expediente se utilizan principalmente técnicas de Procesamiento del Lenguaje Natural (PLN) y se incluye el primer modelo de lenguaje en español adaptado al sector legal. Sus funcionalidades principales son:

Clasificación de documentos

(partes, actas de declaración, diligencias, autos, etc.)

Detección de entidades jurídicas

(personas y organizaciones)

Visualización en grafos

(documentos, las entidades y sus relaciones)

Para desarrollar la herramienta, se trabajó con 79.6 GB de datos sin etiquetar, pertenecientes a 6 expedientes judiciales del despacho de abogados Garrigues. Para asegurar la calidad de los textos, hubo que incorporar algunas tareas adicionales: se utilizan técnicas OCR (Optical Character Recognition) para digitalizar los documentos, descartar páginas no informativas y detectar los límites de los documentos para dividirlos.

En cuanto al modelo de lenguaje, este se desarrolló con una metodología propia del IIC. Se hizo una adaptación en dos fases del modelo en español BETO: primero con un corpus legal-administrativo general y después con los datos del despacho de abogados, hasta obtener el modelo legal del IIC adaptado en este caso a Garrigues.

Diagrama MAPA EXPEDIENTE

Por último, hay que destacar la colaboración de los profesionales del despacho de abogados Garrigues, que estuvieron presentes en las fases de anotación y validación del modelo para enriquecer el proceso.

Beneficio

En primer lugar, Mapa del Expediente permite a los usuarios consultar de manera rápida los documentos relevantes o las personas y organizaciones involucradas en cada caso judicial, así como visualizar la red de relaciones entre estos. De esta forma, los profesionales del sector legal pueden automatizar la organización y estructuración de la información, concentrando su tiempo en tareas de más valor.

Además, se ha comprobado que el modelo legal del IIC, desarrollado específicamente para el caso, ofrece mejores resultados que el estado del arte en modelos de lenguaje en español. Este fue un paso significativo para el posterior desarrollo del modelo de lenguaje en español propio del IIC: RigoBERTa.

Proyectos relacionados

Resumen de privacidad
Instituto de Ingeniería del Conocimiento

En Asociación para el Desarrollo de la Ingeniería del Conocimiento usamos cookies propias y de terceros necesarias para que nuestro sitio web funcione adecuadamente y para fines analíticos. política de cookies

Al pulsar “Guardar cambios”, se guardará la selección de cookies que hayas realizado. Si no has seleccionado ninguna opción, pulsar este botón equivaldrá a rechazar todas las cookies.

Cookies necesarias

Son aquellas que ayudan a hacer una página web utilizable activando funciones básicas como la navegación en la página y el acceso a áreas seguras de la página web. La página web no podrá funcionar adecuadamente sin estas cookies. Le informamos de que puede configurar su navegador para bloquear o alertar sobre estas cookies, sin embargo, es posible que determinadas áreas de la página web no funcionen. Estas cookies no almacenan ninguna información de identificación personal. El reproductor de Youtube usa cookies publicitarias, el cual usamos para poder ver vídeos insertados.

Cookies de analítica

Son aquellas que permiten al Editor de las mismas, el seguimiento y análisis del comportamiento de los usuarios de los sitios web a los que están vinculadas. La información recogida mediante este tipo de cookies se utiliza en la medición de la actividad de los sitios web, aplicación o plataforma, con el fin de introducir mejoras en función del análisis de los datos de uso que hacen los usuarios del servicio. Las cookies analíticas utilizadas son:

Cookies que se utilizan:
_ga (Google Analytics) | _gid (Google Analytics) |