Clasificar patentes

Objetivo

El Instituto de Ingeniería del Conocimiento – IIC y la Secretaría de Estado de la Sociedad De La Información Y Agenda Digital – SESIAD firman un contrato para la investigación del empleo de técnicas de aprendizaje automático, propuesta de algoritmos y su realización, aplicado a la clasificación de solicitudes de patentes.

La Secretaría de Estado de la Sociedad De La Información Y Agenda Digital forma parte del Ministerio de Energía, Turismo y Agenda Digital y, según la Oficina Española de Patentes y Marcas (OEPM), recibe alrededor de 3.000 solicitudes de patentes al año. Es por esto que la SESIAD necesita una herramienta que le facilite las labores de clasificación y que proporcione etiquetas.

Solución

La solución implementada por el IIC, basada en redes neuronales profundas y tecnologías de procesamiento del lenguaje natural, permite clasificar automáticamente las patentes escritas en cualquier idioma y buscar otras patentes similares para detectar plagios y originalidad entre las patentes. Propone hasta 10 etiquetas distintas para un texto y el grado de certeza que tiene en cada una.

Nuestra herramienta ha sido probada en corpus de 780.819 patentes americanas y de 41.469 patentes españolas, y ha conseguido en los niveles IPC un 85% en el nivel 1, un 73% en el nivel 2 y un 53% en nivel 3 en clasificar patentes.

Beneficio

Con la aplicación de estas tecnologías, la herramienta del IIC propone etiquetas para facilitar la labor de etiquetado y sugiere otras patentes similares ya etiquetadas basadas en el contenido del texto. Además, define el grado de seguridad de cada etiqueta, lo que permite revisar solo aquellas en las que la herramienta tiene duda.

Proyectos relacionados