Detección de entidades o NER

Detección de entidades o NER

Identificar y extraer conceptos y términos clave en los textos

La detección de entidades permite conocer cuáles son las entidades relevantes y cómo categorizarlas dentro de un texto.

entidades

¿Qué es la detección de entidades?

La detección de entidades o Named Entity Recognition (NER) permite localizar y clasificar automáticamente determinadas palabras de un texto en categorías predefinidas: personas, organizaciones, lugares, marcas, cantidades, entre otras.

Aunque la mayoría de las herramientas de detección de entidades son generalistas, también pueden desarrollarse para una temática específica, pudiendo extraer términos de un dominio concreto: legal, médico, financiero, educativo, etc.

Además, estos sistemas han evolucionado para detectar las llamadas entidades nombradas vinculadas o Named Entity Linked, pudiendo relacionar y enlazar directamente las entidades detectadas con puntos geográficos, la Wikipedia u otros sitios web.

Tras este entrenamiento y un primer escaneado del texto, la detección de entidades puede constituir un paso previo para otras aplicaciones de PLN:

Anonimización de textos

Anonimización de textos, tras detectar los datos personales y borrarlos automáticamente.

Extracción de términos

Extracción de términos de un dominio concreto, proponiendo incluso términos potenciales en ámbitos cuyo vocabulario aumenta constantemente, como es el caso del lenguaje médico.

Detección de similitudes y anomalías

Detección de similitudes y anomalías entre varios textos, útil para la detección de plagio o el control de calidad de documentos.

Clasificación automática de textos

Clasificación automática de textos, al identificar el tema de los mismos a partir de las entidades destacadas.

anotación textos

¿Cómo se realiza la detección de entidades?

La detección de entidades o NER se basa en técnicas de Procesamiento del Lenguaje Natural (PLN) y de Machine Learning. Estos sistemas suelen abordar dos tareas:

  • Detectar una entidad nombrada
  • Categorizar la entidad

Para saber cuáles son las entidades relevantes y cómo categorizarlas dentro del texto, el modelo requiere ser entrenado con un corpus anotado. Una vez definidas las entidades y sus categorías, el algoritmo etiquetará los textos de manera predictiva.

Te ayudamos a extraer los términos y conceptos clave de tus textos.

QUIERO MÁS INFORMACIÓN

Beneficios de la anotación automática de textos

En términos generales, la detección de entidades o NER permite:

Resaltar keywords y términos

Resaltar keywords y términos, pudiendo hacernos una idea del texto o textos en cuestión.

Ahorrar tiempo

Ahorrar tiempo al automatizar la tarea, sobre todo en ámbitos en los que se maneja mucha información.

Obtener información

Obtener información estructurada y estandarizada con la que trabajar en otras tareas de PLN.

En ámbitos concretos, podemos mostrar las ventajas de la detección de entidades mediante ejemplos:

Recuperación de información

Recuperación de información entre el material de archivo y base para resumir artículos, facilitando la tarea a estudiantes e investigadores.

Agilizar procesos

Agilizar procesos de contratación, al destacar información clave en los CV de los solicitantes.

Extraer información clave

Extraer información clave de informes clínicos y relacionarla, mejorando la atención al paciente.

comunicación-clara

Mejorar los tiempos de respuesta

Mejorar los tiempos de respuesta a los clientes, categorizando solicitudes, quejas o preguntas.

Mostrar contenido relevante

Mostrar el contenido relevante de noticias y otras publicaciones, pudiendo clasificarlas e identificar tendencias.

Anonimización de textos

Asegurar la privacidad de documentos en ámbitos de justicia y seguridad, mediante la anonimización de textos.

Contacta con nosotros


    He leído y acepto las condiciones de uso y la política de privacidad*.

     Sí deseo recibir comunicaciones comerciales.

     

    Información básica sobre Protección de Datos

    • Responsable: Asociación para el Desarrollo de la Ingeniería del Conocimiento.
    • Dirección: Ctra. de Colmenar Viejo, km.15, Calle Francisco Tomás y Valiente 11; EPS, Edificio B, 5ª planta; 28049 Madrid.
    • Teléfono: 914972323
    • Correo electrónico: contacto.iic@iic.uam.es
    • Delegado de Protección de Datos: dpd@iic.uam.es

    En nombre de Asociación para el Desarrollo de la Ingeniería del Conocimiento, tratamos la información que nos facilita con el fin de dar respuesta a la solicitud realizada por usted en relación con los servicios que prestamos y los productos que suministramos. Los datos proporcionados se conservarán mientras se mantenga el contacto, siendo eliminados una vez finalizada la solicitud. Los datos no se cederán a terceros salvo en los casos en que exista una obligación legal. Usted tiene derecho a obtener confirmación sobre si en Asociación para el Desarrollo de la Ingeniería del Conocimiento estamos tratando sus datos personales, por tanto, tiene derecho a acceder a sus datos personales, rectificar los datos inexactos o solicitar su supresión cuando los datos ya no sean necesarios. Asimismo, podrá oponerse al tratamiento de sus datos, solicitar la limitación al tratamiento y la portabilidad de sus datos. Si considera que sus datos personales no han sido tratados conforme a la normativa, puede contactar con derechosrgpd@iic.uam.es. Asimismo, podrá presentar una reclamación ante la Agencia Española de Protección de Datos, especialmente cuando no haya obtenido la satisfacción en el ejercicio de sus derechos, a través de la sede electrónica en www.aepd.es.

    Asimismo, se desean utilizar sus datos para ofrecerle productos y servicios relacionados con los solicitados por Usted, por cualquier medio, incluido el electrónico, incluso una vez terminada la relación negocial/contractual.