Bitext.com The bits and text company

Extracción de entidades, conceptos y eventos: NaturalExtractor

Bitext ha desarrollado una herramienta (NaturalExtractor) que, aplicando tecnología lingüística, permite extraer diferentes tipos de información a partir de grandes bases de datos de texto:

  • Entidades: nombres propios de personas, empresas, productos, lugares, etc, como “Barack Obama”, “Agencia Española de Cooperación Internacional”, “Avenida del Mar Mediterráneo”
  • Conceptos: ideas o asuntos de los que trata un texto, como “calentamiento global”, “países en vías de desarrollo”, “fuentes principales de niveles de ruido urbano”, etc.
  • Eventos: relaciones entre entidades y conceptos, como en la frase “el presidente Barack Obama ha visitado recientemente los países aliados de EEUU en el Golfo Pérsico”, de donde se extraen las siguientes relaciones: autor “Barack Obama (presidente)”, acción “visitar”, objeto “los países aliados de EEUU en el Golfo Pérsico”.

Estas aplicaciones son de gran utilidad en sectores como:

  • Inteligencia de negocio
  • Seguimiento de medios de prensa (Press Clipping)
  • Gestión automática de correo electrónico
  • Informática forense, lucha contra el fraude
  • etc.

Además, NaturalExtractor se adapta para resolver problemas concretos como:

  • detectar todos los nombramientos de nuevos cargos aparecidos en diferentes fuentes, como la prensa especializada (para sector privado) o los boletines oficiales (para sector público)
  • crear una lista de todos las personas físicas y jurídicas que contraen relaciones civiles, mercantiles, etc., en documentos legales, como escrituras o contratos de compra-venta
  • reunir todas las noticias de prensa sobre una empresa o un tema concretos
  • identificar las relaciones entre personas que aparecen en un determinado conjunto de documentos o correos electrónicos
  • y muchos más

Asimismo, NaturalExtractor permite la creación y mantenimiento de bases de conocimiento (diccionarios especializados) específicas para cada cliente, para abordar problemas como la catalogación automática o la creación de ontologías. NaturalExtractor ofrece multitud de posibilidades de personalización y configuración.

relacionado

  • Documento

    Extracción de información. (PDF)

Política de datos | Legal

© 2012 BITEXT INNOVATIONS, S.L. info@bitext.com

Código XHTML 1.0 y CSS válidos

Chamber Trust SealEuropean Seal of e-Excellence