Extracción de entidades, conceptos y eventos: NaturalExtractor
Bitext ha desarrollado una herramienta (NaturalExtractor) que, aplicando tecnología lingüística, permite extraer diferentes tipos de información a partir de grandes bases de datos de texto:
- Entidades: nombres propios de personas, empresas, productos, lugares, etc, como “Barack Obama”, “Agencia Española de Cooperación Internacional”, “Avenida del Mar Mediterráneo”
- Conceptos: ideas o asuntos de los que trata un texto, como “calentamiento global”, “países en vías de desarrollo”, “fuentes principales de niveles de ruido urbano”, etc.
- Eventos: relaciones entre entidades y conceptos, como en la frase “el presidente Barack Obama ha visitado recientemente los países aliados de EEUU en el Golfo Pérsico”, de donde se extraen las siguientes relaciones: autor “Barack Obama (presidente)”, acción “visitar”, objeto “los países aliados de EEUU en el Golfo Pérsico”.
Estas aplicaciones son de gran utilidad en sectores como:
- Inteligencia de negocio
- Seguimiento de medios de prensa (Press Clipping)
- Gestión automática de correo electrónico
- Informática forense, lucha contra el fraude
- etc.
Además, NaturalExtractor se adapta para resolver problemas concretos como:
- detectar todos los nombramientos de nuevos cargos aparecidos en diferentes fuentes, como la prensa especializada (para sector privado) o los boletines oficiales (para sector público)
- crear una lista de todos las personas físicas y jurídicas que contraen relaciones civiles, mercantiles, etc., en documentos legales, como escrituras o contratos de compra-venta
- reunir todas las noticias de prensa sobre una empresa o un tema concretos
- identificar las relaciones entre personas que aparecen en un determinado conjunto de documentos o correos electrónicos
- y muchos más
Asimismo, NaturalExtractor permite la creación y mantenimiento de bases de conocimiento (diccionarios especializados) específicas para cada cliente, para abordar problemas como la catalogación automática o la creación de ontologías. NaturalExtractor ofrece multitud de posibilidades de personalización y configuración.