Parascript大幅增强复杂数据提取技术

Parascript是一家在数据提取方面拥有超过25年经验的软件公司,它发布了其智能文档处理(IDP)解决方案的新版本"FormXtra. AI 8. 4"。 这个新版本增加了对法语、德语、西班牙语和葡萄牙语的无内容手写识别的多语言支持;嵌套表支持更好地识别和提取复杂表中的数据;以及对全页智能字符识别(ICR)、基于自然语言处理(NLP)算法的可训练字段以及非结构化文档的动态签名字段定位的显著改进。

"8.4版是FormXtra.AI的巨大飞跃。 我们的研发团队实施了多项改进,以提高从传统上难以自动化的文档中自动提取数据的准确性和效率。 我们很高兴看到包含手写和机器打印的组合以及复杂表格的文档可达到的准确度水平。" -销售副总裁Dawn Wood

FormXtra.AI是Parascript的首要IDP软件,它建立在原始的FormXtra软件的基础上,以深度学习和自然语言处理中最创新的趋势和方法对其进行增强。 FormXtra.AI具有很高的通用性,它允许软件对任何类型的文档中的数据进行分类和提取,无论其格式、文本样式和复杂性如何。

语言支持

FormXtra.AI8.4现在可以为任何类型的手写文本提供无语境的阅读,适用于比以往更广泛的拉丁语和西里尔语系语言。 现在,可以对用英语、法语、德语、俄语、西班牙语和葡萄牙语编写的文档进行无词汇数据提取。

ICR

以高精度水平自动提取一整页手写和机器打印数据非常复杂,但现在,这项复杂的自动化任务比以往任何时候都更容易实现。 在FormXtra.AI 8.4中,Parascript开发团队改进了其专有ICR技术,以在识别和提取全页数据时实现更好的性能。 这种全页面提取能力得到人工智能的补强,可随着时间的推移提高准确性。

嵌套表支持

这种创新的解决方案允许FormXtra.AI 8.4 可完全自动化复杂表中的数据提取,包括具有不规则结构的表以及巢状嵌套表。 它可用于任何类型的文档(结构化、半结构化和非结构化),其广泛的实施功能使该功能成为许多应用程序和许多行业中使用的通用功能。

训练字段

FormXtra.AI 8.4包括在文档中定位和提取具有与用于训练的段落含义相似意思的文本段落时增强的能力。 这种能力实现了NLP技术的专有方法,可以在有限的样本集(3-50个)上进行有效训练。 该软件使用这种NLP技术,可以有效地解决具有挑战性的任务,例如提取法律文档中的关键合同条款、提取非结构化文档中的命名实体、查找与合同中财产的法律描述相关的段落、提供情感分析等。

Parascript 

Parascript的软件每年为公司节省超过10亿美元。 Parascript 最先进的软件结合了专有的AI技术,提供强大的数据捕获解决方案,在处理文档时提供最高级别的准确性。 凭借30多年应用人工智能解决复杂问题的经验,Parascript可以以结构化、半结构化和非结构化格式自动化面向文档的流程,大大减少了人员的参与。 Parascript已经实现了邮政业、抵押贷款、支付处理和数百个其他流程的自动化。

稿源:美通社

最新文章