Adobe 稍早宣布,推出 Adobe PDF Extract API 和 Adobe Document Generation API 两种全新应用程序界面,协助用户快速释放 PDF 的智慧潜能并以程式化方式生成具动态资料的档案。
Adobe 指出,随着许多企业采用混合办公模式,远距工作的生产力将持续备受关注,数位档案亦将成为大部分工作的核心。PDF 的普遍性有助统一数位档案体验,而以云端为基础的 API 更可协助开发人员及 IT 公司加速开发解决方案,以满足数位业务的需求。
Adobe 估算,每年约有 2.5 万亿个新创建的 PDF 档案。全新的 Adobe PDF Extract API 建立于去年推出的 Liquid Mode 的基础上。做为一种云端 API,其可分析来自于扫描或原生的 PDF 档案结构,从中提取文字、表格资料、图像等所有 PDF 元素,同时了解相对位置以及跨栏和分页的阅读顺序。
PDF Extract API 的优势在于可提取所有 PDF 元素,不同于其他 API 仅限提取某一种类型的元素。此外,许多 API 供应商都有指定的使用平台,然而 Adobe 包括 PDF Extract API在内的所有 API 则给予用户高度灵活性,可使用任何现代程式设计语言或平台。
企业可利用 PDF Extract API 快速准确地提取资料以用于机器学习模型、分析、制作索引或储存,使用机器人流程自动化(Robotic Process Automation,RPA)和自然语言处理(Natural Language Processing,NLP)等技术将下游流程自动化,以及重新发布适用于多个媒体的 PDF 内容。
另外,将动态、关键的档案的数字化和自动化是业务关系的核心。企业通常需要将资料输入到诸如 ERP、CRM 系统等各种数据库的档案。这项工作程序向来都是手动操作的,不但复杂、费时、昂贵,亦为用户带来欠佳的档案体验。
借助 Adobe Document Generation API,开发人员可以快速设计自订的 Microsoft Word 范本,以及生成具动态资料的 Word 和 PDF 档案。Document Generation API 还包括与 Adobe Sign 整合、开箱即用的工具,以便用户随时可在档案中使用电子签名。
Document Generation API 还可与适用于 Microsoft Power Automate 的 Adobe PDF Tools 连接器一起使用,使 Power Platform 用户能够轻松地将预备发票、协议书等档案的流程自动化,也可在 Power Automate 的档案工作流程中使用 15 种全新、现成的作业范本。
(首图来源:Adobe)