Dropbox 又将添实用新功能：利用 AI 辨识扫描文件档 04月05日更新

云端文件同步和共享服务商 Dropbox 13 日披露了更多支持光学文字辨识（OCR）功能的技术细节，已经为 Dropbox Business 付费的企业员工可以在 Android 和 iOS 应用程序中使用该功能。

具体操作是这样的，使用行动装置上的相机扫描文档后，光学文字辨识功能将会启动。然后，应用程序会根据需要裁剪或旋转文档，然后将其保存为 Dropbox 中的 PDF。 8 月，该公司表示正在使用电脑视觉来检测应用程序扫描文件档。

与人工智能深度学习结合的 OCR 技术已经不是新鲜事了。GitHub 上的开源软件可以用于两者结合，Google 在 Google 街景图像中也运用了机器学习和 OCR 技术。OCR 系统的初始版本采用市售软件开发工具包（SDK）。Dropbox 选择执行自己的数据包以节省资金并提高准确性，因为市售系统主要是为实际的硬件扫描仪构建的，而不是为行动装置上使用相机的扫描仪。Dropbox 利用用户数据训练系统。

Dropbox 的软件工程师 Brad NeubergNeuberg 表示，Dropbox 需要收集用户上传一部分图像或文件，例如收据、发票、信件等。为了收集这些，公司事先征得了用户的同意。如果用户同意，那么这些文件资讯一定会被保密。Dropbox 对用户捐赠的数据采取各种安全措施，比如绝不会将数据保留在本地部署的服务器上，保持持续并广泛的审计、部署强大的身份验证访问数据措施等。

为了预测文档中特定单词的剪切文本，Dropbox 透过卷积神经网络，然后是双向长时间短期记忆（LSTM）网络发送图像，最后连接时间分类（CTC）系统。该系统部分依赖于 Google 的 TensorFlow 开源深入学习框架。为了加强这个系统，Dropbox 借鉴了虚构的数据，然后以简单的方式进行了转换。

Dropbox 已经脱离了亚马逊网络服务（AWS）的公共云端，并运行自己的资料中心基础架构。此外，Dropbox 已经开始使用图形处理单元（GPU）加速的 G2 虚拟机（VM）实例对其模型进行了培训，并储存了一些数据在 AWS S3 服务中。为了进一步改进模型，Dropbox 训练了小数量的图像单词。然后，从预测单个词跳转到处理整个文件档。

Dropbox uses AI to to recognize words in documents scanned in its mobile apps

（本文由 36Kr 授权转载；首图来源：Dropbox）

Dropbox 又将添实用新功能：利用 AI 辨识扫描文件档

热门推荐

《还愿》回来了！有游戏还有童书，台湾限定实体版开放预购

《还愿》游戏从 Steam 下架！开发商赤烛：维护品质进行检测

《还愿》遭中国网友抵制、团队道歉、中国代理商终止合作，销量反冲高

我们的肉眼每秒能够捕捉多少画面？

最新内容

十年后全球锂电池产能高达 1.3TWh，亚太仍是生产重地

小脑其实并不小，研究：只有可丽饼厚，皱褶拉平长达 90 公分

全球最快！荣总团队 7 天就能找出新生儿听损原因

废弃火箭应已撞向月球，NASA 绕月飞行器预计 3 月中进行成像

聚焦电动车散热工程方案，高柏科技推出一条龙散热对策服务

金价触 2,000 美元大关，普丁盟友哈萨克原油也遭回避

303 停电惩处出炉，台电董事长杨伟甫准辞、王美花续留

真实版钢铁擂台！新北、鸿海合办世界级 FRC 机器人区域大赛

心诚镁结盟台耀、台新药！攻全球呼吸治疗药 CDMO 商机

高龄者打疫苗送 500 元内赠品！网传打三剂返台免隔离为假讯息

关于我们

新闻资讯

意见反馈

网站地图