自然语言运算系统是目前人工智能应用中,非常受重视的范围,不过分析大量文字资料时,如何保护敏感资讯和隐私是难题。最近亚马逊(Amazon)公布研究报告,讲述如何改善隐私保护。
亚马逊表示,数据隐私虽然很容易被认为可用“匿名化”解决,但不少研究指出,攻击者只需使用其他数据来源的资料比对,就可抵消匿名化。因此亚马逊的办法就是加入噪声,让资讯更难用来追踪提供的人。加入噪声后,虽然准确度会下降,但随着资料组扩充,就可消除负面影响。
据研究人员指,此技术可将更多通用术语以更具体的术语替代,使个人数据更难以提取。亚马逊打算下个月在休士顿举行的 ACM Web 搜寻和数据挖掘(WSDM)大会详细介绍新发现。改善隐私保护除了保障个人利益,也可让使用者有更多信心面对这类技术,对未来技术开发和普及也有一定帮助。
- Amazon explores a way to preserve privacy in natural language processing
(本文由 Unwire Pro 授权转载;首图来源:shutterstock)