14 日,美国旧金山地方法院判决一家资料分析公司 HiQ 有权利从 LinkedIn 网站上撷取资料,并且 LinkedIn 应该立即移除任何阻止 HiQ 撷取资料的技术壁垒。
HiQ 公司利用在 LinkedIn 网站上公开的资料建立模型、训练算法,进而更预测员工行为,例如他们什么时候可能辞职。LinkedIn 的辩词是,HiQ 的做法违背了用户协议,侵犯了用户掌控自己公布讯息在 LinkedIn 平台上的的权利。
但是法院并不这么认为。第一,平台上的资料由用户自行发表在公共空间,LinkedIn 不能证明他们拥有这些资料,也就没有权利阻挡他人使用这些数据。第二,理论上说,任何人都可以手动点开每个人的资料,拿纸笔抄下来,然后再输入电脑。当然这是非常低效和愚蠢的做法,所以才使用算法来这么做。
HiQ 认同这个判决,表示这对所有依赖公开资料开展商业活动的公司来说是一次胜利。网络行业的创新不应该被几个资料寡头垄断,公开资料应该可以被公众获取。另外一家靠撷取数据分析预测潜在消费者 Node 的 CEO 也表示支持,如果 LinkedIn 允许用户讯息被搜索引擎检索到,进而为自己的平台带来利益;他们就不能阻止其他网络公司从这些资料中获利。
LinkedIn 表示,他们会提出上诉,继续为保护用户掌控自己讯息的权利奋斗。
这个案子应该不会就这么结束,如果上诉到上级法院,可能给产业带来重要的影响。这会决定网络寡头的资料壁垒到底有多高。至少在这案子中,法院指明了 LinkedIn 不能以保护用户权利的借口,保护自己的商业利益,并且用户主动公开的资料也应当被公众自由使用。如果用户真要保护自己的讯息只能在 LinkedIn 上使用,他们应该做出特许约定;进而给予 LinkedIn 法律基础阻止其他机构撷取用户的资料。
AI 的角色在这次判决中没有过度强调,可能因为技术本身不是法律关注点。法院是为了平衡利益、保护权利,如果 HiQ 利用撷取来的资料从用户身上获利,那么那些用户有权知道这些,并且有权允许或阻止,但是这些权利不该由 LinkedIn 这家商业公司来代理。
自己在一个网站上公开的资料是属于谁的、该怎么被第三方撷取使用,都可能是案子接下来需要回答的问题。我们拭目以待。
(本文由 36Kr 授权转载;首图来源:Flickr/Blogtrepreneur CC BY 2.0)