在几天前举行的发表会上,Google 一改以前的技术公司风格发表了 Pixel 手机、DayDream View VR 装置、Google Home 等多款硬件设备。但发表会上,Google CEO Sundar Pichai 反复提到的一个概念是 Google Assistant 智慧语音助手。和苹果的 Siri 一样,Google Assistant 已经嵌入了 Google 的几乎每一款新发表硬件和软件产品。
这种转变的背景是 Google 面临的竞争环境改变。Google,或者说它的母公司 Alphabet 目前是世界上市值第二高的公司,同时它也是搜寻、线上广告、行动装置等诸多领域的领头羊。但 2015 年刚上任 Google CEO 的 Sundar Pichai 面临的问题却是,这家公司虽然在技术上遥遥领先于其他大公司,但当需要把技术应用到产品中时,Google 却拿不出类似于苹果和亚马逊那样的成绩。
在桌面时代靠搜索引擎起家的 Google 在移动网络成为主流之前,靠 Android 系统成功地完成了一次转型,这让 Google 成为了一家“行动优先”的公司。但现在的情况却是,网络不仅是从桌面转移到行动装置上,而是转移到多种屏幕上,甚至是没有屏幕的装置都开始接入网络。对这个趋势反应最灵敏的是亚马逊,这家公司在 2014 年推出了没有屏幕的智慧语音音箱 Echo。当时很多人都认为 Amazon Echo 只是一个“鸡肋”产品,因为看起来它的应用范围实在是太小了。但现在,Echo 和它背后的智慧语音系统 Alexa 已经成了大公司们争相模仿的对象,因为 Alexa 成为了很多家庭的智慧家居的控制者。
于亚马逊相比,Google 早就在语音辨识、自然语言处理和机器学习等技术领域取得领先地位。但 Google 唯一没有做的就是像亚马逊那样早早地就把这些技术做成产品,让它们去占领消费者的家庭。
或许是已经准备充分,或许是看到了对手们咄咄逼人的攻势,Google 现在决定利用自己的优势,并将其利用在产品上,包括软件和硬件。而这个优势就是人工智能。
在今年 4 月发表的 Google 公司内部信里,Pichai 说 Google 将由一家“行动优先”(mobile-first)的公司转变为一家“人工智能优先”(AI-first)的公司。“我们正在有意地把它应用于我们所有的产品,无论是搜寻、广告、YouTube 还是 Google Play。我们还处于早期阶段,但你将会看到我们在所有这些领域以系统性的方式运用机器学习。”Pichai 在 2015 年的一次电话会议上这样说。
和 10 年前的 mobile-first 一样,Google 在人工智能领域的杀手锏也是开源,这一次 Google 开源的同样是和 Android 地位相当的机器学习平台 TensorFlow。TensorFlow 的魅力在于,它不仅在建立和训练神经网络的速度上比以前快了 5 倍,还可以支持行动装置、桌面、CPU、GPU 和服务器等多种平台。
开源的 TensorFlow 提供为开发者提供了完整的开发指南和文字档案,以及丰富的 API 接口,目前已经有五十多款 Google 产品正在使用这个系统。
最先受惠于机器学习系统的 Google 产品是 Gmail,该系统已经让 Gmail 的垃圾邮件辨识准确率达到 99%。因为辨识垃圾邮件本身就是一个典型的机器学习应用场景──分析越多垃圾邮件时,这些数据就会越来越增加机器学习系统的辨识准确率,这是一个循环渐进的过程。
但现在 TensorFlow 在电子邮箱里能做的已经远不只辨识垃圾邮件了。在 Google 推出的面向企业用户的 Inbox 邮箱里,邮件会被自动归类为重要、行程、财务、社交等标签,而完成这一归类的就是 TensorFlow 的机器学习系统。这和辨识垃圾邮件的原理一样,正确归类越多邮件,系统的归类准确率就越高,而 Gmail 和 Inbox 的用户已经超过了 10 亿,这给系统带来了海量的数据。
Inbox 还有一个“智慧回复”的功能,它能让系统阅读你的邮件,并为你自动判断可能会回复的内容,你可以选择回复直接发送给对方。这个系统本质上是一个递归神经网络,它能将你做出的选择传递回服务器,当然没有人能够阅读到这些内容。利用这些数据,系统就会慢慢“学会”如何更加智能地回复邮件。
这一切都发生在 Google 总部园区的一座不起眼的两层小楼里,在这里一个名为“Google Brain”(Google 大脑)的团队,正在竭尽全力将 Google 在人工智能技术上的积累转化为可用的产品。
这个团队成立于 2012 年,当时它的主要目标是进行一个深度学习和神经网络的研究实验。现在这个实验已经完成,但这个团队保留了下来,并在 TensorFlow 创始人 Jeff Dean 的领导下在多个领域改善了 Google 产品的用户体验。
Jeff Dean 曾透露,Google 目前已经有 100 个产品团队正在使用机器学习技术,其中包括搜寻、Google Photos、Google Adwords 等。当然,其中最重要的就是这一次 Google 发表会的主角 Google Assistant 智慧语音助手。Dean 说它旨在“开启一个更自然、更智慧的人机交互模式,基于日常语言的使用。”
现在 Google Assistant 已经出现在了 Google 的多款硬件设备和软件产品中,并且很有可能被开放给第三方开发者,这让 Google 在语音助手领域可以与亚马逊的 Alexa、苹果的 Siri 和微软的 Cortana 展开正面竞争了。
我们从 Google 发表的新产品中就可以看到 Google 的这个野心。例如 Google Pixel 手机的最大卖点就是搭载了 Google Assistant,它不仅让 Pixel 手机能像 Siri 一样的智慧语音回复和任务处理,还在翻译、图像辨识上较以前的版本有极大的提升。而智慧音箱 Google Home 则几乎是将 Google Assistant 变成了一个实体设备,你可以让它播放音乐、查询天气和安排日程。
在软件上,Google 着重推出的聊天应用程序 Allo 同样内建了 Google Assistant,这让 Allo 具备智慧回复、图像辨识等功能。虽然 Google 的 Gmail 和 Inbox 拥有 10 亿用户,但电子邮箱对于年轻人来说实在是太古老了,因此 Allo 也成为了 Google 实现社群梦想的新一次尝试。
但 Allo 的智慧回复功能使用的机器学习技术,需要将用户发送的讯息发送回 Google 的服务器上进行算法分析,并且 Google 会将这些讯息储存一段时间。这一点遭到了爱德华·史诺登的猛烈批评,他认为 Google 储存这些讯息会导致用户隐私泄露。
在做社交产品时,苹果也遇到了类似的隐私问题,但苹果的做法更加尊重用户隐私,那就是采取端对端的信息传输和差分隐私技术(Differential Privacy)。这项技术会将用户的数据切割成数个片段,并加入数学噪音隐藏用户的个人讯息,然后这些加密的数据就会被上传到苹果的服务器上,用来训练神经网络。这也能在用户在使用一些本地知识库中不存在的新词汇时,让系统更快地理解其意思,从而很好地提升了人机交互的体验。
能够如此完美地兼顾机器学习对数据的需求和用户隐私,是因为苹果多年来在实际产品中得到的经验。虽然不能说 Google 有多么不尊重用户隐私,但史诺登的批评也不是没有道理的。或许是 Google 内部的工程师占据了主导地位,而忽视了用户对隐私的担忧,但在急于将人工智能推向用户的过程中,Google 还需要向它的同行们学习很多。
(本文由 PingWest 授权转载;首图来源:shutterstock)