5 月是 Google 总部所在的山景城一年中最舒适的时节,一年一度的 Google I/O 大会如期在这里举行。钢筋与 LED 交织的露天舞台,后背包和衬衫组合的黑鸦鸦人群让人总觉得是一场寻常的音乐节,而那些闲坐在草地上的观众丝毫不让你觉得这里的一切会改变世界,改变亿万人的生活。
Why so serious?Google 可不会现场把工程师叫上来给你编一段看不懂的程式码,这里的宅宅只会告诉你,嘿,你只需要这么做,后面的东西会让你张大嘴巴。
这是一场会让你感叹机器聪明到让你自愧不如的大会。
Google Lens:聪明的 Google Assistant 多了一双火眼金睛
去年解放你双手的人工智能助理 Google Assistant 在今年 Google I/O 上依然是全场主角。
Google CEO Sundar Pichai 介绍过去一年 Google 达成的各种成就,然后没有卖关子,端出一个利用人工智能的新产品,Google Lens。如果你走在路上看到一朵花,但不知道是什么品种,这时只需开启 Google Lens,透过镜头取景,Google Assistant 便可告诉你这朵花的各种资讯。
Google Lens 还有一个更酷的功能,可以辨识 OCR,将镜头对准 Wi-Fi 路由器就可以直接抓用户名和密码,然后连上 Wi-Fi,免去汇入各种复杂的 Wi-Fi 密码。
镜头对准餐厅招牌,马上就能看到餐厅评分资讯,堪称超高速版的大众点评。当然,这只是 Google Lens 一部分功能,在 Google Assistant 会谈到更多。
Google Assistant:Hey Siri,我来了
首先,我们终于可以透过文字和 Google Assistant 交流了。去年 Google Assistant 上线到现在,用户只能和 Google Assistant 语音交流(在聊天软件 Allo 上可用文字交谈),不过 Google 发现,人们最常用的汇入与交流方式依然是文字,因此,Google 为 Google Assistant 引入文字交谈。
此外,Google Assistant 最大的变化,是集成 Google Lens,也就是说,Google Assistant 拥有透过镜头直接辨识影像的能力,当你到国外遇到看不懂的字时,只需要让 Google Assistant“看到” 文字便可翻译成你的母语。即便我们外语能力不怎么好,有了这两个神器,出国在外也就不那么慌张了,Google 在弥平语言鸿沟上又更进了一步。
除了直接翻译文字,Google Assistant 还可以辨识餐厅的名称。在现场展示中,Google Assistant 可将辨识出的餐厅资讯呈现给用户,包括功能表等,过去需要在不同应用中完成的作业,现在只需要一个 Google Assistant 就能达到了。
过去一年,Google 不遗余力地推广 Google Assistant,除了 Android 平台上人工智能助手的统治地位,Google Assistant 也将入住 iPhone,到时候如何和 iPhone 上的主人 Siri 相处,或许是个有趣的话题。不仅如此,Google 还计划将 Google Assistant 放进更多生活用品中,Google 目前已为 Google Assistant 找到 70 多个“家”,你能想到的都有可能,洗衣机、婴儿车、购物车等等等等。
遗憾的是,Google Assistant 的 iOS 版目前还未在中国区 App Store 上架。
Cloud TPU:强劲的云端大脑,AI First 战略的第一步
过去几年,Google 在机器学习方面取得不少进步。这些成果大大提高 Google 翻译的品质,也在 Google 搜寻发挥关键作用,同时使用 Google Photos 寻找照片更方便。强大的学习功能也为 AlphaGo 人工智能系统提供预测和决策的基础功能,这使 DeepMind 的 AlphaGo 打败世界顶级棋手之一李世乭。
不过,Google 第一代 TPU 在针对不同用途时,仍需要分开培训,这样的培训需要花费很多时间成本。
于是,Google 设计了一个全新的机器学习系统,以消除瓶颈并最大限度地提高整体效能。这个系统的核心就是 Google 今天推出的第二代 Tensor 处理单元(TPU),它可以训练和执行机器学习模型,Google 称之为 Cloud TPU。
Google 表示,Cloud TPU 已全面投入使用,并且部署在 Google Compute Engine 平台上,将 64 个 Cloud TPU 组合成 TPU Pods,有效地将 Google 服务器变为具 11.5 petaflops 计算能力的超级电脑,每个 Cloud TPU 可提供高达 180 teraflops 的浮点效能来培训和执行机器学习模型。
使用这些 TPU Pods,可有效减少机器学习的培训时间,以往一个大型翻译模组,需要花费 32 个最好的商用 GPU 用上一整天时间,但现在只需要八分之一的 TPU Pod,就能达到同样的效果和精准度。
这对培训系统更普遍的意义是,透过大量计算改进 AI 软件。所以当硬件效能越强大时,得到的结果就越快。这不仅缩短时间,还能提高每个机器学习者更快进行更新和实验的能力。
为了帮助最大量的研究人员,进一步加快开放机器学习研究的步伐,Google 将透过 TensorFlow 研究云免费为机器学习研究人员提供 1 千个 Cloud TPU 。
它成为 Google 在探索 AI 领域拓荒路上强有力的功臣。
Google CEO Pichai 还提到前不久推出的 AutoDraw,能帮你自动画画,这个应用正是基于 Google 人工智能服务。
继续解放双手的 Google Home
Google Home 是另一个基于 Google Assistant 的产品,诞生之初就是想在解放双手同时让你动动嘴也能做更多事。虽然 Google 这次并没有拿出硬件改进的 Google Home,但“Hands Free”的宗旨执行得更彻底了。
Google Home 这次获得了一个最重要的功能──Hands Free Calling,用户可直接透过 Google Home 打电话,不像其他音响与手机连线后成为手机音响,而是真正脱离手机直接打电话。
这项功能目前只能在美国和加拿大使用,完全免费。预设情况下,被呼叫人的手机上会显示为私人号码,但用户可将自己的手机号码与 Google Home 配对,避免对方因为未知号码而不接听。
此外,如果有家人共用 Google Home,也支援连结多个号码,不同用户使用时,Google Home 会自动辨识是谁在使用电话功能,并同步这个人的通讯录,简直智慧到不行。
除了打电话,Google Home 也终于支援各种状态如航班资讯、约会等提醒功能,这使它更像一个管家。
对了,Google Home 终于支援蓝牙,可以连上手机播放串流音乐了,此外,它还增加了几个新的内容合作方,包括 HBO Now 和 Spotify 免费版,以及 YouTube 今年推出的串流媒体服务 YouTube TV。总之,Google Home 更智慧,也更传统了。
Google Photos:更多实用功能
在不到两年的时间里,借着免费、高容量的储存空间、优秀的使用体验以及类似 iPhone 照片的回忆功能,Google Photos 月活跃用户达到 5 亿,这些用户每天上传 12 亿照片和影片。
今天 Google I/O 大会上,这项服务也带来更多新功能。首先是 Suggested Sharing ,透过机器学习,智慧辨识照片中的人,让你一键传送含有某人的照片给对方。当然,这样聪明过头的智慧,不知道会不会捅出什么篓子。
虽然 Google Photos 不知道你的朋友是谁,但它做了一系列聪明的预测。如果你将某人的照片传给同一个电话号码或电子邮件数次,下一次拍这个人照片的时候,Google Photos 会建议你使用该电话号码或电子邮件位址来分享。
如果你的朋友也是 Google Photos 用户,他们可以一键将照片储存到自己的云端。这样的功能在一些聚会和派对上就很实用,不用担心照片分享错了。
其次是 Shared Libraries,上面提到的功能都可一键分享。而这个功能,你能设定自动分享某些照片给某人。例如,你能设定分享自己孩子的照片给另一半。
你可以选择共用整个相册,也可以只分享某些人一部分照片。一旦邀请选中的人,他们将看到你授权他们检视的任何照片,并且即时更新。
最后是 Google Lens×Google Photos,我们总会透过拍照来记住某些要做的事:todo list、要读的书、要买的东西……当 Google Lens 融入 Google Photos 后,能帮助你完成工作。
你可以在 Google Photos 触发 Google Lens,然后它能辨识照片里的建筑物,辨识油画作品资讯。甚至拍下的名片,它也能自动辨识并存成联络人,该功能将于今年稍晚推出。
有意思的是,这些功能将预装在搭载最新版原生 Android 的智能手机上。
此外,Google Photos 还将提供相册集“Photo Books”制作服务,Google 希望让相册集成为人们每年多次购买的物品。起价是 9.9 美元包含前 20 页的制作费用,可为用户提供 7 英寸或 20 英寸两种大小的相册本。超过 20 页后,每页是 0.35 美元到 0.65 美元。
那么,这相册算不算 Google 硬件计划的一部分呢?
Android:一个更完美的配角
在介绍 Android O 时,Andorid 研发副总裁 Dave Burke 的语速比去年快上不少,发表会上留给 Android 的时间也并不多,曾经 Google I/O 的绝对主角已经易主。
和去年一样,Google 在今年 3 月便放出 Android O 系统的首个开发者预览版,不过从 Android 5.0 时代开始,之后每代 Android 系统的变化并不大,所做的改变也多为各种最佳化,新功能和界面的变化并不多。
这次 Android O 也一样,你很难张口说出它与上一代系统 Android N 的区别。但,它确实更加面面俱到。
在 Android N 时代,Android 就已有多视窗,但在这个形态下,两个同时开启的应用只能分成上下两个界面,但在手机屏幕上,效果并不理想,而且使用场域也并不多,一边发推一边看 YouTube 的情况只有为了体验这项功能时才会发生。
在 Android O 上,画中画功能的加入似乎比多视窗型态更实用,在支援画中画功能的应用全屏幕执行时,比如正在播放影片的 YouTube,此时只需要按一下 Home 键,应用界面会消失,但正在播放的画面会以小视窗的形式悬浮在手机上,用户可以随意拖曳视窗位置,也可以播放或停止,但这都不影响使用其他应用,想要关闭小视窗只需要向下划出屏幕即可。
不管是从小视窗使用的面积还是显示内容上,画中画似乎比多视窗更实用。YouTube 和 Google 自家的视讯聊天软件 Duo 可在 Android O 上实现画中画功能。
此外,Android O 增添了一个你可能在很多手机上都见过的功能──Notification Dots,但更像 iOS 的 3D Touch。
以 Instagram 为例,之前在 Android 上都需要下拉功能表来读取通知,但现在,除了通知数量会显示在 App 右上角,长按 App 图像就可以检视新讯息通知了,Shortcuts 虽然更像 3D Touch,但确实比以前更实用。
在 Dave Burke 飞快介绍 Android O 时,还有两个微小的功能无法忽视,其中一个叫 Autofill,也就是自动填补功能,这个功能在电脑上和浏览器上很常见,但手机应用中并不多见。以 Twitter 为例,开启应用后,只需按一下用户名和密码的键入区域,就可以自动填补储存的用户名和密码,再点一下,就可以登入了。这项功能的实现,也需要应用中有相应的 API。
另一个功能叫 Smart Text Selection,这又是一项利用人工智能的功能。举个例子,在邮件里,如果你在密密麻麻文字中选了一个地址,系统会自动出现 Google Maps 选项,你可以进入 Google Maps 检视更多资讯;如果选中电话号吗,则会出现拨打选项;选中电子信箱,则出现邮箱的相关选项。
除了上面提到的功能,Android O 还能帮你防广告防流氓 App。
另外,经典键入应用 GBoard 现在已支援 191 种语言。现在 GBoard 融入翻译功能,你能直接键入一种语言,然后自动翻译为另一种语言,直接在对话方块发出去。这意味着,如果你与外国人聊天,再也不用跳转其他 App 查来查去了。
当然,Android O 依然强调安全性、更快的系统和应用启动速度,这些改进虽然微小,但对一个已成熟的系统来说,稳定比激进的改变更重要。
AI 优先的今天,Android 只是一个载体
可以看到,人工智能在今年 Google I/O 上无处不在。Google 也宣布,将把 AI 从云端直接植入装置,同时也释出机器学习框架的行动装置版本,TensorFlow Lite。但为什么要把 AI 直接植入你的手机?
因为在手机上,机器学习应用可以执行更快,且相较于存在云端的资料更安全,更重要的是,可以脱离网络离线工作,目前的 AI 都无法脱离网络。这也将使用户有更好的使用体验,Google 也可以从中获得更直接的用户习惯。而 Google 认为,你的下一支手机,将会拥有一个住着 AI 的芯片。
虽然 Android 已不是 Google I/O 的主角,但对 Google 来说,依然是还未饱和的行动市场主角。可能少有人知道 Android One 这个专案,是 Google 专门对经济薄弱、基础设施较落后的地区推出的,主要是售卖价格较低的原生 Android 手机,但与同价位的其他手机厂商相比,Android One 手机的低价低配难有说服力,因此 Android One 在很多地方用户并不埋单。
Google 这次宣布 Android One 的继任者 Android Go,Android Go 能在 512MB 内存的手机上较流畅执行,主打的自然是亚非拉地区市场,显然 Google 不愿放弃硬件业务在新兴市场的扩张,“Building for Billions”的愿望仍在继续。
Daydream VR:美美的白日梦继续做下去
和之前预测的不太一样,AR 和 VR 在本次 Google I/O 大会并没有占据过多篇幅。
Google VR 副总裁 Clay Bavor 回顾去年 VR / AR 方面取得的进展,在回顾自家 Daydream VR 平台后,表示今年 LG G6 以及三星 Galaxy S8 也将支援 Google Daydream,用户透过简单的软件更新即可获得支援。
除此之外,Daydream 平台也迎来全新 VR 装置──独立的头戴式装置 Daydream VR 一体机 ,Google 将其定位于中阶 VR 产品,既不是入门级的纸盒+手机,也不像 HTC Vive 那种需要高规格电脑需求的旗舰产品。
Daydream VR 一体机是 Google 与高通、联想及 HTC 合作的产品,拥有独立执行的硬件,不需要连线手机或电脑,有点类似大疆的 Goggles。然而会上并没有公布发售日期和价格,只粗略地看到这款产品的外框。
在 AR 方面,一段 Google VR 教育应用“Google Expeditions”的介绍影片中,加入一个扩增实境(AR)形态,教室中出现了虚拟的火山和龙卷风,该功能将于今年稍晚正式推出。
另外,Google 还介绍了视觉定位服务(Visual Positioning Service),比如进入某个商店后,你可以得到各种物品摆放位置的辅助说明,手机可以获得货架的空间资料,然后导引你更快找到商品。
(本文由 爱范儿 授权转载;首图来源:Google)
延伸阅读:
- 【Google I/O 2017】Google 第二代 TPU 既能推理又能训练,性能霸道
- Google Assistant 即日起登陆 iPhone,并支援更多语系