2016 年 3 月,“李世乭 vs. AlphaGo”人机大战,让全世界都知道人工智能的威力。在这场大战半年前,Google 就已把人工智能底层能力开放给全世界。
2015 年 11 月 9 日,Google 正式对外开源机器学习框架 TensorFlow,到 2018 年 11 月正好 3 年。TensorFlow 三年一直更新,2019 年即将发表 2.0 版。应用方面也没落后,Google 已用 TensorFlow 最佳化旗下许多产品。
借助 TensorFlow,Google 让产品更智慧
在 Gmail 写信,系统会智慧建议下一个单词或完整的句子;Google Photos 浏览时看到一张偏暗的照片,系统会自动帮助你调整曝光,让照片更亮点;Google 翻译写入一句话,系统可对整个句子翻译而非逐字翻译,大幅提高翻译精确度和流畅度;跟 Google 的人工智能助理 Google Assistant 对话,再也不用一次次说出唤醒词“Hey, Google”,一次唤醒就能多轮对话。
▲ Gmail 智慧补充。
Google 内超过 80% 软件都采用基于 TensorFlow 的机器学习,最新案例是可自己打电话的 AI 系统 Duplex。
Google 在 2018 年的 Google I/O 大会发表 Duplex,具语言理解、互动、时间控制、语言生成方面能力,可帮你打电话给发廊、餐厅等消费场所,询问资讯或预约。和店员交谈时,还能模仿人类的语调,停顿、拉长,甚至使用“嗯、呃”一类语助词。
▲ Google Duplex 展示影片。
将 TensorFlow 用于产品智慧化,这是再正常不过了。一些有足够标记资料的垂直产业,TensorFlow 可发挥更大潜能。
上能发现“第二个太阳系”,下能预测余震位置
2017 年 12 月,Google 和德州大学奥斯汀分校合作,用 TensorFlow 分析开普勒望远镜抓取的资料,成功发现两颗新的地外行星:开普勒-90i 和开普勒-80g,其中开普勒-90i 所在星系开普勒 90,更是太阳系之外首个已知的八行星星系。
众所皆知,天文是资料量非常庞大的领域。不久前退役的开普勒天文望远镜,一直用凌星测光法收集资料。
凌星测光法的原理是,当行星从恒星前方经过,会遮住一部分光线,开普勒望远镜就能探测到恒星光线减弱,光变曲线会有“U”型下沉。
▲ 凌星测光法。
原理很简单,但开普勒望远镜收集的资料实在太多,若逐一人工检查,实在太耗时耗力。且有的行星很小、很黯淡,对应的恒星却非常明亮巨大,观察起来非常困难,就像在探照灯下找到一只萤火虫。
Google 的 AI 科学家想到,这个问题和 Google Photos 为照片分类十分类似,于是在 TensorFlow 的基础上搭建一个机器学习模型,训练一已标记过 15,000 个地外行星资料的神经网络,判断开普勒望远镜接收的讯号是否来自某颗地外行星。经过训练后,模型判断准确率达 96%。
成功运作后,模型用至实战,很快从 670 颗恒星周围找到两颗地外行星,就是开普勒 90 星系中的开普勒-90i 和开普勒 80 星系中的开普勒-80g。
得益于开普勒-90i 的发现,开普勒 90 星系成为太阳系之外首个已知的八行星星系。
天文学界的共识是,和太阳系近似的星系,可能有和地球类似的行星,生命存在的可能性较高。遗憾的是,开普勒-90i 离恒星太近了,一年只有 14.4 天,地表温度约摄氏 427 度,几乎不可能有碳基生命存在。
▲ 上为开普勒 90 星系,下为太阳系。
TensorFlow 不仅可处理天上的事,还能解决地面的麻烦,比如地震。地震造成破坏不可避免,但如果及时营救,能最大程度减少损失。
每次主震之后,灾难没有完全过去,还可能有余震维持数月,继续摧残被主震动摇的建筑物。地震学家一直致力于透过资料预测余震发生的时间、规模和地点,以及时营救。
但地震学领域的资料非常复杂,每次地震事件都有很多变数,如不同区域地表的构成元素、地震模组之间的互动、地震波传递能量的方式,单纯靠人工找到关联、预测余震成本很高。基于过去的经验定律和模型,地震学家已能大致预测余震发生的时间和规模,但预测位置则较困难。
为此,Google 和哈佛大学的研究人员利用 TensorFlow 开发一个深度学习模型,并用包含超过 13 万次主要地震的资料集训练。深度学习模型引入一种以前常用于冶金术的冯·米赛斯屈服准则,以找到复杂地震资料间的相关性,进而预测余震位置。
这个模型目前还只能应用于静态应力(较好预测),对动态应力还有心无力。但正如哈佛研究团队领队 Phoebe DeVries 说:“准确预测余震位置还有很长的路要走,但我想机器学习在这方面有很大的潜力。”
行医济世,AI For Good
医学一直是 TensorFlow 应用的重点领域,目前在侦测糖尿病视网膜病变、侦测移转性乳腺癌、心血管疾病评估、癌症侦测和分析病历都小有成果。
以检测糖尿病视网膜病变为例。全球有 4.15 亿糖尿病患者面临视网膜病变的风险,若发现及时可治愈,但若未及时诊断,可能导致不可逆失明。
专科医生侦测糖尿病视网膜病变最常用的方法之一,是用眼球后部扫描分析,观察是否有病变征兆(例如微动脉瘤、出血、硬性渗出等),并判断严重程度。但世界许多糖尿病好发地区,并没有足够专业医疗人士诊测。这个问题在南亚地区尤为严重。
为此,Google 于 2016 年和美国、印度医生合作,建立一个包含 12.8 万张眼底图片的资料集,训练基于 TensorFlow 的深度神经网络。Google 把神经网络的诊断结果,和 7 个专业医生的诊断结果比较,结果前者与眼科医生小组的诊断相当。
2016 年研究公布后,深受医学界好评。哈佛医学院的安德鲁‧比姆和艾萨克‧柯汉表示,“这研究展示了医学新世界的样貌。”
目前,Google 在医学领域最新的消息是,成立 Google Health 部门,并把一手缔造 AlphaGo 的 DeepMind 健康业务纳入。
实用之余,还会画画
别看 TensorFlow“一本正经”,又是发活动星、预测余震,又是诊断糖尿病视网膜病变的,其实搞艺术也有两把刷子。像 AutoDraw,能帮助你将自己的涂鸦变成画作。
操作步骤很简单,点击第二个按钮,启动机器学习辨识模式,再随便涂上几笔。AutoDraw 会即时辨识这是什么,并给一些图形供你选择,点击一下即可代换。
▲ 笔者画的猫很抽象,AutoDraw 能瞬间转成现实画风的猫。
AutoDraw 之所以能猜出你画的是什么,得益于名为“Quick, Draw!”的计划,采用众包模式整合成千上万的涂鸦,组成资料集后用于训练模型。模型能理解人们绘画涂鸦时何处起笔、走笔方向、何时停笔,以及画的是什么。
▲ Quick, Draw! 资料集有超过 12 万人画的大脑涂鸦。
(本文由 PingWest 授权转载;首图来源:TensorFlow)
延伸阅读:
- 会打电话的 AI 背后:Google Duplex 技术解析
- 用机器学习发现新行星,Google 这样做
- 以深度学习判读肿瘤定位、糖尿病视网膜病变,Google:AI 与医生合作可达理想成效
- Google 用机器学习,新工具 AutoDraw 让涂鸦变身艺术家画作