在 Google I/O 2019,除了针对消费者的功能改进和开发者的工具革新,Google 将重点放在如何用 AI 解决人类面临的棘手难题。
美国工程界的最高学术团体美国国家工程院(National Academy of Engineering)于 2008 年发表 21 世纪人类面临的 14 大工程挑战,而 Google 科研领袖 Jeff Dean 告诉笔者,他领导的 Google AI 正着手解决这些挑战。
如果这些挑战背后的难题不得到一定程度的缓解,很可能意味着人类将无法健康地延续到 22 世纪。这些难题在世界各地出现,也包括各行各业,但 Google AI 用擅长的手段尝试攻克(或贡献力量)。
▲ NAE 一共列出 14 条工程挑战,红色标记的是 Google AI 参与解决的项目。(Source:Jeff Dean)
毫无疑问,Google AI 擅长的,正是深度学习。
为什么深度学习可用于解决能源、交通、诊断、医药、安全等多方面问题,成为泛用的科学探索工具?
Jeff Dean 认为,这是因为深度学习可从原始、异构、携带噪声的数据开始学习,即便开发者不具特别领域知识,也可开发出达到甚至超过领域最高水准的神经网络。
且机器学习技术日新月异,现在每天发到 ArXiv 的论文就有 90 篇;深度学习的技巧也层出不穷,使神经网络掌握越来越多过去公认只有人类才能掌握的复杂能力。
现在,人类不得不应付重大的工程挑战,并寻求在本世纪解决。Jeff Dean 认为,深度学习可成为很好的工具。
维护和改进城市基础设施 Restore & Improve Urban Infrastructure
交通是城市基础设施的重要部分,也是随着人口增长和城市化加剧,面临压力最大的领域之一。社会在变化,道路通常是一成不变。因此,交通在 21 世纪工程难题尤其显著。
Google 采取的切入角度是提高道路交通安全和效率,而除了开车放下手机,最有效的方法可能就是自动驾驶。
Waymo 自驾车从研发到今天已将近 10 年,截至去年累计行驶 800 万英里,并在全球所有自动驾驶开发者中取得最低事故率。
Jeff Dean 指出,深度学习是 Google / Waymo 取得成就的功臣,让自动驾驶系统整合并学习不同感测器的原始数据,绘制高精度地图,“看懂”周围的车辆、行人和障碍物在哪里,甚至可预测其他道路参与者的行进方向,辅助自驾车决策。
他介绍,现在 Waymo 在亚利桑那州已有超过 100 辆测试自驾车,可在没有安全驾驶员的条件下载客前往目的地。许多业界人士都认为,理论上如自驾车占一地区总车辆的比例越高,此地区的事故率越小、交通效率将越高。
除了自动驾驶之外,机器学习也可以透过其他方式提高交通效率。比如在摩托车流行的东南亚国家和地区,Google 在地图导航加入“两轮模式”,让系统能汇总多元数据来源,为摩托车驾驶者推荐捷径、小道,避免高峰壅塞。
用深度学习带来医疗资讯革命 Advance Health Informatics
糖尿病的并发症之一,糖尿病视网膜病变(Diabetic Retinopathy,DR)侵蚀患者视力,一般患病 10 年才开始出现病变,导致失明。这病症实际上可预防,有经验的眼科医师往往能透过视网膜眼底扫描观察到征兆。然而,以印度为例,全国约有 12 万名眼科医师缺口,DR 患者往往无医可投,导致大量人口失去视力。
Google AI(原 Google Research)的研究员莉莉‧彭博士带领团队,基于卷积神经网络搭建,利用眼科专家标记好的扫描图为训练数据,最终得到一个 DR 预估模型。
笔者曾采访报导这项技术。当时,此模型在发现症状的敏感度(98.8)和判断症状的准确性(99.3),都比人的得分要高(统计学上这个得分叫 F-score,普通眼科医生的分数是 0.91,模型 0.95)。
好消息是,Jeff Dean 告诉我们,经过两年发展,现在新模型更进步,得分和专业视网膜眼科医师持平。
这还没完,潜力远不只诊断 DR。Jeff Dean 透露,莉莉‧彭的团队在这个模型取得更卓越的科学成就。正是因为深度学习的泛用型强,现在他们可用同样的眼底扫描图像,来预测性别、年龄、血压、骨龄及其他病症的发病概率,且准确度极高。
这是医疗资讯学的重大突破,因为能补充医疗条件限制未能获取的关键资讯。最短期和直接的效果就是为眼科医生的诊断和治疗推荐提供更多参考数据,长期来看还能提前预测和诊断更多病症(比如心血管疾病)。尽管这并非专业诊断,但仍足以提前 5 年甚至 10 年,拯救现在的普通人,未来的患者。
通用 AI:打造科学突破的工具 Engineer the tools for Scientific Discovery
以青霉素和 X 光为例,许多知名的科学突破都有偶然性。即便如此,人们也一直没有停止试图发现让科学突破持续发生的“永动机”。
Jeff Dean 指出,在更强大计算力的加持下,深度学习更便于投入更多领域,因此,深度学习有成为这样工具的潜力。因为正如前述,深度学习的技巧层出不穷,让神经网络掌握越来越多过去公认只有人类才能掌握的复杂能力。
以 TensorFlow 为代表,这个由 Google 主导并开源的深度学习计划,现在正在被农业种植养殖、工业生产、网络、医疗金融等多个行业使用,在三大产业中持续促成效率进步。一个例子在欧洲的一座农场,农场主人运用了 TensorFlow 搭建养殖监控技术,透过镜头、动作捕捉等感测器时刻追踪和分析牲畜的健康状况和运动轨迹,显著提高了出栏率。
至于科学突破,前述的视网膜眼底扫描也可以做为一个例子。
前年,Google 宣布了神经架构搜寻(NAS)/ AutoML 技术,可以比喻为“用神经网络设计和训练神经网络”,在包括图像辨识等领域超过手调神经网络的效果。
但是现在,Google AI 已经不满足于已经取得的成就。Jeff Dean 说,他们正在思考一种全新的神经网络形式:一个巨大的、稀疏触发的模型(a large model, but sparsely activated)。
这种新神经网络的参数之多,和现有神经网络相比可能是几何级的,但是,当它处理不同任务时,只需要触发少数路径的节点,并不需要全部触发。这样设计的目的,是让一个神经网络执行多种不同任务──少则数百、多则上百万种,以此显著降低神经网络设计、搭建和训练的计算量和耗时,做到更强的通用性。
Jeff Dean 表示,他描绘的新神经网络,确实和人们曾热议但认为短期内不会实现的“通用人工智能”(general AI)有些许相似。但是他强调,Google AI 的主张是即便在这个新的巨大且稀疏触发的网络内,训练仍然是自我监督。
2017 年,他和几位同事(包括 Geoff Hinton、Quoc Le 等 Google AI 顶级学者)以及外部研究伙伴共同提交了这个方向的首篇论文,名为《Outrageously Large Neural Networks: The Sparsely-Gated Mixture- of-Experts Layer》,呈现了一个超过 1,370 亿参数,拥有数千个子网络的巨大神经网络架构,在语言建模、机器翻译等场景下,用更少的计算量超越目前最高水准的神经网络。
Jeff Dean 展示了 Google AI 对于这个技术的未来构想:除了优化网络结构,Google 可能还将开发新的、针对网络结构优化的机器学习超级电脑(就像他们为 TensorFlow 设计 TPU),届时,新的计算公式将为 Google AI 解决 21 世纪伟大工程挑战带来更多帮助。
“深度学习正在帮助我们挑战很多重大难题,会在科学突破和人类发展的许多领域做出巨大贡献”。Jeff Dean 表示。
(本文由 PingWest 授权转载;首图来源:shutterstock)