人工智能的研究近几年取得长足进步,但想让电脑理解人类交流的所有内容仍处于开始阶段。今天大多数机器人和智慧语音助理都能回应简单命令,例如播报天气预报、播放歌曲,但无法理解其中的含义以及对话。为了让沟通更加有效,智慧助理需要能够进行自然对话,而不仅仅是回应命令,这被称之为“对话式 AI”。
5 月 20 日,微软宣布收购了位于加州柏克莱的 Semantic Machines 公司,该公司开发了一种革命性的新方法来建立对话式 AI。他们是利用机器学习的能力,让使用者能以更自然的方式发现、访问讯息,获得服务并与之互动,而且效率更高。
▲ Semantic Machines 公司成员。(Source:微软)
据了解,Semantic Machines 由会话式人工智能领域的许多先驱领导组成,其中包括科技企业家 Dan Roth,还有全球杰出和创新的自然语言 AI 研究人员,加州大学柏克莱分校教授 Dan Klein 和史丹佛大学教授 Percy Liang 以及苹果前 Siri 首席语音科学家 Larry Gillick。
微软人工智能及微软研究事业部 CTO David Ku 表示:“20 多年来,微软一直在致力于研究和突破对话式 AI 的基本模组建构,例如语音辨识和自然语言理解。我们的目标是将我们周围电脑的‘视觉’扩展到它们能够看到的世界,听到并理解人们的谈话。在 2016 年,我们在实现会话运算这一目标的过程中又迈出了一大步,推出了一个机器人开发的框架,并为人工智能助理发表了预先架构的认知服务,包括语音辨识和自然语言理解。今天,有超过 100 万开发人员使用微软的 Microsoft Cognitive Services 和超过 30 万名开发人员使用 Azure Bot Service ,这些都有助于使计算更具对话性。”
微软还在进一步增强数位助理 Cortana 以及像“小冰”一样的社交聊天机器人的对话式 AI 能力。目前小冰已经进行了超过 300 亿次的会话,每次会话时间平均为 30 分钟,这些会话来自中国、日本、美国、印度和印尼的 2 亿用户。透过小冰和 Cortana,微软在语音辨识领域取得了突破,最近还成为第一家为对话式 AI 系统增加全双工语音感应的公司 ,让人与系统之间的对话更方便自然。
David Ku 还表示,随着微软收购 Semantic Machines,微软将在柏克莱建立一个对话式 AI 中心,推动自然语言技术的向前发展。将 Semantic Machines 的技术与微软的人工智能技术相结合,提供性能更强大、更自然和高效的使用者体验,也将会话运算提升到一个新的水平。
由于对话式 AI 是人机互动的革新,也是 AI 时代的服务入口,因此随着对话式 AI 的载体之一的智慧喇叭竞争的火热,据了解,除了微软,亚马逊、Google、苹果以及中国的百度都非常重视对话式 AI。苹果 Siri 是最早的语音对话助手之一,不过其产品体验一直让人不满意。亚马逊方面,在 2012 年的时候亚马逊工程师就开始投入到对话式语音助手的研发中,随后逐渐演变成了 Alexa。Google 在 2016 年 5 月推出语音智慧助手 Google Assistant,并在同年 9 月还收购了为开发者提供 Siri 式会话机器人开发工具的 API.AI 团队。百度则推出了 DuerOS,DuerOS 是百度度秘事业部研发的对话式人工智能系统,百度希望把语音做为入口,打造未来智慧家居和万物互联的关键节点。巨头都在积极投入,谁将在对话式 AI 中取得领先?
- Microsoft acquires Semantic Machines, advancing the state of conversational AI
(本文由 雷锋网 授权转载;首图来源:Flickr/iphonedigital CC BY 2.0)