Facebook 首席执行官祖克柏(Mark Zuckerberg)在今年年初立下个人目标,计划打造人工智能(AI)语音助手“贾维斯”(J.A.R.V.I.S.),原本预计会在 9 月公开成果,却迟迟没有消息,如今祖克柏总算赶在 2017 年到来前,告诉大家他已成功打造出贾维斯系统,并发表长文分享贾维斯的建造过程与心得。
为了让 AI 助手具备学习与识别能力,祖克柏为贾维斯采用多项人工智能技术,包括自然语言处理(Natural Language Processing)、语音与脸部辨识、增强式学习(reinforcement learning),其系统程式则以 Python、PHP 及 Objective-C 等语言编写。平常只要透过手机或电脑便能跟贾维斯“说话”,进一步操控家电装置、保全系统,调节室内灯光与空调,播放音乐等。
串联家中所有装置
不过在打造 AI 助手之前,必须先解决家中设备连网的问题。祖克柏在文章里提到,家中设备的语言和协定各有不同,加上仍有许多装置未有连网功能,因此若要透过 AI 助手操控家中所有装置,就必须让所有装置都连上网。他也建议厂商应开发通用的应用程序界面(API)及标准,好让各装置间能够互相连结通讯。
▲ 祖克伯透过 AI 助手贾维斯开关灯光
理解自然语言
祖克柏又以循序渐进的方式,让贾维斯理解人类的文字和语音指令。一开始先让贾维斯了解简单词汇如“房间”、“灯”、“打开”等做为指令关键字,再教贾维斯学习更多同义词、新词汇及概念,使贾维斯准确执行不同人所发出的指令。祖克柏表示,就算他和妻子 Priscilla 下了差不多的指令,也不见得两人需求相同,好比说同样的指令但没有指明房间位置,祖克柏所指的可能是办公室,Priscilla 可能指的是某个房间,因此要AI助手得学习分辨个中差异。
而音乐在自然语言认知上,则是更有趣却也更复杂,毕竟单靠关键字无法一下掌握众多歌手、歌曲及专辑,但经过不断“沟通”调整后,贾维斯能够分辨差异,并根据每个人听音乐的喜好与模式推荐歌曲。祖克伯认为,当 AI 助手懂得愈多语意脉络,愈能处理各种开放式、非特定而惯用的指令,而贾维斯也在这样的“训练”下,表现愈来愈进步。
具备视觉与脸部辨识功能
为了让贾维斯拥有视觉与脸部辨识能力,祖克柏在家门口装置数台摄影机,让贾维斯能以多个角度取得访客样貌长相,并透过脸部辨识技术加以识别访客身份。一旦确认对方身份是预期到访的客人,贾维斯就会让对方进门,同时知会祖克柏。
除此之外,视觉与脸部辨识功能还能应用在许多方面,例如掌握女儿 Max 的动态,或是侦测每个人的所在位置,藉以判断应在哪个房间、哪个位置执行指令。
沟通靠文字和语音讯息、声控功能
祖克柏运用自家 Messenger 架构打造聊天机器人平台,以便随时随地透过手机传送文字或语音讯息跟贾维斯沟通;贾维斯也会利用平台提醒祖克柏待办事项,或传送访客影像给祖克柏,告诉他哪位客人来访等等。
祖克柏跟贾维斯沟通的方式以文字讯息居多,连他自己也感到相当惊讶。他认为主要原因是文字讯息的干扰性较低,也能等自己想看时再看,不受语音讯息限制。这其实也符合 Messenger 和 Whatsapp 等通讯软件的使用者偏好,也就是惯用文字讯息多于语音讯息。祖克柏表示,未来的 AI 产品不能只着重在语音声控,还必须具备文字讯息界面。
当然,祖克柏并不表示声控和语音辨识功能不重要。他为此还开发出声控专用 app,载入手机之后便能直接以语音操控贾维斯。
持续改良贾维斯,配音人选将揭晓
这一年来,祖克柏利用闲暇时间打造贾维斯,总共耗时约 100 小时。他认为透过这次挑战所学习到的事物远远超出预期,对自家工程师所使用的内部技术也更有概念。祖克柏对于 Facebook 程式码数据库及各种内部工具感到相当满意,也因为这些资源,为开发贾维斯节省了不少时间。
虽然目前已成功打造出贾维斯,祖克柏坦言还是有许多地方有待改善,接下来会想办法教贾维斯自行学习新技能,而不是教他执行特定任务。
祖克柏即将在明年初分享新年新挑战,至于先前网友们热烈讨论的贾维斯配音人选问题,他则是卖关子表示,贾维斯的“真声”即将会在接下来释出的影片中揭晓。
(首图来源:Facebook/ Mark Zuckerberg)
题图来源:
- Building Jarvis
- At Home With Mark Zuckerberg And Jarvis, The AI Assistant He Built For His Family
延伸阅读:
- 祖克柏 AI 助手“贾维斯”缺人声,钢铁人自愿担纲配音助阵
- “贾维斯”成真?祖克柏预告 9 月公开 AI 助手
- 祖克柏新年挑战:打造如“贾维斯”般的 AI 助手