AI 是相当热门的话题,各大科技厂无不投入资源进来,想要靠 AI 帮助他们的业务,像是机器学习教程式分辨物品。而昨日 (6/29) Facebook 人工智能研究院 (Facebook Artifact Research, FAIR) 院长 Yann LeCun 博士在台大进行专题演讲,题目是 Deep Learning and the Path to AI,对象为学院中的人谈的是领域内常用的技术,竟然场地爆满,而且开 Facebook 直播时人数破千。
LeCun 从最基本的部分,解释学界常用的机器学习技术,像是监督式学习 (supervised learning)。除了 AI 用到的技术之外,LeCun 讲到 Facebook 研发的技术,就真的实际用到网站上了,如用户上传照片后,识别里面的人物,甚至猜测里面的人是谁。其猜测的结果精确度相当高,往往还会建议用户朋友贴标签,这几年的训练成果,看来让不少使用者会吓一大跳,看到辨识的成功概率相当高。
以 Facebook 用户的活跃程度,每天平台上会出现 10 亿到 15 亿之间的照片量,如何分类就是门学问了。前面提到识别照片中用户之外,AI 也得辨识照片中出现的物品。其实每当用户上传照片,AI 都会运作把照片中辨识出来的物品或人标示在相片上面。
▲ Facebook 不只辨识人物加上建议标签,连照片中的物品也会辨识归类。
而在 AI 玩围棋的话题以 AI 战胜人类作结之后,电脑游戏成为 AI 新的挑战目标。目前有用 Torch libray 驱动的 TorchCraft 尝试用 AI 玩即时战略游戏星海争霸,但其成绩还需要再努力训练。
▲ 挑战围棋之后,玩游戏成为 AI 新的挑战,不过目前还在初步的阶段。
机器跟人之间最大差是机器没有常识,因此需要花费大量资源进去,训练机器学会人们习以为常的概念。LeCun 认为 AI 要能够有突破性发展,就得靠非监督式学习 (unsupervised learning),又称为预测式学习 (predictive learning)。LeCun 以蛋糕比喻的话,他将目前机器学习的主流方法如增强式、监督式和非监督式,分别对应樱桃、糖霜和蛋糕。用增强式辨识如樱桃之类的物品不需要太多资料就可以做到,但是糖霜监督式学习需要多一些资料,而蛋糕也就是非监督式学习则需要最大量的资料。但这不意味只需要非监督式学习,而要有增强式和监督式学习才能完整辨识出物品。
▲ LeCun 以蛋糕和蛋糕上不同部分,比喻不同的机器学习方法,指出要辨识全体各种方法缺一不可。
台大资工系教授洪士灏则评论训练 AI 必须有大量运算资源,须下重本下去。Facebook 在训练 AI 是用 256 颗 GPU 下去跑,最后用一小时时间跑出结果。如果用一颗 DGX-1 有 8 颗 GPU,仍需要 30 小时。而其他家想进来玩机器学习的人,要用多少资源下去,要怎么跟 Facebook 这类有资源的公司竞争呢?
▲ Facebook 用大量 GPU 来将训练 AI 的过程缩短到 1 小时的时间。
Facebook 也有将相关的 library 放出来,放在 Facebook Research 的 Github 页面,有兴趣的人可以上去自行研究和布署。
(首图和内文图片来源:国立台湾大学电机资讯学院脸书影片截图)