苹果在月初曾表示,将会公开发表他们的 AI 研究成果。而首份论文也在日前亮相,主题是电脑的“视觉辨识”。
这篇名为“Learning from Simulated and Unsupervised Images through Adversarial Training”的论文,内容阐述了苹果对图片辨识的看法。传统上让电脑“学习”辨识影像,通常会使用电玩照之类的合成图,而不是真实照片,原因是合成图会编上预设的标签,比如“狗”。相比之下,直接看真实影像,电脑就需要先透过人工重新对照片中的物件下标签,再从一片背景里判断出“狗”。这会导致辨识的效率下降很多。
不过这么一来也有个缺点。由于电脑平时“学习”看的图片是合成影像,但事后要拿去辨识的却是真实照片,导致这一类图像辨识的算法效果都差强人意。因此,苹果的研究员在这篇论文想出的办法,是让合成图更逼近真实。
这个方法首先是先建立两组 AI 神经网络,一组负责资料输入(generator),另一组则是辨识器(discriminator),负责辨识 generator 产制的资料,以及一般“学习用”的图像,最后再让两组 AI 互相对抗,逼生更接近真实的影像。实际上,这样的资料处理方式,就是 Generative Adversarial Networks(GANs)的基础手法。
有趣的是,这批研究员有的是苹果收购来的新创公司成员,有的则来自大学。例如论文的共同作者 Joss Susskind,就是 Emotient 的创办人。它们的技术是透过 AI,从表情辨识人的情绪,但在今年一月时被苹果收购。苹果的研究员亦表示,他们希望接下来可以从图片进展到影片辨识。
这篇论文是由康乃尔大学出版。苹果在日前的宣布中,也开放旗下的研究员或学者,可以自由投稿自己的 AI 研究成果,一反过往的保密传统。
注:由于已经公开发布,短期内应该没有引进商用产品的想法。
- Apple’s first AI research paper focuses on computer vision
- Apple publishes its first AI research paper online after promising to engage with the academia community
(首图来源:苹果)
延伸阅读:
- 不再坚持保密,苹果的 AI 团队将与外界共享研究成果
- 大举投入研发后,苹果想用他们的 AI 技术来做什么?