在人工智能技术的发展之下,透过 AI 对图片进行基本分类已经不是什么难事,而 Google 的研究团队最近更展示出一种新方法,教会 AI 从多张相似图片中,挑选出人们的审美观普遍认为较好的图片。
TNW 报导指出,透过深度学习来训练卷积神经网络(CNN),研究人员让 AI 学会预测人类对图片的喜好,进而替图片评分,团队将这种模式称为神经图像评估(NIMA)。
与传统的方式不同,NIMA 采取的是 10 分制评分,在检查特定像素和整体美学后,NIMA 会以深度学习了解到的人们对这些资料评分的倾向,为每张图片评出一个分数。
这并不是在说机器能像人一样“感觉”或“思考”,但这项设计确实能让电脑具一些程度的审美观,进而成为更好的艺术家或策展者。团队认为,NIMA 未来可用来从大量图片筛选最好的图片。
许多摄影者为了捕捉到最好的影像,经常选择某些瞬间拍摄 20~30 张图片,在这种情况下,NIMA 便能为你节省大量空间与时间。试着想像只要按下按钮,AI 便会替你浏览这些图片后,挑选出最好的一张并删除其他图片。
除了帮助摄影者挑选照片,Google 研究部落格指出,NINA 的“基准美学”也可以协助人们改善图片,透过引导卷积神经网络过滤器,NINA 能找到适合图片各项参数的最佳设置,让图片达到完美的成果。
从 AI 广大的应用层面来说,仅是创造一个能和人类一样理解图片质量的神经网络,听起来并不是非常具革命性意义,但为了让 AI 能在现实生活执行任务,像是在无人帮助的情况下自动驾驶汽车,AI 必须学会观察并了解周遭环境,而类似人类视觉应用便是必要的,NIMA 及类似的项目正在奠定基础。
- Google’s AI can predict whether humans will like an image or not
(图片来源:Google research Blog)