机器学习常常并不是什么伟大的功能,而是利用小细节的调整,巧妙的改善用户的体验。而 Twitter 就利用神经网络自动裁切照片,让预览图可以呈现出整张图最有趣的部分。
Twitter 一直都在研究这项功能,终于在 1 月 24 日于官方的部落格中公布了这个消息。原先 Twitter 的研究人员是采取脸部辨识技术来裁切照片,但后来发现这种方法不适用于风景图、物品的图片,还有最多人会贴的,猫咪图。为了让预览图可以呈现出图片的重点,或者是为了让猫咪可以清楚地出现,他们提出了“裁切重点”的方法,不管是不是脸部而是找出整张图最重要的地方。
为了找出一张图最重要的部分,他们将学术研究中人眼会先看到的图片区域记录运用到眼球追踪的技术上,试图找出实际上图片中人们会最先看到的地方。利用这些资料来训练神经网络,并预测人们可能会想看到的东西。这项技术经过优化之后能在短时间内找到图片最有趣的部分,不会让用户在上传图片时造成时间上的延迟。
▲ 上图是原本的预览图,下图则是经过神经网络裁切的预览图。(Source:Twitter)
对研究人员来说非常幸运的是,这项裁切不需要到非常精确的程度,只要能让预览图呈现图片最有趣的那三分之一部分就可以了,最后神经网络比原本刚设计出来的时候速度要快了 10 倍。这项新功能已经在桌机版、 iOS 和 Android 版本推出,让所有用户能够使用。
- Twitter is using machine learning to crop photos to the most interesting part
(首图来源:Twitter)
延伸阅读:
- Google 研究员用一张简单贴纸,成功吸走图像辨识系统的所有目光
- 为了换一张预设使用者图片,Twitter 花的心思超乎想像
- 美团队 3D 打印出的这只玩具乌龟,对 Google AI 来说怎么看都是把步枪
- 除了基本分类,Google AI 还学会“审美”替照片评分