从好几年前开始,Google 就已经在机器学习领域里耕耘,也陆续将此技术导入到各项 Google 服务中,像是大家熟悉的 Google 图片、Pixel 2 人像模式等等,事实上 Youtube 也不例外,精准推荐用户最适合、最感兴趣的影片,就是靠它来实现,而为了让我们能更了解其运作原理,Google 今天就举办一场 Youtube 机器学习讲座。
2011 年之前,Youtube 的推荐影片功能都是以观看次数作为演算基础,当时他们认为用户对某个主题看了很多次,就代表对它有兴趣,但长期下来却发现到,这其实没办法直接反应是否符合用户需求。
用户很可能是找了 3、4 次才发现真正有兴趣的影片,而过程中这些快速略过的影片就不适合拿来参考。因此 2011~2012 年,Youtube 就把算法修改成“观看时间”,虽然观看次数一天下降 20%,但平均观看时间却从原本的 120 秒,提升到 140 秒,代表着推荐的影片变得更符合用户兴趣:
而 2014~2015 年进入行动时代后,Google 也开始导入机器学习技术,来加强推荐系统,让推荐影片更精准。只不过这不是一个简单任务,有很多问题需要解决,Google 就举例三个主要挑战:1. Youtube 上有非常庞大的资料规模,每分钟超过 500 万小时影片上传;2. 每天都有新的影片上传,加上创作者也希望第一时间就能让用户知道,因此必须能快速比对这些影片适合哪些用户;3.为了推荐精准,用户显性与隐性的使用回馈都是要纳入训练的资料,像是喜欢、不喜欢按钮、观看时间等等,因此资料相当的杂:
机器学习基础系统是使用 Google 的开源 TensorFlow,由两个神经网络结合而成,首先数百万部 Youtube 影片会进入第一个“候选生成模型”,利用浏览历史、搜寻历史以及年龄等资讯,先找出与用户相关的影片,把这些资料缩小成多个数百个资料子集,然后再进到第二个“排名模型”,接着再透过各项更细节的特征,如:语言、用户近期观看纪录、受不受欢迎等等,为每部影片评分,进而变成只剩下数十个推荐影音:
随着推荐功能导入机器学习技术后,可说是越来越符合用户需求,目前已经有超过七成的观看时间,都是来自观看 Youtube 自动推荐的影片内容。同时过去三年,使用者在 Youtube 首页点击推荐影片的观看时间,也成长了 20 倍。
除了推荐影片,今年六月起 Youtube 也把机器学习应用在辨识含暴力或宣扬极端主义的影音内容,根据数据显示,现在已经有超过八成的影片,是用户还没提出任何检举前,就已经从 Youtube 上移除,成效也非常明显: