3 月 8 日的 Google Cloud Next Google 云端计算开发者大会上,华人 AI 学界的骄傲、Google 云端首席科学家李飞飞宣布一则重大讯息:Google 收购 Kaggle。
其实,这事近两天已陆续有风声传出。但 Google 和 Kaggle 对媒体总是“无可奉告”的态度,导致大家各自猜测,但无从证实。即便李飞飞在 Next 大会上对全世界宣布,也仅停留在“没错,我们是收购了 Kaggle,这对双方都有好处”层面;对收购细节、未来计划等一概没提,更别说收购协定和价格。
但是 Google+Kaggle,即便不进行任何探究,也是震动资料科学、AI、机器学习三界(在很多方面“三界”本是一体)的大事件。其衍生出来的潜藏资讯:对开发者社群的意义、产业走向,以及Google的机器学习布局等──虽然当事者惜字如金,却为嗅觉敏锐的观察者带来巨大的想像空间。这隐约使人联想到 2014 年 Google 收购 DeepMind:虽后者与 Kaggle 不管在业务还是营运方式都完全不同,但 Kaggle 所掌握的产业资源,只会在 DeepMind 之上;两次收购对 Google 的意义,同样位于极高的战略层面。
▲ 李飞飞宣布 Google 云收购 Kaggle。
下面我们来整理一下,关于此次收购至今披露的所有资讯。
Kaggle 简介
凡是玩资料科学和机器学习的老手,有两个网站一定不会错过:GitHub 和 Kaggle。前者用来分享,后者进行实战练习。对不熟悉 Kaggle 的人,先来一段简介。
简而言之,Kaggle 是玩资料、ML 的开发者展示功力、扬名立万的江湖。
它在 2010 创立,专注于举办资料科学相关的线上竞赛。它吸引大量资料科学家、机器学习开发者参与,为各类现实中的商业难题开发基于资料算法的解决方案。竞赛的获胜者、领先者,在得到对方公司提供的优厚报酬之外,还可引起业内科技巨头的注意,或许获得各路 HR 青睐,为自己的职业道路铺上红地毯。
因此与 GitHub 不同的地方,Kaggle 为其社群提供一整套服务。其中最有名的是它的招聘服务以及名为 Kaggle Kernels 的程式码分享工具。
或许因为如此,Kaggle 社群在圈内极受欢迎:用户基数大、黏着性强。通常认为 Kaggle 平台有几十万名资料科学家,至于具体多少,有媒体认为是 50 万,有人说 80 万(李飞飞),还有人说超过 100 万。
总而言之,Kaggle 是当今最大的资料科学家、机器学习开发者社群,其产业地位独一无二。
大约一年前,Kaggle 开始全力在 AI、机器学习领域着力,相关竞赛专案纷纷上马。李飞飞评论:“Kaggle 是搜寻、分析公用资料集,开发机器学习模型,和提高资料科学专业水准的最佳场所。”
“AI 民主化”的使命
在大会上,李飞飞发表主题为“让 AI 民主化”的演讲。在演讲和之后撰写的文章里,她对 Google 收购 Kaggle 的意图给了官方版本的解释:
我强调 AI 民主化的重要性──我们必须降低进入 AI 领域的门槛,让 AI 技术尽可能为更多开发者社群、用户和企业所用,让 AI 用于解决他们各自的问题和需求。Kaggle 加入Google,能加速这一进程。
讲好听点,推动 AI 技术的分享和推广,是 Google 收购 Kaggle 背后的“mission”,即使命。
加入 Google 后的 Kaggle
虽然 Google 对收购协定的内容保密到家,我们仍能从双方透露的资讯看出一些端倪。比如一件事是确定的:Kaggle 将保留独立品牌和团队。
Kaggle 创始人 Anthony Goldbloom 也在当晚发文,回顾 Kaggle 创立以来取得的成绩,对支持 Kaggle 社群的开发者表示感谢,并透露一些将来的计划:
Kaggle 团队仍会是一个整体,并且是 Google 云旗下的独立品牌营运。我们会继续延伸 Kaggle 上的竞赛和开源资料平台;我们会继续向所有资料科学家、公司、技术敞开怀抱。Kaggle Kernels 会继续支援各类机器学习程式库和工具包组成的多样生态,不管其是否来自 Google。
加入 Google 能让我们实现更多。此次收购,结合了世界上最大的资料科学社群与最先进的机器学习云。
加入 Google 后,我们能够提供社群 Google 云技术。这将使大家能利用更强大的基础设施和部署服务(deployment services),进行可延伸的训练,并帮助 Kaggle 拥有储存、抓取大型资料集的能力。
李飞飞在大会和部落格上的表态,虽没有 Anthony Goldbloom 详细,但也印证了一些 Anthony Goldbloom 提到的要点。比如李飞飞说 Google 云将为 Kaggle 社群成员提供云端机器学习设计环境,Kaggle 和 Google 云将继续支援训练和部署服务,并帮助社群储存、抓取大型资料集。
结合李飞飞对“AI 民主化”的表态,以及在大会上反向搜寻她亲手建立的 ImageNet、对资料程式库重要性进行的强调;雷锋网认为,应当可以期待 Google 云在资料上为 Kaggle 提供强力支援,帮助 Kaggle 社群的开发者抓取更多、更有价值的资料集。这确实击中了资料科学家和机器学习开发者的一大痛点。这无疑也将直接提升 Google 对资料科学、机器学习社群的影响力,以及在其中的口碑和品牌认同。
收购 Kaggle 后的 Google
Google 的核心业务与 AI 紧密相关,也已经成为推动这一轮 AI 技术浪潮的主要玩家之一。AI、资料科学和机器学习对 Google 的战略意义,毋庸赘言。自从去年 AlphaGo 与李世乭的世纪之战后,Google 的江湖声望更是如日中天。
但是,在 AI 应用和技术的各个垂直领域,如自动驾驶、语音辨识、深度学习等,Google 很可能感觉到压力。众所周知,Google Waymo 自动驾驶业务并不顺利。在语音辨识领域,微软和 IBM 屡创纪录。深度学习领域,Facebook AI 实验室 FAIR,以及 OpenAI 都在生成对抗网络“GAN”前线技术上投入巨大,产出丰厚研究成果。业内人士对 Google 在 AI 技术上“领先”其他对手的印象,已经不再那么牢固(如果之前称得上“牢固”)。
想要维持“老大哥”地位,就要进一步投入。而有一个领域是 Google 远远甩开对手的:没错,我说的是 Tensorflow。在深度学习开源工具上,Tensorflow 的市场占有率远超出其他框架、平台。对开发者群体,Google 的影响力有天然优势,收购 Kaggle 则将这优势无限扩大。
当然,不要忘记 Kaggle 加入的部门是Google 云。与竞争对手亚马逊 AWS、微软 Asure 相比,Google 云的地位一直十分尴尬,市场占有率远远落后前两者。这次 Google Cloud Next 大会,重点其实是宣传 Google 在云计算上的巨大投入和决心,而细看 Google 对此次收购的官方表态,也不乏强调 Google 云将来能提供 Kaggle 的各种支援。Google 或许希望 Kaggle 能成为 Google 云业务的突破,比如藉 Kaggle 平台让开发者体验 Google 云、为后者宣传。至于其他玩法,现在不得而知,尚待将来观察。
另外,外媒纷纷猜测,收购 Kaggle 可使 Google在雇用尖端开发人才上更便利。这是一个十分合情合理的推测。
其他
- Google与 Kaggle 的合作已经开始
2 月 16 日,Kaggle 与 Google 联合举办了 Google Cloud & YouTube – 8M Video Understanding Challenge。这是迄今规模最大的影片理解挑战赛。该挑战要求机器学习开发者,搜寻出自动记号 YouTube 影片的方法。
- 澳洲媒体的哀叹:“Google 买走了我们的 Kaggle!”
Anthony Goldbloom 是墨尔本大学毕业生,他于 2010 年在雪梨创办 Kaggle ,但 2011 年将公司总部迁至旧金山,这次更直接被美国企业收购。不出所料,对这次 Google 收购 Kaggle 报导最积极的当属澳洲媒体。这再次让人联想到 DeepMind──它被收购后英国 AI 圈的反应。
(本文由 雷锋网 授权转载,首图来源:Kaggle)
延伸阅读:
- 是真的!Google 出手收购资料科学平台 Kaggle
- Google 公布新机器学习 API:从影片中辨识物体