big data 可说是近几年来的热门趋势,可是你知道有些类型的公司与 big data 相关吗?让我们从美国创投 Matt Turck 眼中,来看整个 big data 生态圈
大图
由 Matt 制作的 big data 生态圈图每年更新一次,已经出了三个版本。这张图上的公司可分为架构、分析、应用、跨平台架构、开源解决方案、资料来源提供商这六类。我们所熟知的公司像是 IBM、Google、微软、Amazon 等是跨平台解决方案提供厂商,统计软件公司 SPA、SAS 也在里头占一席之地。这六个领域,对一般人来讲可能因为工作或是兴趣,对分析这分类提到的厂商可能会知道。像是缩网址服务 Bitly,提供数据分析,算是分析这一分类里的社交分析。或者是常见资讯图表的人,可能会知道 visual.ly,属分析下面的资料视觉化服务。
总体来说,创投的钱仍持续投入,造成 big data 相关的公司一直不断成立。当然有公司收掉,也有被收购。预估这几年 big data 领域会迈入成熟期,媒体关注度会降低,但公司推出的产品从实验性质变为成熟品。
Hadoop 成为整个生态系领先的架构,但仍有不少其他框架,像是从 Hadoop 衍生的 Spark 来势凶凶。在 Hadoop 表现比较没那么好的领域,仍保留其他架构的挥洒空间。其他值得注意的像是大公司会不会将其资料移到云端上。新创要进入 big data 领域,资本额垫高不少。
市面上已经有各式各样的分析服务,提供像试算表到时间轴的呈现方式,不同的分析方式和视觉呈现。即使已经有多家厂商,但新创进入可分食的市场仍有,从贩售工具给逐渐变多的资料科学家,到直接面对商业客户,给他们一整套能运用的工具。
应用服务方面,虽然进展缓慢,仍旧有相关服务推出,像是 big data 趋动的 CRM、行销工具,或者是诈骗侦侦工具。
下面是 2013 年(大图)和 2012 年(大图)的 big data 生态圈状况,大家可以来比较这三年来的变化。
Via Venturebeat
封面图片来源:Matt Turck