云端储存和运算是近年来网络发展的显学,如今储存已经不大是消费者关心的重要硬件设备,但对于企业来说,云端储存的配置是需要好好规划的状况。Western Digital 嵌入与整合式解决方案资深副总裁 Christopher Bergey 在 COMPUTEX 期间来到台湾拜访厂商,离开台湾的前夕,接受《科技新报》的专访,在众多新兴技术之下,背后的储存做了什么,如何成为背后坚定支援的力量。
资料要处理才有价值
Bergey 说不同的应用场景会有不同的储存配置,像是组成物联网的感测器,这些端点装置收集很多资料,其实不适合一鼓脑就直接传送到云端。
Bergey 进一步说明感测器的资料需要处理过后,才是有价值的资料。像是监视器资料其实大部分时间照的资料都算是噪声,重要的内容是出现在上面的人。因此需要 edge computing 的能力,本地先处理辨识后,变成 meta data 之后再上传,这过程就是储存能发挥的地方。
在 edge computing 之中,车子某种程度可以视做终端装置,而且是相当特殊的终端装置。Bergey 说车辆网需要低延迟性,不能发生太多错误。连接到车辆网的车子,还未到达目的地前是不能任意停下来,车上感测器存下来的资料,必须经过即时处理,传到云端再传到车子会来不及。车辆网也是 edge computing 会发挥的地方,也是储存商能发挥之处。
综合上面感测器的例子,我们现在有相当强大的云端运算,但是通信网络还没办法满足特殊的需求,如需要即时而且非延迟性状况,或是关键任务性质,最后忍痛付高额通讯费用,还得面临通讯不稳定状况。Bergey 笑说许多公司要迁移资料,由于资料量太大,最后选择靠 Fedex,先把要搬家的资料用实体的硬盘装好,再请 Fedex 过来收件,完成资料搬迁工作。
架构决定资料跑上云端还是本地处理
至于架构上要怎么选择,是要将资料在本地处理过,还是一鼓脑的将资料上传传送到资料中心,Bergey 说这就要看需求是什么,不能一概而论。像是法律有规定的产业,如医疗业或是金融业,则有要求储存地的规定,最严格的要求是完全不能放云端,要存在本地的硬盘。如果没有那么即时需要的资料,则可以处理过后,再传送处理过的资料。
AI 是相当火红的话题,Bergey 说 AI 能真正发光发热还早,目前只能做人类都觉得很枯燥的工作,如在商家里计算来店人数,或者是来店人数的男女比例等。还有一种状况是处理感测器的资料。
不少工厂基于效率和管理考量,开始将工厂设备连网,而且也都有资金更新设备。Bergey 认为在连网同时要担心资安问题,分开不同的存取限权,确保资料不会被未经授权情况下,被不该看到的人看到。
医疗方面的应用,则会牵涉到医疗法规的规范,一般不能存个人医疗资讯,必须在医疗数据库操作。医疗方面存取资料管控类似工厂,但要确保只有负责医生看得到病人资料,其他人不行。训练 AI 时,资料要经过去识别化处理。
仍需要私人储存装置放越占越多的私人资料
Bergey 说未来的储存趋势方面,个人储存变成云端加 SSD 的混合方案,传统 HDD 的需求下降,渐渐被 Flash 储存装置取代。DVR 则是用云端储存方案。个人储存即便是云端加 SSD 的混合储存方案,PC 的储存空间仍很重要,大家的装置拍摄私人影片,手上数量不少的私人资料,或者是监视个人健康状态的数据,不会轻易放到云端上面,而是自行储存。
最后聊到有厂商推出挖矿手机,对于储存产业的影响,Bergey 认为离线储存有其必要性,可保护使用者的隐私。像是挖比特币,要安全保存比特币,就需要比特币钱包,用自己储存空间放。而从整个比特币生态来看的话,算区块链要运算,有不少 AI 机器学习需要,也能驱动储存需求。