欢迎光临GGAMen游戏资讯




“腾讯云”因自身错误导致客户网站所有资料遗失还没有备份,仅愿赔偿 13 万人民币

2024-11-25 205

中国第二大云端厂商“腾讯云”最近遭客户“前沿数控”指控,表示他们在腾讯云端服务器存放的网站所有资料,全部被腾讯云“搞丢”,而且腾讯连备份都没有,等于公司所有心血及客户资料全部毁于一旦,而腾讯表示他们会负责,赔偿“13 万人民币”。

“前沿数控”是一间 2014 年成立的行销公司,服务对象锁定数位控制、模具与机械产业。像这种行销公司最重要的就是累积的粉丝数量及客户资料,他们目前已有 40 万粉丝,也从过去原本只在微信公众号的经营转型到建立网站。且因流量持续成长,而在去年开始使用腾讯云端服务,将所有资料搬到腾讯云。

他们表示,腾讯云宣称公司的云端虚拟机器(CVM)有 99.9999999% 可靠性,资料遗失概率微乎其微,且云端硬盘还会有 3 个资料备份,简直就是万无一失。但是今年 7 月中,他们突然发现无法登入网站服务器,且所有功能都无法使用。经过联系,腾讯表示部分云端硬盘出现故障,正在抢修。不过抢修完毕后,“前沿数控”发现资料已损毁,再也无法使用。

根据“前沿数控”表示,自从事情发生后,平台已全部停止营运,过去的活跃用户在这种情况下也逐渐流失,客户对平台的信任度降至冰点,广告商也要求他们退款赔偿,公司融资计划也被中止,公司陷入了生存危机。与腾讯讨论赔偿问题过了 14 天后,腾讯的答复是 132,900 人民币的补偿金额。

腾讯表示,全额退还前沿数控从去年 12 月到今年 7 月消费的 3,569 人民币,再加上 132,900 人民币的现金或云端资源。

资料救不回来是谁的责任?

据中国媒体的了解,“前沿数控”跟腾讯申请的服务为单部 CVM,只有系统硬盘没有资料硬盘。如果拿我们比较熟悉的 PC 来解释,就是他们只有一颗 C 槽,没有 D 槽。

有装过电脑的人都听过“重要的资料不要放在 C 槽”这句话,意思就是资料与系统不要放在同一槽。这样当系统出错时,资料还可以救回来。而“前沿数控”就是把资料与系统放在同一颗云端。

另外,资料备份有所谓的“三二一原则”。简单的说明就是,要备份资料应该依循以下的原则,才能确保资料万无一失:

  • 至少备份 3 份
  • 使用两种不同形式
  • 其中一份备份要存放异地

以“前沿数控”的例子来说,至少该在本地电脑要同步备份一份资料,才能确保万无一失。而他们也没有做到这点。

不过,“前沿数控”向中国媒体表示:“腾讯云宣称这是十亿份之一的概率,你想一个道理,人家的安全概率是这么高了,还有 3 个备份,那还有什么风险?3 个备份都出问题了,那再来几个备份又(怎么)能保证安全?”

后续处理:狮子大开口?

根据“前沿数控”表示,由于公司等于全部停止营运,因此认为腾讯必须赔偿 1,101.6 万人民币,腾讯云在事发后 14 天,提出的 13 万人民币的方案他们完全不能接受。

不过,腾讯也向媒体表示,对方的要求远远高出腾讯云能提供的方案。对方甚至提出希望“获得腾讯投资”、“腾讯官方引流”等补偿方式,但腾讯表示,公司很难满足这些要求。

不过,也有其他云端业者质疑,腾讯的说法还是有问题,因为一个合格的云端业者帮客户做好备份是最基本的,腾讯还号称有 3 个备份,而云端硬盘出错导致备份全都出错,而且是 3 个备份都出错,这实在是很难想像的事情。甚至怀疑腾讯云端到底有没有帮客户备份?

而针对此事,腾讯也在 8 日发表了公开信说明,以下为腾讯全文。

腾讯发表公开信说明的真相

近日,腾讯云客户北京清博数控科技有限公司所属“前沿数控”平台一块操作系统云盘发生故障,导致该客户的文件系统数据损坏,我们对客户业务所受影响表示诚挚歉意。同时,我们也对此次故障过程进行了深入的技术检视。

检视发现,该故障缘起于因磁盘预设错误导致的单副本数据错误,再加上数据迁移过程中的两次不符合规范的操作,导致云端的三副本安全机制失效,并最终导致客户数据完整性受损。

痛定思痛,腾讯云希望在尽力帮助客户解决本次问题的同时,也通过相关机制的优化避免类似情况的再度发生。

故障过程检视

当天上午 11:57,我们的运维人员收到仓库 Ⅰ 空间使用率过高告警,准备发起搬迁扩容;在 14:05 时,运维人员从仓库 Ⅰ 选择了一批云盘搬迁至新仓库 Ⅱ,为了加速搬迁,手动关闭了迁移过程中的数据校验;在 20:27 搬迁完成之后,运维人员将客户的云盘访问切至仓库 Ⅱ,同时为了释放空间,对仓库 Ⅰ 的源数据发起了回收操作;到 20:30 监控发现仓库 Ⅱ 部分云盘出现 IO

故障原因检视

本次事故起源自因磁盘预设错误导致的单副本数据错误,再由于数据迁移过程中的不规范操作,导致异常数据扩散至三副本,进而导致客户数据完整性受损。

数据搬迁过程中的违规操作主要如下两点:

  • 第一是正常数据搬迁流程默认开启数据校验,开启之后可以有效发现并规避源端数据异常,保障搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验。
  • 第二是正常数据搬迁完成之后,源仓库数据应保留 24 小时,用于搬迁异常情况下的数据恢复,但是运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。

因这些错误操作的连续影响,导致该客户数据完整性受损,给客户的正常业务运行造成影响,腾讯云对此再次表示最诚恳的歉意。

改进措施

经过技术复盘,腾讯云技术团队深入到每个环节,通过责任到人与流程闭环的双管齐下,相应做出如下的加强和改进措施:

  • 首先,我们将全面审视所有的数据流程,涉及数据安全的流程自动化闭环,进一步提升我们常规运维自动化和流程化,降低人工干预。同时把全流程的数据安全校验作为系统的常开功能,不允许被关闭。
  • 其次,针对物理硬盘静默数据错误,在当前用户访问路径数据校验自愈的基础上,我们优化现有巡检机制,通过优先巡检主副本数据块、跳过近期用户访问过的正确数据块等方法,加速发现该类错误,进行数据修复。

进一步建议

腾讯云自 2016 年 3 月以来一直在提供免费的快照功能,可以对重要数据进行定期备份。同时出于对客户数据隐私性和安全性的考虑,客户可以自由选择开启或者不开启这一免费功能。腾讯云在这里也呼吁客户开启这一功能,进一步提升自身数据的安全性。

未来,本着对客户数据最大的敬畏,腾讯云将继续探索更科学的机制,避免类似事件再次发生。

(本文由 T客邦 授权转载)

2019-03-14 06:30:00

标签:   游戏头条 资讯头条 ggamen科技资讯 ggamen科技 ggamen科技资讯头条 科技资讯头条 ggamen游戏财经 新闻网 科技新闻网 科技新闻 ggamen游戏新闻网 科技新闻 科技新闻网 新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 ggamen科技资讯 资讯头条 ggamen ggamen游戏新闻网 科技新闻 科技新闻网 ggamen游戏财经 科技资讯头条 ggamen科技资讯头条 ggamen科技 资讯头条 游戏头条
0