为什么不要用 Excel 记录确诊病例?这个答案或许问英国公共卫生部最知道。
漏了近 1.6 万人
10 月 5 日,COVID-19(武汉肺炎)确诊病例飙破 51.8 万人的英国,传出 9 月 25 日到 10 月 2 日 8 天内,将近 1.6 万新确诊病例没有追踪,这代表原本应该接受隔离治疗的患者依旧在外头跑,加剧疫情蔓延的风险。
将 Excel 当成大型数据库
而这 1 万 5,841 起确诊病例之所以被英国公共卫生部(Public Health England)漏掉,原因就出在英国公共卫生部将微软 Excel 试算软件当成大型数据库使用,没有注意到 Excel 并不适合记录和追踪每天增幅调整的确诊病例数据。
▲ 伦敦街头,人们走过英国国民保健署(HNS)提醒大众对抗武汉肺炎的广告看板。
为什么会漏数据?
如果要还原整起漏数据事件,必须先从英国公共卫生部如何记录武汉肺炎确诊病例说起。
每天,英国各地的公私立检测中心会将确诊病例和检测人数等数据以 CSV 档寄给英国公共卫生部,英国公共卫生部再将收到的数据汇入 Excel 数据库。
虽然 CSV 档案大小没有限制,但英国公共卫生部使用的旧版 Excel 档案格式 XLS 只能呈现 65,536 列,这代表多出来的数据会自动删除,这也是为什么确诊病例数会遗漏。
如果是新版 Excel,档案格式 XLSX 可容纳 1,048,576 列,能记录的检测数据量是前者 16 倍,相对来说不容易发生数据遗漏问题。
要存大数据,Excel 不适合
不过 IT 专家指出,不管是 1987 年的 Excel XLS 档案格式,还是 2007 年更新的 XLSX 档案格式,都不适合存放武汉肺炎的检测数据,个中道理连中学生都知道。
英国剑桥大学计算机实验室通讯系统教授克罗克洛夫(Jon Crowcroft)说:“一直以来,Excel 都是专门设计给小型公司处理数据,并大致看看数据长相的软件。”
“当你要做某些比较严肃的正事时,你会用为正事量身打造处理数据的方式,你有很多其他选择,但你不会用 Excel,没人会用这个起头。”
▲ 5 日这天,英国卫生大臣韩考克在下议院提到 Excel 漏数据事件,他承诺除了会深入调查意外,也会立刻升级过时的电脑系统。
英国公卫部:“技术问题”已解决
回到 Excel 漏数据事件。发现漏掉 1 万 5,841 起确诊病例没有追踪后,英国公共卫生部表示已立刻回溯追踪,并在 3 日凌晨 1 点大致补完,这项“技术问题”已经解决。
卫生大臣:这起意外根本不该发生
5 日英国卫生大臣韩考克(Matt Hancock)在下议院接受质询时,也提到 Excel 漏数据事件,他坦言整起事件肇因于英国公共卫生部使用“老旧系统”统计确诊和检测数据,两个月前当局就决定要更换系统。
“这起意外根本不应该发生”,韩考克承诺当局除了会深入调查意外,也会立刻升级过时的电脑系统。
比一团乱糟多了
对这起意外,工党的影子卫生大臣阿什沃斯(Jonathan Ashworth)表示,就算英国公共卫生部事后力挽狂澜,人民的生命安全照样因延迟追踪而陷入危险。
阿什沃斯说:“成千上万的人根本不知道他们曝露在染疫的风险下,住院人数不断增加的情况下,这种致命的病毒很有可能广泛散播。”
“这起事件不仅是一团乱,这比一团乱还更糟”。
除了漏数据,还有很多地方做不好
苏格兰爱丁堡大学全球卫生治理学程主任斯里达(Devi Sridhar)说:“这起事件发生的时机不能更糟了,随着时序准备进入冬季,我们早就知道到时病例数会增加,现在正是需要当局‘检测和追踪系统’(test-and-trace system)好好发挥功用的时候。”
没想到,英国公共卫生部的检测和追踪系统却出了这种大包。斯里达继续说,除了漏数据,当局防疫还有许多地方做不好,像是把人送去离家好几百公里远的地方检测、实验室检测速度太慢、累积大量民众没有检测等。
▲ Excel 不是万用的,某些情况就不适合使用 Excel 处理数据。(Flickr/Christiaan Colen CC BY 2.0)
解决之道:拆成小档案汇入 Excel
面对各方挞伐,发生 Excel 漏数据事件的英国公共卫生部表示,他们现在将检测数据拆分成小堆汇入能容纳大量数据的 Excel 模板,如此一来就不会发生数据量超过上限,数据自动删除的情况。
然而 IT 专家表示,英国公共卫生部该做的是找到更适合的数据库软件取代 Excel,而不是继续使用 Excel。
其实,Excel 不是万用
据《卫报》报导,Excel 虽然是全世界最受欢迎的商业工具,但某些情况下并不适合使用 Excel 记录数据,过去也有不少企业使用 Excel 出错,结果付出高昂代价的例子。
举例来说,2013 年摩根大通集团(JPMorgan)使用 Excel 出错,损失将近 60 亿美元(约台币 1,741 亿 5 千万元)。当时 Excel 试算表的单元格错误地除以两种利率的总和,而不是除以平均值。这个错误也让美国康乃狄克大学法律系教授柯克(James Kwak)警告大众,Excel 其实“非常脆弱”。
人人都能用,但不一定用得好
柯克说:“对初学者来说,Excel 没办法追踪数据从哪里来,Excel 也没有审计追踪功能,所以你有可能不小心重复输入某些数字,但你自己不知道。此外,Excel 也没有简单方式测试试算表是否有错。”
“Excel 最大的问题在人人都能生出 Excel 试算表,但可能做得不好,因 Excel 操作太简单,人们制作重要试算表时并没有局限于一定要给了解程式设计的人去做,也没有以系统性、能追踪制作纪录的方式制作。”
- Covid: how Excel may have caused loss of 16,000 test results in England
- Thousands of coronavirus cases were not reported for days in the UK because officials exceeded the data limit on their Excel spreadsheet
- Excel: Why using Microsoft’s tool caused Covid-19 results to be lost
- In U.K.’s Test and Trace: Now You See ’em, Now You Don’t
(本文由 地球图辑队 授权转载;首图为英国博尔顿镇的一处 COVID-19 检测站内,人们正在自行采检。图片来源:达志影像)