一只出现一年多的普通病毒,一个人为疏失,竟让台积电竹科、中科、南科厂区生产线大面积停摆,让台积电第三季毛利率下降 1%!8 月 3 日,台积电发生罕见的资安事件,这起事件的真正原因是什么,至今仍无完整答案。
8 月 6 日,台积电总裁魏哲家在记者会,将这起事件定调为“人为疏失”,强调“台积公司于 8 月 3 日安装新机台时,并未将此机台于连结网络前隔离确保无病毒,造成病毒进入公司网络。”
但,这恐怕只是答案的一部分,因为,如果只要一个小小疏失,就能造成台积电生产线大面积停摆,那么,未来投资者又该如何估计台积电的经营风险?台积电过去对作业疏失处分严厉,这一次,魏哲家却对谁该负责、问题由哪一厂开始爆发,不愿透露任何资讯。
一个新机台、一只病毒 一连串巧合掀起的完美风暴
还原台积电中毒事件 45 小时紧急救援的过程,发现这件事的核心和魏哲家进行的一项重大变革有关,这也是魏哲家低调面对的真正原因。
时间回到 8 月 3 日下午 6 点,台积电 12 厂的机台开始出现异常,刚开始范围不大,现场工作人员以为是机台出了问题。晚上 10 点半,状况开始变得愈来愈严重,不只机台,连搬运晶圆的系统都出了问题,所有人意识到,网络出了问题。
各地的情报不断传进来,不只新竹、台南和台中厂都出现状况,控制机台的中控电脑纷纷出现无限次自动重新启动或当机的状况。
主管 IT 的副总经理林锦坤等高阶主管坐镇 12 厂,林锦坤在台积电是从设备工程师一路立下战功的老台积人,他原本是负责管理工厂营运,在资讯长左大川退休前,他升为副总经理管理资讯系统,带着所有人漏夜开会评估影响。
造成病毒感染的原点究竟在哪里?“有两个说法,一说是在龙潭,一说是在新竹。”一位产业人士分析,事件的起因极有可能是为了新的机台要开始试产,让受感染机台第一次连上台积电制造部的网络,“一个机台里可能有不只一台电脑”,他分析,如果工程师只扫了其中一台电脑的毒,就将机台连上网络,这一道防线因此失守,病毒开始在台积电制造部的网络流窜。
业界观察,台积电过去不是没遇过这样的挑战,但以前,台积电还有第二道防线,机台无需连上云端,就能独立作业,“控制机台的程式,放在机台的肚子里。”他分析,以前遇到这种状况,只要改为人工操作就能解决。
这一次不一样。去年初,台积电开始在内部推动云端自动化系统,机台生产前,是由中控电脑把控制机台生产的程式放进机台里,生产完之后就杀掉,“这样能做到资料不落地”,好处是能减少人为错误,提高效率,只要电脑下指令,所有机台用的都会安装一致的程式,而且保密性更高,有心人无法从机台里偷走这些重要资料。
但这套系统的问题是,如果病毒进入网络,机台就无法独立运作。“也不是所有的机台都中毒,但是那些有问题的中控电脑送到机台的程式,谁敢保证它放进去是对的程式?”
▲ 台积电技术资讯及资材暨风险管理副总经理林锦坤(右二),是这一次台积电危机处理的核心人物。
病毒疫情四处扩散 为何只有南京厂幸存?
爆发灾情的当晚,病毒沿着生产部门的网络在台湾各厂区之间迅速扩散,只有南京厂不受影响。过去,台湾各厂区之间还有防火墙阻绝,这一天,却没有发生作用。
关键在于,台积电台湾各厂区之间为了追求效率,会跨厂合作,有时是产能不足,把生产资料丢上云端,用其他厂的机台来帮忙生产,或是有问题,把相关资料传到其他厂的机台,验证自己的生产程序哪里有错。魏哲家在记者会也证实,“我们生产的系统是全部连线,使我们有最大的效率,北中南全部连线在一起。”
对各生产单位来说,如果有防火墙,对其他厂区的机台下指令,可能要几分钟才能得到回应,拿掉防火墙,立刻就能知道结果;方便的下场,就是无法阻隔病毒。台积电内部老旧的厂区,因为还没连上云端,基本能维持运作,但已经完成云端自动化系统的新厂区,就受伤惨重。南京厂因为防火墙仍维持运作,作业反而不受影响。
当天许多台积电员工工作到第二天凌晨才下班,早上 8 点,各单位主管狂打电话,把设备工程师全部召回厂内,其他单位支援人力,按照前一天定下的应变计划,数千台电脑扫毒,惟恐漏掉任何一台。
这并不容易,因为台积电里面,旧有生产线的机台,也有部分是历史悠久的老设备,这些设备用的电脑旧到不能灌防毒软件,但是,生产这些设备的厂商,可能已被购并,或已经不继续营运,无法随便更动设备,“只能先扫毒,确定没病毒之后再想办法,可能是建一个外挂,保护这台电脑。”产业人士分析,未来如何处理这些老旧设备的资安问题,也是一个重点。
台积电各厂之间的防火墙,也迅速恢复起来,各生产单位虽然抱怨连连,但面对资安风险,没人敢再多讲什么。到星期天下午 3 点左右,八成机台都已恢复生产。魏哲家没说的是,台积电的云端自动化,是一条非走不可的路。
云端自动化势在必行 资安与生产效率的两难
台积电兴建南京厂时,是把南京厂当成云端自动化示范点来做,当时左大川仍是资讯长,为了设计南京厂的云端系统,台积电人仰马翻。在南京厂,要做一份跨部门工作报告,需要穿过数百道防火墙!
南京厂完工后,台积电把这套系统推广到台湾各厂区,未来新兴建的厂,都会采用这样的云端系统。过去几年,魏哲家不断在内部推行自动化,因为,台积电的投资金额愈来愈大,他希望能让台积电即使扩厂,未来员工人数仍维持 4 万多人左右的规模,提高效率才能让所有员工维持高薪,提高台积电的竞争力。这个策略不会因为意外而有所改变。
这也是台积电在资讯安全的重要一课,因为,面对资讯安全,不管有再好的设备和技术,只要有人贪图方便,这些防护措施可能都完全起不了作用。补起了这个漏洞,未来台积电完成云端自动化平台后,竞争力会更强。
(本文由 财讯 授权转载;首图来源:Flickr/Thomas CC BY 2.0)
延伸阅读:
- 台积电说明病毒事件约影响 2018 年第 3 季营收 3%,毛利率影响 1%
- 魏哲家 : 台积电染毒纯属内部疏失,对第 3 季营收冲击降至 2% 以下
- 台积电爆发病毒感染,资安亮红灯