物联网进入你我生活,透过云和端之间的数据传输提供便利服务。当成千上万的应用软件服务在云端运行,如何确保服务稳定运作,在出现问题时快速找出瓶颈?工研院的“免代理式应用效能管理系统”无异是最佳解答,该技术同时也入围 2018 全球百大科技研发奖。
“网页怎么这么慢?”“APP 一直卡卡的!”网管人员最怕接到这类抱怨,因为他们接下来得忙着找出问题的根源,还要让系统恢复正常。如何有效率地管理网络应用软件效能?由工研院开发的“免代理式应用效能管理系统”(Agentless-based Application Performance Management;AAPM)便是网络维运者的好帮手。
网络系统营运行业可说是“每秒几千亿上下”的生意!根据电商巨擘亚马逊的研究,因网页回应时间延迟所造成的商业冲击,每 0.1 秒的延迟会影响 1% 的销售额,折合新台币 300 多亿元;搜寻巨人 Google 也指出,网络延迟每增加 0.5 秒,搜寻浏览量将下滑 20%,代表商机正从指缝中溜走。如何有效率管理应用程序,应用效能管理系统(Application Performance Management;APM)已成为不可或缺的关键技术。
“三不”独家特色 解决客户痛点
现行利用 APM 来监测应用软件效能,须先安装代理程式(Agent),如此一来势必要修改应用软件本身,植入监测程式码;应用软件一旦更新,又得重新安装代理程式,不仅耗时费事、增加维运成本,无形之中也提升了系统不稳定的风险。
为了让网络应用服务管理更有效率,工研院以自主开发的应用软件监控专利技术,将 APM 结合OpenStack KVM(Kernel Virtual Machine)虚拟机管理功能,在 2017 年成功整合为“免代理式应用效能管理系统”。AAPM 不必安装代理程式,不修改任一个应用软件,不改变执行环境,以“三不”独家特色,解决网络系统营运商使用传统APM的痛点,就连无源代码的应用软件也能管理。AAPM 成功把痛点变卖点,入围 2018 年全球百大科技研发奖。
视觉化拓朴图 快速找出效能瓶颈
“凡走过必留下痕迹,”研发成员之一的工研院资讯与通讯研究所组长江沧明解释,AAPM 针对在资料中心运行的所有应用服务,都能显示应用服务与客户端间的程序(Process)/执行绪(Thread)、虚拟机及连线状态,产生应用服务拓朴图,并建立服务轨迹。“资料细到客端用PC还是手机,几点几分向应用服务提出请求(Request)、浏览的页面、执行的动作,全部视觉化,一目了然,”江沧明说,网络应用服务异常,往往产生延迟,AAPM 可即时侦测延迟时间,以红色标示异常网段;进一步做到问题根源分析,快速找出效能瓶颈。
▲ AAPM 可即时侦测延迟时间,以红色标示异常网段;进一步做到问题根源分析,快速找出效能瓶颈。
然而,标榜“免代理式”的特色,却让 AAPM 的开发难度倍增,因为 AAPM 必须跟系统软件“缝在一起”,方能让未安装代理程式的应用软件顺利被 AAPM 管理。在不知系统软件的源代码之下,要捞出系统软件必要资料,把 AAPM 与系统软件做完美整合,正是一大挑战。为此,江沧明找来系统软件专长的俄籍工程师 Dmitry Sherstoboev 协助,在“绑手绑脚”与“半做半猜”中成功达阵,完成开发。
微服务时代 免代理程式更具优势
随着云端运算与虚拟化应用市场渐趋成熟,APM 的前景看好。江沧明说,凡透过网络软件搜集资料、服务客户的企业都会用到 APM,例如网络/行动银行、电商网站、网络订票等都是潜在客户。研调机构 IDC 指出,APM 一年市场规模高达 34.6 亿美元,并以 12.5% 年复合成长率成长,市场潜力可期。
此外,微服务(Micro-services)概念兴起,将单一应用程序划分为许多小型服务,使其具备扩充的弹性与快速更新的能力,逐渐成为云端应用的趋势。“把大服务划分为小服务后,更能凸显 AAPM 免代理式的优势,”江沧明认为,AAPM 此时切入正是时候,可协助解决微服务在安全与效能上的挑战。
展望未来,团队将进一步导入机器学习,让 AAPM 从被动监测进化成主动预测。团队成员之一的资通所经理阳鸣谷说:“延迟代表损失,预防胜于治疗。”机器学习能根据过去的资料进行分析、建立预测模型,并以模型作为侦测不正常行为的基础,找出问题之后进而自动解决、自动修复,隔离问题,减低管理者的负担。
(首图来源:工研院)