深度学习技术的成熟,大幅提升影像与语音辨识的精准度,也再度掀起了市场对人工智能技术的强烈关注。
全球疯 AI,台厂也不例外
随着 Amazon、Google、IBM 与 Microsoft 等国际大厂的加入,面对庞大的人工智能市场商机,包括台湾等来自世界各地的企业,都想透过图像辨识等人工智能技术加值产品服务能量。不过,碍于人才(技能)不足、对深度学习模型掌握度不高、可用数据库不齐全等挑战,如何将技术真正落实在产品应用中,以充分满足使用者需求,仍是许多对 AI 大饼跃跃欲试的厂商所须攻克之处。
全球市占第一的台湾网络储存服务器品牌群晖科技(Synology)日前推出搭载深度学习影像辨识的相片管理服务── Moments,仅运用四人团队,在不到一年的时间之内就将深度学习技术应用于服务,其关键即在于运用自行建置的深度学习模型,以提升图像辨识精准度。
优化图像辨识精准度的两大秘诀──自建与训练深度学习模型
对期望提升人工智能图像辨识能力的企业来说,如何自建深度学习模型,以及如何训练模型来优化图像辨识精准度是最关键、也最具挑战的工作。企业资料科学家得先依据目标建立适合的算法,并建构一套可以自行分析数据资料、找出特征值的深度学习模型,然后透过大量有标记(Label)的数据资料(又称资料集)持续不断的训练、优化深度学习模型对图像辨识的精准度。
现成模型通常都有原先设定的目标,如“物件侦测:侦测每张照片里面的物件与位置”,但企业开发新应用时希望建立的算法往往与现成模型原先目标不相同,导致同一张图像套入模型或算法出现不同的辨识结果,大幅影响将深度学习技术导入产品的可能性。以群晖科技为例,希望建立的算法目标是“从一张照片中辨识出多个物件 / 场景”,但这与当前学界研究中盛行的“影像分类:一张图片即一个主题”等算法的目标不同。为了让研发结果能与产品服务接轨、满足使用者需求,群晖科技才决定自行开发模型。
然而,另一个困难点则在于训练用资料集的可用性问题。深度学习模型能够成功实现智慧辨识的关键,在于资料的训练过程,而训练用资料中已经存在的标记,将很大程度地决定最终训练结果能否符合目标。群晖科技在取得训练用数据资料时,便因为资料标记方式与训练目标不一致,于是重新标记每一笔资料,并且另外准备了一份专门用来验证辨识成果的验证用资料集,才得以顺利进入正式的模型训练阶段。
值得特别注意的是,为提升深度学习模型的图像辨识精准度,研发团队通常都将花费许多时间“调整模型参数、重新训练模型与验证模型精准度”,才能从中找出最佳参数,并导入于产品或应用服务中。
从跨界合作取代单打独斗 人工智能就这么做
深度学习模型的研发费时费工,群晖科技花了近一年的时间,透过产学合作的方式与台湾大学资工系教授徐宏民的研究团队合作,加速整个产品开发;但是前瞻深度学习技术还是得面对群晖产品、客户上的诸多要求,因此内部的人工智能研发团队得自行落实模型开发与建立。“很令人兴奋的产学合作经验,群晖在深度学习技术从无到有,甚至目前各项视觉辨识指标都达到世界级的水准。”徐宏民表示,在协助群晖科技研发团队采用合适的视觉辨识技术之际,也发现了其他重要的研究议题,已带回实验室进行前瞻的研究工作。
群晖科技软件开发部协理高士轩说:“在开发 Moments 的经验中,我们发现想以人工智能提升服务能量,除了要成立人工智能研发团队、还得清楚定义目标,并且持续不断的予以优化。”高士轩亦认为,因应需求差异,每个产业所需要的深度学习模型都将有所不同,为加速人工智能相关产品的开发脚步,建议除成立专门的研发团队,还可进一步寻求外部技术支援;群晖科技便是在徐宏民教授的专业指导下,得以在短时间内成功推出搭载人工智能技术的全新应用服务。
▲ 全新智慧照片管理套件 Moments 透过深度学习技术,主动辨识出人像、地点、主题等,分类照片不费吹灰之力。(Source:Synology)
对欲导入视觉辨识等人工智能技术的企业,徐宏民提出三点建议,首先是相信台湾具有相关领域世界级的技术研究能量;其次是确保高阶主管对深度学习等技术的认可并愿意投资;最后是将深度学习等技术放到产品蓝图,而非只是单纯做研究。
展望未来,随着机器人、自动车、智慧工厂与智慧医疗等应用的崛起与普及,视觉辨识等人工智能技术将被广泛地应用在各个地方,不过,由于应用领域差异,所需的视觉辨识技术将有所不同,相关领域企业可透过产学合作等方式及早投入,提升对视觉辨识等人工智能技术的掌握度,从而开创专属蓝海市场。
(首图来源:Synology)