大家可能不知道目前 AI 人工智能大概分为两种,一种就是像脸书 / Google线上语言翻译,或是像依照语音命令帮你搜寻资讯的 Google 语音助理/SIRI这类的巨量云端 AI 应用。还有一种就是行动装置终端的 AI 应用,如脸部辨识、拍照场景辨识/优化…这类在本地端不需联网的 AI 应用。上周的深圳 Qualcomm AI Open Day 研讨会之后,主办单位在会场旁边也邀请了中国业内 AI 相关业者展出行动装置端的 AI 应用,为大家做简单的介绍。
过滤背景音与 AI 算力展示
首先来到高通自己的摊位,这里展示的是 Snapdragon 855 与 710 处理器在第四代 AI Engine 底下使用 HVX(Hexagon 向量加速器)与HTA(Hexagon 张量加速器)协同运算之后算力的差异:
Snapdragon 处理器采用“异构多核心”的方式设计,在第四代 AI Engine 里面又新增了 HVX 与 HTA 的设计,在两颗处理器同时运作的情况下,算力会有蛮大幅度的提升(看不懂的朋友建议阅读一下这一篇)。下图左就是 HVX 与 HTA 协同运算,下图右是关闭 HTA,只有 HVX 独立处理,Snapdragon 855 平台大概会有一倍的差距:
在730平台则是差了1/3(S855算力还是强不少呀):
在使用语音输入、语音命令时,最怕的就是背景因太吵杂,Qualcomm 的 AI 语音辅助技术可让装置在吵杂背景底下也能随时背景接收语音指令唤醒并执行,主要应用在于 OK Google 与厂商的第三方语音助理(如小爱同学)上:
现场说明:
晶圆坏点检查
一般人应该没有在晶圆厂工作的经验,虽然制程都是全自动的,但检测每个单元是否有坏点几乎都是靠人工目视检查,而这个技术就是透过手机镜头与内建的 AI 应用检查晶圆是否有坏点,大大减少从业人员的工作时间与眼力:
智慧看板应用
另外的智慧广告看板系统,只要架设一台有摄影机的机器在会场,不需要电脑系统就会依照人脸识别路过的人群性别、年纪、心情与走动路线等资讯,在对应的位置显示适合的广告内容:
使用情境是展览场、露天演唱会等大型活动:
收集的相关资讯也会整合到后台中进行统计:
无人商店
我个人觉得最有去的是由“华捷艾米”所推出的无人商店方案,与 AMAZON 的无人商店方案相比相对简单与平价:
首先顾客要先下载App并进行脸部特征与信用卡资讯登录,完成的人就可在门口的脸部识别处进行检验,检查通过才能进入:
华捷艾米的方案主要是使用 AI 视觉辨识的超商货架:
在货架上方与内部配置镜头,可识别哪个消费者拿了商品、又取走哪些东西。现场询问工作人员如果说消费者偷窃、不买了将产品乱放没归位是否会受到影响,厂商则是信心满满的表示这些状况都模拟过,只要有东西没结账超商就不会开门让对方离开(保全也会同时出现):
系统会依照超商内的人群即时辨识哪些人怎么走、又取走了哪些产品,后台也会有相关纪录,至于准不准确就还要等上线实测:
王者荣耀 AI 电竞战队
vivo、腾讯与高通合作打造的王者荣耀 AI 电竞战队“SuperX”,在现场也初试啼声亮相:
AI 人工智能与真人玩家进行PK比赛,根据现场的简报,vivo与腾讯的目标是要将这支战队与真人职业队伍进行PK对战:
AI战队的相关影音介绍:
TOF深度摄影机与动态捕捉系统
以往要在电视上玩“体感游戏”通常都需要类似 KINET 之类的摄影机才能进行,现在使用 AI 与 TOF 镜头协同使用就可以直接侦测玩家的动作进行各种体感操作的游戏:
使用的手机是搭载 TOF 深度镜头的 OPPO R17 Pro:
认真说如果可以发展成另一个独立机器的话,也许这种玩法是有商机的:
超级分辨率处理
另外觉得拍出来的照片不够清晰吗?也有厂商推出超级分辨率的 AI 应用,让模糊的照片经过处理后变清晰:
AR 大头贴运用
这间厂商最厉害的是可以即时依照你的个人形象产生一组AR大头贴,并与本人的头部进行无缝结合,辨识相当精准:
阿达的凤梨头也判别的不错(变帅了):
还可以即时更换发型、眼睛等各部位的造型:
也可以产生各种动作的AR造型大头贴,主要厉害的是相似程度是目前我个人使用过最好的:
测试影片:
AR即时翻译与学校作业解题
“有道科技”是中国相当知名的翻译公司,“有道翻译官”就是他们旗下的知名 APP,好用程度不输给 Google翻译(甚至更好):
以往的 AR 翻译必须透过联网才能使用,有道使用的 AI 神经网络翻译系统,可在离线状态下也翻译出水准不错的译文:
另外这个功能就比较逆天了,有道开发出只要拍作业本上的题目,系统就会帮你解出答案共支援国小、国中、高中与九种学科(需联网),千万要注意别让小孩使用呀(笑):
有道翻译与解题的实际使用影片:
AI 即时录影特效
中国软件公司“旷视”推出一款“希区考克变焦”的 AI 影像处理应用,也就是所谓的“推轨变焦镜头”(Dolly Zoom)让人物在原位置,维持相同大小,画面背景却有“Zoom In”的效果:
大概就是这样的呈现方式,以往必须要有专业摄影师与器材才能做到,现在只要有手机,在本地端就能完成:
超级夜景与即时美体
最后是由“Arcsoft”(虹软)所推出的特殊效果,包含了超级夜景效果与即时美体等 AI 功能:
超级夜景的效果相当惊人,除了降噪以外同时连细节也都完整呈现:
经过实际测试效果非常好,原则上在 Open AI Day 的所有厂商都是提供技术授权给手机制造厂商使用,所以以上的技术在许多手机厂的相机效果中都看的到,也大幅减少厂商开发时间:
即时美体效果,可支援在照片影片上,同时不会有变形的状况:
整体来说人工智能并不像以往电影中那么狭隘,只要具备学习、分析、判断能力的都可称为是人工智能的应用,以前我们觉得 AI 在云端、在科幻电影中,但随着科技的进步与如高通这类厂商的努力,AI早已经与我们身边的手机、智慧喇叭、智慧穿戴…等各种应用结合,接下来