PTT 之父杜奕瑾返台后,创立台湾人工智能实验室(AI Labs),开发的语意辨识引擎“雅婷一号”,他分享内部测试过辨识率准确度更胜科大讯飞,如今,“雅婷一号”也传出将跟华硕合作。
杜奕瑾表示,“我们台湾的中文语音技术已经是世界水准,跟科大讯飞、Google 及百度一起测,我们台湾本地的中文辨识率是最准确的。”不过对于华硕合作案,他表示个别的合作不方便讲。
开发“雅婷一号”,靠网络大数据训练
▲ 杜奕瑾说,雅婷一号不断在 YouTube 上看片学国语,现在国语、台语都能通。(Source:HowFun)
他表示,现在 AI Labs 团队做的语音辨识及语意理解,都是用本地的资料做训练,不管是看 PTT 网站还是上 YouTube,“网络就是大数据”,杜奕瑾说,很多企业说没有数据无法做机器训练,现在雅婷一号台语也能通,连人脸辨识训练也是用在地影片做训练。
为何要开发雅婷一号?据了解,起源是有次数位政委唐凤拜会杜奕瑾时,带了一位每分钟可以打 300 到 350 字的速录师薛雅婷,做访谈逐字稿,结果唐凤对杜奕瑾的语音 AI 辨识印象深刻,还打趣不要让“雅婷”整天做会议纪录太累,所以让这个语音辨识系统取名雅婷一号。
“但语音界面要每天在身边使用,其实还有很大的改善空间”,杜奕瑾说,至今身边都没有出现太多语音控制服务。但他仍对声控发展乐观以对,可是能否做到完全顺畅,他认为不管是国际大厂还是台湾业者,都还在摸索。
人工智能使用者界面,仍处摸索期
在杜奕瑾的观念里,数位社会发展有 3 个时间轴线发展,第一阶段是 1995 年起的 10 年,是电脑时代,当时的使用界面是浏览器;而后进入 10 年智能手机时代,使用界面就是 App;如今现在进入第 3 个人工智能阶段,但使用界面是什么呢?杜奕瑾说,“大家都还在摸索”。
▲ 人称 PTT 创世神的杜奕瑾在台专攻智慧医疗、智慧交通、语音辨识 3 大领域。(Source:AI Labs)
AI Labs 开发了雅婷一号语音辨识引擎。杜奕瑾说,语意理解跟语音辨识技术其实在这几年有很大的突破,但怎样才是最佳用户体验,还有很多改善空间。
他建议大家发展 AI 的使用方式,应该是思考用科技去解决身边的问题,这样做出来的工具自然最好用,因为这是你最了解的地方。也因此,杜奕瑾回台后创立 AI Labs 投入智慧城市、智慧医疗、人机界面 3 领域发展,他说,“台湾一定要有自己的力量”。
台湾徒有框架,缺乏核心引擎
杜奕瑾观察,台湾厂商大量做装置端产品,或是服务框架出来后,却缺乏核心引擎,现在人工智能实验室就是建立一个很扎实的、在台湾的引擎,不需要把资料送出国。
“你愿意把资料送到中国吗?”杜奕瑾问,个资传送涉及隐私跟安全问题,“资料就是国安”,雅婷一号是唯一不需要将资料外送的引擎。
▲ 智慧音箱品牌大增,杜奕瑾问:你愿意把自己资料送出国运算吗?
现在的语音辨识引擎,例如 Alexa 主要功能就是购物跟听音乐,但杜奕瑾认为,未来人机界面体验其实还有很多发挥空间,若能做到天然的沟通技术,不会只能做这两样工作。
杜奕瑾说,现在大家就是看 Alexa 做得起来(购物跟听音乐)就跟进做,但他呼吁,“我们不要做大老二”,不要只是看亚马逊做了就想复制,又例如无人机运货或无人商店,在他眼里实用性都不够强,他认为台湾厂商仍应回归关注身边的问题,以此为本去想解法。
台湾 AI 产业占据良好位置
杜奕瑾说,其实台湾在数位社会发展迈入人工智能阶段时,有非常好的位置,一方面跟美国厂商合作关系好,一方面有世界第一流的软件人才,比方台大在 2016 年是亚洲 AI 大学排名第一,台湾团队在国际比赛中也常拿到世界冠军,在他眼中,台湾的基本教育水准已在,加上有开放的思想与言论及行动力,在未来时代中都是非常好的创新点,只是需要有人帮忙组织。
也因此,除了雅婷一号,医疗照顾上,人工智能实验室跟疾病管制局合作,透过 AI 线上判读检测,让医生不必白跑一趟,另外做心脏超音波也可以不需专业人员,能透过远端即时执行,目前更计划用算法发现罕见疾病跟基因关系,期望利用基因编辑方式治疗罕见疾病。
在智慧城市上,人工智能实验室也在做交通自动辨识监控系统,期望在兼顾隐私下,做急难救助及犯罪防治,但这需要搭配边缘运算力。另外也利用人工智能引擎,学习已逝导演齐柏林大量的影片中运镜跟影像调整技巧,未来要用 AI 来拍《看见台湾》影片续集。
(本文由 数位时代 授权转载;首图来源:pixabay)
延伸阅读:
- 电商新战场?华硕携手 PChome、杜奕瑾推声控购物助理与乡民音箱
- PTT 之父杜奕瑾谈 AI:台湾处在非常好的位置