自从社群网站蓬勃发展。不论是新创公司,还是大大小小的云端公司,都想抢食探查广大网络群众的喜好和关注重心。但到底谁能抢到针对的政府、大型消费公司的订单呢?IBM 显然有相当大的信心,今日(9/21)IBM 宣布 AI 舆情分析平台 Watson Analytics for Social Media 正式支援繁体中文,借由分析繁体中文资料,来探查网络族群到底在关心什么,提供商家投入行销资源的依据。
Watson Analytics for Social Media 支援繁体中文,并且加入分析繁体中文常见的网站,除了全球通用的脸书和 Twitter 之外,还抓取台湾本地的热门网站或服务,如 PTT、Mobile01、痞客邦、Dcard等。
IBM 特别强调他们结合其领先的认知技术,来训练 Watson 学习繁体中文,能正确解读复杂的中文语意逻辑,以及特定产业的专业知识,在社群舆情分析平台中大显身手,并能从海量资料中判断网络声量的正反面情绪。以世大运跆拳道新闻“庄佳佳大败奥运银牌得主”为例,Watson 并不会因为语句中有“败”一字,而认定这对中华跆拳道来说是一则负面新闻,而是根据中文的特殊语法,辨识该词为正面语意。
台湾 IBM 公司商业分析业务协理胡育铭表示:“IBM 致力于从‘客户需求’开始提出适合的解决方案,延续年初针对台湾企业资料分析能力成熟度的调查结果,以及回应台湾各产业针对资料分析的应用需求,我们积极争取 Watson Analytics for Social Media 支援繁体中文,让台湾中小企业也能享有大型企业同级的舆情分析能力,进而能预测且因应消费者需求,制定更精准的行销策略,与产业趋势接轨。”
自从社群网站成为上网的第一站后,变成只要有办法抓取社群网站的贴文,都有潜力来分析上面流窜的讯息,进而统计整合为有高度价值的资讯,供商业行为以及判断政治风向的重要依据。台湾不少家新创主打舆情分析,更别提大型网络或云端公司也有相关的服务,IBM 投入这块市场恐怕很辛苦。
从 IBM Watson for Oncology 在医院的实际使用情境,真实资料如何转变为 AI 能够分析的素材,考验第一线人员的耐心。进而被质疑使用 Watson 的效果和投入的资源相比,其实没得到太突出的结果。真实的情况可能不是急于想要业绩,而将产品或服务说得天花乱坠的销售人员,效果如此的好。
不论是对 IBM Watson Analytics for Social Media,或是其他家舆情分析服务来说,尽管一开始需要辞库,但仍要面对反串、同音/谐音字,怎么推断,不是只有字典早有定义的辞汇或语句有加入就能搞定,需要大量真实世界的素材拿来训练 AI。
不过我们知道信赖 IBM 品牌的公司相当多,有不少家金融、政府单位客户,相信凭借既有的客户群,IBM 能将 Watson Analytics for Social Media 推销给不少家公司使用。
(首图为台湾 IBM 公司商业分析业务协理胡育铭,来源:IBM)