人工智能(AI)是未来科技发展中最受瞩目的一大议题,自推出以来,科学家及研究学者不断的精进人工智能系统,帮助它能完成更复杂的任务,例如:照片识别、做出复杂的变换等。而近几日,伊利诺伊大学(University od Illnosis)的研究团队为麻省理工学院(MIT)一台名为 ConceptNet 4 的 AI 系统测试智商(IQ),结果显示,这台 ConceptNet 4 拥有等同于人类的 4 岁儿童智商,尚处于幼儿园的学习阶段。
研究学者在这次的 IQ 测验中,选用在许多美国的学校普遍使用的魏氏幼儿智力量表(WWPSI),而这个量表主要是设计给幼童作答,并以 5 种类别的题目来衡量幼童的智力,再给 ConceptNet 4 作答前,这些题目也必须经过修改后才好让它“读懂”题目在问什么,类别和范例题型分别是以下 5 种:
- 知识:“哪里可以找的到企鹅呢?”
- 字汇:“房子是什么东西?”
- 推理:“给予三个暗示,可以直接看穿、方形、能被打开”
- 相似:“笔和铅笔都是…?”
- 理解:“为什么人要握手呢?”
测验后的结果显示,ConceptNet 4 的智商大约落在 4 岁儿童的平均智商,但低于 5 至 7 岁儿童的平均智商。这个 AI 系统在字汇以及相似这两类题目中拿下了颇高的分数,知识类则是在同年龄层取得处于平均的分数,但在推理和理解这两方面则得到极低的分数,也证明了现有的人工智能还没办法有像人类一样的的复杂的理解与推理能力。
而为什么 ConceptNet 4 会在推理和理解这两个方面得到较低的分数呢?这都要归究于它是怎么样“解读”题目的,举例来说,题目问:“为什么我们要握手(shake hands)?”ConceptNet 4 会回答:“因为癫痫发作。”但若研究学者将问题简化为“握手”,它就会回答较有关连性的答案,像是“调情”、“表达感谢”、“跟朋友见面”等。有时它也会回答的文不对题,像是问它“哪里可以找的到老师?”,却得到了“钢琴”、“乐团”等不合乎逻辑的答案。
研究学者也没有办法解释为什么 ConceptNet 4 会提出这些不合理的答案,只建议考试的方式可能需要改变一下,像是透过虚拟语音助理 Siri 或 Cortana 转换自然语言,再输入问题给 AI 系统回答,这样的方式可能才会让它的答题正确率提高。
人工智能的研究最早可以追溯到 1950 年代,在当时,研究学者将知识库输入到电脑中,让它以逻辑与理解能力解决事情。而在近十几年,“机器学习”的方法兴起,方法是在人工智能系统中输入大量的数据,让它能够自己学习,而原先“教导”电脑的这个方式也渐渐被“机器学习”取代且超越。研究学者也表示,以上的这两种方法其实都是有帮助的,但若能将两种方式做结合,在未来人工智能的发展中一定会扮演着极重要的角色。
- IQ Test Result: Advanced AI Machine Matches Four-Year-Old Child’s Score
- Measuring an Artificial Intelligence System’s Performance on a Verbal IQ Test For Young Children
-
Intelligent Machines: AI had IQ of four-year-old child
(首图来源:Flicker/Pratham Books CC BY 2.0)