当人们在网站注册或购物时,经常会出现图像验证码的输入要求,为了区分“真人”,图片会出现线条及扭曲分隔开的文字,让电脑难以辨识,但这种方式最近被一款人工智能(AI)破解了。
NPR 报导,新创公司 Vicarious 表示,他们已运用 AI 开发出一种算法模型,可以通过“全自动区分电脑与人脑的公开图灵测试”,也就是现在十分常见,称为 CAPTCHA 的验证机制。
CAPTCHA 主要是在图上显示一组验证码,由混乱的字母、波纹线和一些背景噪声组合而成,类似测试过去电脑判读起来十分困难,也因此 CAPTCHA 能力被一些 AI 研究人员当作测试的关键基准。
这并非第一次有人成功破解 CAPTCHA 验证,大约在 10 年前,一家科技公司就曾被贩售票券的 Ticketmaster 控诉,原因是绕过 CAPTCHA 系统大量购买演唱会门票。
但过去这例子中,主要是利用 CAPTCHA 特定的弱点,防止程序出现细微的变化借以绕过系统,但 Vicarious 联合创始人 Dileep George 指出,这项新的研究却是“从根本上”打倒了 CAPTCHA。
过去多是采用深度学习(Deep learning)来训练 AI 反应特定事物,透过这样的训练,AI 能逐渐学会辨识图中不同字母,但一旦字母互相重叠,AI 便会难以辨识。
George 解释,深度学习只是克隆人脑工作方式的一部分,就像人们也从经验中学习一样。但人类小孩并不需要看过大量、不同形式的字母才能区别,即使出现的字母比较大又是斜体,小孩依然能轻松辨识出来。
George 表示,他们发现大脑在接受视觉时,会自然出现一些假设,但过去使用的深度学习并没有相同情况。为了让 AI 也有这种特性,Vicarious 团队改采用递归皮质网络(RCN)技术,让 AI 即使较少培训,也能推理出看到的内容。
在训练阶段,AI 看到字母后便会建构出它所认知的字母模型概念,理解并猜测字母的轮廓、内部、背景等,之后新的图片出现时,AI 便会试着运用过去建立的理解解释这张图片。当字母部分重叠,它便能理解缺失是因为字母部分隐藏在另一个字母后面。
Vicarious 团队提到,CAPTCHA 有非常多种类型,但无论哪种只要被算法达到 1% 以上准确度,就能视为破解。而这款 AI 算法模型在 reCAPTCHAs 的测试中,准确率达 66.6%,BotDetect 达到 64.4%,Yahoo 和 PayPal 则都达 57% 左右。
虽然 Vicarious 的演算模型确实在通过 CAPTCHA 验证机制达到不错的成效,但这项研究的主要目标其实是要让机器人视觉上能像人类一样理性思考,和破解 CAPTCHA 并没有太大关系。
George 表示,团队的长远目标是建立像是人脑一样的 AI,CAPTCHA 只是一个自然而然的测试,因为这正好能检测系统是否能像人脑一样工作。
George 强调,机器人需要认识周遭的世界,能理解并操作物体,在人们打算应用的领域,AI 必须要在较少培训之下,运用快速推论、非常灵活的方式处理事情。
“这是技术的必然进步方向,人们必须接受这件事:电脑将像人脑一样工作。”
目前尚不清楚这项研究对资讯安全会有多大影响,George 指出,Google 已开始从基于文字的 CAPTCHA 转移到更进步的测试,随着人工智能越来越聪明,这些验证机制也必须找出新方式,来确保用户的人类身份。
- AI Model Fundamentally Cracks CAPTCHAs, Scientists Say
- Vicarious AI passes first Turing Test: CAPTCHA
(首图来源:shutterstock)