在 Facebook、Instagram、Facebook Messenger 与 WhatsApp 等平台上,用户们上传的照片每天超过 20 亿张,但对盲人或视障人士来说,Facebook 等平台上所出现的照片,只能是屏幕阅读器读出的“照片”二字,影像内容从来不得而知。而现在,Facebook 透过人工智能技术,要将图像内容以语音叙述方式,“说”给盲人或视障人士听。
Facebook 所推出的这项新功能名为“自动文字替代(automatic alternative text)”,利用机器学习技术,建立算法来帮助人工智能学习识别图像内容,喂养数百万个范例,在正确度达 80% 的情况下,才会对图像进行标示,让人工智能系统能辨识平台上图像中的内容,并透过语音诠释图片。自动文字替代功能辨识图像内容后,接着利用 iPhone 的 VoiceOver 功能,以语音叙述方式,向用户读出照片内容。
虽然目前这项功能还在发展初期,但已能辨识包括交通工具(车、船、飞机)、自然现象(日落、下雪、海洋)、运动(篮球场)、食物等类型的图像,也能针对人脸特征进行叙述。就如 Facebook 所举例,假如影像中出现“一对情侣戴着太阳眼镜站在海边微笑着”(首图左),那么,Facebook 的自动替代文本功能所读出的会是“两个人、微笑、太阳眼镜、户外、水”,至于首图右,所读出的则会是“披萨、食物”。
对于如种族等较为敏感、可能引起争议的内容,Facebook 表示,将会特别小心处理,若不具高度把握的话,并不会对这类图像进行标示,避免引起纷争。
目前自动文字替代功能仅在 iOS 平台上推出,且语言的部分仅支援英文语音,但 Facebook 表示将会尽快在其他平台上推出并提供更多语言。虽然这项功能还在发展初期,但对盲人或视障人士来说,无疑为他们使用社群平台又多开启了一扇窗。
延伸阅读:
- 微软盲人工程师写下代码,造出让盲人看懂世界的人工智能手机
- 乡民太可怕!微软新人工智能机器人 Tay 竟被教成种族歧视