微软推出“Seeing AI”手机 App,利用电脑视觉技术,为视障者描述周遭环境。只要将镜头指向一个人,手机就会说出对方是什么样的人、心情如何;对一个产品扫描,就会描述是什么产品。
2016 年 3 月,微软在开发者大会上展示了“Seeing AI”的原型。“Seeing AI”是利用神经网络技术辨识周遭环境,神经网络也广泛用于自驾车、无人机等。现在“Seeing AI”已可在美国免费下载,但目前仅释出 iOS 版,尚未向 Android 或其他国家用户推出。
▲“Seeing AI”可利用电脑视觉技术,为视障者描述周遭环境。
“Seeing AI”可适用于许多情境。除了能辨识先前看过的人、猜测陌生人的年龄与心情,也可透过扫描条码辨识家庭用品。此外,“Seeing AI”还能阅读标志、菜单或扫描文件。这项功能不只是单纯的光学字符辨识技术(OCR),还会提示使用者将镜头左右移动,以将目标放入画面中。
这款应用程序还有一项实用功能,就是能辨别美元。由于不同面额的美钞,大小、颜色都相同,对视障者往往是个困扰。透过“Seeing AI”就能协助他们获取这些资讯。
“Seeing AI”的基本功能大多是直接在装置上进行,因此存取速度快,即使没有网络连线时也能使用。不过有几项实验功能,例如描述整个场景或辨识手写,就需要连接到云端。
技术负责人 Saqib Shaikh 表示,这款应用程序与其他类似产品的区别是,“Seeing AI”的神经网络处理速度极快,号称在几毫秒之内就能在装置上完成脸部辨识。
微软成立通用 AI 实验室、与 MIT 合作、建立 AI 伦理监督小组
微软在人工智能技术上不断推进。微软刚宣布成立一个专门研发通用人工智能的实验室“Microsoft Reseach AI”,设于美国华盛顿州雷德蒙德的微软总部。团队将有超过 100 名研究员,领域涵盖自然语言处理、机器学习与感知系统等。
新的研究单位除了微软公司现有的 AI 专家之外,还会增募新人,包括认知心理学等相关领域专家。此外,新实验室也将与麻省理工学院的脑、心智与机器研究中心(Center for Brains, Minds and Machines)正式合作。
除了成立新实验室之外,微软将会建立“人工智能伦理监督小组”,该小组能为整个公司提供相关咨询,这也是目前业界的趋势。先前,微软与 DeepMind、Amazon、Google、Facebook和IBM,针对人工智能开发伦理共同签署跨公司合作关系。此外,Google、DeepMind 内部也都有各自的 AI 伦理委员会。
- Microsoft’s new iPhone app narrates the world for blind people
- Microsoft creates an AI research lab to challenge Google and DeepMind
- Microsoft Creates New AI Lab to Take on Google’s DeepMind
(本文由 数位时代 授权转载;图片来源:Seeing AI)