DeepMind的AI已经可以理解空间概念如像人有视觉

2025-04-19 211

据外媒报导，继 Google 人工智能子公司 DeepMind 开发教 AI 如何玩电子游戏的系统后，先又推出一款可以更好地“看到”并理解空间与环境的视觉系统，还因此成为了各大媒体的头条。

这个人工智能视觉系统能够基于一张 2D 照片，来推断出一个 3D 场景模型。从不同的角度拍摄场景都可以建立 3D 视图，是因为这是通过使用大量由人类产生的、带注释的图像来训练的最先进的视觉识别系统，但是就只有总体内容的一小部分场景被捕获，大大地限制了使用这些数据进行培训的 AI 视觉系统。

另外，即便没有相关学习经验或知识，它也可以处理很多新鲜事物，甚至用来猜测和想像，以便能更好地了解周围的环境，例如学习诸如透视和光线这类知识。虽然听起来不大可靠，但是能让机器学习根据教导想像，根据其所“见到”的信息来猜测，从而变得有更接近人类的感觉，将是重大的突破。

在技术投入实践和市场之前将会作出更多的实验与研究，但是其已迈出一大步，相信“完全自主的场景理解”不需要靠着人类教导的 AI 视觉系统将很快实现。

2018-06-19 17:38:00