据外媒报导,继 Google 人工智能子公司 DeepMind 开发教 AI 如何玩电子游戏的系统后,先又推出一款可以更好地“看到”并理解空间与环境的视觉系统,还因此成为了各大媒体的头条。
这个人工智能视觉系统能够基于一张 2D 照片,来推断出一个 3D 场景模型。 从不同的角度拍摄场景都可以建立 3D 视图,是因为这是通过使用大量由人类产生的、带注释的图像来训练的最先进的视觉识别系统,但是就只有总体内容的一小部分场景被捕获,大大地限制了使用这些数据进行培训的 AI 视觉系统。
另外,即便没有相关学习经验或知识,它也可以处理很多新鲜事物,甚至用来猜测和想像,以便能更好地了解周围的环境,例如学习诸如透视和光线这类知识。虽然听起来不大可靠,但是能让机器学习根据教导想像,根据其所“见到”的信息来猜测,从而变得有更接近人类的感觉,将是重大的突破。