2022-07-12 14:46

DeepMind AI通过观看毫无意义的视频来学习物理

人工智能公司DeepMind开发的一种算法可以区分视频中的物体遵守物理定律和不遵守物理定律

观看物体交互的视频有助于人工智能学习物理

DeepMind的研究人员表示,教人工智能理解简单的物理概念,比如一个固体物体不能占据另一个物体的相同空间,可能会产生更强大的软件,需要训练的计算资源更少。

这家总部位于英国的公司此前创造出的人工智能可以在国际象棋和围棋中击败专业棋手,编写计算机软件,并解决蛋白质折叠问题。但这些模型是高度专业化的,缺乏对世界的普遍了解。正如DeepMind的研究人员在他们最新的论文中所说,“一些基本的东西仍然缺失”。

现在,DeepMind的Luis Piloto和他的同事们创造了一个名为“通过自动编码和跟踪对象进行物理学习”(PLATO)的人工智能,旨在理解物理世界是由遵循基本物理定律的对象组成的。

研究人员通过模拟视频来训练PLATO识别物体和它们之间的相互作用,视频中物体会像我们预期的那样移动,比如球落在地上、相互滚动和相互反弹。他们还给了PLATO数据,显示出每一帧中哪些像素属于每个物体。

为了测试PLATO理解5个物理概念的能力,比如持久性(物体不会消失)、坚固性和不变性(物体会保留形状和颜色等特征),研究人员使用了另一系列模拟视频。其中一些展示了遵守物理定律的物体,而另一些则描绘了一些荒谬的行为,比如一个球在柱子后面滚动,不是从另一边出现,而是沿着它的路线从另一个柱子后面再次出现。

他们让PLATO预测每个视频中接下来会发生什么,结果发现,在无意义的视频中,PLATO的预测确实是错误的,但在有逻辑的视频中,PLATO的预测通常是正确的,这表明人工智能具有物理学的直觉知识。

皮洛托表示,研究结果表明,以物体为中心的世界观可以赋予人工智能更广泛和适应性更强的能力。他说:“如果你考虑一个苹果可能出现的所有不同场景。”“你不需要了解树上的苹果、厨房里的苹果、垃圾桶里的苹果。当你把苹果孤立起来,把它当成自己的东西,你就能更好地概括它在新系统,新环境中的表现。它提高了学习效率。”

英国南安普顿大学(University of Southampton)的马克·尼克松(Mark Nixon)表示,这项工作可能会引领人工智能研究的新途径,甚至可能揭示人类视觉和发展的线索。但他表达了对可重复性的担忧,因为这篇论文说,“我们对PLATO的实施在外部是不可行的”。

他说:“这意味着他们使用的架构其他人可能无法使用。”“在科学上,可重复性很好,这样其他人就可以得到相同的结果,然后进一步推广。”

纽约大学的陈峰表示,这些发现可能有助于降低训练和运行人工智能模型的计算要求。

他说:“这有点像教孩子什么是汽车,先教他们轮子和座椅是什么。”“使用以对象为中心的表示,而不是原始的视觉输入,使人工智能以更好的数据效率学习直观的物理概念。”Follow On Google News