2022-08-17 15:45:12

谷歌为Alphabet的助手机器人添加了人工智能语言技能,以更好地理解人类

谷歌的母公司Alphabet正将其最具雄心的两个研究项目——机器人和人工智能语言理解——结合在一起,试图制造出能够理解自然语言指令的“助手机器人”。

自2019年以来,Alphabet一直在开发可以执行取饮料和清洁表面等简单任务的机器人。这个“日常机器人”项目仍处于起步阶段——机器人行动缓慢,犹豫不决——但机器人现在已经得到了升级:谷歌的大型语言模型(LLM) PaLM提高了语言理解能力。

大多数机器人只会对简短的指令做出反应,比如“给我拿一瓶水来”。但是像GPT-3和谷歌的MuM这样的llm能够更好地解析更多间接命令背后的意图。在谷歌的例子中,你可能会告诉一个日常机器人的原型“我洒了我的饮料,你可以帮助”iAV6el”>是的,这是一个“智能”机器人的低标准,但它绝对是一个进步!真正聪明的是,如果那个机器人看到你打翻了饮料,听到你大喊"天啊,我的天啊,我的蠢饮料"然后帮你。

谷歌将结果系统命名为PaLM-SayCan,这个名字捕捉了该模型如何将llm的语言理解技能(“Say”)与机器人的“可视性基础”(即“Can”-通过可能的动作过滤指令)结合起来。

谷歌表示,通过将PaLM-SayCan集成到机器人中,机器人能够对101条用户指令做出84%的正确响应,并成功执行它们的成功率为74%。这是一个可靠的命中率,但这些数字应该持怀疑态度。我们没有101个命令的完整列表,所以不清楚这些指令有多受限制。他们真的掌握了我们所期望的一个真正的家庭助手机器人理解“OMiQ5d”语言的全部广度和复杂性吗?这是因为这是谷歌和其他家庭机器人研究的巨大挑战:现实生活是绝对混乱的。我们有太多复杂的命令想要问一个真正的家庭机器人,从“清理掉我刚才洒在沙发底下的麦片”到“sauté做意大利面酱的洋葱”(这两个命令都包含大量隐含知识,从如何清理麦片,到冰箱里的洋葱在哪里,以及如何准备它们,等等)。

这就是为什么本世纪唯一取得了一点点成功的家用机器人——机器人吸尘器——只有一个人生目标:吸灰尘。

随着AI在视觉和导航等技能上的提升,我们现在看到了新型机器人进入市场,但它们的能力仍然受到有意的限制。以拉布拉多系统公司的寻回机器人为例。它基本上是一个有轮子的架子,把物品从房子的一个地方搬到另一个地方。这个简单的概念当然有很大的潜力——寻回机器人可能对行动不便的人非常有用——但我们距离梦想中的无所不能的机器人管家还有很长的路要走。