机器人领域的OpenAI时刻？这家公司想给机器人装上“通用大脑”_健康_健康资讯

“让计算机在智力测试或下棋时表现出成人水平相对容易，但要让它们在感知和行动方面拥有1岁儿童的技能，却很困难甚至不可能。”

1988年，机器人研究员汉斯·马鲁韦克（Hans Moravec）提出了这个后来被称为“莫拉维克悖论”的观察。近40年过去了，这仍然是机器人技术面临的最大障碍。

然而，一家位于旧金山的初创公司——Physical Intelligence（物理智能），正试图彻底解决这个问题。他们计划打造世界上第一个通用的“机器人大脑”，一个能够适应现实世界各种混乱场景的基础模型。这家公司由来自澳大利亚的洛基·格林（Loki Green）联合创立，已筹集超过10亿美元资金，估值达到56亿美元。

我们走进他们的实验室，亲眼见证了他们的工作，并与创始团队和投资人进行了一场深度对话。

一、从咖啡机到叠衣服：机器人正在学会“动手”

走进Physical Intelligence的办公室，首先映入眼帘的是一个全自动咖啡制作机器人。它能够拿起手柄、放入咖啡机、按下按钮，整个过程流畅自如。

“这是我喝过最好喝的机器人咖啡。”采访者笑着说。

但这只是冰山一角。旁边，一台机械臂正在折叠衣物——一件从未见过的短裤。机器人通过观察和遥操作数据，学会了如何处理可变形物体，这是以前机器人几乎不可能完成的任务。

“我叠衣服叠得特别差，”洛克·格林坦言，“所以看到机器人能帮我做这件事，真的很有帮助。”

团队还展示了削水果皮、组装包装等其他任务。这些看似简单的家务活，对机器人来说却是巨大的挑战，因为它们涉及可变形物体、精细动作技能和复杂的环境交互。

二、为什么机器人技术过去几十年一直“掉链子”？

在采访中，洛克解释了机器人技术长期未能普及的根本原因。

“之前的机器人几乎完全是预先设定好的，”他说，“你把它们部署到工厂里，它在同一位置拾取同一个物体，以同样的方式操纵它，然后继续下一个。这没有问题，但它是确定性的。”

下一波机器人引入了计算机视觉，但仍然是针对特定场景，受到高度限制。核心问题在于，它们无法处理“变异性”。现实世界是混乱的、不可预测的：厨房里的光线、物体的位置、衣物的褶皱……每秒钟都在变化。

“对计算机来说容易的事（例如算术、下棋），对人类很难；对人类来说微不足道的事（例如走路、抓取、叠衣服），对计算机却极其困难。”洛克称这为“物理智能”的缺失，而这正是他的公司要填补的空白。

三、数据、算法、部署：Physical Intelligence的研发引擎

那么，他们打算如何解决这个问题？

洛克表示，方法与其他深度学习领域相似：“收集大量数据，重新设计并编写能够拟合这些数据并从中学习的算法，然后逐步完成部署。”

在公司开放式的办公室里，一边是研究人员在讨论算法，另一边是数据收集员在通过“遥操作”控制机械臂，演示各种任务。这些数据会被标注、混合、增强，然后用于训练模型，再回到同一台机器人上评估效果。

“我们拥有一个庞大的研究团队，”洛克说，“他们提出假设，这些假设通常需要收集一定量的数据。然后我们训练模型，在收集数据的那些站点上评估模型。

通过结果，我们可以了解这个研究想法是否有效——也许是一种新算法，一种新的数据收集策略，一种新的数据混合方式。”

四、从洗衣到泛化：三个版本，三次突破

Physical Intelligence的首个版本（代号Pi-0）专注于功能证明——让机器人做以前从未可能的事情，比如折叠衣物。这不仅包含巨大物理复杂性，还因为“人人都知道怎么叠衣服”，数据收集门槛极低，是理想的试验平台。

第二个版本（Pi-0.5）专注于泛化能力。团队证明，机器人只需在大约100个家庭环境中训练，就能将知识推广到第101个从未见过的家庭中。他们原以为可能需要成千上万甚至上百万个样本。

最新的版本则侧重于性能。团队正在开发能够自主提升性能的方法，让机器人在洗衣、制作咖啡、组装包装等任务上达到很高的成功率。

“这是一个以前从未实现过的水平，”洛克说，“但要大规模部署机器人，他们需要配合得非常好，而这一点一直难以捉摸。我们还没有解决这个问题，甚至不能说接近解决。”

五、投资人视角：时机、团队和超预期的速度

菲利普·克拉克（Philip Clark）是Thrive Capital的投资合伙人，也是Physical Intelligence最早的投资人之一。他从公司只有四人在客厅里创业时就开始投资。

“所有伟大的公司投资最终都归结为两件事：人和时机，”菲利普说，“很明显，这些人是世界上最优秀的科研人员在研究这个问题。而时机也很重要——如果回到十年前，底层模型能力还不具备。”

他透露，Physical Intelligence的进展速度比他最乐观的预期还要快两到三倍。“我原以为可能需要三到五年才能达到现在的水平，但他们只用了一年半。”

菲利普特别提到了洛克·格林的背景：这位来自珀斯的澳大利亚人，17岁飞来硅谷，加入Stripe成为早期员工，在Stripe工作了六年，展现出非凡的职业道德。之后他一直在投资和关注机器人领域，直到2023年，他听说DeepMind机器人团队的几位顶尖科学家（包括卡尔·豪斯曼、谢尔盖·莱文、切尔西·芬恩）打算离开，于是联手创办了Physical Intelligence。

六、未来十年：机器人做无聊、危险、无意义的工作

当被问及“如果成功，十年后世界会是什么样”时，洛克沉思了一会儿。

“世界将会变得非常不同，简直难以想象，”他说，“但我认为这是一个非常好的世界。”

他强调，许多人一生中做的很多事情并不令人愉快——洗衣服、打扫房子、重复性的工厂劳动。“他们这样做不是因为自愿，而是因为他们不得不做。为了让世界正常运转，有大量的事情需要完成，而人们从中得不到多少乐趣或意义。”

“人们从工作中获得意义，但我认为未来的工作不必和过去一样。我们的成功很大程度上归功于改变了那些枯燥、危险、无趣、毫无意义的工作——那些应该由机器人来完成的工作。而人们真正想做的事情，他们应该去做。”

“这就是我做这一切的真正希望。当然，在这两者之间会有很多困难和复杂的情况需要应对，但我对人性充满信心和乐观。”

七、展望：GPT-2时刻已经到来？

洛克将目前机器人的发展比作大语言模型的早期阶段。

“这更像是GPT-2的时刻，而不是GPT-3、GPT-4、GPT-5的时刻。我们看到了生命的迹象，看到了潜力，但还需要大力扩大规模，才能让它真正实用，对世界各地的每个人都有用。”

对于接下来的一到三年，他持谨慎乐观态度：“很难想象在未来几年内家家户户都会拥有实用性强的机器人。有些事情需要一定的智力，以及应对变化的能力——哪怕只是洗碗或叠衣服。我们正走在解决问题的路上，但企业级产品似乎触手可及，消费品将迎来新一波浪潮。”

八、独特的文化：研究+工程，寻求真相

Physical Intelligence的文化给采访者留下深刻印象。这里既有顶尖的学术研究人员，又有来自Stripe等公司注重执行的工程师。“我没想到这家公司会是这样，”采访者感叹，“我以为会有很多刻板印象，但这里的研究人员和工程师与最终目标有着出奇紧密的联系。有一种对最终目标的执念，以及尽快达成目标的执念。”

洛克表示：“有一种探寻真相的渴望，一种雄心壮志。”最优秀的研究人员具备好奇心、创造力、开放的心态。“他们都很棒。”

从折叠衣物到制作咖啡，从实验室数据收集到真实的太空部署——Physical Intelligence正站在机器人技术的历史转折点上。他们相信，通用机器人大脑不再是科幻，而是即将到来的现实。而这场变革的核心目标，是让人类从无意义的体力劳动中解放出来，去做真正热爱的事。

本文来自微信公众号“后浪进化星球”，作者：Mark，36氪经授权发布。