分享好友 健康资讯首页 健康资讯分类 切换频道

机器人领域的OpenAI时刻?这家公司想给机器人装上“通用大脑”

2026-05-14 13:000036kr

“让计算机在智力测试或下棋时表现出成人水平相对容易,但要让它们在感知和行动方面拥有1岁儿童的技能,却很困难甚至不可能。”

1988年,机器人研究员汉斯·马鲁韦克(Hans Moravec)提出了这个后来被称为“莫拉维克悖论”的观察。近40年过去了,这仍然是机器人技术面临的最大障碍。

然而,一家位于旧金山的初创公司——Physical Intelligence(物理智能),正试图彻底解决这个问题。他们计划打造世界上第一个通用的“机器人大脑”,一个能够适应现实世界各种混乱场景的基础模型。这家公司由来自澳大利亚的洛基·格林(Loki Green)联合创立,已筹集超过10亿美元资金,估值达到56亿美元。

我们走进他们的实验室,亲眼见证了他们的工作,并与创始团队和投资人进行了一场深度对话。

一、从咖啡机到叠衣服:机器人正在学会“动手”

走进Physical Intelligence的办公室,首先映入眼帘的是一个全自动咖啡制作机器人。它能够拿起手柄、放入咖啡机、按下按钮,整个过程流畅自如。

“这是我喝过最好喝的机器人咖啡。”采访者笑着说。

但这只是冰山一角。旁边,一台机械臂正在折叠衣物——一件从未见过的短裤。机器人通过观察和遥操作数据,学会了如何处理可变形物体,这是以前机器人几乎不可能完成的任务。

“我叠衣服叠得特别差,”洛克·格林坦言,“所以看到机器人能帮我做这件事,真的很有帮助。”

团队还展示了削水果皮、组装包装等其他任务。这些看似简单的家务活,对机器人来说却是巨大的挑战,因为它们涉及可变形物体、精细动作技能和复杂的环境交互。

二、为什么机器人技术过去几十年一直“掉链子”?

在采访中,洛克解释了机器人技术长期未能普及的根本原因。

“之前的机器人几乎完全是预先设定好的,”他说,“你把它们部署到工厂里,它在同一位置拾取同一个物体,以同样的方式操纵它,然后继续下一个。这没有问题,但它是确定性的。”

下一波机器人引入了计算机视觉,但仍然是针对特定场景,受到高度限制。核心问题在于,它们无法处理“变异性”。现实世界是混乱的、不可预测的:厨房里的光线、物体的位置、衣物的褶皱……每秒钟都在变化。

“对计算机来说容易的事(例如算术、下棋),对人类很难;对人类来说微不足道的事(例如走路、抓取、叠衣服),对计算机却极其困难。”洛克称这为“物理智能”的缺失,而这正是他的公司要填补的空白。

三、数据、算法、部署:Physical Intelligence的研发引擎

那么,他们打算如何解决这个问题?

洛克表示,方法与其他深度学习领域相似:“收集大量数据,重新设计并编写能够拟合这些数据并从中学习的算法,然后逐步完成部署。”

在公司开放式的办公室里,一边是研究人员在讨论算法,另一边是数据收集员在通过“遥操作”控制机械臂,演示各种任务。这些数据会被标注、混合、增强,然后用于训练模型,再回到同一台机器人上评估效果。

“我们拥有一个庞大的研究团队,”洛克说,“他们提出假设,这些假设通常需要收集一定量的数据。然后我们训练模型,在收集数据的那些站点上评估模型。

通过结果,我们可以了解这个研究想法是否有效——也许是一种新算法,一种新的数据收集策略,一种新的数据混合方式。”

四、从洗衣到泛化:三个版本,三次突破

Physical Intelligence的首个版本(代号Pi-0)专注于功能证明——让机器人做以前从未可能的事情,比如折叠衣物。这不仅包含巨大物理复杂性,还因为“人人都知道怎么叠衣服”,数据收集门槛极低,是理想的试验平台。

第二个版本(Pi-0.5)专注于泛化能力。团队证明,机器人只需在大约100个家庭环境中训练,就能将知识推广到第101个从未见过的家庭中。他们原以为可能需要成千上万甚至上百万个样本。

最新的版本则侧重于性能。团队正在开发能够自主提升性能的方法,让机器人在洗衣、制作咖啡、组装包装等任务上达到很高的成功率。

“这是一个以前从未实现过的水平,”洛克说,“但要大规模部署机器人,他们需要配合得非常好,而这一点一直难以捉摸。我们还没有解决这个问题,甚至不能说接近解决。”

五、投资人视角:时机、团队和超预期的速度

菲利普·克拉克(Philip Clark)是Thrive Capital的投资合伙人,也是Physical Intelligence最早的投资人之一。他从公司只有四人在客厅里创业时就开始投资。

“所有伟大的公司投资最终都归结为两件事:人和时机,”菲利普说,“很明显,这些人是世界上最优秀的科研人员在研究这个问题。而时机也很重要——如果回到十年前,底层模型能力还不具备。”

他透露,Physical Intelligence的进展速度比他最乐观的预期还要快两到三倍。“我原以为可能需要三到五年才能达到现在的水平,但他们只用了一年半。”

菲利普特别提到了洛克·格林的背景:这位来自珀斯的澳大利亚人,17岁飞来硅谷,加入Stripe成为早期员工,在Stripe工作了六年,展现出非凡的职业道德。之后他一直在投资和关注机器人领域,直到2023年,他听说DeepMind机器人团队的几位顶尖科学家(包括卡尔·豪斯曼、谢尔盖·莱文、切尔西·芬恩)打算离开,于是联手创办了Physical Intelligence。

六、未来十年:机器人做无聊、危险、无意义的工作

当被问及“如果成功,十年后世界会是什么样”时,洛克沉思了一会儿。

“世界将会变得非常不同,简直难以想象,”他说,“但我认为这是一个非常好的世界。”

他强调,许多人一生中做的很多事情并不令人愉快——洗衣服、打扫房子、重复性的工厂劳动。“他们这样做不是因为自愿,而是因为他们不得不做。为了让世界正常运转,有大量的事情需要完成,而人们从中得不到多少乐趣或意义。”

“人们从工作中获得意义,但我认为未来的工作不必和过去一样。我们的成功很大程度上归功于改变了那些枯燥、危险、无趣、毫无意义的工作——那些应该由机器人来完成的工作。而人们真正想做的事情,他们应该去做。”

“这就是我做这一切的真正希望。当然,在这两者之间会有很多困难和复杂的情况需要应对,但我对人性充满信心和乐观。”

七、展望:GPT-2时刻已经到来?

洛克将目前机器人的发展比作大语言模型的早期阶段。

“这更像是GPT-2的时刻,而不是GPT-3、GPT-4、GPT-5的时刻。我们看到了生命的迹象,看到了潜力,但还需要大力扩大规模,才能让它真正实用,对世界各地的每个人都有用。”

对于接下来的一到三年,他持谨慎乐观态度:“很难想象在未来几年内家家户户都会拥有实用性强的机器人。有些事情需要一定的智力,以及应对变化的能力——哪怕只是洗碗或叠衣服。我们正走在解决问题的路上,但企业级产品似乎触手可及,消费品将迎来新一波浪潮。”

八、独特的文化:研究+工程,寻求真相

Physical Intelligence的文化给采访者留下深刻印象。这里既有顶尖的学术研究人员,又有来自Stripe等公司注重执行的工程师。“我没想到这家公司会是这样,”采访者感叹,“我以为会有很多刻板印象,但这里的研究人员和工程师与最终目标有着出奇紧密的联系。有一种对最终目标的执念,以及尽快达成目标的执念。”

洛克表示:“有一种探寻真相的渴望,一种雄心壮志。”最优秀的研究人员具备好奇心、创造力、开放的心态。“他们都很棒。”

从折叠衣物到制作咖啡,从实验室数据收集到真实的太空部署——Physical Intelligence正站在机器人技术的历史转折点上。他们相信,通用机器人大脑不再是科幻,而是即将到来的现实。而这场变革的核心目标,是让人类从无意义的体力劳动中解放出来,去做真正热爱的事。

本文来自微信公众号“后浪进化星球”,作者:Mark,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
3800亿,今年最大收购案被喊停
三十年电商鼻祖,何去何从电商鼻祖,也要卖了?就在这个月,一场并购要约,把eBay重新推上了舆论中心。游戏驿站掌门人里安·柯恩抛出555亿美元的收购提案,要以一家百亿市值的公司去吃下四倍于自身体量的电商老牌平台。eBay董事会随即发出回函,断然拒绝了这份提案。但这场被拒绝的并购,反而把一个更值得追问的问题摆到了台面上。这家1995年诞生于车库、靠一根坏掉的激光笔完成第一笔交易、此后三十年定义了C2C

0评论2026-05-140