分享好友 健康资讯首页 健康资讯分类 切换频道

2026年智能体AI展望

2026-03-03 08:0514036kr

神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。

编者按:告别“提示词工程”,欢迎来到软件 4.0:2026 年,编程的本质将从编写代码彻底转向“编排智能”。文章来自编译。

2024年是AI智能体(AI Agents)概念深入人心的一年。那些令人惊叹的演示效果吸引了全球的目光。

2025年则是智能体实现从实验室演示向生产环境跨越的一年。我们带着“2025是AI智能体元年”的口号开启了这一年。到年底时,几个明确的信号表明一场更深层次的变革正在发生:Linux基金会成立了Agentic AI基金会,标志着生态系统迈向开放;摩根大通部署的智能体已覆盖超过3万名员工,这暗示了智能体系统在真实生产环境中具有巨大的复利价值。

那么,2026年将迎来什么?在2026年,AI领域的核心转变将不再是追求更聪明的模型,而是转向可协调、可验证且能随时间持续进化的智能体操作系统。

在过去的三年里,我一直站在智能体系统研究、开源和生产应用的最前沿。这段历程可以追溯到2023年初AutoGen的诞生。在本文中,我将总结这些经验,并分享我对2026年智能体AI走向的看法。

1. AI智能体:从演示迈向规模化生产

这个趋势显而易见(甚至很难称之为“预测”)。尽管技术栈尚未完全定型,但由于智能体能带来的巨大经济价值,生产环境的部署早已势不可挡。

尽管势头强劲,但许多团队仍会陷入一个共同的陷阱:没搞清楚真正的投资回报率(ROI)到底在哪里。

对于任何具备一定运营和组织成熟度的机构而言,最高的价值绝非来自一个简单的聊天机器人、通用型智能体或任何孤通的智能体系统。在规模化场景下,缺乏协作的智能体会迅速退化为难以管理的庞大“上下文孤岛”。真正的杠杆在于编排(Orchestration)。最高的收益往往产生于一个协调良好的智能体系统——它能智能地理解组织结构,进行路由分发,并协调多个专业角色来共同完成任何单一智能体都无法独立达成的目标。

2. AGI的雏形?智能体深入职场

OpenAI在2025年10月发布了GDPVal,这是一项衡量模型在44个职业中执行具有经济价值的现实任务表现的评估体系。虽然它看起来不如新模型发布那样风光,但它揭示了一个深远的意义:即使以现有的模型能力,我们也已经能够构建出可规模化执行具备经济价值工作的智能体。这些任务直接取自美国职场的真实工作职能。当智能体同时通过了图灵测试和“就业测试”时,它们开始展现出AGI的雏形。

3. 自改进闭环与验证架构

自进化智能体的技术全景图

AI智能体不应是静态的,而应具备适应性。要想在现实世界发挥作用,智能体必须能够观察自己的行为,从结果中学习并随时间自我优化。缺乏这种能力的智能体,即使再强大,也会随着环境的变迁、假设的失效以及边缘案例的堆积而不可避免地出现性能退化。

对于需要持续、自主且规模化运行的智能体来说,适应能力不是锦上添花的选项,而是基础性的要求。我们最新的研究成果之一《绝对零度推理者》(NeurIPS 25 焦点论文)展示了强化自博弈推理(Reinforced Self-play Reasoning)在几乎零数据的情况下处理编程任务的有效性。这种新范式的核心是一个可验证的环境加上一个任务生成器,允许智能体通过自博弈进行压力测试,并系统地提升其推理能力。

将这一范式扩展到编程任务之外,会直接引出一个更普遍且基础的挑战:验证。对于许多现实任务,目前尚不存在可扩展的验证机制。我们必须构建一套围绕验证的基础设施:通过任务与问题的结构化分解、中间检查点、反馈信号,甚至人工标注与指导,共同将开放式目标转化为可验证的环境。一旦这种验证架构(Fabric)建立起来,自博弈和强化学习就能广泛应用于编程之外的领域,如推理、规划、数据分析、决策以及多智能体协作。

这重新定义了智能体AI的核心挑战与机遇:进步将由那些能使结果变得可观察、可对比且可持续改进的系统来推动。

4. 欢迎来到软件4.0时代:智能体软件(Agentware)

软件正在改变(一次又一次地):从1.0到4.0的演进

安德烈·卡帕斯(Andrej Karpathy)曾有一个著名的论断,描述了软件从1.0到3.0的演进过程。

六个月前,安德烈最后一次公开谈论这一演进,主题是“软件(再次)发生改变”。但就在他演讲时,我们已经跨入了软件4.0时代的门槛——在这个时代,“代理能力”(Agency)与“协作”(Coordination)变得可编程。

在软件4.0中,编程的概念和开发者的角色都发生了根本性的变化。衡量开发者的标准不再仅仅是编写代码或撰写提示词的能力,而是设计、编排和运营AI智能体的能力。编程回归了其本质:定义问题并引导计算,而机器则承担了更多的执行工作。新颖之处在于一种完全不同的计算形式——“智能体计算”——系统具有适应性、目标导向性,能够采取行动,并能通过反馈进行迭代,而非仅仅执行固定的代码路径。

软件进化为“智能体软件”(Agentware)。智能体成为应用程序的基本单元:将推理、记忆、工具/技能、编排和学习闭环封装在一个单一的运行系统中。对于开发者来说,这实在是太令人兴奋了!

5. 智能体互联网的兴起

2025年见证了开放协议的初步形成与巩固,其中著名的包括:智能体工具调用协议MCP;智能体间通信A2A协议;以及智能体支付协议:ACP(智能体商务协议)、AP2(智能体支付协议)和x402。

我们一直在积极实验这些开放协议,并系统地将其中的许多协议集成到AutoGen/AG2中。通过这些早期探索,我开始看到了“智能体互联网”的雏形——在这个世界里,自主智能体可以跨越组织和平台界限,彼此发现、通信、调用工具、交易价值并协同工作。

就像早期的互联网一样,这一层对于全面的开放运营来说仍然粗糙且不完整。然而,在受控的边界内,我们已经看到了网络效应的显现。其意义是深远的:智能体不再是孤立的自动化工具,而是成为了共享全球底座的参与者。能力变得可组合,智能变得可分发,而协作——这一长期以来AI系统中最复杂的问题——终于开始实现规模化。

前行之路

我们正进入智能体AI的新阶段,这不再由更大的模型或更炫的演示来定义,而是由那些可操作、互联、可信且能随时间持续进化的实用系统来定义。

译者:boxi。

举报
收藏 0
打赏 0
评论 0
抛弃“不作恶”,谷歌和五角大楼签订协议、承接美军机密AI业务,超700名员工联名反对
谷歌,这个曾以“不作恶”为行为准则的科技巨头,如今正深陷一场前所未有的内部风暴。28日,美国消费者新闻与商业频道(CNBC)援引科技媒体“The Information”报道,谷歌已与美国国防部签署协议,承接机密人工智能业务。一位知情人士透露,美国国防部正将谷歌的最新模型用于机密项目。这个项目遭到了谷歌员工的强烈反对。CNBC报道称,本周,700余名谷歌员工联名致信公司首席执行官桑达尔・皮查伊,要

0评论2026-04-297

一季度净利环比暴增27倍,剑桥科技股价一年涨三倍,险资与社保基金加仓,股东高管减持
4月27日盘后,光模块概念大牛股剑桥科技(603083.SH、06166.HK)发布2026年一季报,公司一季度营收同比增长43.98%至12.87亿元;归母净利润同比增长276.44%至1.18亿元。从环比来看,剑桥科技今年第一季度营收环比下滑约12%;净利润环比增长2722.62%,而2025年第四季度归母净利润环比下跌近97%。作为光模块大牛股,剑桥科技H股曾在11个交易日完成了翻倍,4月2

0评论2026-04-297

32美元一辆车,Tesla为什么不认?(下)
本案真正值得关注的,不只是Tesla能不能把Avanci平台价格拉进英国法院。更重要的是,如果法院最终认为这类平台许可条款不能进入FRAND审查,那么未来SEP权利人通过专利池、平台、集体许可安排对外收费时,实施者还能不能有效挑战其许可条件?这才是本案超出Tesla、InterDigital和Avanci三方争议的地方。从表面看,Avanci提供的是一种提高交易效率的许可方案。大量SEP权利人把专

0评论2026-04-297

“保本”又“看病”?监管部门约谈健康险公司,中介平台下架热销“医疗金”产品
早在前两年,市场上就出现了带有一般医疗保险金账户的产品。随着利率下行以及市场需求增长,这类产品的资产增值属性被放大,经过长期现金价值积累,配合可以累积的医疗保险金,使得产品有着不输理财型产品的收益率,这也是引起监管部门关注的原因之一。2026年4月初,当保险经纪人小李带着客户在同仁堂线下门店参加体验活动时,他可能不会想到,体验活动中的重磅产品“岁月长安·特定疾病保险(互联网版)”即将面临下架。4月

0评论2026-04-295