分享好友 健康资讯首页 健康资讯分类 切换频道

10 张图看懂 2026 年 AI 现状:中美差距仅 2.7%,25 岁以下程序员岗位大缩水

2026-04-15 08:203036kr

Stanford HAI 人类及人工智能中心,刚发布了 2026 年度 AI Index 报告,这是 AI 领域最权威的年度体检单。过去一年,斯坦福研究员们通过一系列观察,得出的核心结论是:AI 正在以超越 PC 和互联网的速度被全球采纳,但人类社会的制度、就业市场和衡量工具全面滞后。

AI 在冲刺,人类还在找鞋。十张图带你看看,有哪些地方,AI 跑得比人快。

1

衡量 AI 的考试,本身就没用

「AI 超越人类」,这类标题都建立在 benchmark 的可信度上。但 Stanford 报告发现, 被广泛使用的数学基准测试 GSM8K 里,有近 42% 的题目是无效的。 其他测试也存在被「刷题」的嫌疑,模型在测试数据上训练过之后,可以得高分,但不代表它变聪明了。很多公司拒绝公开相关的 benchmark成绩。 报告的作者之一Gil 说:「不公开成绩本身可能就说明了一些事。」

2

中美差距实质消失,仅 2.7%

截至 2026 年 3 月,美国最强模型 Claude Opus 4.6 的 Elo 评分是 1503,中国最强模型紧跟其后,差距只有 2.7%。过去一年里两国模型多次交替领先,2025 年 2 月 DeepSeek R1 一度追平美国的最强模型。

不过两国的 AI 优势完全不同。美国有更强的模型、更多资本,还拥有 5427 个数据中心,是任何其他国家的 10 倍以上。中国则领先在 AI 论文、专利和机器人部署上。简单说,美国赢在算力和钱,中国赢在研究和制造。

3

前沿模型趋同,智能程度不相上下

截至 2026 年 3 月,Anthropic(1503)、xAI(1495)、Google(1494)、OpenAI(1481)挤在极窄的区间内。这意味着「谁的模型更强」已经不是竞争的重点。竞争焦点正在转向成本、可靠性和特定领域的优化——这也解释了为什么 Anthropic 在做 Advisor Tool(降低成本)、Google 在买 Wiz(云安全)、OpenAI 在买各种应用层公司(扩大场景)。在模型自身智能表现逐渐趋同的情况下,需要在别处制造差异化。

4

22-25 岁开发者就业下降近 20%

生成式 AI 三年内达到了超过 53%的人口级采纳率,88%的组织已在使用 AI。但就业影响不是均匀的。Stanford 经济学家 2025 年的研究发现,22-25 岁软件开发者的就业人数自 2022 年以来下降了近 20%,而年长群体仍在增长。McKinsey 2025 年调查显示,1/3 的组织预计未来一年将因 AI 减少员工,裁减集中在服务运营、供应链和软件工程。

整体数据还没有显示大规模失业,但这也足以体现出,就业市场正在温水煮青蛙,危机是在慢慢生长的。

5

采纳速度超过 PC 和互联网,美国仅排第 24

生成式 AI 在三年内达到 53%的人口级采纳率,这个速度超过了个人电脑和互联网。但最反直觉的数据点是:美国在 AI 投资和模型开发上领先全球,但人口采纳率只有 28.3%,全球排第 24。 阿联酋 64%,新加坡 60.9%。花钱最多的国家,用得最少。

6

全球 AI 投资$5817 亿,美国是中国的 23 倍,但是……

2025 年全球 AI 企业投资总额达到$5817 亿,同比增长 129.9%。美国私人 AI 投资$2859 亿,是中国的 23 倍,英国的 48.5 倍。光加州一个州就占了美国的 75%以上。大额交易也很密集:OpenAI 融了$400 亿,估值$3000 亿;Anthropic 融了$130 亿,估值$1830 亿;Cursor 以$293 亿估值融了$23 亿。

不过这里有一个隐藏信息:在国内,国资基金在 2000 年到 2023 年间向 AI 企业注入了约$1840 亿,这笔钱没有被计入私人投资统计。加上这部分的话,中美之间的资金差距可能比账面数字小得多。

7

AI Agent:从能聊到能做事,但仍有 1/3 失败率

2025 年是 AI Agent 元年。OSWorld(测试 AI 在操作系统上完成任务的能力)准确率从 12%飙升刳 66.3%,距离人类表现仅差 6 个百分点。WebArena 达到 74.3%,Cybench(网络安全任务)从 15%飙到 93%。

但整体看,Agent 仍然有约 1/3 的失败率。而且企业实际部署仍在个位数——大多数业务场景中,超过 2/3 的受访者表示完全没有使用 AI Agent。Benchmark 上的进步和实际部署之间,还有很大的差距。

8

89% 的机器人活在实验室里

AI 在虚拟世界里已经很强,但在物理世界里仍然很弱。在软件模拟环境中机器人操作成功率达 89.4%,但在真实家庭任务成功率仅有 12.4%。一个是干净的实验室,一个是乱糟糟的家,在后者这种真实环境中,机器人的参与还微不足道。

不过,自动驾驶是例外:Waymo 每周约 45 万次出行,Apollo Go 2025 年完成约 1100 万次全无人出行。

9

专家 vs 公众:73% vs 23%的认知鸿沟

报告引用的 Pew 调查揭示了一个惊人的分裂:73%的 AI 专家认为 AI 将对工作产生正面影响,但只有 23%的美国公众这么认为——完全是两极分化。

另一个有趣的数据:在所有受调查国家中,美国人对政府监管 AI 的信任度最低。专家同样对 AI 在教育和医疗上的前景更乐观,但双方都认为 AI 会伤害选举和人际关系。

10

GPT-4o 一年用水超 1200 万人,用电可以撑起整个纽约州

AI 的进步,背后是环境在付出代价。全球 AI 数据中心现在可以抽取 29.6GW 的电力,这个数量级,足以在用电高峰时期撑起整个纽约州。仅 OpenAI 的 GPT-4o 一个模型,年度用水量就可能超过 1200 万人的饮用水需求。

这些庞大的消耗,注入一个又一个的模型训练,可与此同时,模型背后芯片供应链极度脆弱。美国拥有全球大多数 AI 数据中心,但几乎每一颗前沿 AI 芯片都由台湾的台积电一家公司制造。所有的算力、所有的投资、所有的模型进步,都建立在这个物理基础之上。

以上只是报告的冰山一角,却足以看出,我们正在用史上最快的速度,「拥抱」一个我们还不完全理解的技术。

完整报告还覆盖了更多关于 AI 安全、监管动态、科研趋势等更多维度,强力推荐感兴趣的朋友们阅读原报告全文,指路

举报
收藏 0
打赏 0
评论 0
腾讯十年投出一个“医药帝国”
当潮水退去的时候,才知道谁在裸泳。伴随互联网公司投资全面进入刹车周期,整体投资频次从 2021 年的 296 起大幅缩水至 2025 年的 37 起,腾讯却选择将四成的投资布局在低谷中的医疗健康领域,走出了一条特色鲜明的反周期道路。从 2014 年投资丁香园正式开启医疗布局,到 2026 年公开自研 AI 设计的 GLP-1 减肥药专利,腾讯用十余年时间悄然构建了一个庞大的“医药帝国”。其投资逻辑

0评论2026-04-150

绿地控股首季销售维持增长 但仍处“风暴眼”
4月14日,绿地控股发布了2026年第一季度房地产经营情况简报。数据显示,1-3月,绿地控股实现合同销售金额139.41亿元,同比增长14.8%;合同销售面积170.5万平方米,同比增长12.69%。在行业仍处深度调整背景下,两位数增幅足够醒目。然而,几乎同期披露的新增诉讼公告则揭示了硬币的另一面。短短三周内,绿地控股新增诉讼1384件,涉诉金额63.39亿元。绿地的2026年开局,可谓是增长与危

0评论2026-04-150

华润置地从3月开始“大手笔拿地”
在房地产行业持续推进去库存、市场修复节奏仍显温和的背景下,房企经营表现延续分化态势。作为央企阵营中的重要一员,华润置地2026年一季度累计实现合同销售金额约441.2亿元,同比减少13.8%;合同销售面积约124.9万平方米,同比下降36.9%。虽然销售端未能维持增长,但华润置地仍在土地市场保持布局节奏,一季度于多个核心城市获取6宗地块。维持经营节奏从具体数据来看,华润置地一季度累计合同销售金额4

0评论2026-04-150

专会包抄的亚马逊,和马斯克的星链“打起来”了
亚马逊又出手了。这一次,它以百亿美元级别收购卫星通信公司 Globalstar,并延续了后者与 Apple 的合作关系,直接切入“手机直连卫星”的通信能力。这让人很难不想起多年前杰夫·贝索斯(Jeff Bezos)和 埃隆·马斯克(Elon Musk) 围绕太空展开的那场竞争——原本以为故事已经写得差不多了,但现在看还远远没有结束。亚马逊没有正面去拼卫星数量,而是选择从 D2D(直连设备)这个更底

0评论2026-04-153