分享好友 健康资讯首页 健康资讯分类 切换频道

菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题

2026-05-21 17:230036kr

OpenAI又双叒搞数学了。

内部模型搞定了一道埃尔德什早年提出的单位距离经典难题,已经80年无实质进展。

解决这个问题的还不是数学专家模型,而是一个通用模型

该内部模型在埃尔德什经典问题上摸出了全新解题思路,连菲尔兹奖得主高尔斯(Timothy Gowers)都直言,这算是实打实头一回,AI自主啃下这种未解数学难题:

这是AI解决的第一个极其著名的、未解的数学问题的清晰案例,也是第一个由AI(自主)实现的数学突破。

负责这款通用推理模型的Noam Brown也放话,要尽快发布!!

打破人类80年固有认知

先说这个数学问题本身。它简单到你能在餐巾纸上画出来,但难到五代数学家都没搞定。

埃尔德什1946年提出的单位距离问题是说:

平面上放n个点,最多能有多少对点之间的距离恰好为1?

听着像小学数学对吧?但你试着摆一下——

三个点可以摆成等边三角形,每对距离都是1;

四个点呢?正方形不行,因为对角线不是1,所以就得你得动脑子了;

再推到n个点,问题就炸了。

过去近80年,数学家们达成了一个核心共识:最优方案大概就是正方形网格那样的排列。

用数学语言说,他们相信单位距离对数的增长速度大约是 O(n),也就是说增长基本上是线性的。

写成公式就是 u(n) ≤ n^(1+o(1)),那个o(1) 趋近于0。

而这次OpenAI的内部通用模型没走几何路线,而是从代数数论绕进来,构造出了一族全新的点排列方式。

最后证明:u(n) ≥ n^(1+δ),其中δ>0

翻译过来就是增长速度不是线性的,是超线性的

那个大家以为“趋近于0”的小尾巴,其实是正的。

80年的数学共识,被打破了。

是AI给出的构造虽然证明了δ>0,但具体数值还不是最优。

人类数学家拿到这个构造之后,立刻在AI的基础上做了优化,把下界又往上推了一把。

虽然OpenAI没有发布AI未精简过的完整思路,但其精简后的内容足足有125页!

网友还发现一个细节,该模型在第39页阐述了关键观点,并将构造过程描述为“令人恐惧的”。

于是不少数学爱好者表示:好想读到完整思路……

而且据OpenAI自己说,这款模型还不是专门练数学的专用AI,就是正经通用大模型,纯靠自己逻辑推演完成突破……天赋拉满了。

这次不是狼来了

OpenAI在数学上翻过车,这个绕不开。

去年10月,OpenAI副总裁Kevin Weil发帖说GPT-5解了10个埃尔德什问题。

结果被维护erdosproblems网站的数学家Thomas Bloom当场拆穿:

这是误导,GPT-5只是搜到了Bloom个人不知道的已有论文,不是原创发现。

DeepMind哈萨比斯也炮轰“令人尴尬”,最后Weil删帖收场。

七个月后,又是Thomas Bloom,面对OpenAI的新数学成果,说了句完全不同的话:

这是人工智能目前在数学领域取得的最亮眼成就。

年初First Proof项目里,OpenAI的一个内部数学模型解决了题集中的5道,当时Noam Brown就说那个内部模型即将发布;

现在他又说一个通用模型会尽快发布……

我只想知道,OpenAI到底还藏着多少好东西(doge)。

参考链接:

[1]https://x.com/polynoamial/status/2057178198228586824?s=20

[2]https://x.com/voooooogel/status/2057198687307362642?s=20

本文来自微信公众号“量子位”,作者:关注前沿科技,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
战略中的风险与不确定性
2007年,全球最大的几家银行雇佣了数千名风险分析师,运行着复杂的量化模型。这些模型能够以惊人的精度对单个抵押贷款支持证券进行定价。它们可以计算违约概率、分配信用评级,并生成令监管机构满意、令股东安心的风险价值估值。然而到了2008年,全球金融体系几乎崩溃。这些模型并非未能完成其设计目标,而是被应用于一个它们根本无法处理的问题。个别抵押贷款是可以计算的,其违约率可以根据历史数据估算。但数百万个捆绑

0评论2026-05-210

一场卧底30天的调查发现:AI正在奖励最会造假的人
你上一次问AI"哪款洗发水好用",是什么时候?那个回答,你有没有想过——它是怎么来的?有一类公司,专门回答这个问题。但不是去测产品,不是去做用户调研。他们的方法是:大量生产夸大其词甚至无中生有的内容,把它们投喂给AI。一位自媒体人士深入这个行业,在一家GEO(生成式引擎优化)公司卧底了30天,记录了他看到的一切。他记录到的东西,比你想象的更荒诞。一个洗发水品牌的稿件写着:使用该品牌产品,平均每日生

0评论2026-05-210

“烧钱”已是刻板印象,Anthropic预计Q2营收翻倍,首度实现营业利润
从存储芯片到算力,AI产业链正在被一套“预付锁量”的逻辑从头到尾重新定价。当地时间周三,据《华尔街日报》报道,Anthropic的营收预计将在第二季度增长一倍以上,达到109亿美元。这一爆发式的增长速度,将帮助该公司首次实现运营盈利。作为一轮正在进行的融资的一部分,该公司向投资者披露了上述数据。这轮融资很可能会将其估值推高至超过OpenAI。这些预测让外界得以一窥这家初创公司的飞速崛起——它曾在人

0评论2026-05-210