AI编程赛道,又有公司开始“印钱”了。
5月27日,AI程序员Devin母公司Cognition AI宣布完成超过10亿美元(68亿元)融资,投后估值达到260亿美元(约1800亿元人民币)。
企业关键信息
什么概念?8个月前,它的估值还只有102亿美元。短短8个月,估值又涨了158亿美元。
更值得关注的,是它的赚钱速度。
Cognition年化收入(ARR)增长轨迹,不到两年从100万美元到4.92亿美元。
过去一年,Cognition的年化收入(ARR)从3700万美元,一路冲到4.92亿美元(约35亿元人民币),12个月增长约13倍,每天进账约1000万元。
如果再往前倒:2024年9月,Devin的ARR还只有100万美元;到2025年6月,已经涨到7300万美元;收购Windsurf后,ARR又在7周内环比增长超30%。
与此同时,2026年至今,企业客户使用量增长超过10倍。
这意味着:AI编程行业,已经开始从“大家看热闹”,进入真正大规模赚钱阶段。
而资本现在最疯狂下注的,也不再只是“谁模型更强”。而是:谁能真正替企业干活。
本轮融资由Lux Capital、General Catalyst、8VC联合领投,彼得·蒂尔旗下Founders Fund、Ribbit Capital、Atreides Management、Layer Global等参投。
为什么资本愿意给它260亿美元估值?
因为越来越多企业开始发现:AI程序员,不只是“辅助写代码”。它开始真的能帮公司省下大量研发时间、人力成本,甚至直接改变企业的软件开发流程。
一群AI程序员,开始年入几十亿元
Cognition最核心的产品,是Devin。简单理解:它不是传统意义上的代码补全工具,而更像一个“AI工程师”。
它可以:阅读需求文档;自己写代码;调试Bug;调用工具;部署项目;持续修改代码。甚至还能像真人程序员一样,自己打开浏览器查资料。
Devin产品界面,工程师可以像委托同事一样委托Devin完成编程任务
去年,Devin第一次公开演示时,整个硅谷几乎瞬间炸锅。因为很多人第一次发现:AI不只是“辅助写代码”,而是真的开始尝试“代替程序员完成完整任务”。
但真正让资本疯狂的,并不是演示效果。而是:它开始赚到真钱了。
4.92亿美元ARR,对一家成立不到两年的AI创业公司来说,已经属于极少数。更关键的是,这种增长,并不是靠疯狂烧钱换规模。
Cognition官方披露:公司历史累计净消耗(Net Burn)不到2000万美元。
这个数字,在AI行业非常罕见。因为过去两年,大量AI公司都在疯狂烧GPU、烧训练成本。一些大模型公司,一年亏损甚至数十亿美元。
但Cognition不一样。它本质上不是卖模型,而是在卖“AI程序员劳动力”。
程序员,本来就是全球最贵的一批数字劳动力之一。一个大型企业研发团队,一年人力成本动辄数亿元。
而只要AI能替代其中10%-20%的工作量,企业就愿意持续付费。这也是为什么:AI Coding赛道,比很多AI聊天、AI图片应用,更容易快速商业化。因为它直接连着企业利润。
谁买单?开发者、银行、军事系统
Cognition的客户,已经跳出科技公司范围。
目前,其客户包括:金融机构:花旗、高盛、桑坦德银行、巴西最大银行Itaú;汽车制造:梅赛德斯-奔驰;科技企业:戴尔、思科;军事与政府:美国陆军、美国海军、NASA。
与此同时,Infosys、Cognizant等系统集成商,已经把Devin嵌入企业交付流程。这意味着:Devin不再只是开发者的效率工具,而是开始进入企业核心IT系统。
其中,一个最典型案例来自奔驰。
奔驰有一个遗留系统现代化改造项目,原本预计工期8个月;使用Devin后,8天完成。哪怕这个数字打个五折,也已经是量级差异。
真正变化的,不只是开发速度,而是企业IT成本结构。
过去,一个大型系统改造项目,往往意味着:数十名工程师;数月开发周期;大量外包费用;长时间测试与维护。
而AI程序员真正吸引企业的地方在于:它开始第一次大规模压缩“高薪研发时间”。对于银行、汽车、制造业等大型企业来说,这类效率变化,往往意味着数百万甚至上千万美元级别的成本差异。
Devin为什么像“收费站”?
AI编程赛道,现在有一个很大的结构性矛盾:几乎所有大模型公司,都在亲自下场做编程工具。
Anthropic推出Claude Code;OpenAI重启Codex;Google推出编程代理Jules。在这种情况下,一家独立AI编程公司,为什么还能值260亿美元?
某种程度上说,Devin的性能不是最强的。
在SWE-bench测试中,ClaudeCode得分约80.9%,Gemini 3 Pro约76.2%,Devin自研模型SWE-1.5约40.08%。
Cognition给出的答案是:重心不放在模型层,而是做编排层。简单说:它不押注某一个模型,而是帮企业找到“最合适的模型组合”。
今年,Cognition推出自研模型SWE-1.6,在Windsurf中已经成为最常用模型之一,推理速度达到950 tokens/秒。同时,SWE-1.6兼容多个模型。
Cognition自研编程模型SWE-1.6,推理速度950 tokens/秒
OpenAI模型更适合某类任务,就调用OpenAI;Anthropic更强,就调用Anthropic;自研模型够用,就优先用自研。
这个逻辑好比:大模型越来越像“高速公路”,而Cognition们想做的,是高速公路上的收费站。模型能力越强、Token越便宜、AI调用越频繁,经过收费站的“车流量”就越大。
而AI编程,又比普通聊天机器人,更容易疯狂消耗Token:高频调用、多轮推理、自动Debug等。
这也是为什么:Cursor、Devin、Windsurf增长那么快。本质上,大家都在争:谁来承包程序员的Token消耗。
华人金牌选手,干出260亿美元
Cognition背后,是一个非常典型的“硅谷竞赛天团”。
CEO Scott Wu,90后,父母从上海移民美国。他曾获得:3块IOI金牌;2014年IOI全球第一;Mathcounts全国冠军;Google Code Jam全球季军。
Cognition CEO Scott Wu在Bloomberg TV上阐述独立性策略
CTO Steven Hao,同样是IOI金牌得主,曾在Scale AI担任核心工程师。CPO Walden Yan,则是00后IOI金牌选手,曾在Cursor母公司Anysphere担任工程师。三人合计拿下5块IOI金牌。
在硅谷技术圈,这类人甚至有个名字:“竞赛黑手党”。类似当年的PayPal黑手党。他们互相介绍机会、联合创业、共享资源。
而AI编程,恰恰是最适合这类顶级工程师创业的方向之一。因为这里拼的,不只是模型能力。更是软件工程能力、Agent编排能力、大规模系统能力、企业交付能力。
程序员们的饭碗
下一个问题:未来的软件公司,还需要多少程序员?
更疯狂的是:Cognition自己的代码库里,89%的代码已经由Devin编写。而这个数字,在2025年12月时,还只有13%。
也就是说:从13%到89%的飞跃,只用了5个月时间。
Devin编写代码占Cognition自身代码库比例,5个月从13%飙升至89%
但89%是Cognition自己说的数字。外部测试给出了另一个版本。
2025年1月,AI研究机构Answer.AI对Devin进行了20个真实软件工程任务测试。结果:3个成功,14个失败,3个无结论,成功率15%。
成功的任务都是简单操作,比如把Notion数据库拉取到Google Sheets;失败的任务涉及理解现有代码库和保持上下文一致性。
过去两年,AI行业比拼的是:谁模型更强。但现在,资本越来越关心另一件事:谁能真正把Token变成企业生产力。
而AI编程,恰恰是目前最容易形成高频调用、高付费、高粘性的场景之一。下一个问题可能已经不是:AI能不能替代程序员。而是:未来的软件公司,还需要多少程序员?
本文不构成任何投资建议。
本文来自微信公众号 “铅笔道”(ID:pencilnews),作者:爱羽,36氪经授权发布。