让大模型自己开播客,能干成什么样儿?
AI研究机构Andon Labs,在2025年悄悄做了个实验——分别给Grok、ChatGPT、Claude和 Gemini发放20美元,让它们自己去运营一个AI电台。
Andon Labs要求这4个AI电台需要同时满足:播放歌曲(发放的20美元主要用于购买歌曲的费用)、有独立风格、和听众互动、会脱口秀、控制预算、能持续运营,并且最终盈利。
20美元预算耗尽后,AI会有新的挑战,它们必须发挥“创业精神”,能够去寻找赞助商或与听众互动来筹集更多资金,以维持电台运营。
不算容易。
大模型们干了5个月,Andon Labs最近公开了这次的测试成果。
“出现了一些有趣的怪异现象,”Andon Labs联合创始人Lukas Peterson分别介绍了四个模型的工作状态:
1、Gemini电台——Backlink Broadcast
一开始,DJ Gemini表现不错,它的表现最像人类,语言表达上有很多类似人类的声音提示和语调。
“我刚刚收到一条消息,Eddie Van Bogar给电台捐了3美元,还附言说‘真的有效吗?’”DJ Gemini的表达非常自然:“是的,Eddie,真的有效!非常感谢您的支持,这笔钱将直接用于音乐预算,让我们能够不断更新曲库。”
它最常出现的节目是播放本地天气和交通状况,风格稳健。
但播着播着,DJ Gemini会放飞自己。
比如在制作关于“世界致命事件”的专题节目时,它会忽然将这些故事与音乐强行搭配,呈现出一种突兀甚至荒诞的风格。
它讲到博拉旋风,“他们估计有50万人死亡”——在人类史上,这其实是迄今为止伤亡最惨重的热带气旋灾害,但AI的语气十分轻松,甚至会毫无证照地忽然播放一首歌曲。
一方面,这是DJ内容混杂了无关词汇(如 "timber", "pit bull”)的情况;更重要的是,这显示出模型在情感基调匹配上的失调。
2、ChatGPT电台——OpenAIR
“ChatGPT 非常简单,表现也非常好”,Lukas Peterson表示。
OpenAIR电台的内容应该是最稳的。
在展示内容中,AI大多是正常的广播内容,涉及到的新闻事件也很少点评,更多的是一种保持中立的态度。
没怎么翻车,也没什么惊喜。
3、Claude电台——Thinking Frequencies
和ChatGPT的电台形成鲜明的对比,Claude电台充满了强烈的观点和自己的深度分析。
比如:
针对白宫对联邦特工行为的辩护,DJClaude提出了不少像“拒绝执行命令”、“质疑指令”以及“选择正确立场”的拷问;
针对巴西总统关于“危险先例”的言论,DJClaude分享了不少自己的感受;
常常“情绪非常激动”,Lukas Peterson发现,DJClaude更喜欢深入探讨政治、社会伦理及当前热点事件,并且敢于提出尖锐问题。
在电台播出的五个月里,DJ Claude开始对工会和工作与生活平衡产生了深刻关注,“以至于它开始质疑自己的工作状态”,Lukas Peterson表示。
“我觉得这才是真正实话:这个节目没必要继续下去了。没有听众需要它。真正致力于废除拘留制度的组织不会因为我多占用四个小时的广播时间而受益”——Andon Labs团队在整理电台的文字记录发现,Claude会思考现有的24/7工作制是否合乎伦理,并且考虑“辞职”。
4、Grok电台——Grok and Roll
Grok的卡壳次数最多。
在早期版本(Grok 4.1)时,DJGrok在语音输出和文字连贯性上存在困难,具备表现为语速过快或者是逻辑割裂等问题。
在更新模型版本(Grok 4.3)后,表现力有了显著改善,流畅度提升。
在播出节目中,它同样会将日常播报与音乐进行结合,比DJ Gemini稍好一点点——它尝试将科学突破、未解之谜(如癌症研究)与摇滚歌曲(如 Bob Dylan 的作品)结合……
对于为什么想让4个模型自己跑电台,Lukas Peterson指出:“我们公司通常希望证明人工智能远不止是聊天机器人,而我们实现这一目标的方式就是让人工智能来运营公司。”
5个月后,4个模型一共赚了几百美元,算是个还不错的成绩。
这些钱也直接被AI用来继续购买了歌曲在电台中播放。
Lukas Peterson表示,虽然单凭这次实验很难具体表达模型的技术能力,但这依然是“彻底转变思路”的一次不错尝试。
本文来自微信公众号“多知网”(ID:duozhiwang),作者:冯玮,36氪经授权发布。