你以为在举报AI烂片？谷歌：这招，我用验证码玩了15年_健康_健康资讯

最近，YouTube 向用户发起调查：你刚刚看的这个视频，有没有「AI 烂片」的感觉？

评分从「完全没有」到「极其明显」，由用户自行判断。

官方的解释是，平台希望借此打击泛滥的低质量 AI 生成内容。

消息一出，有人拍手叫好，认为 YouTube 终于出手整治乱象。

有人则认为表面是举报 AI 烂片，实际上在帮谷歌训练下一代 AI。

YouTube 每天有 1.22 亿活跃用户。当这些人开始对 AI 视频逐一打分，他们实际上是在告诉系统，哪些画面、哪些动作、哪些细节，会让人一眼识破这是 AI 生成的。

这批数据，恰好可以直接用于训练谷歌旗下的 AI 视频生成模型 Veo，让下一代模型知道哪里「露馅」了，从而生成更难被肉眼分辨的视频。

与此同时，谷歌还向一家专门为儿童制作 AI 视频内容的初创公司投资了 100 万美元。

事实上，这家公司已做了同样的事情整整十五年。

每当我们打开浏览器、登录银行账户或是在网购平台下单，屏幕上总会跳出一个熟悉的小方框，要求点击几张图片，或是在一个勾选框旁边打上对勾。

我们以为这只是一道防止机器人入侵的安全关卡，实则在那短短十秒钟里，我们正在为一家市值数百亿美元的科技巨头，无偿完成一项极具商业价值的工作。

这套系统叫做reCAPTCHA，它是互联网史上规模最大、也最鲜为人知的数据采集行动。

那道「验证码」，从来都不只是验证码

故事要从 2000 年前后说起。

彼时，垃圾邮件机器人正在席卷互联网，论坛被大量刷帖，用户收件箱被塞满无用信息，各类网站急需一种方法来区分真实的人类用户与自动化程序。

卡内基梅隆大学教授路易斯・冯・安发明了CAPTCHA，这是一种将文字扭曲变形、只有人类才能辨认的图形验证码。

冯・安意识到，每天有数以百万计的人在这些验证码上消耗认知精力，如果这些精力能被同时引导去做另一件有价值的事，会怎样？

2007 年，他推出了reCAPTCHA。

验证码不再显示随机乱码，转而呈现来自真实书籍的扫描图像，那些计算机尚无法自动识别的古旧文字。用户每完成一次验证，就等于帮助完成了一小段古籍的数字化。这些书来自《纽约时报》历史档案与谷歌图书项目，总量超过 1.3 亿册。

2009 年，谷歌收购了 reCAPTCHA。真正大规模的数据采集，就此开始。

到 2012 年前后，辨认扭曲文字的时代走到了尽头，谷歌有了新的需求。

谷歌的街景采集车正在将地球上的每一条道路拍进镜头，然而原始照片只是数据。要让 AI 真正读懂这些图像，就必须知道画面里哪里是红绿灯、哪里是人行横道、哪里是店面招牌。

这一过程在机器学习领域叫做「数据标注」，是训练计算机视觉模型不可缺少的环节，也是一项造价高昂的工程，行业市价通常在每小时 10 至 50 美元之间。

谷歌就把标注任务嵌进全球每个人每天都绕不开的东西里。reCAPTCHA v2改变了界面，用户面对的是一组来自谷歌街景的真实照片，被要求「点击所有包含红绿灯的方块」，或「选出每一处人行横道」。

看起来仍是一道安全验证，背后的每一次点击，都是在为谷歌的计算机视觉模型打上精确的训练标签。

巨大的规模

鼎盛时期，全球每天有 2 亿个 reCAPTCHA 被完成，每次耗时约 10 秒，折合每天超过 50 万小时的人工劳动。按数据标注行业最低市价估算，谷歌每天从中获取的免费劳动价值高达 500 万美元。

reCAPTCHA 几乎无处不在，每一家银行、每一个政务平台、每一个电商网站，都将它嵌入了登录入口。用户根本没有绕行的余地，想访问自己的账户，就必须先完成标注。

这种强制性，是其他任何数据采集方式都无法企及的。Scale AI、Appen 等专业标注公司雇用了数十万名工人，有时时薪不足一美元，但即便如此，也无法达到 reCAPTCHA 所覆盖的规模与密度。

这些数据最终流向了两款产品。

一是谷歌地图。作为全球使用最广的导航工具，它识别路牌、定位商家、理解城市地理的底层能力，有相当一部分建立在这些人工标注之上。而那些完成标注的人，大多只是想查一下账单余额，或是在网上下一张订单。

二是 Waymo。这是谷歌旗下的自动驾驶项目，2016 年独立运营。自动驾驶汽车要在真实道路上安全行驶，必须以近乎完美的精度识别红绿灯、行人、停车标志等数千种视觉信息，这些识别任务所需的核心训练数据，正是由数以百万计、对此毫不知情的普通用户通过 reCAPTCHA 完成标注的。如今 Waymo 估值 450 亿美元，2024 年完成超过 400 万次付费载客，仍在持续扩张。

2018 年，reCAPTCHA 推出第三个版本，这一次连验证题都消失了。系统在后台静默运行，追踪用户的鼠标轨迹、页面滚动速度和光标停留位置，通过分析这些行为模式来判断访问者是否为真实人类。这些行为数据，同样源源不断地流入谷歌的 AI 训练体系。

结语

冯・安当年的构想，在某种程度上称得上是对人类认知资源的一次创造性调度，把人们原本就要花在垃圾过滤上的精力，引导去做一件真正有意义的事。这个出发点，本身并无恶意。

但有人认为，谷歌将一套用户别无选择、必须使用的安全机制铺设至整个互联网，而后将产出的海量数据悄然收割，转化为价值数百亿美元的商业产品。整个过程中，用户不仅一无所获，甚至连知情的权利都未曾拥有。

今天 YouTube 对 AI 视频打分这件事，似乎也是把用户自发的行为，包装成一项有益于平台生态的举动，同时将产生的数据悄悄收入囊中，用于喂养下一代商业产品。

参考链接：

https://x.com/TukiFromKL/status/2033968600248180958?s=20

https://x.com/cryptopunk7213/status/2034074712444207504?s=20

https://x.com/sharbel/status/2033921490412806579?s=20

本文来自微信公众号“机器之心”（ID：almosthuman2014），作者：杨文，36氪经授权发布。

DeepSeek百亿美元估值融资传闻背后的四重逻辑判断

本周末中国AI圈最大的消息，就是DeepSeek被传将以100亿美元估值释放3%左右股权融资的事情了。对于一个曾长期坚持“自我供血”、创始人梁文锋本人直接和间接持有84.29%股份并拥有几乎100%表决权的公司而言，这一消息本身足以引爆行业讨论。但值得注意的是，消息发酵不过两天，各方渠道传回的信息高度一致：某大型国资股权机构人士表示该消息“很可能属实”，但“目前完全投不进去”；多位创投人士也坦言，

0评论2026-04-200

Agent时代，训练师的核心技能不再是写Prompt，而是…

模型能力的提升与Agent框架的成熟，使得单纯编写提示词的技能迅速贬值，取而代之的是系统思维、工具理解与异常处理能力。本文深入剖析Agent时代对训练师能力模型的重构过程，以及AI与业务深度融合带来的全新职业机遇。去年这个时候，招聘网站上最火的AI岗位是”Prompt工程师”。年薪可观，门槛不高，会写提示词就能上岗。今年，这个岗位的热度明显降温了。不是Prompt不重要了，而是它的价值正在被稀释。

0评论2026-04-200

杨立昆开喷 Anthropic CEO：别信那个卖AI的人
0评论2026-04-20

AI时代，软件“日抛”是趋势还是陷阱？

周末在群里看到这样一则视频，某软件平台大咖在演讲时推出了AI时代软件“日抛”的观点，认为日后用户无需绑定软件，用完即废。此视频一出顿时在群内引发热烈的讨论，有人认为这是日后的趋势，轻量化、即用即抛；有人则质疑其真实用心，认为这不过是资本为收割流量而编造的概念；甚至有群友说“日抛”那么牛叉，他敢不敢把自己平台中的所有第三方收费软件都抛弃？那么什么是软件“日抛”？企业是否适用？今天老杨就与大家来分析一

0评论2026-04-201

请来“项羽”的苏超，又吓了所有人一跳
0评论2026-04-20

内存不够用这件事，可能要持续到2030年
0评论2026-04-20

杯子原料飙升50%，奶茶要涨价？别慌，真相来了
0评论2026-04-20

第一代网红奶茶奈雪，怎么悄悄亏麻了?
0评论2026-04-20

酒店四巨头连发财报：效率才是行业活下去的硬底气
0评论2026-04-20

国产大模型集体转身

过去六十天，国内大模型头部公司在集体做同一件事。从卖算力、做项目，转向卖Token、做订阅。你可能会好奇，为啥动作这么一致？我拆了一下，觉得有三件事同时发生了，把大家推到了同一条路上。01第一件，C端这口井，挖不动了。这事MiniMax替所有人验证过；2025年它全年收入7903万美元，海外收入占73%，整体毛利率25.4%。这已经是国内C端AI产品跑得最好的一家了。其他C端AI助手，到今天没一家

0评论2026-04-201