生成式AI下一道门槛：数据合规_健康_健康资讯

从媒体机构与AI公司的版权纠纷，到音乐、影视行业对生成式模型的质疑，再到创作者发现作品被秘密用于AI训练，围绕训练数据来源的争议不断浮现。

AI模型赖以成长的海量数据，究竟来自哪里，又该如何获得合法授权？

随着生成式AI从技术探索走向产业应用，这一问题已成为行业无法回避的现实。当AI从技术探索走向产业应用，训练数据不再只是技术问题，而开始成为一个制度问题。

合作止痛，难医根本

面对不断增加的版权争议，一些企业已经开始尝试通过合作方式，为AI训练数据寻找更加稳定的来源。

部分AI公司正在与媒体机构、出版机构建立内容授权合作，通过付费授权或联合开发的方式，为模型训练提供合法数据来源。一些大型内容集团，例如迪士尼与OpenAI以及达成相关协议，探索类似合作路径。

这种模式在一定程度上缓解了版权冲突，也让AI企业能够获得更清晰的数据来源。

但从行业角度看，个别合作很难成为长期解决方案。AI模型训练所需的数据规模往往以亿计，涉及的内容类型复杂，权利主体极其分散。即便大型机构之间能够达成合作，也难以覆盖数量庞大的中小创作者和海量内容。

换句话说，合作可以缓解局部问题，却无法解决规模问题。

权利合流，集体授权

AI模型需要规模化数据，而版权却天然是分散的，这是技术与制度之间自然形成的矛盾。

当逐一授权无法支撑产业规模时，制度化授权往往会成为新的解决方式。

在传统版权领域，类似问题早已出现。音乐、文字作品等内容同样具有"权利分散、使用规模巨大"的特点。如果每一次使用都需要逐一取得授权，文化产业几乎无法正常运转。

为了解决这一问题，市场逐渐发展出著作权集体管理制度。通过集体管理组织，大量分散的作品权利被集中管理，使用者只需获得一次许可，便可以在一定范围内合法使用大量作品，而相关收益则通过统一机制分配给权利人。

从制度逻辑看，AI训练数据所面临的问题，与传统版权领域的"大规模分散权利交易"高度相似。如果仍然依赖逐一授权，不仅成本难以承受，也几乎无法在现实中操作。

因此，借鉴集体管理制度，探索面向AI训练的数据集体授权机制，很可能成为未来的重要制度方向。

这一制度的核心作用，可以概括为"降本增效"。

降本，降的不仅是权利人的维权成本，也降低了AI企业在谈判与合规上的交易成本。

增效，增的不只是权利人的稳定收益，也使AI企业能够在合法框架下获得规模化训练数据。

这一制度的核心作用，可以概括为"降本增效"。

降本，降的不仅是权利人的维权成本，也降低了AI企业在谈判与合规上的交易成本。

增效，增的不只是权利人的稳定收益，也使AI企业能够在合法框架下获得规模化训练数据。

在这样的机制下，分散的内容资源可以进入更顺畅的数据流通体系，既提高作品利用效率，也为AI训练建立更加稳定的合法来源。

当然，这并不意味着简单复制现有模式。与传统作品使用相比，AI训练数据在权利界定、使用方式和价值分配上都更加复杂。例如训练数据中可能同时包含原始作品、二次创作内容以及来源不清的数据；不同内容对模型能力的贡献也难以精确衡量。

这意味着，围绕AI训练数据建立集体授权体系，本身将是一项复杂的制度工程。但随着训练规模扩大、版权争议增加，市场与制度都可能推动更加集中化的数据授权机制逐步形成。

数据门槛，垄断隐现

训练数据问题，正在悄然改变AI行业的竞争结构。

过去几年，AI行业的竞争主要集中在算力和算法能力上。谁拥有更强的计算资源，谁能够训练出更大的模型，往往就能在技术竞赛中占据优势。

但随着版权争议不断增加，训练数据的来源和合规性开始成为新的现实约束。获取高质量、合法来源的数据，不仅意味着更高成本，也意味着更复杂的合规体系。

如果未来的数据获取主要依赖大型内容机构与头部AI企业之间的个别合作，这种模式很可能进一步抬高行业门槛。

大型科技企业更容易通过资金和资源获得优质内容授权，而大量中小创作者和小型IP却难以进入合作体系。

对于资源有限的新兴AI企业而言，缺乏稳定的数据来源，也可能使其难以参与竞争。

从长期看，如果训练数据逐渐集中在少数大型企业手中，AI产业甚至可能形成新的数据垄断格局。届时，数据不仅是技术资源，更可能成为新的产业权力。

也正因为如此，建立更加开放、规模化的数据授权机制才显得尤为重要。如果能够通过集体授权等制度安排，让分散的内容权利进入统一的数据流通体系，不仅可以降低AI企业的授权成本，也能够让更多创作者参与数据价值分配，从而避免数据资源过度集中。

AI行业的竞争正在悄然改变方向。

如果说过去的门槛是算力和算法，那么未来的门槛很可能是数据来源的合法性。

当训练数据成为新的准入条件时，AI行业的竞争规则也将随之改写。

本文来自微信公众号“知产力”（ID：zhichanli），作者：Edwin，36氪经授权发布。

抛弃“不作恶”，谷歌和五角大楼签订协议、承接美军机密AI业务，超700名员工联名反对

谷歌，这个曾以“不作恶”为行为准则的科技巨头，如今正深陷一场前所未有的内部风暴。28日，美国消费者新闻与商业频道（CNBC）援引科技媒体“The Information”报道，谷歌已与美国国防部签署协议，承接机密人工智能业务。一位知情人士透露，美国国防部正将谷歌的最新模型用于机密项目。这个项目遭到了谷歌员工的强烈反对。CNBC报道称，本周，700余名谷歌员工联名致信公司首席执行官桑达尔・皮查伊，要

0评论2026-04-2912

AI对话框成“赛博魅魔”：它越懂你，为什么越危险？
0评论2026-04-29

一季度净利环比暴增27倍，剑桥科技股价一年涨三倍，险资与社保基金加仓，股东高管减持

4月27日盘后，光模块概念大牛股剑桥科技（603083.SH、06166.HK）发布2026年一季报，公司一季度营收同比增长43.98%至12.87亿元；归母净利润同比增长276.44%至1.18亿元。从环比来看，剑桥科技今年第一季度营收环比下滑约12%；净利润环比增长2722.62%，而2025年第四季度归母净利润环比下跌近97%。作为光模块大牛股，剑桥科技H股曾在11个交易日完成了翻倍，4月2

0评论2026-04-2912

32美元一辆车，Tesla为什么不认？（下）

本案真正值得关注的，不只是Tesla能不能把Avanci平台价格拉进英国法院。更重要的是，如果法院最终认为这类平台许可条款不能进入FRAND审查，那么未来SEP权利人通过专利池、平台、集体许可安排对外收费时，实施者还能不能有效挑战其许可条件？这才是本案超出Tesla、InterDigital和Avanci三方争议的地方。从表面看，Avanci提供的是一种提高交易效率的许可方案。大量SEP权利人把专

0评论2026-04-2913

英伟达全模态大模型来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍
0评论2026-04-29

靠补贴扭亏为盈？摩尔线程仍需打“硬仗”
0评论2026-04-29

AI时代，“10后”沉迷于捡“电子垃圾”
0评论2026-04-29

“保本”又“看病”？监管部门约谈健康险公司，中介平台下架热销“医疗金”产品

早在前两年，市场上就出现了带有一般医疗保险金账户的产品。随着利率下行以及市场需求增长，这类产品的资产增值属性被放大，经过长期现金价值积累，配合可以累积的医疗保险金，使得产品有着不输理财型产品的收益率，这也是引起监管部门关注的原因之一。2026年4月初，当保险经纪人小李带着客户在同仁堂线下门店参加体验活动时，他可能不会想到，体验活动中的重磅产品“岁月长安·特定疾病保险（互联网版）”即将面临下架。4月

0评论2026-04-298

比亚迪、奇瑞汽车的供应商冲击IPO，上市前巨额分红，来自山东济宁
0评论2026-04-29

第一批押注AI的酒店、民宿，已经不看OTA脸色了？
0评论2026-04-29