分享好友 健康资讯首页 健康资讯分类 切换频道

生成式AI下一道门槛:数据合规

2026-03-11 09:007036kr

从媒体机构与AI公司的版权纠纷,到音乐、影视行业对生成式模型的质疑,再到创作者发现作品被秘密用于AI训练,围绕训练数据来源的争议不断浮现。

AI模型赖以成长的海量数据,究竟来自哪里,又该如何获得合法授权?

随着生成式AI从技术探索走向产业应用,这一问题已成为行业无法回避的现实。当AI从技术探索走向产业应用,训练数据不再只是技术问题,而开始成为一个制度问题。

合作止痛,难医根本

面对不断增加的版权争议,一些企业已经开始尝试通过合作方式,为AI训练数据寻找更加稳定的来源。

部分AI公司正在与媒体机构、出版机构建立内容授权合作,通过付费授权或联合开发的方式,为模型训练提供合法数据来源。一些大型内容集团,例如迪士尼与OpenAI以及达成相关协议,探索类似合作路径。

这种模式在一定程度上缓解了版权冲突,也让AI企业能够获得更清晰的数据来源。

但从行业角度看,个别合作很难成为长期解决方案。AI模型训练所需的数据规模往往以亿计,涉及的内容类型复杂,权利主体极其分散。即便大型机构之间能够达成合作,也难以覆盖数量庞大的中小创作者和海量内容。

换句话说,合作可以缓解局部问题,却无法解决规模问题。

权利合流,集体授权

AI模型需要规模化数据,而版权却天然是分散的,这是技术与制度之间自然形成的矛盾。

当逐一授权无法支撑产业规模时,制度化授权往往会成为新的解决方式。

在传统版权领域,类似问题早已出现。音乐、文字作品等内容同样具有"权利分散、使用规模巨大"的特点。如果每一次使用都需要逐一取得授权,文化产业几乎无法正常运转。

为了解决这一问题,市场逐渐发展出著作权集体管理制度。通过集体管理组织,大量分散的作品权利被集中管理,使用者只需获得一次许可,便可以在一定范围内合法使用大量作品,而相关收益则通过统一机制分配给权利人。

从制度逻辑看,AI训练数据所面临的问题,与传统版权领域的"大规模分散权利交易"高度相似。如果仍然依赖逐一授权,不仅成本难以承受,也几乎无法在现实中操作。

因此,借鉴集体管理制度,探索面向AI训练的数据集体授权机制,很可能成为未来的重要制度方向

这一制度的核心作用,可以概括为"降本增效"。

降本,降的不仅是权利人的维权成本,也降低了AI企业在谈判与合规上的交易成本。

增效,增的不只是权利人的稳定收益,也使AI企业能够在合法框架下获得规模化训练数据。

这一制度的核心作用,可以概括为"降本增效"。

降本,降的不仅是权利人的维权成本,也降低了AI企业在谈判与合规上的交易成本。

增效,增的不只是权利人的稳定收益,也使AI企业能够在合法框架下获得规模化训练数据。

在这样的机制下,分散的内容资源可以进入更顺畅的数据流通体系,既提高作品利用效率,也为AI训练建立更加稳定的合法来源。

当然,这并不意味着简单复制现有模式。与传统作品使用相比,AI训练数据在权利界定、使用方式和价值分配上都更加复杂。例如训练数据中可能同时包含原始作品、二次创作内容以及来源不清的数据;不同内容对模型能力的贡献也难以精确衡量

这意味着,围绕AI训练数据建立集体授权体系,本身将是一项复杂的制度工程。但随着训练规模扩大、版权争议增加,市场与制度都可能推动更加集中化的数据授权机制逐步形成。

数据门槛,垄断隐现

训练数据问题,正在悄然改变AI行业的竞争结构。

过去几年,AI行业的竞争主要集中在算力和算法能力上。谁拥有更强的计算资源,谁能够训练出更大的模型,往往就能在技术竞赛中占据优势。

但随着版权争议不断增加,训练数据的来源和合规性开始成为新的现实约束。获取高质量、合法来源的数据,不仅意味着更高成本,也意味着更复杂的合规体系。

如果未来的数据获取主要依赖大型内容机构与头部AI企业之间的个别合作,这种模式很可能进一步抬高行业门槛。

大型科技企业更容易通过资金和资源获得优质内容授权,而大量中小创作者和小型IP却难以进入合作体系。

对于资源有限的新兴AI企业而言,缺乏稳定的数据来源,也可能使其难以参与竞争。

从长期看,如果训练数据逐渐集中在少数大型企业手中,AI产业甚至可能形成新的数据垄断格局。届时,数据不仅是技术资源,更可能成为新的产业权力。

也正因为如此,建立更加开放、规模化的数据授权机制才显得尤为重要。如果能够通过集体授权等制度安排,让分散的内容权利进入统一的数据流通体系,不仅可以降低AI企业的授权成本,也能够让更多创作者参与数据价值分配,从而避免数据资源过度集中。

AI行业的竞争正在悄然改变方向。

如果说过去的门槛是算力和算法,那么未来的门槛很可能是数据来源的合法性。

当训练数据成为新的准入条件时,AI行业的竞争规则也将随之改写。

本文来自微信公众号“知产力”(ID:zhichanli),作者:Edwin,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
抛弃“不作恶”,谷歌和五角大楼签订协议、承接美军机密AI业务,超700名员工联名反对
谷歌,这个曾以“不作恶”为行为准则的科技巨头,如今正深陷一场前所未有的内部风暴。28日,美国消费者新闻与商业频道(CNBC)援引科技媒体“The Information”报道,谷歌已与美国国防部签署协议,承接机密人工智能业务。一位知情人士透露,美国国防部正将谷歌的最新模型用于机密项目。这个项目遭到了谷歌员工的强烈反对。CNBC报道称,本周,700余名谷歌员工联名致信公司首席执行官桑达尔・皮查伊,要

0评论2026-04-2912

一季度净利环比暴增27倍,剑桥科技股价一年涨三倍,险资与社保基金加仓,股东高管减持
4月27日盘后,光模块概念大牛股剑桥科技(603083.SH、06166.HK)发布2026年一季报,公司一季度营收同比增长43.98%至12.87亿元;归母净利润同比增长276.44%至1.18亿元。从环比来看,剑桥科技今年第一季度营收环比下滑约12%;净利润环比增长2722.62%,而2025年第四季度归母净利润环比下跌近97%。作为光模块大牛股,剑桥科技H股曾在11个交易日完成了翻倍,4月2

0评论2026-04-2912

32美元一辆车,Tesla为什么不认?(下)
本案真正值得关注的,不只是Tesla能不能把Avanci平台价格拉进英国法院。更重要的是,如果法院最终认为这类平台许可条款不能进入FRAND审查,那么未来SEP权利人通过专利池、平台、集体许可安排对外收费时,实施者还能不能有效挑战其许可条件?这才是本案超出Tesla、InterDigital和Avanci三方争议的地方。从表面看,Avanci提供的是一种提高交易效率的许可方案。大量SEP权利人把专

0评论2026-04-2913

“保本”又“看病”?监管部门约谈健康险公司,中介平台下架热销“医疗金”产品
早在前两年,市场上就出现了带有一般医疗保险金账户的产品。随着利率下行以及市场需求增长,这类产品的资产增值属性被放大,经过长期现金价值积累,配合可以累积的医疗保险金,使得产品有着不输理财型产品的收益率,这也是引起监管部门关注的原因之一。2026年4月初,当保险经纪人小李带着客户在同仁堂线下门店参加体验活动时,他可能不会想到,体验活动中的重磅产品“岁月长安·特定疾病保险(互联网版)”即将面临下架。4月

0评论2026-04-298