专家解读 | 自动化程序收集公开数据的合法边界
创始人
2026-05-07 04:02:07

文 | 广州数据交易所总经理 沈海

数据具有易复制、非排他等特性。通过自动化程序收集公开数据,有利于数据融合利用及推动数据要素价值释放,已成为数字经济时代企业获取数据资源的主要手段。然而,由于合规边界模糊,导致企业一方面依赖公开数据进行市场洞察、产品创新与战略决策,另一方面又因法律风险“不敢用”,陷入发展悖论,严重制约了数据要素的合规流通与价值释放。

为破除这一痼疾,我国数据产权制度旗帜鲜明确立了“以产权促流通、以流通促创新”的核心逻辑,对有序复用公开数据进行清晰界定,为自动化程序收集公开数据这一普遍但敏感的实践,划定合法边界、明确权利归属,将海量公开数据从“合规模糊地带”转化为可安全合规开发利用的“价值富矿”。

一、制度创新:从原则共识到操作规则的“定分止争”

将行业内长期形成的实践共识与司法裁判中逐步清晰的裁判规则,上升为国家层面的、稳定可预期的制度安排,实现从“个案裁判”到“普遍规则”的关键一跃。

一是系统性解决“合规边界模糊”的问题

长期以来,我国对于自动化程序收集公开数据行为的法律规定散见于《刑法》《数据安全法》《反不正当竞争法》等具体部门法和相关司法解释的零星规定中,主要是从“禁止非法侵入与干扰”“保护技术措施”“限定爬取内容”“禁止损害合法权益”及“防止实质性替代”等不同侧面和角度进行约束,尚未形成统一、清晰的法律定位和规制体系,导致市场预期不稳,“同案不同判”现象时有发生。

应系统总结并明确合法收集公开数据的 四大核心边界:其一是不非法侵入他人网络,即不得以技术手段突破正常的访问控制;其二是不干扰网络服务正常运行,即不能对目标网站的正常服务造成实质性妨碍(如通过过高频率请求导致服务器瘫痪);其三是不破坏有效技术措施,即不得规避或破坏权利人设置的保护性技术手段;其四是不损害个人和组织合法权益,这既包含个人信息、商业秘密等权益保护的兜底性要求,也要求关注数据处理活动带来的权益影响,落实技术发展与应用中的风险监测义务,贯彻数据全生命周期安全合规管理要求。这“四不”原则如同为自动化程序收集公开数据行为划定了清晰的“交通规则”,让企业在合规轨道上放心前行。

二是创新性地解决“权利归属不清”的问题

发布公开数据这一行为的首要价值就是实现信息传播并促进其流通与复用。众多中小企业乃至大型企业的市场研究、竞品分析、趋势预测等经营活动,高度依赖对公开数据的合法收集与分析。应立足公开数据这一本旨, 明确支持在合理合法范围内有序复用公开数据,并赋予合法收集者相应的持有权和使用权。这符合当代信息社会数据公开的价值本旨,能够为企业以及各类经营主体从公开渠道合规获取数据、据此开展活动(包括投资与内部开发利用)并对这类活动产生收益等合理预期提供稳定的支持,确认其劳动投入的正当权益,高度符合《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出“尊重数据采集、加工等数据处理者的劳动和其他要素贡献”的政策精神,从制度层面为数据驱动型创新提供了规范依据。

但若允许对收集的原始公开数据无限制地进行对外经营(即享有经营权),可能导致“搭便车”行为,增加被收集方的成本与竞争顾虑,反而会抑制数据公开的意愿,不利于数据生态的长期繁荣。因此,数据产权制度作出了审慎而富有建设性的安排:数据处理者对合法收集的公开数据,可以持有和使用,但若要以数据产品等形式对外提供(即行使经营权),需满足“不实质性替代被收集方产品和服务”的前提。这一规定巧妙地将激励导向从“数据搬运”转向“数据加工与价值增值”,鼓励企业基于原始公开数据进行深度分析、模型构建、指数开发等实质性创新,形成具有独立价值的衍生数据或数据产品,从而在保护原始数据来源方基本利益的同时,最大化释放数据的复用价值与乘数效应。

三是前瞻性解决“产业发展受阻”的问题

大规模、高质量的数据是训练人工智能大模型、驱动“人工智能+”行动不可或缺的“燃料”。然而,合规顾虑严重制约了相关数据的获取与利用。应在保障合法权益的前提下,为合法、有序地通过自动化程序收集和利用公开数据形成高质量数据集用于AI训练、算法优化等创新活动提供制度依据。特别是允许在“不实质性替代”前提下提供数据产品,为专门从事高质量数据集清洗、标注、加工的“数据商”提供了明确的发展空间,有助于繁荣服务于AI产业的数据供给侧生态。

二、实践指引:构建“阳光化”治理体系

为深入贯彻落实国家数据产权战略部署,推动数据要素市场健康有序发展,应加快构建自动化程序收集公开数据的“阳光化”治理体系,彻底破解“不敢用”的困局,同时坚决抵制任何滥用自动化程序收集公开数据、破坏市场秩序的行为。

一是强化数据合规与产权登记衔接

数据交易所应将“四不”原则和“不实质性替代”标准深度融入数据产权登记、合规审核与产品流通交易流程。为数据商提供清晰的合规指引与辅导,对符合要求的数据产权核发登记凭证,使其成为市场信任的“通行证”。通过数据产权登记明确权利归属与限制,从源头规范数据流通。

二是推动规则细化与标准统一

建议加快制定网络公开数据自动化获取的可操作性指南,对获取频率、规模、技术方式等做出具体指引,发布典型案例,统一裁判尺度,稳定市场预期。支持通过API接口、可信数据空间、合成数据等替代方案,减少对自动化程序原始获取的依赖,推动更高效、更安全的合规流通。

三是倡导生态共治与价值共创

鼓励收集方与被收集方在明确规则下探索合作模式,如合规授权、数据产品联合开发等,将对抗性博弈转化为共生性合作。引导产业资源投向数据深度加工、模型构建、场景化解决方案开发等价值创造环节,繁荣数据供给侧生态,真正让数据要素成为驱动新质生产力发展的核心引擎。

在自动化程序收集公开数据的“阳光化”治理体系下,数据交易所不仅是公开数据合规流通的“交易场所”,更是推动其有序复用、价值倍增的“市场运营方”与“生态组织者”。此外,上述原则和规则已在数据交易所的实践中得到验证。例如“某AI法律数智平台数据报告”“某大宗商品交易价格预测数据产品”等案例,从合规的数据“有序复用”到“价值创造”与“权利行使”,均严格遵守“四不”原则,并通过实质性创新实现数据增值,是合法、可持续地开展公开数据复用业务的关键。

三、展望

构建有序复用公开数据的产权配置方案,将是我国数据产权制度建设中一项极具现实意义与前瞻性的安排。基于系统梳理立法分散的现状,通过建立一套权责清晰、激励相容的规则,针对无序收集与流通堵点提供行之有效的解决方案与行动指引,引导数据要素在合规前提下顺畅流动、在创新驱动下价值倍增。

同时,通过构建“阳光化”治理体系,强化数据合规与数据产权登记的联动,数据交易所必将引导数据要素在合规前提下顺畅流动、在创新驱动下价值倍增,将公开数据的“价值富矿”转化为驱动数字经济高质量发展、加快发展新质生产力的强大动能,在全国一体化数据市场建设中发挥应有的枢纽作用。

来源:国家数据局

数据辽阳

上一篇:宁波银行2025年度报告解读

下一篇:没有了

⚠️
本网站信息内容及素材来源于网络采集或用户发布,如涉及侵权,请及时联系我们,发送链接至2697952338@QQ.COM,我们将第一时间进行核实与删除处理。

相关内容

热门资讯

专家解读 | 自动化程序收集公... 文 | 广州数据交易所总经理 沈海 数据具有易复制、非排他等特性。通过自动化程序收集公开数据,有利于...
301083,终止收购机器人公... 【导读】百胜智能宣布终止收购中科深谷股权 中国基金报记者 忆山 5月6日,百胜智能发布公告,宣布终止...
为快乐买单,情绪经济如何“点燃... 【大河财立方 记者 王宁宁 文图】从强势出圈的丑萌潮玩LABUBU,到年轻人的解压新宠“网红”拼豆;...
林志玲决定和Akira交往的原... 搜狐娱乐讯 据台媒,林志玲老公Akira近日分享和林志玲恋爱故事,他回忆当时两人语言不通,只能用简单...
披露重组预案,天迈科技5月7日... 北京商报讯(记者 王蔓蕾)5月6日晚间,天迈科技(300807)披露重组预案,公司股票将于5月7日起...
882 ▏三星:停止在中国大陆... 点蓝色字关注“石家庄新 闻 广 播”,倾听石家庄的声音 5月6日,三星电子在官网发布公告称,为应对急...
“持股过节”的人笑了!科技、有... 假期期间,外围科技股集体走强,进一步提振了市场资金对科技赛道的配置热情。“五一”节后首个交易日,A股...
中国气候投融资试点项目超630... 来源:中国新闻网 记者从第五届气候投融资国际研讨会上获悉,截至2025年底,中国气候投融资地方试点项...
海量财经丨从百度退费到字节收费... 消息一出,社交平台上关于“吃相难看”“寻找平替”的讨论迅速升温。尽管官方紧急澄清“豆包始终提供免费服...