[ 由于其非排他性、复用性、多归属等特性,数据的保护与利用之间总是存在冲突。一方面,加速数据的流转与交易,能够激发数据要素的活力,使其创造出更大的经济价值;另一方面,数据的公开意味着数据被泄露、复制、爬取的可能性增大,数据收集者对数据的掌控力下降,数据权益更容易受到侵犯。如何在数据的保护和利用之间寻找平衡,是数字经济时代数据权益保护的重要课题。 ]
随着数字经济向人工智能经济纵深发展,数据在企业的发展与竞争中发挥着越来越重要的作用,掌握数据意味着更了解用户,可以根据用户需求进行商业计划和研发方向的调整,更意味着对算法训练的提升和优化,其作用价值不容小觑。然而,由于其非排他性、复用性、多归属等特性,数据的保护与利用之间总是存在冲突。一方面,加速数据的流转与交易,能够激发数据要素的活力,使其创造出更大的经济价值;另一方面,数据的公开意味着数据被泄露、复制、爬取的可能性增大,数据收集者对数据的掌控力下降,数据权益更容易受到侵犯。如何在数据的保护和利用之间寻找平衡,是数字经济时代数据权益保护的重要课题。
当前数据不正当抓取行为的主要类型
数据不正当抓取行为主要有两种类型:未经授权抓取已公开数据、未经授权抓取未公开数据。
(一)未经授权抓取已公开数据
已公开数据虽处于相对开放状态,但抓取公开数据仍应征得数据持有者的授权同意,数据持有者享有经营自主权,可拒绝数据抓取者的抓取请求。企业公开数据的目的通常是为了扩大自身知名度,公开特定的数据集合吸引流量,从而提升自身竞争力。在上海首例提供爬虫程序抓取已公开数据构成侵入计算机信息系统程序罪案件中,被告人王某开发出无需授权即可绕过防护机制获取得物服务器上商品数据的爬虫程序,并从中获利。涉案商品信息在得物APP中能够正常访问,并在服务器后台中设置了加密代码等防护措施。法院审理后认为被告人王某的行为已构成提供侵入计算机信息系统程序罪。在某堂与隐某案中,隐某未经某堂授权许可,抓取某堂已公开的数据并商业使用,违反了涉案CC开源协议的规定。二审法院经审理认为涉案数据集因某堂的主动公开而丧失秘密性,虽然不构成《反不正当竞争法》第九条规定的商业秘密,但是隐某未经许可的抓取涉案数据集并商业使用的行为损害了某堂的合法权益、市场竞争秩序以及消费者利益。
企业公开数据仅代表允许他人访问数据,而非允许他人未经授权抓取数据。“访问”和“抓取”的行为目的与行为内容存在显著差异,访问通常是基于消费需要等正当目的,用户单次访问的数据量较为有限,是在公开数据合理使用范围内使用数据,数据持有者对用户正常访问公开数据的行为具有合理预期与包容;而抓取通常是基于网络爬虫等程序实现,抓取的数据量大,爬虫程序绕开公开数据存储服务器上设置的防护措施,抓取数据分析者在服务器后台设置的加密代码,实施诸如价格趋势分析等超出公开数据合理使用范围的行为,超出了数据持有者原先的预期。因此,未经授权抓取已公开数据的行为可能侵犯公开数据持有者的正当竞争利益,也可能构成刑事犯罪。
(二)未获授权抓取非公开数据
非公开数据处于相对隐蔽状态,当非公开数据满足商业秘密构成要件时,能够适用商业秘密对非公开数据进行保护,数据抓取者未获授权抓取非公开数据明显侵犯数据持有者的数据权益,甚或构成侵犯商业秘密罪。非公开数据通常受API认证机制等技术手段保护,在未经授权的前提下,行为人通过API接口、网络爬虫等手段抓取非公开数据,不当抓取行为通常会被认定为损害市场竞争秩序、损害数据持有者的合法权益,甚至损害消费者合法权益,构成不正当竞争行为。尽管,非公开数据符合商业秘密构成要件,能够适用商业秘密进行保护,但由于商业秘密保护的举证难度较大,目前实践中几乎没有当事人在诉求中援引商业秘密条款寻求商业秘密保护。
司法规范数据抓取行为面临的主要挑战
通过司法规范数据抓取行为,首要面临的挑战就是数据权属的模糊性问题,这是识别数据抓取行为正当与否的前提和基础,但是无论在学术理论中,还是在司法实践中,都没能达成共识。
譬如,在“某某微博诉某某脉脉软件不正当竞争案”中为平衡个人主体、数据处理者、数据使用者的关系,法院创设了“三重授权”原则,以优先保护个人主体与数据处理者的利益;再如“某宝公司诉某景反不正当竞争案”中法院首次确认数据产品具有竞争性财产利益。2022年12月《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(下称“数据二十条”)中对数据要素授权确权问题有针对性地提出探索数据产权结构性分置的方案,建议建立数据资源持有权、数据加工使用权、数据产品经营权等“权益分置”的数据产权制度。“数据二十条”虽然为数据权属的结构性设置指明了方向,但还需通过立法予以确认,并在具体法律适用中不断丰富和完善相关具体规则。
其次,通过现有的知识产权类型及制度所确定的保护理据来保护数据权益,仍然存在制度和操作上的局限性。一方面,通常来讲,数据不具有严格意义上的排他性,其多归属和复用性使之很难归类到现有的知识产权权利客体及类型之中;另一方面,现有知识产权制度对于其客体设置了比较高的构成要件门槛,大多数的数据不能达到要求,难以受到知识产权的保护。
再次,依据《反不正当竞争法》商业秘密条款对数据进行保护或许是另一种路径,但是这种路径仍然存在规范层面上的冲突与适用困境。现行商业秘密构件要求符合秘密性、价值性、保密性三个特点。数据虽然符合价值性特征,但是由于数据在流转的过程中具有一定的公开性,难以契合秘密性要求。关于保密性,部分数据可能会采取加密措施进行保护,但是大部分的数据仍是没有采取加密措施的公开数据,或者只是设置了较为简单的访问限制措施,致使在技术层面难以认定为符合商业秘密构成要件,或者只有很少一部分数据在特定情形下予以认定。
最后,现行《反不正当竞争法》第二条规定了不正当竞争行为的“一般条款”,在实践中也有大量纠纷在适用法律时选择绕过有争议的数据权属问题,而将非法获取、利用数据的行为概括成一种抽象的不正当竞争行为。“某度诉某虎案”中,某度通过设置Robots协议的方式限制某搜索引擎抓取其相关网页内容,受案法院认为某度的涉案行为损害了某虎的合法权益,扰乱了市场公平竞争秩序,最终将会损害广大网络用户的利益,构成不正当竞争,并依据《反不正当竞争法》(2019)第二条“一般条款”作出裁判。在“某创科公司诉某节案”中,被告未经原告同意非法抓取、复制新浪微博数据,受案法院依据《反不正当竞争法》(2019)第二条“一般条款”判决某节的涉案行为构成不正当竞争。上述案件作为典型的数据抓取纠纷案件,受案法院均以“一般条款”进行裁判。这种做法看似是迂回的保护,但实际上会使数据保护陷入困境之中。“一般条款”作为兜底性规则,本身就存在着规则模糊不清晰的缺陷,需要通过法律解释明确法条的内涵,且极易引发同案不同判的情况。
以新《反不正当竞争法》实施为契机划定数据抓取边界
在公平竞争视阈下,数据抓取的合法边界需寻求技术合规性、权益正当性与公共利益间的平衡。2025年新修订的《反不正当竞争法》第13条第3款规定:“经营者不得以欺诈、胁迫、避开或者破坏技术管理措施等不正当方式,获取、使用其他经营者合法持有的数据,损害其他经营者的合法权益,扰乱市场竞争秩序。”(下称“数据专款”)明确列举了欺诈、胁迫、避开或者破坏技术管理措施等是数据抓(获)取的非法手段,明确禁止以违背商业道德、诚实信用原则的手段获取数据。
数据持有者对数据采用的技术管理措施需与数据的敏感性、投入成本相匹配,对核心经营性数据的保护措施可适当严格,对已公开且无显著竞争价值的数据不宜设置过于严格的管理措施。同时,技术管理措施不得成为排除、限制竞争的工具。若数据持有者利用技术手段对同类经营者设置歧视性访问措施,无正当理由拒绝同类经营者访问数据,则该技术管理措施本身可能因具有歧视性而丧失合法性基础,在此情形下需要重新评估数据抓取者“避开技术管理措施”行为的不正当性。此种判断逻辑有利于维护数据持有者通过合理技术手段保护权益的正当性,同时也防止技术管理措施成为数据持有者的垄断工具,符合公平竞争的本质要求。
“数据专款”以“合法持有数据”初步划定了数据抓取的边界,持有数据的经营者应保证其所持有的数据来源合法。对于已进入公共领域的公开数据,数据持有者不得主张数据独享,抓取行为若未损害数据持有者的核心竞争利益,数据抓取者可基于数据流通的公共价值主张抓取行为具有正当性。
对于非公开数据,数据持有者的权益则应受到优先保护,抓取行为需以获得合法授权为前提,未获授权的数据抓取行为可能构成不正当竞争行为,受到《反不正当竞争法》规制。同时,该条款还确立了双重效果要件,即损害其他经营者的合法权益以及扰乱市场竞争秩序,通过对双重效果要件的界清,避免对合理流通数据的过度限制,能够更加有效规制不正当的数据抓取行为。以此建立健全符合公平竞争理念的数据要素流通利用市场秩序,在保护数据权益的同时,更好释放数据要素价值。
(作者系南开大学竞争法研究中心主任,法学院副院长、教授、博导,南开大学数字经济交叉科学中心研究员)