数据到底属于谁?
——从网络爬虫看平台数据权属与数据保护
作者简介
丁晓东中国人民大学法学院副教授、未来法治研究院副院长
目次
一、网络爬虫与数据争议
二、数据权属的四种观点
三、数据权属:法律条文与教义分析
四、数据权属:实用主义的后果分析
五、数据权属的场景化界定
六、结语
摘要
网络平台数据已经成为互联网企业的核心资产,但平台数据常常包含大量的个人数据。平台数据既可以被认为个人所有、平台所有、个人与平台共有,也可以被认为是互联网空间的公共数据。无论是法律条文和法律教义的分析,还是基于正当性与后果主义的分析,都无法完全明确界定数据权属。究其原因,平台数据具有多重属性,而且其属性高度依赖场景。对平台数据进行确权,应当遵循场景化的规则制定方式,以理性规则和个案来自下而上地推动数据规则体系演进,而非寻求数据的统一性规则。在实体判断上,应当综合考虑平台性质、数据爬虫行为等多种因素,最大限度推动数据流通与数据保护的平衡。
关键词
数据权属 数据保护 网络爬虫 隐私 不正当竞争
数据对于互联网企业的发展具有举足轻重的作用。一个互联网企业与平台拥有的用户数量越多,它就可能吸引越多的用户,在和其他互联网企业与平台的竞争中,它就越可能处于有利地位。这种滚雪球式的网络效应使得互联网企业往往将数据视为竞争中的核心资产。哪家互联网企业掌握了更多的数据,对数据进行了更好地利用,哪家互联网企业就可能在竞争中具备领先优势。
或许正是由于数据的重要地位,近年来关于数据的争议问题层出不穷。在华为与腾讯的数据之争、顺风与菜鸟之争的接口门事件、新浪诉脉脉案、大众点评诉百度案、淘宝诉美景不正当竞争纠纷案、美国的Craigslistv.3Taps案、hiQv.LinkedIn案中,各方所争议的核心问题都是数据:当一个网络平台通过技术手段获取另一个平台的数据时,这种行为是否合法与合理?或者更为简单地说:平台的数据到底属于谁?对于这个问题,法学界已经有不少研究,但此类研究主要从部门法的角度切入,对平台数据权属问题进行部门法分析。例如,有的学者从反不正当竞争法的角度分析数据爬虫的合法性,有的学者从民法财产权的角度分析企业数据的财产权保护,有的学者从知识产权角度分析企业数据保护。此类研究虽然从不同角度对思考数据权属问题提供了深刻的洞见,但没有从整体性的角度思考数据权属特别是平台的数据权属问题。而经济学的文献虽然越来越