查看原文
其他

原创 | 数据爬虫案例中平台数据的权属争议

法律未来 互联网法律大会 2022-04-09

免费订阅请点击上方“互联网法律大会”



本文作者


姜新嫄


浙江大学法律硕士



案情简介

斯氏(杭州)新媒体公司(以下简称“斯氏公司”)为“极致了”网站的经营者,以展示微信公众号的账号信息、发布内容、互动数据等信息并提供排行推荐、数据分析等数据服务为主营业务,其数据系自腾讯计算机系统有限公司、腾讯科技(深圳)有限公司(以下简称“腾讯公司”)经营的微信公众平台上爬取而来。腾讯公司据此诉请法院判令斯氏公司停止非法抓取行为并赔偿经济损失。经审理,杭州互联网法院认定原告对案涉微信公众号数据享有竞争性权益、涉案被诉行为构成不正当竞争,并据此判决被告停止数据抓取行为、消除影响并赔偿损失60万元。


问题提出

本案中斯氏公司抓取的微信公众号数据可视为每个微信用户数据所累积形成的整体数据池。对于腾讯公司是否可以对斯氏公司爬取数据的行为主张权利,首要解决的问题即为平台数据的权属问题。究其原因,平台数据公共性与私有性兼具,既由每个个体用户的使用行为产生,又由平台服务器收集、保存并计算,且与互联网经营者的商业利益紧密相关。平台数据由此呈现出你中有我,我中有你的局面,公私属性浑然难分。有学者甚至基于其复杂的多重属性认为平台数据的权利归属无法得到明确断定。


司法裁判中亦对数据抓取行为需要何者授权的看法不一,而其背后反映出的是对平台数据权利归属的认识。因此,本文首先回顾前有涉及平台数据案件中法院对平台数据权属的理解,并探讨其中反映出的平台数据权属问题的困境与解决路径。


平台数据权属的公私之争:案例与观点

数据归属问题存在广泛的争议。争议焦点主要集中在两个问题上,其一为享有平台数据权益的主体为互联网经营者还是用户,二为主体享有权益的定性。由于缺乏法律法规对数据权利的明文界定,法院广泛采用“竞争性权益”“正当权益”描述网络平台对数据享有的权利。在现有司法实践中,绝大多数判决肯定了互联网经营者对数据享有的权益,而对用户是否享有数据权益、爬取数据是否需要用户授权的问题则存在争议。在该等问题的看法与论证上,主要存在以下裁判观点:


01

平台单独享有数据权益

如在淘宝公司诉美景公司案中,对于被告主张的其抓取的数据系用户信息、原告无权主张权利的抗辩,杭州互联网法院基于单个用户上网痕迹信息的经济价值十分有限否认了个人对加工后平台数据的权益,认为虽网络原始数据不能脱离用户信息而存在,但数据经过平台加工整理后则演变为网络数据产品,平台由于对该等产品投入了大量智力活动而对其享有独立的财产性权益。

02

用户、平台共享数据权益

如在新浪微博诉陌陌案中,对于陌陌擅自抓取新浪微博用户数据的行为,法院提出第三方获取用户信息需得到双重授权,既需要用户对抓取信息行为的同意,也需要平台的明示授权。此裁判理由反映出对数据权属的看法偏向为共有关系。也即平台用户信息的背后既包含着用户的私人属性,而平台亦对此享有一定权利。


03

承认平台对数据的权益,同时提出抓取数据需要用户授权


如在本案判决中,杭州互联网法院对原告对数据享有的权益判断呈现出较为清晰的路径:区分了数据中“用户个人数据”与“整体数据”的概念,从斯氏公司抓取信息的性质出发,承认微信平台对数据的竞争性权益——其爬取的数据中不只包含用户数据,而实为具有整体性质的整合性数据资源,而通向竞争性权益的关键桥梁为互联网平台对数据的加工整合;同时法院亦在判决书中提到,该爬取行为未经用户允许即将公众号持有者的点赞数等数据公布于其他网站上,损害了个体用户的利益,因此被告不得以“不受扭曲的竞争标准”为由抗辩。在整体视域下,互联网经营者对收集整理后的微信公众号数据享有权益;而在每个公众号个体的视角下,法院认为出于对个人信息的保护,亦需征得公众号持有者的同意。


困境与展望

通过上述司法实践的观察,笔者认为对于平台数据权属的问题司法裁判中反映出的困境主要如下:


(1)首先,总体来说,法院对平台数据归属问题的看法有效保护了互联网平台对数据的经济利益,但对数据权属问题看法不一且回应不足。


法院在缺乏有关法律明确支撑的情况下,普遍承认平台对数据的权益,这种做法有效保护了平台对数据享有的财产性权益,在其受到未经允许的数据爬虫等行为侵害后得以用诉讼手段捍卫正当权利、维护商业利益。而判决中在承认互联网经营者权益的同时,在说理中提及个人用户授权的方法亦不失为一种周全之策,因为相当一部分诉讼中被告未征得任何一方的同意。但同时,用户是否对数据享有权益的问题就显得更加模棱两可。


而受到明显利益损失的一方通常为网络经营者而非个人用户的情况下,数据权属问题的争议似乎无关紧要,因为争议焦点似乎集中在用户对数据的权益而非互联网平台对数据的权益上。但首先,数据加工的原材料全部来源于用户使用互联网平台所留下的信息,其次,若设想数据抓取的行为得到用户授权但未得到平台授权的情形,如有专家认为符合得到用户授权、人工而非机器抓取信息、信息的性质为独创性信息的条件,则可绕过平台授权的限制而只需征得用户的同意即可实行抓取行为。因此该问题依然是一个具有现实性的问题。


(2)其次,应进一步找寻平台对数据权益的边界。


在承认互联网经营者对平台数据享有一定权利的同时,其是否对数据池享有全部、完整的财产权利,以及平台和用户之间的权利边界如何划定,应当在肯定其享有权益的基础上进一步加以认定。以及应当考虑平台对爬取数据等行为的禁止是否构成数据垄断的问题,如排除他人抓取数据的robots协议是否具有合理性。平台数据与互联网经营者的利益密切相关,但同时考虑到平台数据具有一定公开性,那么是否可以尽数排除一切对平台数据的爬取行为?例如该问题在今日头条诉微博不正当竞争案中法院曾对此有所讨论。对于微博与robots协议中禁止今日头条爬取数据的行为,法院认为该协议区分经营主体的行为违反了robots协议促进信息自由流动的精神,因此判决微博构成不正当竞争。


(3)最后,“数据”与“信息”概念不同,且不同案中的“数据”各有其特点。


本案前述论述中,平台“数据”与微信公众号的“信息”,两个概念有相似之处,但内涵外延有一定的差别。亟需厘清二者的差别,方可更好定义数据、明确数据的权属关系。且适用法律上有所区别。而对数据权属的观点差异中,其背后的不同不仅源于对数据权属问题本身的看法不一,也有各个涉案数据具有不同特点的因素。如从上述案件中可以看出,当抓取的信息涉及具有可识别性的用户信息时法院偏向多重授权的共有模式,而当涉及的数据为碎片化、不具可识别性的信息如商品浏览足迹,法院则偏向否认个人用户对数据的权益。


综上所述,笔者认为平台数据属性复杂、且不同的数据各有其不同特性、难以统一界定其权属,应具体考量平台数据的特性再加以裁量判断为宜。在此过程中,应纳入的考量因素包括是否含有可识别的个人信息、网络平台对数据加工整合的程度等。若其中包含了大量可识别的用户数据,则出于对用户个人信息的保护应认定用户应享有一定权益;而若平台数据的整合性高、互联网经营者在平台数据的构建中付出了大量智力劳动,则权益的天平更应倾向于经营者。


END


浙江大学《互联网与法学》课程成果

本文作者:姜新嫄 

本文编辑:涂懿敏

本文审阅:张婕妤

(限于篇幅,文中注释均已省略)

(本文观点和内容与本公众号无关)

延伸阅读:

2021年浙江大学《互联网与法学》课程综述

“无诈校园”之大学生如何防骗|数字法治大讲堂第20期

新冠疫情期间的刑法问题|数字法治大讲堂第19期

主     编:黄益豪

副  主  编:涂懿敏

来稿请投:zjulaw@aliyun.com

转载须授权


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存