UGC■数据抓取的边界在哪里?——以公开的用户生成内容为例( 二 )


抓取对象和方式的考察
在公开的用户生成内容被抓取的场景下 , 对于抓取行为的法律边界 , 要从抓取对象和方式两个角度来考察 , 并进而从行为效果来综合判断其正当性 。
在考察抓取对象的时候 , 需要对用户生成内容所涉的权益归属进行场景化的分析 。 通常来说 , 典型的用户生成内容 , 如消费评价、***发布内容 , 主要涉及用户和平台两方主体的权益关系 。 根据篇幅、传递信息类型和表达形式的不同 , 有些内容更容易符合独创性的要求从而构成作品 , 纳入著作权法保护的范畴;而针对商品和服务的消费评价有可能更多比例是传达相对客观的信息 , 或者囿于篇幅过短无法构成作品 。 在存在著作权的情形下 , 作者拥有的是边界相对清楚的法定权利 , 而即使无法构成作品 , 用户作为内容的直接生产者 , 如果这些内容上产生法律需要认可的利益 , 用户无疑也应当获得相应的控制能力和话语权 。
对于平台来说 , 它们对于数据可以主张的权益 , 通常是基于其资本和经营投入 , 以及据此所产生的竞争优势 。 与法定权利相比 , “投入”和“竞争优势”这些概念都是高度不确定的 , 是否受到法律的保护并非如权利一样是先定的 , 而是要看其优势被谁、出于何种原因、以何种方式被削弱 。 竞争者之间的正当竞争 , 恰恰是以相互削弱竞争优势的结果体现出来 , 这也是反不正当竞争法想要努力保护的目标 。
以用户生成内容存在著作权的情形为例 , 假设用户利益和平台利益产生了冲突 , 用户授权第三方对其已公开的作品数据进行抓取 , 平台的权益是否可以阻止这种抓取行为?这就涉及到对于这些作品数据的法律属性和权属界分问题 。 从著作权法的体系看 , 作品在传播过程中 , 有可能对作者的著作权形成控制的经营者权利 , 被法律固化为法定的邻接权 , 典型的如音像制品制作者权利、广播组织权 , 在法律赋权的前提下 , 这些传播者可以基于其资本投入获取激励 , 从而对于作品的传播产生对抗作者权利的控制能力 。 因此 , 类比来看 , 如果仅仅因为平台有投入就给予平台数据之上的排他权益 , 就相当于在著作权法所设邻接权体系之外 , 创设了一种新型邻接权 , 来对抗作者对于作品的控制 , 这显然是不符合反不正当竞争法立法本意的 。
从数据抓取的方式来看 , 也要避免路径依赖 , 落入原有案例不同事实导致的分析思路 。 从法律上评价数据抓取行为 , 不应当仅限于技术上的比较 , 而应当将完成抓取的整体过程进行综合考察 。 对于已经获取用户授权的数据抓取行为 , 尽管技术上有可能与此前案例类似 , 但是法律上的评价有可能迥然不同 。 在大众点评诉百度和微博诉脉脉案件中 , 未经任何利益主体认可的数据抓取行为 , 一方面的确容易招致“不劳而获”的指控 , 另一方面由于其没有获取授权的成本 , 因此更容易无限拓展从而更容易达成“实质替代” 。 但是 , 在获取用户授权之后的数据抓取 , 在法律上的属性很可能是相反的 。 一方面 , 数据抓取是协助用户实现对自己智力成果进行支配的一个辅助性技术过程 , 用户的这一诉求本身合理合法;另一方面 , 正是由于获取数据的前提 , 是需要依据用户授权这一实质性投入 , 难言抓取者属于“不劳而获”的投机者 。 此外 , 需要获得用户授权的数据抓取行为也不具有任意扩张性 , 在效果上 , 实现“实质性替代”的可能性也大打折扣 。
反思激励不足的假定
从防止市场失灵的激励理论出发 , 反观数据抓取行为的效果 , 在复杂而多变的互联网市场上 , 市场失灵和激励都不是有和无的问题 , 而是强和弱的问题 。 很多时候法律规制数据抓取行为 , 也不见得是认为这些行为就会导致针对数据资产的投入急降为零 , 而是担心会削弱市场资源对于数据资产的投入意愿 。 而且 , 数据资产之上的弱激励并不一定总是对整体社会福利有害 , 如果弱的投入激励能够换取数据和信息的低成本传播和利用 , 实际上有可能带来更高的总体福利 。 在数据权益的激励问题并未如同著作权法那样被立法者确定下统一的判断之前 , 法院就必须承担起在具体个案中进行复杂衡量的责任 , 而不能遵循一个统一的前设假定 , 对特定行为模式作出划一的规则嵌套 。


推荐阅读