【瑛明分享】企业大数据挖掘中的雷区 — 从Robots协议说起

 

散落在各公开网站上貌似随取随用的信息,如何采集使用?大数据采集怎样才能合法合理地避开雷区?这些都是目前所有企业应对使用大数据抢占商机时需要审视的问题。...



请点击上方文字“瑛明律师事务所”关注我们

毫无疑问,大数据时代最值钱的是数据。没有体量足够大、种类足够多的数据池,后续的数据价值挖掘、分析就无从做起。因此,在商机转瞬即逝、分秒必争的今天,企业往往使用爬虫工具进行数据采集(以下简称“网络机器人”)[1]。

网络机器人与Robots协议



普通网民对“Robots协议”一词或许还有些陌生,实际上,它作为一种预防恶意的“网络机器人”多次访问网站、导致网站拥堵甚至瘫痪、数据和信息被盗用的技术手段在全球互联网行业内已得到普遍认可和使用[2],即:网站可以在服务器根目录下的“Robots.txt”中指明哪些内容可以或不可以被抓取,它向网络机器人发布指令,允许或者不允许其访问自己网站中的某些内容。

虽名为“Robots协议”,但它并非网站与所有来访者之间经过逐个协商而达成的协议,它是网站单方面设置的一种告示。这就如同一家酒店在每个房间门上悬挂的,如“请勿打扰”或者“欢迎参观、选购”之类,向所有访客进行引导的告示牌。进一步说,它不是具有防御手段的防火墙,无法制止个别访客对其置之不理的硬闯行为。

问题: 企业使用“网络机器人”采集公开网站中信息的行为是否存在风险呢?



2012年11月1日,在中国互联网协会的牵头下,12家在我国搜索引擎行业内具有较高代表性且占绝大部分市场份额的互联网公司已共同签署了《互联网搜索引擎服务自律公约》(“《自律公约》”),在《自律公约》中的第七条承诺:“遵循国际通行的行业惯例与商业规则,遵循机器人协议(robots协议)。”

在我国,行业协会的《自律公约》并非法院可以直接适用或参照适用的法律法规。但在2016年4月13日北京市高级人民法院公布的《关于涉及网络知识产权案件的审理指南》(“《指南》”)中,明确地将“行业惯例”及“行业协会自律公约”列为了对“公认的商业道德”进行认定时可以综合参考的内容。《指南》还首次明确了在司法实践中“公认的商业道德”的认定标准[3]。根据《反不正当竞争法》第二条的规定,违反“公认的商业道德”的行为应被认定为不正当竞争行为。[4]

可见,当某一“行业通行规则”被业内大多数经营者认同、体现行业内公认行为准则的时候,它就具有了被认定为商业道德的初步条件。违背该“行业规范”,将极可能被认定为违背“公认的商业道德”而构成《反不正当竞争法》第二条下全面限制的不正当竞争行为。

除构成不正当竞争的风险外,根据《著作权法》第二条[5] 、第三条[6] 和《著作权法实施条例》第二条[7]:公民、法人作品,只要满足“独创性” 和“可复制性”的特点,均可获得中国版权制度的保护。因此,若使用“网络机器人”在公开网站中所采集的信息具有“独创性”和“可复制性”的特点,属于可版权的作品(文字作品、图形作品、美术作品),除《著作权法》第二十二条[8]列举的法定“合理使用”情形外,使用他人作品,必须取得著作权人的许可,否则将面临侵犯他人著作权的风险。

散落在各公开网站上貌似随取随用的信息,如何采集使用?大数据采集怎样才能合法合理地避开雷区?这些都是目前所有企业应对使用大数据抢占商机时需要审视的问题。关于我们

在瑛明律师事务所合伙人林忠博士的带领下,我们一直关注不断变化的国内和国外数据保护的法规,以便为客户在当今的数字经济中应对权利冲突提供更为优质的建议。我们的意见已被来自多个行业的客户广泛采纳,包括娱乐、金融服务以及消费品。如您有兴趣获得更多相关信息,请联系:





林忠 博士

瑛明律师事务所合伙人

电话: +86 21 2228 8358

电邮: zlin@chenandco.com石倩平

瑛明律师事务所资深顾问

电话: +86 21 2228 8341

电邮: qianping.shi@chenandco.com

[1] 又被称为网页蜘蛛或网络机器人,是一种按照一定的规则自动地抓取网站信息的程序或者脚本。

[2] 中国互联网协会2012年11月公布实施的《互联网搜索引擎服务自律公约》(以下简称“自律公约”),将Robots协议的设置、正当利用等要求纳入到了《自律公约》第七条(“遵循国际通行的行业惯例与商业规则,遵守机器人协议”)、第八条(“互联网站所有者设置机器人协议应遵循公平、开放和促进信息自由流动的原则,限制搜索引擎抓取应有行业公认合理的正当理由,不利用机器人协议进行不正当竞争行为,积极营造鼓励创新、公平公正的良性竞争环境”)中。

[3] 33、在涉及网络不正当竞争纠纷中,公认的商业道德是指特定行业的经营者普遍认同的、符合消费者利益和社会公共利益的经营规范和道德准则。在对公认的商业道德进行认定时,应当以特定行业普遍认同和接受的经济人伦理标准为尺度,且应当符合反不正当竞争法第一条所规定的立法目的。

34、对公认的商业道德进行认定时,可以综合参考下列内容:

(1)信息网络行业的特定行业惯例;

(2)行业协会或者自律组织根据行业特点、竞争需求所制定的从业规范或者自律公约;

(3)信息网络行业的技术规范;

(4)对公认的商业道德进行认定时可以参考的其他内容。

[4] 第二条 经营者在市场交易中,应当遵循自愿、平等、公平、诚实信用的原则,遵守公认的商业道德。

[5] 第二条 中国公民、法人或者其他组织的作品,不论是否发表,依照本法享有著作权。

[6] 第三条 本法所称的作品,包括以下列形式创作的文学、艺术和自然科学、社会科学、工程技术等作品:

(一)文字作品;(二)口述作品;(三)音乐、戏剧、曲艺、舞蹈、杂技艺术作品;(四)美术、建筑作品;

(五)摄影作品;(六)电影作品和以类似摄制电影的方法创作的作品;(七)工程设计图、产品设计图、地图、示意图等图形作品和模型作品;(八)计算机软件;(九)法律、行政法规规定的其他作品。

[7] 第二条 著作权法所称作品,是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果。

[8] 第二十二条 在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名、作品名称,并且不得侵犯著作权人依照本法享有的其他权利:(一)为个人学习、研究或者欣赏,使用他人已经发表的作品;(二)为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品;

(三)为报道时事新闻,在报纸、期刊、广播电台、电视台等媒体中不可避免地再现或者引用已经发表的作品;(四)报纸、期刊、广播电台、电视台等媒体刊登或者播放其他报纸、期刊、广播电台、电视台等媒体已经发表的关于政治、经济、宗教问题的时事性文章,但作者声明不许刊登、播放的除外;(五)报纸、期刊、广播电台、电视台等媒体刊登或者播放在公众集会上发表的讲话,但作者声明不许刊登、播放的除外;(六)为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,但不得出版发行;(七)国家机关为执行公务在合理范围内使用已经发表的作品;(八)图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品;(九)免费表演已经发表的作品,该表演未向公众收取费用,也未向表演者支付报酬;(十)对设置或者陈列在室外公共场所的艺术作品进行临摹、绘画、摄影、录像;(十一)将中国公民、法人或者其他组织已经发表的以汉语言文字创作的作品翻译成少数民族语言文字作品在国内出版发行;(十二)将已经发表的作品改成盲文出版。

前款规定适用于对出版者、表演者、录音录像制作者、广播电台、电视台的权利的限制。

本材料是为提供一般信息的用途编制,并非旨在成为可依赖的法律、会计、税务或其他专业意见。请向您的顾问获取具体意见。

请长按以下二维码关注我们,获取更多专业资讯。


    关注 瑛明律师事务所


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册