【学术前沿】衍生数据的法律属性与权利性质

 

为了使这一规定更加准确,我们建议,《民法总则》应当将“数据信息”改为“衍生数据”,将其作为知识产权客体,并且依此创立数据专有权。...



衍生数据的法律属性与权利性质

中国人民大学民商事法律科学研究中心研究员、博士生导师

《民法总则(草案)》(2016年5月27日稿)第一百零六条第一款规定:“民事主体依法享有知识产权。”第二款在规定知识产权的客体时,将“数据信息”规定在第八项,作为知识产权的一种。这样的规定具有特别重要的意义,将成为世界范围内规范数据权利及其客体的首创性规定。为了使这一规定更加准确,我们建议,《民法总则》应当将“数据信息”改为“衍生数据”,将其作为知识产权客体,并且依此创立数据专有权。


一、能够建立知识产权的数据是衍生数据

在大数据的环境下,以数据内容的产生方式为标准,数据可以分为原生数据和衍生数据。原生数据是指不依赖于现有数据而产生的数据,例如用户发表的评论数据、用户使用服务的日志数据等。衍生数据是指原生数据被记录、存储后,经过算法加工、计算、聚合而成的系统的、可读取、有使用价值的数据,例如购物偏好数据、信用记录数据等。能够建立知识产权的数据是衍生数据,而不是原生数据。

从数据的生产方式来看,原生数据是指数据从 0 到 1 的过程;衍生数据是从 1 到 f(1)的过程(注:从0到1仅表示从无到有的含义,f()仅表示数据的加工、计算、聚合的操作过程,均不表示具体含义)。原生数据是不能再生的数据,衍生数据由于是在原生数据的基础上加工、计算、聚合的结果,因此在理论上,衍生数据是可再生的数据。加工、计算、聚合是衍生数据的最重要特征。以互联网为例,互联网上的数据主要是基于用户行为而产生,用户在互联网上的操作包括两类,一是输入,二是点击。前者如用户注册时输入姓名、邮箱,使用服务后的评论,使用搜索引擎时的搜索内容输入等;后者如用户通过鼠标点击某个页面、点击某个商品链接,点击下单、点击提交、点击确认,等等。因此,互联网上的原始数据,主要是用户输入的内容和点击的日志。衍生数据正是在这些用户输 入和点击的日志的基础上,通过算法加工、计算、聚合后,形成一条条结构化的数据。例如,通过交易的点击日志,加工、计算、聚合成的交易数据;通过用户的浏览点击日志,加工、计算、聚合成偏好数据。

被记录,是数据的重要特征之一。但是被记录下的数据并非必然具有价值。当数据量小时,数据价值依赖于原始的数据内容,从数据内容中依据逻辑思维直观的获取价值。当面对海量数据时,原生数据可以直观获取的价值是有限的,数据价值依赖于算法加工计算后,从总量数据的相关性中获取价值。数据价值挖掘方式的变化,使得数据的加工、计算、聚合成为一个非常关键的问题。原生数据并不能直接使用,就像原油一样,地底层的原油并不能直接被使用,需要经过加工、提炼成石油,才能被使用。数据的加工、计算、聚合,实现了从“一般数据”到“可用数据”的过程,而这种可用数据就是衍生数据。在数据业务中讨论的数据基本上都是衍生数据;而实现加工、计算、聚合的算法的精确度,决定了其所产出的衍生数据的价值。

二、衍生数据的性质及与相关概念的联系与区别

衍生数据与相关概念如数据、信息与数据库等,确认它们之间的联系与区别非常重要,关系到立法确认的概念及其性质的准确性,也关系到作为数据权利的性质和保护范围。

衍生数据的性质属于智力成果。智力成果是指人们通过智力劳动创造的精神财富或精神产品。通常认为,智力成果的特征:一是创造性,即以前未曾出现过的智力劳动成果,具有创新和突破的特点;二是非物质性,是一种非物质化的知识形态的劳动产品,人们对其占有不是具体实在的控制,而是表现为认识和利用;三是公开性,权利主体在对其智力成果取得专有权或者专用权前,应将该成果向社会公开,只有包含商业秘密的智力成果除外。衍生数据具有这样的特征:第一,原生数据不具有创造性,只具有记录性;但在记录了原生数据之后,对其加工、计算、聚合,使其脱离了原生数据,创造成为新的,具有使用价值的衍生数据,包含了智力创造。第二,无论是衍生数据还是原生数据,都具有非物质性,都不具有客观的外在物理形态,但是原生数据没有创造,因而不具有产品的性质,而衍生数据是非物质化的知识形态的劳动产品,属于智力成果。第三,从表面上看,衍生数据不具有公开性,也就是在取得权利之前不能予以公布周知,但正是如此,这种智力成果才与商业秘密相似,具有有限的公开性。故衍生数据的性质属于知识产权赖以建立的权利客体,即智力成果。

衍生数据与数据不同。数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的的原始素材。而衍生数据仅指原生数据被记录、存储后,经过算法加工、计算、聚合而成的数据。因此,数据是衍生数据的上位概念,是一般性概念,衍生数据是数据的具体类型。在数据市场交易和需要民法规制的数据,是指衍生数据,而不是一般的数据。

衍生数据与信息不同。信息是指音讯、消息、通讯系统传输和处理的对象,泛指人类社会传播的一切内容。人通过获得、识别自然界和社会的不同信息来区别不同事物,得以认识和改造世界。不过,在法律层面使用信息概念,主要还是限于个人信息的范围,按照《全国人大常委会关于加强网络信息安全的决定》的规定,个人信息包括个人身份信息和个人隐私信息。而衍生数据所产生的原生数据确实带有个人信息或者个人隐私的要素,但是,衍生数据并非是指原生数据本身,而是将带有个人身份信息或者个人隐私信息的原生数据在被记录、存储后,经过算法加工、计算、聚合,经过脱敏(即完全过滤掉个人信息要素)处理,生成新的、系统的、可读取、有使用价值的数据,例如购物偏好数据、信用记录数据等。因此,在民法领域使用衍生数据概念时,最好不要与信息概念并列,以免与个人信息概念发生混淆。

衍生数据与数据库不同。数据库是按照数据结构来组织、存储和管理数据的仓库,是以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度的特点、是与应用程序彼此独立的数据集合。简言之,数据库是本身可视为电子化的文件柜,即存储电子文件的处所,用户可以对文件中的数据进行新增、截取、更新、删除等操作。而衍生数据绝不是对原生数据的简单整理、存储和管理,而是在原生数据被记录、存储后,经过算法加工、计算、聚合,在原生数据的基础上,新产生的系统的、可读取、有使用价值的数据,因此与数据库具有本质的区别。对于数据库,主要采用著作权法的保护方式予以保护,或者以汇编作品保护,或者在著作权法中单独立项,或者单独立法。而对于衍生数据,不能用著作权的方法予以保护,而应当单独规定一个数据的权利予以保护。

三、以衍生数据为客体建立的权利是数据专有权

衍生数据具有重要的财产价值,因此,对于衍生数据的创造性劳动而产生的成果,必须予以法律保护。就现行法律制度的现状而言,对于数据内容主体(数据生产者)与数据载体主体(数据拥有方)分离的现状,在传统的权利体系中难以找出完全适用于衍生数据保护的权利。而衍生数据产生的成本,以及数据存储、计算、加工、聚合,不仅须有巨大财力的投入,且须有智慧的投入,不同的算法模型会产出不同质量的衍生数据。基于自然法的朴素逻辑,数据拥有方基于对合法收集的数据进行加工计算产出为数据处理系统所能读取的数据,实现从“数据”到“可用数据”的创造,民事立法应当对衍生数据享有的权利作出规定,赋予拥有者以数据权利。

对于衍生数据拥有方究竟赋予其一种什么权利,有不同见解。有的学者认为衍生数据是一种新型的物,因而应当建立数据所有权。不过物权的客体是物,而物的重要特征之一是唯一性,而数据本身是可以复制的,因此衍生数据不是物,不适合用物权予以保护。用债权保护衍生数据也不合适,因为债权的客体主要是行为,与衍生数据的特征明显不符。

起源于封建社会“特权”的知识产权,随着时代的变迁,逐渐演变成了私权的一种,地域性这一特征也保留下来。知识产权主要分为著作权、专利权、商标权,其客体表现为一定的信息,一般不能作为独占的标的,可以复制。衍生数据与知识产权客体的这一特征基本相同,特别是与著作权的客体即作品相似,故在我国实务中,有的将衍生数据的拥有方对数据的权利称为数据版权。但是,著作权具有地域性、时间性等特点,而这些与衍生数据拥有方对数据的权利是不相符的。从这个角度来看,数据拥有方对衍生数据的权利又与所有权相似。在用著作权以及所有权概括衍生数据的权利都不合适,又都有相似之处的情况下,界定一个衍生数据的新型权利,就是数据专有权。

数据专有权是一种财产权,性质属于一种新型的知识产权。作为数据专有权客体的衍生数据,是广义的信息,因而与作为知识产权客体的信息非常近似。 但是,数据专有权与传统的知识产权又有着明显的不同,在权利的主体、客体以及保护等方面,都存在明显的差别。传统的知识产权对于受保护的信息是有门槛要求的,例如版权的作品须有独创性,商标须有新颖性,专利须有创造性。而作为数据权利客体的衍生数据,在业务实践中并不要求具备这些门槛。数据专有权具备传统知识产权无形性、专有性、可复制性的特点,但不具备传统知识产权的地域性、时间性的特点,因此是一个新型的权利类型。

知识产权本身是一个发展的概念。传统的知识产权产生于工业时代,工业时代的知识产权的类型也在不断发展。数据专有权产生于数据时代,属于一种新型的知识产权,是从更广的知识产权角度,在新的技术环境下,对知识产权类型的拓展,不能以传统的知识产权来解释,因此是对传统知识产权的更新。

数据内容主体(数据生产者)与数据载体主体(数据拥有方)存在权利冲突,衍生数据也不例外,因而分为两大类:一是衍生数据本身可识别数据主体,二是衍生数据不可识别数据主体。

对于含有可识别数据主体特征的衍生数据,衍生数据上承载数据拥有方的数据专有权与数据主体的专有权,当数据主体为个人时,数据主体的专有权可能涉及个人身份信息和个人隐私信息,当数据主体为企业时,数据主体的数据专有权可能涉及商业秘密权;此种类型的衍生数据的数据权利,需要界定数据拥有方的数据占有权与数据主体数据专有权的边界。

对于不含有可识别数据主体的衍生数据,衍生数据上承载的权利只有数据拥有方的数据专有权。从这个角度而言,此种衍生数据归属于数据拥有方,是民事立法应当规范的数据专有权的基本客体。

四、结论

综上,在大数据时代,衍生数据本身具有极大的价值,并且对于影响经济发展和社会进步具有重要意义。制定具有21世纪特点的民法典,应当反映社会的这种诉求,对数据权利作出肯定性的规定。《民法总则(草案)》第一百零六条在知识产权客体中规定了数据信息,是非常重要的立法举措,在世界各国的民事立法上确属第一次。这一规定,将使我国民法典的编纂具有强烈的时代感,是民法典编纂中的突出亮点,将在世界范围内引领大数据时代民法变革的发展方向,具有特别重要的意义。为更加谨慎起见,使这一立法更能够全面地反映数据研究中的最新成果,具体的内容设计还有进一步改进的余地,建议将该条文中规定的“数据信息”改为“衍生数据”,或者只叫做“数据”而不要与“信息”规定在一起,确定衍生数据的属性是智力成果,据此建立数据专有权,与著作权、商标权和专利权等知识产权并列,成为知识产权中的一种独立权利。



    关注 民法牛


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册