随着互联网技术对社会各行各业产生意义深远的撼动,甚至颠覆性的变革,大数据成为出现频率最高的词条之一。对于大数据的重要性,中国知名投资人田溯宁将其称之为人类发现史上的重大里程碑,并将引领人类进入一个全新的时代。我个人也认为,“大数据”这一概念的提出以及揭示出的一种信息存在,构成人类对客观世界认知的再一次重大挑战和撼动,引发人类的哲学思考,并重新审视那些最基本的哲学问题,我们的世界由什么构成?我们的存在由什么所决定?随之而来的是,对我们现行法律框架的重新审视及思考。

“数据”与“信息”:有区别吗?

数据(data)和信息(information) 有区别吗?在一些英文字典中,大家试图区分数据和信息的区别,并解释为数据多半指原始的数据,而信息指经过处理后得到的有意义和价值的东西。[1]

这一区分在中文的语境中似乎并不符合实际。例如,我们把原始的个人数据也习惯性地称为“个人信息”或“隐私信息”。数据库和信息库,在中文语境中也常常并没有什么不同的含义。

更进一步,这些区分似乎在互联网和大数据的时代似乎更没有什么意义。当时数据量达到一定的程度而能够被称其为大数据之后,数据本身就是信息。同时,数据可能会被多次处理和利用,而这些被处理利用的数据可能直接成为对实际生活产生意义和价值的“信息”,这些所谓“信息”也可能成为再次被分析利用的“数据”。

在法律层面,我们在法律行文中可以见到“数据”和“信息”都被进行使用,但并不存在显著的含义差别。

“大数据”及“数据”:一个字造成的大不同

数据和信息作为一种存在已有久远的历史。部分数据类型被法律所特别界定,成为法律关系客体的一种形态,被纳入法律体系中进行特定的规范或保护,例如人类智力劳动的产物——知识产权,以及与人类主体密切相关的隐私信息等。除此之外,普通数据并未成为法律制度中一个独立的客体被加以规制和保护。

承认人类智力活动的结果(智慧成果)可以作为一种区别于物质以及人类自身的独立存在,并构成客观世界的一部分,这在哲学层面体现了人类社会认知世界的重大进步和突破。而知识产权法律制度只是在这一哲学框架下被随之设计出来以处理相应法律关系的规范。但是知识产权体系所规制的数据类型非常特定,仅仅限于人类智力活动的成果。

而另一些类型的数据,被作为与人类自身主体特征相关的信息被加以保护和调整,例如个人隐私信息。随着互联网的出现,更出现了与隐私信息相关却不完全重合的“个人信息”的概念及其相应的保护和规制。

然而这一状况将随着大数据的出现而发生改变。随着数据产生的规模呈现爆炸性、持续的增长,收集及处理数据的新技术的不断成熟完善,数据的存在价值渐渐得以验证和彰显。数据本身可以作为一种独立的客观存在,难以被人忽略。

但是,虽然仅仅是在“大数据”概念出现后,人们才开始热烈地讨论和正视数据这样一种客观存在。但是,大数据是一个技术及商业概念。在我们审视法律制度的时候,是不是只有“大数据”才是重要的并且应当得到法律的规范和调整呢?大数据是否具有必要的法律含义呢?我认为并非如此。数据,应该才是我们应当关注的法律客体。“大数据”,应当只是法律客体的一种存在形式。但同时,是大数据这样一种存在方式第一次引发了我们对数据的财产价值进行承认和保护必要性的思考。

我认为,在目前法律体系中很多未能得到很好解决的问题,其实都可以纳入数据的范畴进行调整和规范。例如争论已久的虚拟财产问题,网络个人信息问题,遗传信息问题等等。认识到数据将持续成为人类未来世界的一个重要组成部分,现行法律体系需要在体系上确认和承认“数据”作为一种与传统财产如“土地”、“设备”、“知识产权”等并列存在的财产形式,并设计一套适应于其特征的有关获取、交易、处分等的法律规则,而并非“头痛医头”地针对部分数据进行救火式的补丁单项立法(例如针对个人信息出台互联网信息保护法、针对虚拟财产进行单独立法、针对遗传信息进行单独立法),以避免立法缺乏应有的内在逻辑性和整体有序性。

物权、债权、知识产权、人身权?——数据的法律属性

关于“大数据”的内涵与外延,存在多种解释和定义。这些定义多半是从人类通过技术感知、并通过技术处理之后产生的商业价值等人类对其的使用和处理手段的角度进行界定。例如最常被引用的IBM对大数据给出的4V特征,即大数据量(Volume)、快速变化(Velocity),庞杂内容(Variety)和(不)精确性(Veracity);Gartner所定义的“需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产”;

麦肯锡所定义的“一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。”

这些定义基本都是从数据本身的存在特性来进行描述,例如数量、内容等,并未从数据的产生方式、所描述的对象、以及其法律属性进行描述和定义。

从法律视角审视,目前我们在大数据时代所面临的“数据”将具有如下几个特征:

  • 数据外延无限广泛,可以包括任何与人自身、人的行为、心理、精神世界及智力活动及其所产生的成果、物质世界(包括除人之外的任何生物及物质存在)等所有范畴;
  • 数据规模和数据量巨大;
  • 具有财产价值及属性,具有使用价值和交换价值;
  • (4) 具有与知识产权等类似的可复制、传播和重复利用性。

当我们审视具有以上特征的一个新的独立存在时,不禁愕然发现在现有的法律制度体系中竟然没有它的容身之处:我们目前的民事法律制度在关于财产的相关制度中并无处安放这样一种特殊的存在。无论诉诸哪一种制度,仅仅只能覆盖到数据中的某一种类型或存在,而不能给予数据一个完整全面的规制和保护,更不能适应以上“大数据”概念中所描述的数据新特点,例如低密度价值、不精确性等。

首先,数据显然不具备有形财产的特征。虽然数据的载体都属于法律体系中的有形财产范畴,并可以通过物权规则进行规范。但数据本身并没有有形物的特征,难以通过物权法进行调整和规范。

数据也不能很好地利用现有知识产权制度来进行规范和调整。如前所述,知识产权只能覆盖数据中一些非常特定的类别,如符合条件规定的商业秘密信息,或者符合“数据库”定义的著作权下的汇编作品。对于一些具有高度创新性的数据发现,例如人类DNA信息是否能授予专利权保护,也因为其“发现”属性与专利制度天生设计初衷相违背而饱受争议与纠结。此外,这些法律概念的出现都根据大数据出现之前的环境和模式进行规定的,在今天的社会背景下很难适用。例如,大部分数据并不能符合商业秘密的高门槛保护,包括“保密性”、“不为公众所知悉性”等要求。而著作权体系下“数据库”作品,一般仅能享受到汇编作品所享有的对于信息的“选择”和“编排”方面的权利,而难以延及数据本身。

  • 数据当然也不能在人身权的范围内解决。因为只有那些属于个人隐私的信息,才能在人身权的范畴内得以纳入保护和调整。甚至传统的隐私权因为范围如此狭窄和有限,中国不得不通过立法的方式另行创设了“个人信息”这样的概念,来对此进行规范和保护。但是,根据现行《全国人大常委会关于加强网络信息保护的决定》,获得保护的信息范围仅限于“能够识别公民个人身份和涉及公民个人隐私的电子信息”。

目前,数据得以纳入法律调整的方式是作为债权的客体。这也是目前数据在收集、加工、分析、交易环节中主要采取的法律规制方式。例如,《全国人大常委会关于加强网络信息保护的决定》规定,在采集个人信息的时候,需要征得被收集者的同意,一般理解为可以通过合同的方式获得该同意。此外,大量数据在协议的约束下进行商业的传输、处理、加工和分析。而数据进行汇集处理后产生的大数据集合、或者数据加工后产生的结果信息,也通过协议的方式进行自由交易和流动。

然而仅在债权范畴对数据进行规制和调整显然并不能满足数据产业未来的发展。例如,债权的调整仅仅具有主体相对性,而缺乏对世权的绝对保护。因为没有确认数据的财产属性和地位以及相应的所有权制度,因此,如果发生数据财产被复制、窃取、截获等情形,将难以诉诸现行法律的保护。而数据在被进行加工和处理后所产生的数据商品,由于没有确认数据在法律上的财产属性,其评估、交易、作价等方面都将缺少法律依据及相应的会计规则。争论已久的虚拟货币、虚拟财产问题,其实本质上也都可以归因于现行法律体系对于“数据”这一客观存在的缺位。

你的,我的,还是他们的?——数据的所有权问题

数据的所有权问题十分复杂。就以个人信息而言,个人的信息属于个人吗?那么,如果征得被收集者同意后进行收集的数据,数据收集者享有数据所有权吗?个人给予数据收集行为的同意,是否具有数据权转让或许可性质上的法律意义?

在界定数据所有权问题上,需要与现行法律制度中的人身权制度对接,并可借鉴知识产权制度的设计。

在数据中与个体主体相关的特定信息(例如遗传信息、个人信息、医疗信息、隐私信息等),仍然可以在人身权的范畴内进行保护和调整,这取决于社会总体价值取向中对于主体人权的保护是何种状况。而数据中的其它类型,例如关于客观物质世界的信息、人类行为的信息、人类智力劳动成果的信息,则可以考虑比照知识产权制度中的专用权制度进行人为设计。既能够保障数据的收集者、处理者、分析者能够因为自己的投入和付出获得相应的财产权利保障,又能够保障社会公众利益及他人自主进行收集、处理、分析的自由权利。

此外,鉴于某些数据的产生和收集具有唯一性和不可重复性,随着数据产业的不断成熟发展,未来可能还需要对某些数据的所有权保护及许可、流转等设定相应的类似反垄断的规则,确保数据信息能够最大程度地被加以利用和开发,防止数据垄断的情形出现。

结语

小说《三体》中有这样一个情节,只携带了生物遗传信息的云天明大脑,能够被人类发射到未知的宇宙空间,并据此被外星��物以普通物质重新生成一个“云天明”复制人。这其实并非什么奇谈怪论。从另一个角度来审视我们世界,我们的世界构成除了基本的物理组分,也许就是“数据”或“信息”这样一个存在。它能够使相同的碳原子、氢原子、氧原子,在不同的遗传信息的指挥作用下变化生成为不同的物种、物质、人类。而当你能够掌握的“数据”逼近无限时,你就能够逼近还原、重现一切历史及现实,包括所有的人、行为、思想、物质环境、一切的一切。一直潜藏在人类意识深处模糊不清的、我们奉为最高的的所谓的“造物主”、“神”或“罗格斯”,是否就是那个最终的数据集合的本源?

从数据到大数据,在这个数据为王的时代,数据第一次以一种独立存在的面目引起世人关注。我们世界的本质到底是什么?这是数据带给今天人类的哲学迷思。