人民日报社中国经济周刊官方网站  中央新闻网站  互联网新闻信息稿源单位

经济网 中国经济论坛


首页 > 周刊杂志 > 正文

数据为王 | 如何让数据像石油一样被交易?(2)

数据该如何“确权”?如何让数据像石油一样被交易?

如何让数据像石油一样被交易?

数据定价是个难题?

2017年数据行业充满了对数据所有权的纷争,其中以华为与腾讯、菜鸟与顺丰之间的争夺最为激烈,业界对打造“开放共享的数据生态”的期待也始于此。然而对视数据如生命的商业机构来说,无条件地开放共享自己所拥有的数据几无可能,一套有条件的“有价共享”的数据流通规则成为多数业内人士的共识: 即在各市场主体之间达成协议,进而达成行业内有普遍共识的行业协议,形成一套包括定价机制在内的数据流通规则。

有业内人士向记者透露,腾讯曾就与华为之间的数据纠纷提请工信部进行裁决,工信部坚持此事以市场经济规则解决,即涉事双方互相协商,争取达成行业内的一致意见。

与早就实现标准化交易的石油相比,数据的定价问题始终是个难点,也是重点。有分析认为,鉴于数据本身的丰富性和复杂性,即便企业出价从外部购得新的数据,嫁接在自身数据之上,很可能产生不知如何使用、不知如何发挥最大价值等问题,所以对数据价格不知该如何确定,于是将自身数据都“据为己有”,有意回避公开交易机制,成了商业机构自保的一种选择。

中国人民大学金融科技与互联网安全研究中心主任杨东告诉《中国经济周刊》记者:“数据交易双方信息不对称,这种不对称与实物商品交易中存在的信息不对称有所不同,不仅买方对大数据商品的价值不确定,甚至卖方对其拥有的大数据也无法做出理性评估。”据了解,目前数据行业中尚未形成较为统一的定价机制,大多数交易以协议定价和拍卖竞价及固定定价进行。

“我们从来没有从外部采购过数据。”丁香园创始人李天天告诉《中国经济周刊》记者,在数据交易中经常出现“我买来之后发现其实这段数据并不是我想要的,于是我觉得买亏了”,以及“你认为不重要的恰恰是我认为非常重要的”等认知不对等、信息不对称的问题,出于谨慎以及医疗数据的特殊性,丁香园没有对外采购过数据。而与买卖双方以及行业内部自行协商搞出一个价格相比,李天天更倾向于一个第三方交易机构专门就数据的定价做出一系列标准,然后大家共同执行。

“我想我们的使命也是如此。”李天天的想法与汤奇峰不谋而合,汤奇峰认为,企业与企业之间一家家地谈价格,首先在时间上是浪费;其次,某一家企业不可能掌握与数据行业有关的所有动态,而数据交易机构的专业性和信息的准确性及完整性都可以支持其掌握买卖双方的信息,进而逐渐形成买卖双方都认可的市场化定价机制,而非掺杂了较多主观化甚至情绪化的定价行为。“通过我们的打包和其他各种技术处理,形成标准化的各类‘数据商品’,进行自由流通并不会是特别遥远的事情。”汤奇峰说。

数据该如何进行标准化的交易?

石油的标准化交易由美国标准石油公司经过一系列的技术改造得以实现,“标准石油”名如其实,1911年,标准石油公司被美国联邦最高法院以反垄断为由分拆成34个独立公司。

“与石油相比,数据难以进行标准化交易。这与数据本身的定价难、存储载体难以转移以及数据一直在实时更新有关,而这些是不会发生在石油身上的。”中国人民大学金融科技与互联网安全研究中心主任杨东分析说。

如何将数据变成像石油一样可进行标准化、商品化的交易?

据了解,我国与数据有关的交易平台数量在2017年年末已达到30个,包括北京大数据交易服务平台、长江大数据交易所、东湖大数据交易平台、上海数据交易中心等,其中也不乏贵阳大数据交易所这样的“明星项目”。

作为全球第一家大数据交易所,贵阳大数据交易所于2015年4月14日正式开业,其官方网站披露,截至2017年10月,累计交易额1.2亿余元,交易框架协议近3亿元,发展会员超1500家,接入225家优质数据源,可交易数据产品近4000个,可交易的数据总量超150 PB。但与企业所掌握的数据相比,联想一家就拥有超过12PB的数据,每日新增的数据量超过30TB,贵阳大数据交易所掌握150PB的数据总量并不算高。

“总体而言,数据交易额较小、数据来源比较狭窄,数据交易所与我国的其他机构产生的海量数据相比只是冰山一角,目前的存储技术也难以支持数据如同U盘一样‘即插即用’。”杨东表示。

有互联网公司高管曾对记者说,企业拥有的数据必须是“活”的,“数据是有时效性的,半年不用,有效数据可能只占原来的50%;3年不用,有效数据可能只剩下10%。”

一个好消息是,在前一个阶段的探索下,数据交易从概念到落地,部分省市和数据企业在定价和交易标准等方面有了一些成果,催生了体量相当可观的大数据交易行业。据贵阳大数据交易所发布的《2016年中国大数据产业白皮书》统计,2015年我国大数据相关交易的市场规模为33.85亿元,预计到2020年将达到545亿元。

“要想促进数据交易行业的繁荣,很重要的一个环节是把原始数据‘封装’成为可供交易的‘源数据’,其中涉及一系列的‘清洗’和‘打包’技术,这一点上与石油的提炼和萃取有点相似。”上海数据交易中心CEO汤奇峰告诉《中国经济周刊》记者,目前他和同事所做的一项重要任务就是在数据的流通环节,对组织定价、隐私保护、数据质量以及与开放共享有关的数据流转等环节进行一系列标准和规范的探索。

如何打破“孤岛”和“烟囱”?

除交易流通机制外,“打通信息壁垒,形成覆盖全国、统筹利用、统一接入的数据共享大平台”也是习近平总书记在中央政治局集体学习中明确提出的要求。

汤奇峰认为,与商业机构之间的数据交易流通相比,掌握在政府部门、国有企业和公立单位手中的数据在数量上远远超过商业机构所掌握的数据,打破信息壁垒,形成覆盖全国的数据共享大平台应在公共属性较强的数据类别率先展开。

以公共属性较强的医疗领域数据共享平台为例,我国从2014年就已着手布局。2014年7月,国家卫计委提出“46312”工程,即4级卫生信息平台、6项业务应用、3个基础数据库、一个融合网络和两个标准体系,其中“一个融合网络”近似于全国统一的医疗数据平台。在具体实施过程中,各地方因地制宜地做出了一些升级和优化。温州市卫计委信息中心主任何耀平告诉《中国经济周刊》记者,该市在市、县两级数据平台的基础上进行了融合,温州市的市、县两级医疗卫生机构共享同一个数据平台。

“国家要全面地掌握公共属性极强的数据。公共数据归国家所有,也是数据确权的题中之义。”作为“46312”工程文件的起草者之一,浙江省卫生信息学会秘书长倪荣博士告诉《中国经济周刊》记者,几年以来随着云计算技术的提升以及体制外医疗机构(如微医、好大夫、丁香园等)的“倒逼”,“46312”只作为一个顶层设计的框架方案存在,一些地方政府在此基础上进行了必要的优化和升级。“要解决的问题没有变,就是打破数据孤岛,形成全国统一的数据平台。”

“信息壁垒”目前普遍存在的形式是“孤岛”和“烟囱”。

以医疗行业为例,医疗机构的数据目前与社保体系间互成“孤岛”,卫生管理部门和医疗机构自身所掌握的数据间互成“孤岛”。即便在多家医院构成的医联体内部,目前仅能实现互传数据,但无法做到“互操作”,即互相修改对方提供的数据,这也是一类“孤岛”;而较典型的一类“烟囱”则是传染病直报系统,因为传染病数据的特殊性,该系统可将信息由全国任意地方“一竿子杵到底”地直接上传至国家级平台,但该系统独立存在,与医疗行业的其他数据系统和社保系统都不打通。但是一些不特殊的直报系统类“烟囱”应该被“拔除”,产生的数据应该共享。此外,新成立的社会医疗机构,如微医、丁香园和好大夫等渐渐占据较大市场规模,连接了诸多患者和医生,这类机构各自掌握的数据也是一定意义上没有打通的“孤岛”。

“信息壁垒”还带来公立医疗机构与市场化医疗企业间信息是否可以共享的问题,不乏商业机构用非法手段“打破”信息壁垒的案例。

2017年10月,浙江杭州警方就破获了一起某科技公司利用权限便利和系统漏洞,从浙江某疾病预防控制部门网站非法下载接种疫苗儿童及其家长个人信息,后贩卖获利的案件,最终有39名犯罪嫌疑人落入法网,有关部门查获非法获取的公民个人信息370万余条。“某一地区的居民健康信息对医疗企业来说肯定有巨大的商业价值,如果将来能建立起正常的数据交易机制,商业机构可以合法地从公立机构购得这部分数据用于商业开发,对双方来讲都是很大的方便,但这部分机制目前还是空白。”倪荣对记者表示,他希望在大数据战略的继续实施中,能不断打破“壁垒”,解决上述问题。

从德雷克在美国宾夕法尼亚打出第一口现代工业油井算起,现代石油业用了十几年的时间实现了标准化自由流通,业内人士普遍认为数据的这条路所用的时间可以大大缩短。“习近平总书记提出的数据确权、交易流通等机制的建立,正是数据交易市场中亟须解决的难题,国家将数据资源共享开放放在国家战略层面,是所有数据企业的福音,应该为此做好准备,迎接一个具有非常广阔前景的数据交易时代的来临。”京东集团副总裁、大数据研发部负责人翁志表示,数据交易市场机制的建立是个过程,可喜的是国家已经在逐步加强这方面的立法和监管,“在逐步尝试建立相关机制时,技术的进步也日新月异,相信应该很快能解决我们遇到的问题。”

上一页 1 2下一页

中国经济周刊-经济网版权作品,转载时须获得授权并注明来源,违者将被追究法律责任。

(网络编辑:贾璇)
作者
  • 微笑
  • 流汗
  • 难过
  • 羡慕
  • 愤怒
  • 流泪
0