根据《2015年中国大数据交易白皮书》透露的数据,2014年中国大数据市场规模达到767亿元,同比增长27.83%。预计到2020年,中国大数据产业市场规模将达到8228.81亿元。随着IT时代向DT时代的转变,中小企业对数据的需求日趋增长,大数据交易已上升为国家战略,2015年4月贵阳大数据交易所成立,李克强总理亲自做批示。同年10月发源地大数据交易平台正式上线。
作者采访到发源地创始人CEO马建军。发源地大数据交易平台以服务中小企业解决数据源供需为主,致力打造国内领先的大数据交易平台。互联网开放数据、企业/机构的内部数据等数据源,经过发源地SaaS采集引擎接入后,以数据、API和挖掘算法等形式沉淀在交易市场,提供给数据需求方,满足需求方对数据分析、API调用、运营数据、客户营销等方面的数据需求。
针对大数据交易中存在的几个关键问题,如:数据交易的现状、交易中的隐私版权等问题,作者率先提了出来。
马建军认为,目前数据交易主要还是通过QQ群、威客、淘宝等传统平台。对需求方来说,成本高、效率低,交易无保障,无法动态更新。对数据供应商来说,存在数据资源无法复用的问题。据权威报道现今企业数据的利用率还不到30%。
关于“大数据交易中的隐私安全”也是众多企业关心的问题,马建军介绍说:开放性数据源一般不存在这个问题,用户在网上自愿公开的信息是默认开放的。对于非开放数据,发源地已经有完善的数据技术脱敏方案,保障数据交易不侵犯任何个人隐私。数据交易的双方无需担心隐私安全问题。另外马建军还补充道:对于数据版权问题,发源地采取合作的方式,其中平台开发者使用SaaS引擎采集接入的互联网公开数据,发源地也会提供“认领”服务,保证数据源供应商利益。
客户最关注的收费问题,马建军介绍:发源地目前不会对数据交易双方收取佣金,主要为了吸引数据供需双方促成交易,减少数据供需双方的成本。而且佣金模式的变现能力有限,为用户提供延伸服务,整合多边,才是发源地谋求盈利的着重点。在数据和交易沉淀的同时,发源地提供和继续开发增值服务,如SaaS工具引擎增值、交易和定制流程增值、为企业搭建私有云等。发源地未来会在数据处理、数据储存、数据托管等服务上收费。
在发源地平台,作为数据需求方,可以购买现成的数据产品或发布数据定制需求,也可以直接使用SaaS引擎进行数据的采集挖掘。作为数据供应商和开发者,可以在发源地平台发布供应数据源或数据加工产品,也可以接需求者发布的定制订单。发源地数据产品交易流程为:数据接入(SaaS引擎采集和数据上传发布)→数据加工(数据去重、清洗、脱敏处理和数据动态建模)→数据交易(数据、API及算法规则)。定制流程采用威客众包UGC模式,最大化降低供需双方成本。马建军强调:由于数据对行业的高要求,只有UGC众包的方式才能更好的满足数据的多样性及深度挖掘需求。
发源地大数据交易平台的优势是有自己的SaaS引擎,支持海量数据的分布式采集、计算及处理。类似36氪此前报道过的国外企业刚刚完成1300万美元A轮融资的Import.io。供需对接模式方面类似大数据行业的猪八戒网(国内最大的服务众包平台,15年6月完成26亿人民币的C轮融资)。发源地未来将基于其SaaS引擎打造集数据获取、仓储及应用市场于一体的综合性数据服务平台。
发源地团队核心成员来自于腾讯、百度、阿里、IBM等公司。创始人马建军是一名连续创业者,拥有八年数据服务行业经验。此前曾供职于腾讯。几位合伙人均在大数据领域有着丰富的从业经验及人脉资源。团队此前已获得过国内著名投资机构的投资。目前发源地已积累了近4万企业客户,沉淀超过6000个数据源。单笔最大交易额度达20万。马建军对作者表示,平台正面向全国招商代理,今年目标实现5000万流水,并实现盈利。同时正计划启动新一轮融资,投资机构需对数据行业有理解、沉淀或资源。该笔费用主要应用于平台及SaaS引擎的研发、服务器资源投入、品牌推广宣传等。
国际数据公司(IDC)的报告显示,中国大数据市场规模未来5年的复合增长率达51.4%。贵阳大数据交易所、上海数据交易中心、中关村大数据交易等有官方背景的数据交易平台也相继建立,数据交易将会越来越火热。