整个大数据有一个核心理念,就是开发流动带来价值,每个数据是有限的,怎么实现流动呢?比如说我们给独立电商服务,每天大概2000万独立UV,使得我们让这些电商享有一个共同的IV,换句话说,比如说你是一个有名的电商,可能一个对你来说全新的顾客进到你的店里,但是他曾经已经在阿迪达斯、耐克浏览过一些篮球鞋他没有买,可能觉得价格贵或者款式不合适,在你的首页手面会给他推荐一些李宁的篮球鞋,通过这些数据,可以使得没有办法跟天猫、京东抗衡的独立B2C电商,能够大幅度提升单位流量转化率,因为他贡献了自己的数据,同时也使用到其他电商贡献的数据,因为进到他这里一个新用户,对于他来说是新用户。
做大数据是需要基础,我们要了解用户,不仅需要了解他在网上浏览行为,我们要了解他价格的偏好,对商品的偏好,我们甚至要知道他所用的手机设备,他到底设备里面,有没有电子商务支付的终端?有没有支付宝,有没有银联支付?他到底在手机上有没有唯品会、京东、天猫这些购物入口。这些东西都可以通过大数据分析进行统一布局。我们不仅自己拥有我们本身的500多家电商客户,和300多家客户数据,我们同时还拥有移动互联网最大网络平台,通过这个我们了解每一个手机背后的人他使用习惯,利用这些更好了解客户,这些都是使得我们能够真正,把每一个流量价值发挥到极至。
与此同时我们第二个基础,我们还需要一个很好的数据管理平台,不仅仅是数据分析,我们实际上是全世界数据中心变化保持者,但是仅仅有一个数据中心是不够的,更重要是我们要有一个非常好的,管理和运用大数据的平台。当我们的数据来了之后,我们通过三种机制,根据不同算法需求导入到平台中,进行分类,然后利用三个数据挖掘系统,推动引擎系统和用户分析系统,进行简单的分析和算法,算法得到结果,通过不同API推荐广告,包括推荐广告统计分析,权限管理等等。相对我们支持各种行业模型,有了这样一个统一的大数据管理平台,它才能够支持电子商务,以及其他的,包括医疗、金融等等大数据应用。
电子商务应用产品很多,我这里不多说,比如说我们在360上可以买到一些广告位,你通过你精准办法可以提高ROI,从而获得差价,还可以给团购推一些你所喜欢的团购,或者你看单品可以给你推你喜欢的单品,以及推个性化的商品等等。
我这里简单最后花五分钟时间,介绍一下我们常见的电子商务大数据方法。
最简单的电子商务用的最多的是搜索和推荐,推荐最直观方法是找到一些关联,比如说买了A商品的人还喜欢买B商品。现在买了三个月婴儿奶粉,半年以后买九个月婴儿奶粉,同时我们用更复杂办法,比如说你点A的东西,你找某些人购买兴趣跟A相似,把他们喜欢买的A都买的推荐给他。或者A买的商品中,看哪些商品跟这些商品可以共同购买。当然这些方法已经有十几二十年的历史,但是我们这两年进行改变,比如说基于类别推荐、品类数推荐,基于传导扩散的推荐,基于热导扩散推荐,利用这些方法我们可以提高推荐精确度并且提高用户体验。
与此同时在简单推荐引擎我们有两个例子,左边这个例子是淘宝,淘宝我们做了这样的技术。左边这个是我们在给淘宝用户推产品的时候,我们首先挖掘用户在淘宝上搜索的文本词,确定他感兴趣的类目,排出隐私类目,比如说医疗、或者棺材之类我们不送,这个时候我们再找出浏览最多的类目,给你进行个性化推送。
这种场景引擎会带来巨大的变化,比如说以前打开大概是15%左右,在使用了这种引擎,一个产品对用户进行建模,而且它的转化率从6%提高到8%,这两个在一起就带来了基本上是翻倍的增长。
另外我们给用户建立了一个情景引擎,我们猜这个用户他到底是买还是不买?如果一个女孩子看牛仔裤老是看类似宽型,我们看她每两次观看的聚焦,我们就认为她购买,反过来她两次差异很大,我们判定她不买。我们分析用户喜好买或者不买,我们把用户建模之后,我们可以大幅度提高整个推荐用户订单的成功率,我们这个数据用户一下从4%点几提升到13%,仅仅就算法还不够,我们还要跟用户建立场景模型。
最后我们还有一些复杂方法,比如说挖掘搭配,怎么样把传统人工编辑变成机器学习,利用主流时尚杂志或者购买纪录我们自动进行搭配,这种搭配带来的效果,比人工编辑搭配效果更好,同时工作量下降到原来的1/50。