回首过去十年,我们见证了大数据从概念诞生到行业落地,逐渐发展到基于数据中台驱动决策的数据智能时代。作为后互联网时代的产物,数据智能必将是未来很长一段发展阶段的核心所在。
每日互动(个推)作为数据智能行业的代表企业之一,于今年迎来了第一个十年。在这十年间,个推以消息推送起家,借助技术力量拓宽以数据智能为核心的业务范畴,现已成长为一家在A股上市的数据智能企业。
但"数据智能"这个词,对于大众来说仍然相对比较陌生。数据行业从业者如何定义"数据智能"?过去的十年间,个推经历了怎么样的发展历程?
在个推十周年之际, SegmentFault 思否带着以上这些问题,对个推 CTO 叶新江进行了一次专访。
一、何谓"数据智能"?
随着移动互联网时代的到来,互联网内容传播和展现形式发生了巨大的变化,也让数据的量级和形态发生了改变,数据服务也随之发生了转变。传统的数据服务基本只针对于数据本身,而数据智能作为一种由数据、算力和算法等驱动的技术手段,具备着赋能企业进行管理和决策的能力。
1、数据智能是今年非常热门的一个话题,能否谈谈对于「数据智能」和「数据中台」的定义与理解?
目前数据经济在国家层面是一个非常重要的发展方向,但同时也延伸出了一个亟待解决的问题 -- 如何把各个行业的数据作为生产要素,通过数据治理发挥出更进一步的作用。
针对看不见摸不着的数据,需要有一个东西能进行有感管理,数据中台就是一种用来进行数据治理的产品或者平台,而数据智能则属于一个更为广义的范畴,它是以数据作为生产资料,通过结合大规模数据处理、数据挖掘、机器学习、人机交互、可视化、云计算等多种技术,从大量的数据中提炼、发掘、获取知识,为人们在制定决策时提供有效的支持,减少或者消除不确定性的解决方案。
这两个词看起来很接近,但其实是不同维度的。以我们公司来讲,数据中台更多的是一个产品,体现了我们公司的数据能力;而数据智能则包含更多技术,融合了更多的行业知识,中台是其中一个很重要的工具。打一个形象的比喻,数据中台或者平台是一个电脑的操作系统,而数据智能则是结合业务,使用这个电脑,利用多种技术进行APP开发,并且不断进行优化的过程。
2、您认为数据中台的「行业壁垒」和「技术壁垒」分别是什么?个推作为一个成功上市的专业数据智能服务公司,自身在这个领域内具备的最大优势是什么?
目前市面上有很多数据中台类的产品,据我们观察,其中大部分的重点仍主要聚焦于数据治理的能力,但这可能只是数据中台的"第一步"。
对于数据中台产品来讲,技术壁垒可能并不是很高。中台会应用到的技术,虽然有些功能可以通过直接使用开源产品来实现,但也有不少标准或者要求,比如安全性、实时性、可视化能力等,需要专业的技术来定制实现。
当然在数据中台层面,采用的技术架构不同、产品设计的理念不同也是可以有差异的,譬如是否容易使用、容易理解、对资源要求是否经济等。
如果希望通过数据中台中来解决业务问题,实现降本增效或者发现新的业务模式,这就不是数据治理能解决的问题,需要有对行业的深度理解,也就是所谓的行业壁垒。
个推和其他大数据公司的差别,就体现在如何挖掘数据价值的层面。
个推的第一款产品是消息推送服务,这是一项跟数据紧密相关的业务。为了支撑这项业务的进行,实现消息推送在海量数据量下的快速响应,个推一直在尝试为企业内部打造一个业务 + 数据平台的协同闭环。这也为之后公司推出数据服务产品打下了很好的基础。
在数据服务层面,个推既是服务的提供者也是使用者,这是我们在这个领域内最大的优势。
3、数据服务领域是否有一套标准化的判定体系?如何评定服务能力与技术水平的高低?
数据服务领域暂时还没有一套国际或者国家权威机构提出的行业标准。究其原因,是因为数据服务在不同的行业间有着很大的差别,与一般的技术体系相比,具备更强的服务属性。
对于客户来说,挑选数据服务的时候会有几个考量的维度:
平台是否可以快速部署;
部署所耗费的资源是否合理;
能否借助数据服务快速实现业务提升;譬如是否能快速开发出业务的新需求,是否能很好地完成内部各个角色之间的协同。
这三项标准会是客户选择服务时的决策依据。但在选择完之后,服务商应该如何完成、如何实现客户提出的需求,因为没有清晰的界定与评判方式,需要客户在选型时进行综合性的考虑,并在后续实际的业务场景中去感受平台的服务能力。
这种情况其实也和市场需求有关。目前国内企业提出的需求都较为"定制化",再加上不同行业间的差异,导致国内的数据服务公司大部分是结合行业提供垂直的数据服务能力。
二、个推发展的每一步,踩的都是行业需求
我国的数字经济发展才刚刚开始,数据智能服务的能力也在不断迭代、发展。人工智能、区块链、知识图谱、可视化等新兴技术,都可以作为底层的技术支撑为数据智能服务赋能,从而让我们的数据服务具备更强大的能力,产生更多价值。
1、个推的发展经历了多个阶段,技术也在不断迭代和演进。能否简要分享一下不同阶段的业务逻辑重点以及技术研发重点?
个推是我们的消息推送产品,做得比较早并且比较成熟了。但其实我们公司发展到现在已经十年了,业务范畴也早就不止是消息推送了。
公司发展的第一个阶段是 2010 年到 2013年。当时我们的核心团队主要是在打磨消息推送的能力,也就是一套大规模的通信系统 + 互联网搜索系统,这是一个比较垂直但对于技术要求很高的领域。
2014年至2018年,公司进入了数据价值的"掘金"与"实践"阶段。在不断精进推送能力的同时,我们发现系统产生了非常多的数据,如何让这些数据发挥价值成为了我们需要思考和解决的问题。也是从这个阶段开始,个推开始致力于大数据系统的研发。
个推的消息推送产品每天会产生几十个 T 的数据,如何存储、清洗、建模,如何在业务场景中产生商业化的价值,这是这一阶段我们的研发重点。经过几年的业务培养与场景实践,我们将在数据服务领域沉淀下来的能力和 know how(知识、经验、流程) ,变成一种可以服务于更多行业的产品,可以说公司正式进入到了数据智能的阶段。
2019年3月,每日互动成功在A股创业板上市,也引起了数据智能领域的一次新风潮。
在今年的疫情过程中,个推数据智能的能力得到了相当程度的验证。疫情期间,我们与李兰娟院士取得联系,与李兰娟院士团队合作成立联合战队。通过大数据技术,联合战队对疫情发展态势进行了研判,帮助疫情防控部门找到工作重点区域、重点人群和重点场景。在全国逐步有序恢复生产的时候,个推也充分发挥大数据能力并参与其中,为多个省份的疫情联防联控与民生保障、复工复产的有序统筹提供了决策参考依据。
当然,个推的数据智能服务仍然是在不断迭代发展的。随着人工智能、区块链、知识图谱、可视化等等新兴技术的发展,这项基于数据的服务也将产生更多的价值。
2、个推致力于打造"每日治数平台",目标方向是什么样的?与一般的中台产品有什么区别?
「每日治数平台」其实也是数据中台的概念,但我们提供的数据服务主要是应用于数据治理领域,所以命名为治数平台更为准确。
这个平台还有一个提炼后的名字 -- DMP。D 代表了数据(DATA),M 代表了 机器(MACHINE),而 P 则代表了人(PEOPLE)和专业(PRO)。这几个关键词也代表了我们平台的定位,即数据作为底层资料,快速专业地服务于具体业务当中。
我国的数字经济发展其实才刚刚开始,据了解,不少企业并不知道该如何进行数字化、智能化的转型,业内也缺乏专业的数据人才。
因此,我们的目标方向和传统的数据中台不同。我们希望真正将个推 knowhow 的能力沉淀下来,形成客户可以复用的服务或平台产品。之所以想要打造这样的一个平台,背后其实也是基于用户的实际需求。
3、个推的第一个客户是哪家企业?
个推消息推送业务的第一个客户是新浪微博。当时微博非常火,有着上亿的用户量,消息推送对他们来说是不可或缺的一项功能。
2011年,我们主动联系了微博相关业务的负责人,表示可以提供专业的消息推送服务,用更低的成本来实现更好的效果,这也是我们能够打动他们的原因。
之所以第一个客户就敢挑战"行业顶配"的难度,一方面是技术团队自身具备扎实的技术基础和行业基础,另一方面就是前面提到的,我们在支持自身业务的过程当中沉淀下来的数据和技术能力。
有这样一个需求明确的大客户,让我们的技术服务能力得以更加高效地迭代,大大加快了技术进步的速度。
接受挑战并做到"极致",正是我们公司的工程师文化,对此我们感觉很自豪。
4、目前面向的客户群体有哪些,涉及哪些领域?
随着数据能力的增强,以及对于行业理解的不断加深,我们目前的服务客户已经扩展到四大领域 -- 互联网、公共服务、风控服务和品牌营销服务。
以金融领域为例,很多金融机构内部有自己的 App,涉及推送、统计、分析之类非常繁复的数据和信息处理场景。我们帮他们打造了一个集成的消息平台中心,解决了消息处理的分散问题,改善了工作流程。在深度沟通之后,我们发现数据智能服务在金融行业中是一个非常重度的业务场景,为此我们也在考虑开发专门针对金融行业的治数平台。
5、对于数据公司来说,数据安全是红线。个推如何保障数据安全性?
个推团队自建立之初,便非常注重对于数据安全的保障。正如问题所说,数据安全对数据公司来说是红线,个推始终认为保护用户数据隐私是企业必须要坚守和捍卫的行业准则、道德底线,并要时刻保持对数据安全的敬畏之心。
个推在严格落实合规和监管要求的同时,倡导行业自律,积极联合行业伙伴的力量,共同推动行业的健康发展。今年8月,由个推牵头起草的《信息安全技术移动互联网应用程序(App)SDK安全指南》国家标准项目,获得全国信息安全标准化技术委员会正式立项,这将有助于SDK行业在开发、运营、信息处理、安全管理等环节向更规范的方向迈进。
在今年的国家护网行动当中,个推在三四百家参选企业中不借助外部安全公司的力量,仅凭公司自身的安全能力,便取得了第 11 名的成绩,还是很自豪的。
三、大数据的未来,是不提大数据但是数据又无处不在的时代,"你意识不到我的存在就是我最大的存在"
随着数据产业的规模越来越大,生态分工在未来将会越来越细,数据服务也将越来越细。而随着人工智能、云计算、物联网等技术的发展,大数据会不会和互联网一样,不再成为人们单独讨论的概念,而是成为像水电一样的基础设施,服务于各行各业中?
1、随着社会的发展,未来的数据会呈现多形态共存的状态。您认为未来几年大数据领域会出现什么样的一些变化?哪些因素将推动这些变化?你们的生态布局是怎么样的?
随着 5G 的成熟,数据领域的发展将从基础的量变迎来一次质变,成为像水电一样的社会基础设施。
近几年大家其实很少再单独讨论互联网的概念,其中的一个因素,我认为是互联网已经不再是新鲜事物,现阶段技术的发展基于互联网但又高于互联网,大数据之后的发展肯定也会这样,数据智能的未来,虽然基于大数据,但是不会再单独讨论大数据的概念。
从技术层面来看,大数据行业的发展对海量数据的存储、处理、挖掘需求肯定会越来越高,未来可能也会诞生出几个巨头,将行业进行更加明确的细分。这是一个大家已经能够观察到的趋势。
随着数据产业的规模越来越大,生态分工在未来将会越来越明确,数据类的服务也将越来越精细化。我们打造的个推每日治数平台,就是希望能够参与到生态的建设当中,甚至围绕平台打造出一种新的生态。
2、业内最近有个观点:"云原生体系架构是云服务时代的数据管理方法论",从技术角度来看,您如何评判云与数据智能间的关系?
不同的人评价同一件事肯定会有不同的出发点,这个观点看起来应该是云服务厂商提出的(笑)。很巧,我前一阵也跟吉利公司的人在讨论这个问题,他们最近刚从一家云厂商中迁移出来。
对企业来说,上不上云、选择公有云还是私有云、选择哪家云厂商需要考虑几个维度:成本吃不吃得消、是否自主可控、当不满足业务需求或者服务需求时是否方便切换等。
以个推为例,我们目前不会将数据放到第三方的云上,但从资源的调度、成本的控制等方面来看,云体系已经是一个公认的标准答案,所以我们也会使用云计算的相关技术,比如容器云、虚拟化等。
3、物联网、AI、机器学习等新技术的出现,对行业来说是机会还是挑战?个推应对技术的发展是否有做哪些前瞻性的探索?
新技术的出现,对行业来讲既是机会也是挑战。每次新技术的出现,都能为人类解放生产力或者提高生产力提供了可能性。
但一些技术因为过于"新",暂时还没有找到发挥能力的场景,没办法发挥出实际的社会价值,让企业的投入与产出不成正比。
个推还成立了数据智能研究院,目前研究的方向是探索如何将技术更好地服务于具体的业务当中。比如我们对物联网技术方向的探索,是想将自身的推送技术能力延伸到电视机、汽车等场景当中;对机器学习和区块链的探索则是为了进行一些业务模式的研究。
技术是面向未来的,但用户的需求是现在的。对于我们来说,目前的重点还是如何借助技术快速迭代服务能力,为用户以及行业赋能。
回顾大数据行业和个推的发展时间线,不难发现个推成立的这十年,恰巧也是大数据从一种辅助工具向引领发展方向的核心引擎转变的十年。
随着大数据行业的发展,国家正在大力发展数字经济,企业正在迎来一波借助数据智能实现数字化、智能化的转型新浪潮。在这股浪潮中,开始"治数"的每日互动将会扮演一个什么样的角色?我们拭目以待。