近日,每日互动(个推)CTO叶新江受邀出席WAIC世界人工智能大会,并于“大数据关联下的图数据库技术与应用”主题论坛上发表演讲,同与会专家、观众共同探讨“万亿级图下的数据智能”。
叶新江介绍,每日互动成立于2010年,以提供APP消息推送服务起家。十多年来,每日互动参与和见证了移动互联网行业的飞速发展,更依托自身海量数据资源和大数据、人工智能技术优势,构建了完整的数据智能服务生态,提供专业的大数据解决方案,推动移动互联网、品牌营销、金融、智慧城市等细分领域的数智化升级。
目前,每日互动已成长为将互联网、大数据、人工智能、云计算等新兴领域特点有机融合于一身的新经济综合体,并着力打造数据中台产品——“每日治数平台”,输出治数能力,为垂直行业的数字化创新增能提效。
数据智能的新发展:解决现实中不确定性大的问题
每日互动将“数据让产业更智能”作为自己的使命和愿景,对数据智能有着自己独到的理解。叶新江讲到,在信息化时代,我们主要通过数据来描述客观现实。比如,我们通过可视化的监控大屏描述道路状况,用不同的颜色代表道路的拥堵程度。后来,我们越来越多地使用数据进行诊断和因果分析,比如对道路拥堵进行归因。近年来,数据持续呈爆炸式增长,机器学习、图挖掘等前沿技术得到更广泛的应用,数据智能随之发展到一个全新的阶段。当下,人们对数据的应用已经不仅仅停留在描述和诊断的阶段,人们希望通过数据智能,解决现实中不确定性大的问题,并对未来进行预测,从而掌握态势,掌握动向,掌握主动。
正确的解题方式:本体建模和检索
叶新江提到,现实中不确定性大的问题,往往是开放环境下的问题,受到众多因素影响。为了解决这类问题,传统的基于神经网络的深度学习方法,需要大量的参数对环境建模,如最近流行的GPT-3模型包含了千亿级别的参数,一次训练所需的成本达到千万美元。即便如此,这种形式下的人工智能也很难达到人类的智能水平。
因此,我们判断人工智能的最终形态应该是“人脑+电脑”人机共生的方式。如何实现“人机共生”,来解决这些不确定性大的问题呢?基于知识图谱的数据智能是一个具有前景的方向,一方面通过本体建模将已有的知识进行数据化,让电脑具有了人脑的思维方式;另一方面通过在知识图谱上进行检索和推理,让人脑可以利用电脑的计算能力。为了实现这个目标,底层基础设施需要符合建模架构要求,并具有快速检索和全局推导的能力。而综合了图查询系统和图计算系统的综合图数据库系统,能够满足这些特性和功能要求。
万亿级图下的数据智能实践:大数据抗疫
那么,如何基于综合图数据库系统开展数据智能应用,以解决现实中不确定性大的问题呢?叶新江以每日互动参与大数据抗疫为例,分享了每日互动在万亿级图下的数据智能实践。
2020年新冠肺炎疫情发生后,每日互动火速成立大数据抗疫团队——“个医”,并与李兰娟院士团队共同合作,投入到这场与新型冠状病毒的战斗中,在疫情态势研判、传播路径分析等方面进行深入研究,全面助力疫情精准防控。