近日,网易举办的易创课堂分享会走进上海,引来不少互联网创业者、开发者的关注。网易七鱼云客服产品总监段毓铮在主题演讲《新一代智能客服》中,向各位创业者介绍了云客服发展过程的四代智能机器人,目前,网易七鱼云客服等采用的第四代智能客服机器人已经可以帮助企业客服挡掉至少80%的重复性问题。
网易七鱼云客服产品总监段毓铮
以下为演讲实录(部分删减)
今天我们的话题和人工智能相关,开始正题前先给大家讲一个我的小故事。我高中时就对人工智能特别感兴趣,但那时候没有可以系统学习人工智能的条件。当时觉得人工智能有很多算法和模型看起来很难懂,但了解后发现智能水平还比较低。我就有一个想法:能否先把人脑的机制搞清楚,人是如何记忆、学习、推理、预测的。搞清楚这些后就可以让电脑模拟人脑的工作方式了,那么人工智能就很容易实现了。后来我才知道,在我的想法产生的前几年就已经有学者在这方面进行了实践。
现在人工智能已经逐步被应用于不同的领域,比如我们的客服行业就是一个很好的案例。
“你好,在吗?”还需要人来回答吗?
首先的问题是,我们为什么需要客服机器人。如果我们深入到客服的工作场景中,会发现客服面对的80%的问题都是简单的、重复的,例如客户会说“您好,在吗?”就再无下文。这些问题在很大程度上困扰着客服团队。
我们需要客服机器人是因为,它可以极大地减少企业的客服人力成本,另外可以有效改善客服工作状态。我们试想下自己每天处理的都是简单的、无意义的问题,会是怎样的感受。那么,我们就应该让机器人去处理这些常见问题,让人工客服去做一些更有挑战性的工作。
客服机器人如何划分?
我们今天的话题是新一代客服机器人,既然是新一代,那么前几代是怎样的?
第一代
第一代客服机器人叫问答机器人,基于单个关键词的精确匹配。它很简单,简单到几乎没有什么技术可言,客户问的问题也不像是我们常见的问题。例如,在微信公众号平台回复一些关键字词,获取某篇文章或活动入口。这样的问答机器人的原型是出现在电话客服上的,我们叫IVR(交互语音应答系统)。大家应该都有接触过,例如打电话给银行客服,语音提示你选择所需服务的序号,菜单会一层层深入了解客户究竟想问什么问题,最后给出一个自动化的语音回答。
由于第一代问答机器人使用的是单个词的完全匹配,在使用场景中受限很多,所以很快出现了第二代机器人。
第二代
第二代客服机器人已经可以支持多个词匹配,并且具有模糊查询能力。但我们可以发现它仍停留在“词”的层面,例如图书馆的查询书籍系统。第二代机器人还有个名称叫做“精灵系统”,早期在网易游戏中的客服系统,就是这样一个精灵系统。这里顺便再提一下,网易游戏精灵虽然还叫做“精灵”,但是从技术上讲它早已不再停留在第二代技术,这也是顺应更复杂业务场景的要求。
第二代客服机器人虽然比上一代机器人有了进步,但局限也很大,就是它的匹配规则是比较死板的,只能应用于一些简单场景中。例如图书馆查询系统中的书名、作者名都是比较明确的;游戏中查询的角色、装备、副本信息也是相对明确的。这些内容有一个很大的特点——用户问法简单、明确,没有太大变化,在后方支撑这个系统的是一个关键词列表。但当这个系统应用于一个业务相对复杂的场景中,就会出现这样的问题——需要维护一个非常庞大的关键词列表,而且表达同一意义的会有若干不同的关键词,这也就会影响到最终匹配的精度和结果。它需要依靠人的经验、技巧去调整配置关键词列表,可靠性不高,而且还增加了大量的人力成本。这也就是为什么我一开始就强调使用客服机器人的目的是为了节省人力支出。当关键词列表越来越庞大时,其实是在增加人力成本,这就与我们的初衷背道而驰。
第三代
当业务复杂后,我们又不得不寻求一些新技术,这就是第三代智能客服机器人。在关键词匹配的基础上引入了自然语言处理(NLP)技术。比较大的飞跃是,机器人处理的不仅仅是词,可以进一步处理句子。一些简单的处理流程是这样:首先输入信息,然后对数据进行清洗和预处理的工作,把一些杂乱和无效的信息排除。接着进入自然语言处理的流程:这里面包含一些技术如分词、词性标注、文法、句法、识别关键词(即:把一个句子切开,把里面每一个词搞清楚,给每个词加一个权重,根据权重的综合算法来匹配知识库中哪个答案可以最准确回答用户问题)。
如果大家用过后就会发现,它的智能体现在,当我们问一个问题时,机器人支持一定问法上的变化。比如,知识库设定的一个条目是“我要退货”,当客户说 “我想退货”时,第三代机器人是可以理解用户意思的,但语义判断能力还是有限,匹配精度还没有特别高,第三代机器人就需要运营知识库弥补这些局限。运营知识库就是运营问法,不再是关键词,数量上会大量减少,维护方式也变得简单。这就是自然语言处理技术所起的作用,机器人与用户的沟通,更接近于人与人的交流,用户可以用一个完整的句子提问,不再是一个个单个的关键词。
根据一些公开的信息,我们可以确定的是,目前市场上所看到的产品从技术上讲很多都是第三代机器人。第三代机器人虽说已经比较智能,但还是在人给予它的一些规则下运行。
第四代
第四代智能客服机器人是以神经网络为基础,应用了最新的深度学习技术,结合模式识别等技术打造的智能机器人。与第三代机器人相比,因为有了深度学习的技术,完全可以打破人工配置的规则,可以有更好的自主学习能力和语义理解能力,包括可以处理更加口语化的问法。
深度学习是什么?这其实和我一开始讲的小故事就联系上了。人工智能领域的很多技术,在很大程度上都受到了生物学、医学、认知神经科学发展的启发。 1981年诺贝尔医学奖得主David Hubel 和 Torsten Wiesel在1958年做的一系列关于“视觉系统的信息处理”的试验发现,视觉信号的处理是分层次的,图像被一层一层抽象,最终被识别。在这两位科学家伟大的发现之后约40年,1995年前后,Bruno Olshausen和David Field两位学者试图用计算机的方法研究视觉问题。他们通过稀疏编码算法训练机器,让其自主的去提取视觉信号中的特征。计算机算法自主学习后输出的结果与David Hubel 和 Torsten Wiesel两位科学家生物学试验的结果惊人的相似:视觉特征的提取,都是从最基本的物体边缘开始的。更高级的特征,都可以由一些基本的特征组合而成。这就是对深度学习的一种通俗的理解,即通过算法,让机器自主的学习,提取特征;并训练机器形成更深层次的特征。输入的信号被一层层的特征抽象、表达;随着层次的深入,这种表达在不断的变换;不断的迭代抽象,信号被刻画的更加准确。
对于深度学习来说,他的特点就如他的名称一样,需要堆叠更多的特征层次。一般来说,层数越多,输入的数据量越大,学习能力越强,特征描述越准确。但是这就会对计算能力带来很高的要求。这也是为什么机器学习、神经网络的概念早就有了,而深度学习在10年前才被提出来。这和硬件设备的发展有很大关系。当然,特征层次也不是越多越好,这里说的更多的层次是相对于传统的神经网络而言的。现实当中,深度学习的实现要结合特定的算法和数据,选择合适的层次。
形象的打个比方,其实深度学习和人的学习有些相近了。深度学习的模型、或者说算法,就是告诉机器一个学习的方法。而他能学到什么东西,这依赖于训练的输入,也就好比是教材。至于他能学到什么水平,那就看训练迭代的层数,这就好比学习的用功程度。
网易做智能客服有什么优势?
首先网易是很熟悉客服业务的,游戏业务、邮箱业务这些都是老牌的服务,还有现在的一些电商的服务,我们整个团队对于客服服务这件事是有深入体会的。
其次,我们有成熟的、经过验证成功的深度学习方法。目前能做深度学习的机构或者研究院在国内并不多。几年前我们就在研究深度学习的技术,而且我们的技术就应用在比如人脸识别、语音识别、音乐识别等领域。这是通过实践检验的成功、成熟的深度学习方法。
另外,有累积超过10年的专业领域的学习教材,不仅仅是我们的,还包括一些合作伙伴的,积累非常深厚。
最后,深度学习模型是我们根据业务深度定制和优化的,这就使得我们可以根据具体的服务场景设计更深层次的深度学习。网易自有的超大规模服务器集群资源支撑了业务的密集运算需求。
当然,每一代客服机器人的发展都离不开前一代的技术基础。客户服务本身的发展需求在推动技术的发展,它有一个逐渐演变的过程。我们不能孤立地去看待第四代机器人,因为很多时候技术上是混合的,七鱼云客服的第四代智能机器人也会包容很多前代的技术。另外,客服场景决定了不同的情况下我们需要不同的解决方式,多种技术的融合也能使七鱼云客服可以更优雅地解决客服问题。网易七鱼云客服致力于通过合理应用技术解决客户服务中的问题,我们相信能够最有效解决企业客服困境的方法才是最好的方法。