在互联网大战中,我们可以看到,不管是否能够实现盈利,商家首先要做的就是抢占流量,而这些流量正是客户群。不仅互联网,线下商业同样如此,“客户”是销售的来源,如何能够吸引客户、留住客户,并使其重复消费?需要根据不同客户类型提供不同的产品和服务内容。对客户消费数据的挖掘起到重要引导作用。
据美国数据库营销研究所Arthur Hughes提出“RFM模型”,认为它构成了数据分析最好的指标,是衡量客户价值和客户创利能力的重要工具和手段。在RFM模式中,R(Recency)表示客户购买的时间有多远,F(Frequency)表示客户在时间内购买的次数,M (Monetary)表示客户在时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。
用友集团UAP中心大数据专家曾小青表示,在企业,海量数据分析一直是技术瓶颈,基于数据挖掘技术对客户进行细分,既是传统客户细分方法的补充, 也是商业分析技术的重要应用。曾小青曾经在商业分析系统业务模型、高性能实时数据挖掘方面取得了一定研究成果。同时,他看到了传统的RFM模型仍存在不足,因此提出了一套经过改进的针对消费数据挖掘的多指标RFM客户细分方案。曾小青介绍,这个方案包含了3种类型10各指标的RFM细分模型。并通过因子分析法从中提取细分变量,再使用基于划分的聚类算法进行客户细分。
具体流程可细分为以下4 个步骤:(1)构建多指标RFM 细分模型;(2)使用因子分析法提取细分变量。因子分析得出潜在因子个数和因子解释信息的能力,计算每个客户在因子上的得分;(3)将客户在因子上的得分作为基于划分的聚类方法的输入数据,进行聚类;(4)评估客户细分结果。
首先,构建多指标RFM模型。曾小青认为,客户的消费行为是一个很复杂的过程,“R、F、M”三个指标,从一定程度上反映了客户购买和客户价值,但仍存在一些缺陷。对于R表示的最近购买,新客户和老客户的表现可能相同,即在观察时间段内同时具有最近购买的记录,然而企业却无法根据R来判断客户的新老属性,并针对拥有不同属性的客户提供不同的决策,最终导致决策的偏颇。F表示的消费频度在较短的周期内(如月)能说明客户的购买强度,但是当一个客户的周期较长(如一年),那么F作为在这个较长周期内的购买次数将无法说明客户的购买规律,如客户在哪个月的购买最为频繁,在哪个月购买最为薄弱,哪几个月低于了平均购买?同理客户的消费金额也是一样。传统RFM模型无法反映这些信息,然而这些信息又能为企业营销策略提供正确的指导。
为避免这些缺陷,曾小青将传统RFM进行改进,产生了多指标RFM模型。在深入分析传统RFM指标的基础上,构建包含3种类型10个指标的RFM细分模型,用以较为全面的反映客户价值。
曾小青介绍,用多指标代替传统的消费近度、频度和值度,主要基于以下考虑:第一,用多个购买时间代替单一的最近购买,可真实反映客户在时间上的购买规律和整体的购买时间跨度,更易于区分新老客户;第二,用多个频率数据代替整体的消费频度,能更好的体现出购买的集中性,知道客户最最频繁购买月份、最弱购买月份和相关金额,从而为市场营销提供依据;第三,通过平均金额可分析出用户的平均消费额度。结合总体消费金额,可以容易判断出大份额顾客。
其次,利用因子分析法提取细分变量。传统RFM模型三个指标在权重划分问题上存在着各种不同的意见。Hughes认为RFM在衡量一个问题上的权重是一致的,因而并没有给予不同的划分。而Stone通过对信用卡实证分析,认为各个指标的权重并不相同,应该给予频度最高,近度次之,值度最低的权重。国内普遍采用的权重分析方法为层次分析法,但是层次分析方法相比权重的确定更倾向于方案决策的制定,而且在构造初始特征矩阵时,由于人为因素的影响较大,最终导致了权重结果的不准确。在考虑多指标RFM模型指标权重时,曾小青选用因子分析法,找出潜在影响客户细分的因素,确定因子个数和客户在因子上的得分,根据各因子解释客户细分的程度确定各因子的权重。
因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。假想变量(即因子)能够反映原来众多变量的主要信息。根据因子分析的一般步骤,可将改进RFM模型在各因子上的得分定义为: