用友UAP曾小青:改进的多指标RFM客户细分
发表时间:2014年3月25日 11:40 来源:赛迪网
其中, X为改进RFM模型指标,FACTOR为因子,矩阵为因子得分系数矩阵。
第三,基于划分的客户细分聚类算法。“在选择聚类的算法时,由于改进的RFM指标都是数值型数据,不是分类属性数据,并希望客户类型互不重叠,因此我们使用基于划分的聚类算法(Partitioning Methods)进行客户细分。”曾小青解释道。它以各个指标在因子上的得分作为判断依据,将相似性较强的客户细分在一个类别中,相似性较弱的客户存在与不同类别中,确保了同一类别中的距离最小。最常用的基于划分的启发式聚类算法是k-means算法和k-中心点算法。k-means算法简单快速,但容易受噪声点和孤立点影响,且不适用于发现非凸面形状的聚类。k-中心点不是用质心来代表聚类,而是用最靠近中心的一个数据对象来代表聚类,消除了对孤立点的敏感性,具有较强的鲁棒行,但执行代价更高。典型的k-中心点算法有PAM算法、CLARA算法等。为了处理大数据集,可采用CLARA方法进行聚类,通过改进启发式函数,或结合其它方法,比如粗糙集法、遗传算法、Tabu算法等可进一步提升聚类效果。
经过改进的多指标RFM客户细分法,,避免了人为因素带来的数据偏差,提高了对客户细分的科学性和准确性。为数据挖掘的应用,以及消费行为的研究都提供了更好的依据。
[1] [2]