新闻动态
NEWS CENTER
NEWS CENTER
2019-04-26
假设当前统计时间为2019年12月31日,经过简单的统计计算可得:
这里会遇到第一个问题:
R值最近一次消费时间表示用户最近一次消费距离现在的时间,消费时间越近的客户价值越大。以上方式计算出的R值越大说明当前用户最近一次消费时间越远用户价值越小,而F值还有M值越大代表用户价值越大,三组数据不在同一个描述维度,而且R值、F值、M值存在量级之间的差距,无法直观的通过加减来衡量用户价值。
这里有两种处理办法分别是评分方式和算法。
评分方式是根据三组数据各个值的特性,采用5分制为各个数据赋予一个评分值,R值的评分机制是R值越大,评分越小。具体评分的规则可以根据经验设定分值的给予区间,或者将数据平均分配成为5组,对应5个分值。
在基于三组数据对应的评分值来计算评分值的平均数,大于等于平均数的数据划到高的维度,低于平均数的数据划到低的维度,自然将三组数据每组分别划分为高低两组,交叉组合后就是我们上面说过的8种情况。然后在将三组数据对应的评分值做累加就是RFM总值了。
计算RFM总值时解决了不同量级数据相加时影响权重不均衡的问题。由于用户的交易行为中R值和F值相对较小,如果三个值不处理就累加,M值直接决定了总值的量级,R值、F值对总值的影响很小,无法体现出用户的真实价值。
同样以刚刚的数据为例:RFM总值 = 50+4+4400= 4454
可见M值4400直接决定了最后计算结果的量级,前面R值、F值对结果的影响基本忽略不计。采用评分制的方法后,将R、F、M值都映射到了1至5的区间之内,保证了各数据之间的可比性。