数极客首页

大数据时代的用户数据与客户价值分析

大数据下,用户分析的核心是什么? ——解决实际问题

t确定用户分析目的,具体是为了降低成本?增加收入?优化用户体验?提升营销效果?用户针对性管理?

确定目的后开始选择合适的数据,然后搭建模型,最后得出结果,并用数据可视化解读。

t大数据时代,用户数据使用成为企业发展的重中之重。

RFM方法是国际上最成熟、最为接受的客户价值分析方法,RFM实际上是一整套分析方法中的部分内容,但最具代表性,其它还包括客户购买行为随机模型、马可夫链状态移转矩阵方法、贝氏机率推导状态移转概率方法、回归拟合方法等。 它具体的技术原理又是如何呢?

t使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买金额,再对销售毛利率、关系营销费用进行推算,就能按年、按季、按月分析出今后几期的客户价值。

在这里,客户价值指CRM毛利。CRM毛利 = 购买金额 - 产品成本 - 关系营销费用。

RFM方法是国际上最成熟、最为接受的客户价值分析方法,RFM实际上是一整套分析方法中的部分内容,但最具代表性,其它还包括客户购买行为随机模型、马可夫链状态移转矩阵方法、贝氏机率推导状态移转概率方法、回归拟合方法等。

一、客户购买行为随机模型中隐藏着哪些秘密?

随机模型除了显示购买频率概率、平均金额概率的密度分配,还隐藏着购买频率、平均金额的状态移转期望值和概率这两个秘密,等待被揭示。

揭秘后,您就更加理解用必要长度和宽度的样本数据建立起一套牢固、可靠随机模型的重要意义,样本越大,客户价值推测结果就越接近即将发生的事情。

【客户随机购买行为的六个基本假设】

  • tt

    ttt假设一:假设客户随机购买频率和随机购买金额两个不同的行为纬度互相独立,不具有相关性。 tt

  • tt

    ttt假设二:假设客户的购买状态移转行为符合马可夫链的假设,这表示客户下一期购买状态发生的机率只和上一期的购买状态有关。 tt

  • tt

    ttt假设三:假设个别客户购买频率为卜松分配(Poisson Distribution)。 tt

  • tt

    ttt假设四:考虑客户的异质性,假设上述个别客户单位时间平均购买次数服从伽玛分配(Gamma Distribution)。 tt

  • tt

    ttt假设五:假设个别客户有购买行为的各期平均单次购买金额为伽玛分配(Gamma Distribution)。 tt

  • tt

    ttt假设六:考虑客户的异质性,假设上述各期平均单次购买金额又符合另一个伽玛分配(Gamma Distribution)。 tt

t1、观察随机模型

蓝色的就是平均金额概率密度曲线,紫色的是m轴每个mi坐标乘以对应蓝色概率密度pi得到的新曲线。换句话说,紫色包络线上每个点的值都是蓝色包络线对应点的mi倍。

在上图任意位置mi作条垂线,垂线至m=500,000.00(假设此为历史最大平均金额)之间,紫色面积除以蓝色面积,结果就是mi的状态移转期望值。可对m设定一些刻度,如0.01、1,000.00、10,000.00、100,000.00、200,000.00、300,000.00、400,000.00,即可得到这些刻度的对应的平均金额移转期望值。

用积分表达式描述就是:平均金额移转期望值 = ∫紫色曲线函数dm / ∫蓝色曲线函数dm,积分区间由mi到500,000.00。

购买频率移转期望值也类似,只是频率概率为离散函数。

3、推导购买频率、平均金额移转概率

tt

ttt

ttt

tt

tttt从随机模型推导移转概率要复杂些,与上述求面积不同,它是一个求体积的计算(二重积分),较为抽象。


二重积分在直角坐标系中求体积的示意图如右。下面我们换个角度,不在三维坐标系中谈体积积分,而是继续用求面积这种更直观的方式来推导平均金额移转概率。

tttt

ttttt基础知识:客户从上期状态移转至下期状态,在马可夫链中记作(r1, f1, a1≤m1<b1) → (r2, f2, a2≤m2<b2),r表示未成交期数,f表示该期间成交频率,m表示该期间的平均成交金额。若下期成交,则r2=0;若下期不成交,则r2=r1+1;以此类推。tttt

tttt

ttttt
tttt

ttt

tttt
ttt

t平均金额由m1移转到m2的移转概率记作fm(m2 | a1≤m1<b1),由于金额为连续变量,对金额划段后m1属于a1至b1这个分段内。

与推导移转期望值相似,当期望值m2分别等于0.01、1,000.00、10,000.00、100,000.00、200,000.00、300,000.00、400,000.00时,也可用下图的a1至b1之间的绿色面积除以对应的蓝色面积来推到平均金额的移转概率。

t图5

t图5中的蓝色曲线就是图2的平均金额概率密度函数。绿色曲线就不是平均金额概率密度pi去乘以m坐标轴的每个对应mi,而是去乘以另一个贝氏事后机率密度函数,这个函数是{[Γ(2p+q) blog.sql fenxike.sql m2p-1 blog.sql fenxike.sql (k+m1)p+q] / [Γ(p) blog.sql fenxike.sql Γ(p+q) blog.sql fenxike.sql (m2+m1+k)2p+q]},它是通过由果导因的方法获得。

当m2分别等于0.01, 1,000.00, … 400,000.00时,就得到图5的不同图形。当m2等于某值时,用m轴a1至b1之间的绿色面积除以对应的蓝色面积就得到平均金额移转概率fm(m2 | a1≤m1<b1)。

用积分表达式就是:

fm(m2 | a1≤m1<b1) = H / L

其中H = ∫a1b1[Γ(2p+q) blog.sql fenxike.sql m2p-1 blog.sql fenxike.sql (k+m1)p+q] / [Γ(p) blog.sql fenxike.sql Γ(p+q) blog.sql fenxike.sql (m2+m1+k)2p+q] blog.sql fenxike.sql [P(m1 | p,q,k)] dm1

其中L = ∫a1b1[P(m | p,q,k)] dm

而实际上m2也是一个连续变量,从a1≤m1<b1移转到a2≤m2<b2的移转概率是一个二重积分,积分表达式为:

fm(a2≤m2<b2 | a1≤m1<b1) = ∫a2b2fm(m2 | a1≤m1<b1) dm2

类似地,也使用贝氏机率方法推导频率移转概率,马可夫链中的r1值(无成交期数)、频率随机模型中的信任区间也是两个重要计算因素。

4、购买频率、平均金额移转期望值及移转概率计算

针对上述举例,移转期望值及移转概率的推导结果如下:

tt

ttt

ttt

tt

tt

ttt

ttt

tt

tttt样本数据的最小频率=1,最大频率=3:ttt tttt样本数据的最小平均金额=0.01,最大平均金额=499,999.00:ttt
tttt

ttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

ttttt

tttt

tttttttt最近成交期的频率f1
下期的频率期望值f2ttttttt
tttttttt最近成交期至下期的未成交期数r1
下期的频率期望值概率pttttttt
ttttttttf1≥1 → f2≥2ttttttt ttttttttr1=0, p=0.3606;r1=1, p=0.2949
r1=2, p=0.2356;r1=3, p=0.1892ttttttt
ttttttttf1≥2 → f2≥2ttttttt ttttttttr1=0, p=0.3606;r1=1, p=0.2949
r1=2, p=0.2356;r1=3, p=0.1892ttttttt
ttttttttf1≥3 → f2≥3ttttttt ttttttttr1=0, p=0.1367;r1=1, p=0.0958
r1=2, p=0.0669;r1=3, p=0.0477ttttttt

ttt

tttt

ttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

tttttt

ttttttt

ttttttt

tttttt

ttttt

tttt

tttttttt最近一期平均金额m1ttttttt tttttttt下期平均金额的期望值m2、概率pttttttt
tttttttt0.01≤m1<1,000.00ttttttt ttttttttm2=39,510.75,p=0.0126ttttttt
tttttttt1,000.00≤m1<10,000.00ttttttt ttttttttm2=39,598.21,p=0.3719ttttttt
tttttttt10,000.00≤m1<100,000.00ttttttt ttttttttm2=46,920.90,p=0.8754ttttttt
tttttttt100,000.00≤m1<200,000.00ttttttt ttttttttm2=186,871.69,p=0.4707ttttttt
tttttttt200,000.00≤m1<300,000.00ttttttt ttttttttm2=296,732.74,p=0.3049ttttttt
tttttttt300,000.00≤m1<400,000.00ttttttt ttttttttm2=379,455.72,p=0.2227ttttttt
tttttttt400,000.00≤m1<500,000.00ttttttt ttttttttm2=445,441.60,p=0.1748ttttttt

ttt

某客户下期的购买金额 = (该客户的)下期频率 blog.sql fenxike.sql 下期平均金额 blog.sql fenxike.sql 下期频率概率 blog.sql fenxike.sql 下期平均金额概率

二、预测下期产品成本和关系营销费用

CRM毛利 = 购买金额 - 产品成本 - 关系营销费用。

RFM只预测客户下期的购买金额,RFM并不预测下期的毛利率和费用。对个别客户以往的毛利率、费用采取平均法或移动平均法,应用于下期,该推断显然不合适;采取如RFM的概率分析方法去推断下期毛利率和费用也不合适,因为这两者并不是源自客户(或企业、员工)的随机行为,而更是源自企业总体成本控制和差别应对。

【销售毛利率、关系营销费用的五个基本假设】

  • tt

    ttt假设1:假设销售毛利率和关系营销费用不是随机现象,并且毛利率、费用遵循各自的发生规律。tt

  • tt

    ttt假设2:假设个别客户下期的销售毛利率最接近该客户有成交上期的毛利率。tt

  • tt

    ttt假设3:假设个别客户上期、下期之间存在无交易期数,则下期销售毛利率的升、降,服从该客户在无交易期间的企业整体毛利率的拟合回归规律。tt

  • tt

    ttt假设4:假设个别客户下期的关系营销费用服从该客户以往的费用、购买金额比例,即服从关系营销投入产出比。tt

  • tt

    ttt假设5:假设个别客户下期可能存在一个最小关系营销费用基数,它相当于该客户以往各期费用中的最低值。tt

t1、下期产品成本

下期产品成本 = 下期购买金额 blog.sql fenxike.sql (1 - 下期销售毛利率)

如果某客户上、下期之间无交易期数为0,则下期毛利率 = 上期毛利率。上期指有成交的最近一期。

如果某客户上、下期之间无交易期数为r1 (r1>0),则下期毛利率 = 上期毛利率 blog.sql fenxike.sql (1 + Δ)。其中Δ = (上期至r1=0期之间的)线性回归方程的斜率 blog.sql fenxike.sql r1 / 2,用Δ对毛利率进行微调。之所以采用线性拟合回归,是因为决定系数R2在这里并不重要,我们仅是求得无交易期间的企业整体毛利率升、降趋势,并且不是用拟合回归方程本身去预测下期毛利率。

2、下期关系营销费用

定义:Ratei = Σ客户i以往费用 / Σ客户i以往购买金额
Expensei = 客户i以往各期中最小的那期费用(大于0)
Monetaryi = 客户i下期购买金额
Xi = Monetaryi blog.sql fenxike.sql Ratei

如果Xi > Expensei,则下期费用 = Xi;
否则如果Monetaryi < Expensei,则下期费用 = Xi;
否则,下期费用 = Expensei。

3、在SynleadCRM 2008中,对下期的毛利率和费用还可手工修正

用SynleadCRM 2008分析客户价值时,选项“提取产品成本”表示提取以往产品成本并推算今后几期的产品成本,选项“提取费用”表示提取以往关系营销费用并推算今后几期的关系营销费用。前面提到,产品成本和关系营销费用属于企业总体成本控制和差别应对,其未来变化不一定按趋势平滑,可能下期个别客户或整体客户群的情况出现逆反或抖动。依据您的判断,在SynleadCRM 2008中对下期的毛利率和费用还可手工个别/批量地调整、修正。

另一方面,也可能出现少许产品成本、费用数据没有及时填写进CRM系统,例如“机会-产品”中未及时填写或更新产品/销售价/成本价,造成统计时产品成本=0.00、毛利率=100%;或者极特殊的数据没有排除,例如上期毛利率为负值。该情况也需要对个别客户的下期毛利率进行手工修正。

三、完整客户关系生命周期内的客户价值

客户价值 = CRM毛利 = 购买金额 - 产品成本 - 关系营销费用。在完整客户关系生命周期内(从建立关系到未流失的最近一期),分析客户今后价值的意义远远大于分析客户历史价值,因此通常所讲的客户价值分析是对客户今后的价值进行分析。

SynleadCRM 2008为您分析客户今后三期价值的同时,也向您展示客户的历史价值作为参照。

t对预测出的今后客户价值结果,您就可按客户价值分层。CRM客户关系管理将传统的整体营销推进到分块差别化营销、一对一差别化营销的高度,其立足点就是客户价值差别化分析。

t通过预测客户价值,您就清楚一旦VIP客户、大客户流失将在今后造成怎样的利润损失;也可以找出那些临近亏本或负价值的客户,进行置疑分析,找出对策。

也要清醒地认识到,即便预测出的客户价值较高,也只是说明其价值势能(购买潜力)较高,坐等客户送上门的价值动能(实际购买)是不现实的,必须回过头去用CRM基础方法论踏踏实实地与客户互动,推动客户追加购买、交叉购买。

客户价值分析,是企业决策最重要的依据之一,请做好您企业的客户价值分析,正确指引商务运营。

发表评论

评论已关闭。

相关文章