数极客首页

购物篮分析—关联规则操作案例

购物篮指的是超级市场内供顾客购物时运用
的装商品的篮子,当顾客付款时这些购物篮内的商品被停业
人员经过
收款机逐一

注销
结算并记载
。所谓的购物篮剖析

(Market Basket Analysis)就是经过
这些购物篮子所显现
的信息来研讨
顾客的置办

行为。主要的目的在于找出什么样的东西应该放在一同
。依据

顾客的置办

行为来了解

是什么样的顾客以及这些顾客为什么买这些产品,找出相关规则,企业依据

这些规则的挖掘

取得

利益与树立
竞争优势。举例来说,批发
店可藉由此剖析

改动
置物架上的商品排列或是设计吸收
客户的商业套餐等等。

购物篮剖析

基本

运作过程包含下列三点:

  1. 选择正确的品项:这里所指的正确乃是针对企业体而言,必需求

    在数以百计、千计品项当选

    择出真正有用的品项出来。

  2. 经由对共同发作
    矩阵(co-occurrence matrix)的讨论
    挖掘

    出联想规则。

  3. ?抑止

    理论

    上的限制:所选择的品项愈多,计算所耗费

    的资源与时间愈久(呈现指数递增),此时必需
    运用一些技术以降低资源与时间的损耗。

应用上能够

有:

  1. 针对信誉
    卡购物,能够

    预测未来

    顾客可能置办

    什么。

  2. 关于
    电信与金融效劳
    业而言,经由购物篮剖析

    能够

    设计不同的效劳
    组合以扩展
    利润。

  3. 保险业能藉由购物篮剖析

    侦测出可能不寻常的投保组兼并
    作预防。

购物篮剖析

技术的应用,你能够

留言给我,看看你还有哪些更丰厚
的应用!!

过一个简单的超市购物的数据来演示购物篮剖析

的办法

和思想。工作流如下:

购物篮剖析—关联规则操作案例

第一步,读取数据《购物篮.csv》配置如下图

第二步?剔除只需

一种物品的购物篮子此处触及
到的算法节点包括:类型转换,汇总,行ID,选择等算法节点,细致

的功用
能够

点击节点配置页面获取节点运用
阐明

第一
,运用
类型转换节点,将id字段从浮点型转换为整型。

第二
,经过
汇总节点依据

id值中止

汇总:

得到如下结果:

然后,经过
选择节点选择id汇总值为1的样本,配置如下:

过滤后的表一共有174行,这些都是购物篮中只需

一种物品的状况

。右键单击查看过滤表,如下表所示:

第三步,生成购物篮。

第一
,运用
类型转换节点将id卡号由浮点型转化为字符型。

第二
,运用
汇总节点派生购物篮。留意
,这里应该以id为购物篮id,而不是卡号,由于
同一卡可能有多次

置办

。但是并不是不能以卡号为研讨
对象,假定

您想把一个人作为一个购物篮对象,也能够

用卡号,但是此处经剖析

重复

置办

的人并不多,因而

以人为研讨
对象没有意义。研讨
的对象的确

定因研讨
重点不同而调整变化。

节点配置如下:

第三
,运用
参考行过滤节点,从汇总表中过滤掉过虑表中的数据。配置如下:

右键单击参考行过滤节点查看第三
过滤后的数据如下表所示:

第四步,运用
Apriori节点生成锻炼
规则。配置如下:

生成的规则预览如下:

第五步,派生规则质量字段。

第一
,运用
选择节点过滤前项为空的规则。配置如下:

第二
,运用
过滤节点删除下面剖析

中不用的字段。配置如下:

然后,运用
派生节点,派生规则质量字段。规则质量=支持度*规则置信度。配置如下:

最终
,运用
排序节点对数据依照

规则质量和前项中止

二重降序排列。排在前面的即为规则质量比较

高的规则。节点配置如下:

第六步,提取规则质量较高的规则经过
表节点查看结果,表视图如下:

规则解释如下:假定

客户置办

啤酒和蔬菜罐头的话,他还有87.4%的可能置办

冻肉;

假定

客户置办

啤酒和冻肉的话,他还有85.9%的可能置办

蔬菜罐头;

假定

客户置办

蔬菜罐头和冻肉的话,他还有84.4%的可能置办

啤酒;

假定

客户置办

啤酒的话,他还有62.7%的可能置办

啤酒·····

总结

数据挖掘

分为两种,一种是阅历

考证
,即曾经
有个想法,然后考证
一下是不是那样的,剖析

之后的回答

只需

是或者不是,这属于考证
型。还有一种是学问
发现型的
,即原来并不知道

有这样的规律,剖析

之后发现的,即为意想不到的新发现。在这里,我们发现的规则中,啤酒、蔬菜罐头、冻肉同时被置办

的可能性较大,这一点可能是大家都知道

的,这个结果只是考证
了我们以前的想法,而鱼类和水果一同
置办

的可能性很大,我们可能就不知道

了,因而

这就属于学问
发现

因而

,关于
这家超市而言,应该把水果和鱼类排放的近一些,这样能够

进步
销量。还有一点要留意
的是,对这家超市有这样的规律,并不代表其他超市也是这样。但是办法

论是通用的,不同的超市能够

运用
同样的办法

论中止

学问
发现和考证

数据获取:链接:http://pan.baidu.com/s/1o86jUvo 密码:ghch也可经过
SmartMining的购物篮剖析

案例获取建模工作流。

本文来源:微信公众号?莱信学院,由作者 投稿?数据剖析

网 发表,并经数据剖析

网编辑。版权归作者一切
,转载此文请与作者联络

发表评论

评论已关闭。

相关文章