十大互联网数据分析方法之-聚类分析

 

一、什么是聚类分析

聚类分析在统计学上是根据“物以类聚”的道理,对样本或指标进行分类的一种多元统计分析方法。这一方法在任何领域应用时,都需要先对事物彼此不同的属性进行辨认,将具有相似属性的事物聚为一类,使得同一类的事物具有高度的相似性。在互联网用户行为分析上,大量用户都有相同或相近的行为属性,我们可以通过行为对用户进行聚类,提取行为特征,对不同行为属性的用户有针对性精准运营。

二、聚类分析的特征

网站分析APP分析中应用聚类分析时会使得分析过程和分析结果更简单、直观。

简单:分析逻辑内置于系统中,只需点选操作即可实现对用户或页面的聚类

直观:将毫无规律的大量数据变的规律化、类别化、统一化,可直观看出某一群体或某类页面的特征。

三、聚类分析的应用

聚类分析在互联网领域的主要应用有:用户聚类、页面聚类或内容来源聚类、活跃留存聚类分析。

1、用户聚类

用户聚类是将有共同用户属性或行为属性特征的用户归为同一群体,主要体现为用户分群,用户标签法。用户分群用户分群可以通过用户属性组合定义不同用户群体,也可以通过用户群体的行为表现反推用户的属性特征。用户分群对推广营销和用户运营最大的意义在于精细化的定位用户群体细分用户需求。推广和运营已经从初期发的模糊运营进化到当前基于用户行为甚至是基于预测模型的用户分群。

用户分群、用户标签法

2、页面聚类

页面聚类则主要是相似/相关页面分组法,例如:在页面分析中,经常存在带?参数的页面,比如:资讯详情页面、商品页面等,都属于同一类页面,简单的分析容易造成如跳出率、退出率等指标不准确的问题,通过聚类分析可以获取同类页面的准确数据用于分析场景。

资讯详情页面、商品页面、店铺页面聚类分析

 

3、来源聚类

来源聚类帮助我们分析访客来源和推广渠道,可根据设置的UTM参数,根据不同渠道、着陆页、媒介、内容、关键词等对受访页面进行聚类分析。

4、活跃、留存聚类分析

传统的活跃分析和留存分析只依据用户浏览网站或打开APP行为分析活跃和留存,更高级的活跃和留存分析可以自定义不同的用户行为聚类分析。

例如我不只关心用户浏览网站的活跃和留存,还想分析网站中新上线的某个功能模块的用户活跃和留存情况,这时可以通过自定义活跃、留存聚类有相应行为的用户进行分析。