数极客首页

爱奇艺个性化推荐排序实践

在海量的内容在满足了我们需求的同时,也使我们寻觅
所需内容愈加
艰难
,在这种状况
下个性化引荐
应运而生。

爱奇艺个性化引荐排序理论

在当前这个移动

互联网时期
,除了专业内容的丰厚
,UGC内容更是迸发
式展开

,每个用户既是内容的消费者,也成为了内容的发明
者。这些海量的内容在满足了我们需求的同时,也使我们寻觅
所需内容愈加
艰难
,在这种状况
下个性化引荐
应运而生。

个性化引荐
是在大数据剖析
和人工智能技术的基础

上,经过
研讨
用户的兴味
偏好,中止

个性化计算,从而给用户提供高质量的个性化内容,处置

信息过载的问题,更好的满足用户的需求。

爱奇艺引荐
系统引见

我们的引荐
系统主要分为两个阶段,召回阶段和排序阶段。

召回阶段依据
用户的兴味
和历史行为,同千万级的视频库当选

出一个小的候选集(几百到几千个视频)。这些候选都是用户感兴味
的内容,排序阶段在此基础

上中止

更精准的计算,能够

给每一个视频中止

精确

打分,进而从成千上万的候选当选
出用户最感兴味
的少量高质量内容(十几个视频)。

爱奇艺个性化引荐排序理论

引荐
系统的整体结构

如图所示,各个模块的作用如下:

  1. 用户画像包含用户的人群属性、历史行为、兴味
    内容和偏好倾向等多维度的剖析
    ,是个性化的基石
  2. 特征工程:包含了了视频的类别属性,内容剖析
    ,人群偏好和统计特征等全方位的描画
    和度量,是视频内容和质量剖析
    的基础

  3. 召回算法:包含了多个通道的召回模型,比如

    协同过滤,主题模型,内容召回和SNS等通道,能够

    从视频库当选
    出多样性的偏好内容

  4. 排序模型:对多个召回通道的内容中止

    同一个打分排序,选出最优的少量结果。

  5. 除了这些之外引荐
    系统还统筹
    了引荐
    结果的多样性,新颖
    度,逼格和惊喜度等多个维度,更能够

    满足用户多样性的需求。

引荐
排序系统架构

在召回阶段,多个通道的召回的内容是不具有可比性的,并且由于
数据量太大也难以中止

愈加
精确

的偏好和质量评价
,因而
需求
在排序阶段对召回结果中止

统一的精确
的打分排序。

用户对视频的称心
度是有很多维度因子来决议
的,这些因子在用户称心
度中的重要性也各不相同,以至
各个因子之间还有多层依赖关系,人为制定复杂的规则既难以抵达

好的效果,又不具有可维护性,这就需求
借助机器学习的办法
,运用
机器学习模型来综合多方面的因子中止

排序。

爱奇艺个性化引荐排序理论

排序系统的架构如图所示,主要由用户行为搜集
,特征填充,锻炼
样本选择

,模型锻炼
,在线预测排序等多个模块组成。

机器学习的主体流程是比较

通用的,设计架构并不需求
复杂的理论,更多的是需求
对细节,数据流和架构逻辑的认真
揣摩

这个架构设计吸取

了以前的阅历

和经验
,在通用机器学习的架构基础

上处置

了两个问题:

锻炼
预测的分歧

机器学习模型在锻炼
和预测之间的差别
会对模型的精确
性产生很大的影响,特别
是模型锻炼
与在线效劳
时特征不分歧
,比如

用户对引荐
结果的反响

会实时影响到用户的偏好特征,在锻炼
的时分
用户特征的状态曾经
发作
了变化,模型假如
依据

这个时分
的用户特征就会产生十分
大的误差。

我们的处置

办法

是,将在线效劳
时的特征保管
下来,然后填充到搜集
的用户行为样本中,这样就保证了锻炼
和预测特征的分歧
性。

持续迭代

互联网产品持续迭代上线是常态,在架构设计的时分
,数据准备,模型锻炼
和在线效劳
都必需
能够

对持续迭代有良好的支持。

我们的处置

计划
是,数据准备和模型锻炼
各阶段解耦,并且战略
配置化,这种架构使模型测试变得十分
简单,能够
快速并行多个迭代测试。

引荐
机器学习排序算法演进

上古时期

我们第一次上线机器学习排序模型时,选用了比较

简单的Logistic Regression,将重点放到架构设计上,尽量保证架构的正确性。除此之外,LR模型的解释性强,便当
debug,并且经过
特征权重能够
解释引荐
的内容,找到模型的缺乏
之处。

在模型锻炼
之前,我们第一
处置

的是评测指标和优化目的
的问题。

评测指标(metrics)

线上效果的评测指标需求
与久远
目的
相匹配,比如

运用
用户的投入水平
和生动

度等。在我们的实验中,业界盛行
的CTR并不是一个好的评测指标,它会更倾向
于较短的视频,标题党和低俗内容。

离线评测指标是依照
业务来定制的,以便与在线评测指标匹配,这样在离线阶段就能够

淘汰掉无效战略
,避免

糜费
线上流量。

优化目的
(objective)

机器学习会依照
优化目的
求解最优解,假如
优化目的
有倾向

,得到的模型也存在倾向

,并且在迭代中模型会不时
地向这个倾向

的方向学习,倾向

会愈加
严重。

我们的办法
是给样本添加权重,并且将样本权重加到loss function中,使得优化目的
与评测指标尽可能的分歧
,抵达

控制模型的目的。

LR是个线性分类模型,请求
输入是线性独立特征。我们运用
的稠密的特征(维度在几十到几百之间)常常
都是非线性的,并且具有依赖性,因而
需求
对特征中止

转换。

特征转换需求
对特征的散布
,特征与label的关系中止

剖析
,然后采用适合

的转换办法
。我们用到的有以下几种:Polynomial Transformation,Logarithmic or Exponential Transformation,Interaction Transformation和Cumulative Distribution Function等。

固然
LR模型简单,解释性强,不过在特征逐步
增加
的状况
下,优势
也是显而易见的。

  1. 特征都需求
    人工中止

    转换为线性特征,十分

    耗费
    人力,并且质量不能保证

  2. 特征两两作Interaction 的状况
    下,模型预测复杂度是。在100维稠密特征的状况
    下,就会有组合出10000维的特征,复杂度高,增加特征艰难
  3. 三个以上的特征中止

    Interaction 简直
    是不可行的

中古时期

为了解

决LR存在的上述问题,我们把模型升级

为Facebook的GBDT+LR模型,模型结构

如图所示。

爱奇艺个性化引荐排序理论

GBDT是基于Boosting 思想的ensemble模型,由多颗决策树组成,具有以下优点:

  1. 对输入特征的散布
    没有请求
  2. 依据
    熵增益自动中止

    特征转换、特征组合、特征选择和离散化,得到高维的组合特征,省去了人工转换的过程,并且支持了多个特征的Interaction

  3. 预测复杂度与特征个数无关

假定
特征个数n=160决策数个数k=50,树的深度d=6,两代模型的预测复杂度对比


下,升级

之后模型复杂度降低到原来的2.72%

爱奇艺个性化引荐排序理论

GBDT与LR的stacking模型相关于
只用GBDT会有稍微
的提升,更大的益处
是避免
GBDT过拟合。升级

为GBDT+LR后,线上效果提升了约5%,并且由于
省去了对新特征中止

人工转换的步骤,增加特征的迭代测试也更容易了。

近代历史

GBDT+LR排序模型中输入特征维度为几百维,都是稠密的通用特征。

这种特征的泛化才干

良好,但是记忆才干

比较

差,所以需求
增加高维的(百万维以上)内容特征来增强

引荐
的记忆才干

,包括视频ID,标签,主题等特征。

GBDT是不支持高维稠密
特征的,假如
将高维特征加到LR中,一方面需求
人工组合高维特征,另一方面模型维度和计算复杂度会是O(N^2)级别的增长。所以设计了GBDT+FM的模型如图所示,采用Factorization Machines模型交流

LR。

爱奇艺个性化引荐排序理论

Factorization Machines(FM)模型如下所示,具有以下几个优点:

模型公式

爱奇艺个性化引荐排序理论

前两项为一个线性模型,相当于LR模型的作用

第三项为一个二次交叉

项,能够

自动对特征中止

交叉

组合

经过
增加隐向量,模型锻炼
和预测的计算复杂度降为了O(N)

支持稠密
特征

这几个优点,使的GBDT+FM具有了良好的稠密
特征支持,FM运用
GBDT的叶子结点和稠密
特征(内容特征)作为输入,模型结构

表示
图如下,GBDT+FM模型上线后相比GBDT+LR在各项指标的效果提升在4%~6%之间。

典型的FM模型中运用
user id作为用户特征,这会招致
模型维度疾速
增大,并且只能掩盖
部分

抢手
用户,泛化才干

比较

差。在此我们运用
用户的观看历史以及兴味
标签替代
user id,降低了特征维度,并且由于
用户兴味
是能够
复用的,同时也进步
了对应特征的泛化才干

我们主要尝试运用
了L-BFGS、SGD和FTRL(Follow-the-regularized-Leader)三种优化算法中止

求解:

  1. SGD和L-BFGS效果相差不大,L-BFGS的效果与参数初始化关系紧密
  2. FTRL,较SGD有以下优势:
  • 带有L1正则,学习的特征愈加
    稠密
  • 运用
    累计的梯度,加速收敛
  • 依据
    特征在样本的呈现
    频率肯定
    该特征学习率,保证每个特征有充沛
    的学习

FM模型中的特征呈现
的频次相差很大,FTRL能够

保证每个特征都能得到充沛
的学习,更合适
稠密
特征。线上测试标明
,在稠密
特征下FTRL比SGD有4.5%的效果提升。

当代模型

GBDT+FM模型,对embedding等具有结构

信息的深度特征应用
不充沛
,而深度学习(Deep Neural Network)能够

对嵌入式(embedding)特征和普通稠密特征中止

学习,抽取出深层信息,进步
模型的精确
性,并曾经
胜利
应用到众多机器学习范畴
。因而
我们将DNN引入到排序模型中,进步
排序整体质量。

DNN+GBDT+FM的ensemble模型架构如图所示,FM层作为模型的最终
一层,即融合

层,其输入由三部分

组成:DNN的最终
一层躲藏
层、GBDT的输出叶子节点、高维稠密
特征。DNN+GBDT+FM的ensemble模型架构引见
如下所示,该模型上线后相关于
GBDT+FM有4%的效果提升。

爱奇艺个性化引荐排序理论

DNN模型

  • 运用
    全衔接
    网络,共三个躲藏
    层。
  • 躲藏
    节点数目分别为1024,512和256。
  • 预锻炼
    好的用户和视频的Embedding向量,包含基于用户行为以及基于语义内容的两种Embedding。
  • DNN能从具有良好数学散布
    的特征中抽取深层信息,比如

    embedding特征,归一化后统计特征等等。

  • 固然
    DNN并不请求
    特征必需
    归一化,不过测试发现有些特征由于
    outlier的动摇
    范围过大,会招致
    DNN效果降落

GBDT模型

  • 单独中止

    锻炼
    ,输入包含归一化和未归一化的稠密特征。

  • 能处置
    未归一化的连续和离散特征。
  • 能依据
    熵增益自动对输入特征中止

    离散和组合。

FM融合

  • FM模型与DNN模型作为同一个网络同时锻炼
  • 将DNN特征,GBDT输出和稠密
    特征中止

    融合

    并交叉

运用
散布
式的TensorFlow中止

锻炼

运用
基于TensorFlow Serving的微效劳
中止

在线预测

DNN+GBDT+FM的ensemble模型运用
的是Adam优化器。Adam分离
了The Adaptive Gradient Algorithm(AdaGrad)和Root Mean Square Propagation(RMSProp)算法。具有更优的收敛速率,每个变量有单独
的降落
步长,整体降落
步长会依据
当前梯度中止

调理
,能够

顺应
带噪音的数据。实验测试了多种优化器,Adam的效果是最优的。

工业界DNN ranking现状

  1. Youtube于2016年推出DNN排序算法。
  2. 上海交通大学和UCL于2016年推出Product-based Neural Network(PNN)网络中止

    用户点击预测。PNN相当于在DNN层做了特征交叉

    ,我们的做法是把特征交叉

    交给FM去做,DNN专注于深层信息的提取。

  3. Google于2016年推出Wide And Deep Model,这个也是我们当前模型的基础

    ,在此基础

    上运用
    FM交流

    了Cross Feature LR,简化了计算复杂度,进步
    交叉

    的泛化才干

阿里今年运用
attention机制推出了Deep Interest Network(DIN)中止

商品点击率预估,优化embedding向量的精确
性,值得自创

总结

引荐
系统的排序是一个经典的机器学习场景,关于
引荐
结果影响也十分

严重
,除了对模型算法的如虎添翼

之外,更需求
对业务的特征,工程的架构,数据处置
的细节和pipeline的流程中止

认真
揣摩

和深化
的优化。

Ranking引入DNN仅仅是个开端
,后续还需求
在模型架构,Embedding特征,多样性,冷启动和多目的
学习中做更多的尝试,提供更精确
,更人性化的引荐
,优化用户体验。

End.

 

作者:Michael

来源:http://www.36dsj.com/archives/102164

本文来源协作
媒体@36大数据,作者@Michael

题图来自PEXELS,基于CC0协议

新一代大数据用户行为剖析
与数据智能平台:数极客(https://www.shujike.com),是支持无埋点、前端埋点、后端埋点、API导入四种混合数据采集方式,整合剖析
用户行为数据和业务数据,能够
自动监测网站、APP、小程序等多种渠道推行
效果剖析
,是增长黑客们必备的互联网数据剖析
软件。数极客支持实时多维剖析
、漏斗剖析
、留存剖析
、途径
剖析
等十大数据剖析
办法
以及APP数据剖析
网站统计网站剖析
小程序数据统计用户画像等应用场景,业内首创了六种提升转化率的数据剖析
模型,是数据剖析
软件
范畴
首款应用定量剖析
与定性剖析
办法
数据剖析
产品

发表评论

评论已关闭。

相关文章