基于CTR模型的广告点击率预测

发表时间:2020/10/14   来源:《科学与技术》2020年16期   作者: 于锦涛
[导读] 众所周知,点击率预测模型在当今社会十分流行。在线广告中,点击率(CTR)是评估广告效果的重要指标,随着机器学习技术的不断发展,通过机器学习方法构建自动广告,点击预测系统也变得越来越普及。
        于锦涛   
         沈阳化工大学    110142
        摘要:众所周知,点击率预测模型在当今社会十分流行。在线广告中,点击率(CTR)是评估广告效果的重要指标,随着机器学习技术的不断发展,通过机器学习方法构建自动广告,点击预测系统也变得越来越普及。 我收集了艾维邑动公司一段时间内的广告点击数据,利用机器学习方法训练CTR预估模型,完成相应的数据分析报告。
关键词:CTR;点击率;预估模型
Absrtact:As we all know, click rate prediction model is very popular in today's society. In online advertising, click rate (CTR) is an important index to evaluate the effect of advertising. With the continuous development of machine learning technology, automatic advertising is constructed by machine learning method, and click prediction system has become more and more popular. We collected the advertising click data of Avazu company for a period of time, trained the CTR prediction model by machine learning method, and completed the corresponding data analysis report.
 Keywords: CTR; click rate; predictive model
0.引言
        在当今互联网发展迅速的时期,越来越多的人对广告的审美以及需求越来越高级,人人都追求物质的质感,但是大多数的想法都是将其建模成一个二分类问题再选取适当的模型进行结合。大部分点击率的模型发展都是基于特征处理和交叉信息的学习,但是通过利用机器学习的方法,例如:CTR模型。也可以对其进行研究,并且得出相应的数据结论。
1.构建CTR模型
        CTR预估模型的特征数据一般都是包含很多条特征,这些所有的特征会根据它自身特点被转换成为one-hot编码,然后再通过多个特征所对应的编码向量链接在一起构造成新的特征向量。CTR模型要求数据有很多典型的特点,比如数据应该是高维、稀疏、以及多类别的。
        LR从以前来说它一直都是CTR预估的benchmark模型,它具有简单、并且容易并行化实现的优点,但是LR模型中的特征是默认互相为独立的。所以,我们这里选用CTR模型来进行预估。
        首先,建立逻辑回归、决策树、随机森林和AdaBoost模型,然后对于取值进行不均匀特征处理,将整个特征中有些个别值超过30000次的进行二值化处理。
2.广告点击率评估指标
        在广告点击率预测领域中,所谓广告点击率评估指标都是通常被用来去衡量预测的精度的。本文主要采用准确度AUC(Area Under Curve)。AUC的面积比例越大,模型的排序性能越好;召回率为每个用户实际点击此个样本的比例,即
       
        其中,为真阴性,为假阴性。
        AUC的公式为:
       
        代表第i条样本的序号。
        M,N分别是正样本的个数和负样本的个数
        只是把正样本的序号加起来
        
3.实验结果分析以及处理
利用逻辑回归、决策树、随机森林和AdaBoost模型得到的二分类交叉熵为:
 
    由上表可以看出经过特征工程后逻辑回归的误差变小,随机森林没有影响,在此之后要对决策树模型和随机森林模型进行参数的调优,更加不需要考虑AdaBoost模型的构建。
    实验模型性能对比:

    由此可以看出,通过对比实验结果发现,CTR模型在各个方面均优于其他模型。

4.总结
        本文基于CTR模型进行广告点击率预测,其中考虑各个特征的特点以及高维性。本文的模型在实验中表现良好,说明了利用CTR模型来训练数据可以获得很好的结果。

参考文献
?[1]江丹. 基于迁移学习的广告点击率预测方法研究[D].安徽大学,2020.
?[1]陈一文. 一种改进的基于DeepFM算法的高效CTR预估方法[D].吉林大学,2020.
?[2]陈珊珊. 感知个性化对行为定向广告点击意愿的影响研究[D].华东师范大学,2020.
?[3]潘镇. 社交网络事件检测分析及应用的研究[D].中国科学技术大学,2020.
?[4]李浩. 基于深度神经网络的点击率预测模型研究[D].山东师范大学,2020.
?[5]王倩倩. 基于深度学习的广告点击率预测方法研究[D].山东师范大学,2020.

    
投稿 打印文章 转寄朋友 留言编辑 收藏文章
  期刊推荐
1/1
转寄给朋友
朋友的昵称:
朋友的邮件地址:
您的昵称:
您的邮件地址:
邮件主题:
推荐理由:

写信给编辑
标题:
内容:
您的昵称:
您的邮件地址: