刘 炼
中国移动通信集团湖北有限公司 业务支撑中心 湖北 武汉 430012
【摘要】随着5G新基建的建设,目前用户数不足成为制约5G发展的关键因素,推动用户向5G套餐转型迫在眉睫。
传统的通信套餐推荐仅仅根据用户消费、语音时长、手机流量三个维度进行匹配,缺少对家庭套餐中宽带和电视维度的定量匹配。另外没有优先对用户换套餐意愿进行分类,导致用户即使消费行为和目标套餐匹配度很高,但是营销转化率依然很低。
本文首先对用户更换5G套餐意愿进行分析,采用43个维度作为输入,通过xgboost算法,构建5G个人套餐、家庭套餐和无意向换套餐三分类用户模型,作为预置模型。随后以5G家庭套餐举例,对换套餐正样本用户的消费、语音时长、手机流量、宽带流量、HTV电视使用次数五维度权重空间进行枚举,选取最佳权值组合,按月更新,提升营销成功率。
【关键词】5G套餐、xgboost、行为套餐相似度、营销转化率
1.引言
随着中国移动5G+AICDE战略的实施,及时将存量用户转换为5G套餐用户,是执行上述战略的重要抓手。
传统的套餐推荐多是根据用户历史的arpu、dou、mou分别进行筛选后取交集,筛选阈值全凭人工经验,缺少根据套餐包含内容的全面量化匹配,导致转化率较低。因此急需一个能根据客户历史消费习惯和套餐内通信产品使用习惯,自动定量分析客户和套餐匹配度,满足客户实际5G套餐需求的模型,辅助相关营销推荐工作的开展。
2.模型整体方案
本模型采用业务规则与机器学习算法、打分适配结合的方式构建,通过业务规则对全量用户群体进行初筛,再通过机器学习算法判断用户是否适合订购5G套餐,并区分个人版套餐与家庭版套餐的用户群体,最后分别对个人/家庭版套餐的潜在用户群体进行打分适配不同的套餐档位。
3.模型实现方案
1233.15G套餐潜客初筛
(1)剔除新入网用户,剔除月均流量小于5MB用户,剔除状态非正常用户,剔除3月内主产品变更用户;
(2)计算客户消费稳定度,取消费稳定度在(0,0.5]区间的用户为初步目标客户群体。
注:a:T-3月ARPU;b:T-2月ARPU;c:T-1月ARPU;d:近3月ARPU均值;AB:客户消费稳定性评估结果。
3.2个人和家庭套餐潜客挖掘
从产品层面来看,5G家庭版套餐和5G个人版套餐存在一定差异,目标客户的对产品的侧重点也有所不同,故我们在为用户匹配套餐档次之前,前置一步区分出不同类别套餐的潜在客户群体,同时也通过该步骤筛选掉订购5G套餐意愿不高的用户群。
通过xgboost算法,构建不同类别5G套餐的多分类模型,判断用户是否适合订购5G套餐,同时区分出适合订购个人版套餐和家庭版套餐的不同用户群体。
(1)样本选择:
正样本1:T月正常在网并生效5G个人版套餐(5个档次)且T-1月为4G套餐的客户;
正样本2:T月正常在网并生效5G家庭版套餐(5个档次)且T-1月为4G套餐的客户;
负样本:T-1月正常在网且未办理5G套餐的客户。
(2)特征输入
根据业务理解及特征重要度筛选,共选择用户基本标签、用户订购信息、用户消费信息、流量使用数据、语音使用数据、宽带流量数据、和TV使用数据等共计43个特征字段建立建模宽表。
(3)模型调优
通过自定义最佳迭代轮数计算方法和随机搜索的方式完成模型的参数调优工作。
实现代码如下:
图2:个人/家庭区分模型训练代码
模型效果:
通过下表可以看出,通过最佳迭代轮数计算和随机搜索调参后,模型在验证集的三个评估指标均有不同程度的上升。
表2:模型调优评估
备注:由于该模型为多分类问题,所以采用macro-p、macro-r、macro-F1作为评价指标,计算方式为求得每一类别的precision、recall、f1,再对所有类别的precision、recall、f1求平均。
3.3用户套餐档位适配
(1)计算逻辑
通过计算用户日常通信上网行为数据和不同档位套餐包含内容的相似度,来确定每个用户适合的5G套餐档位,相似度计算公式如下:
其中,i表示不同维度,不同的产品可根据实际业务理解情况酌情增减,User_value(i)代表该维度用户近三月的均值,Obj_value(i)代表目标套餐该维度的值,Z表示计算Z分数,w(i)代表不同维度的权重。
(2)确定维度
我们以5G套餐家庭版来举例说明计算维度的确定。通过对已订购家庭版5G套餐的用户数据进行分析,发现大多数用户的arpu值都在订购套餐档位的附近,且流量、语音使用情况较为饱满(套餐包含量的60%-80%之间),少部分用户的arpu均值虽与订购套餐档位存在一定差异,但在宽带使用流量以及HTV使用次数上明显高出其他用户。因此确定了以用户arpu、流量、语音为主,宽带使用流量和HTV使用次数对部分高宽带和HTV使用用户进行修正的计算策略。实际计算时共有消费、流量、语音、宽带使用流量(类似宽带使用流量这类目标套餐没有明确包含值的维度,我们通过订购该产品的用户均值来代替)、HTV使用次数五个维度。
(3)确定权重
计算用户和目标套餐相似度这一过程,不同维度权重的确定尤为重要,在前期缺少已经订购用户的作为样本的情况下,可以通过业务专家确定权重的值或者对不同档位用户的各维度数据进行分析,确定不同的维度的权重,但这样做存在的弊端就是主观性太强,且定期需要人为介入。故当拥有一定量的营销接触用户和营销结果数据后,我们可以通过枚举参数空间,将不同的权重组合带入公式进行计算,比较不同权重组合预测用户订购档位和实际营销中用户订购的档位(相似度最小档位),选取最佳的参数组合。
比较不同权重组合计算的各档位套餐推荐用户群体和用户实际订购的套餐情况,挑选推荐用户和实际订购用户重合度最高的权重组合为该档权重组合,确定各档位套餐的维度权重组合如下:
由上表可以看出,虽然5个档位的5G家庭套餐在arpu值维度,都有较高的权重占比,但随着套餐档位的逐渐升高,用户对资费层面的敏感度也随之下降,高档位套餐(299、399)订购用户更看中语音、宽带、HTV维度,而中间档位套餐(199、229)的订购用户则对套餐包含的流量比较敏感,最低的179档位套餐的订购用户,对流量、语音、宽带、HTV均有不同程度的需求,但是对资费较为敏感。
(4)限定相似度阈值
在得到用户适配的套餐及该套餐的相似度的情况下,我们需要对用户再次进行筛选,这里的相似度阈值主要靠人为业务经验确定,主要把握两个原则:在保证输出用户群体一定数量的情况下,同时参考本期输出的目标客户群体数量是否与往期相似,相似度阈值越小越好,经验值为小于0.1。
(5)模型效果
模型在验证集的表现如下:
备注:验证判断预测是否正确的条件为客户是否订购推荐档位的套餐,例如为客户推荐198套餐,同时客户订购198套餐,则该样本预测正确。
3.4模型迭代训练
随着营销活动的不断展开,将接触用户的营销结果作为增量数据供用户类别判断部分以及相似度计算权重确定部分的机器学习算法进行增量学习,以达到持续自动优化的目的。
4.运营效果
6-8月市场部通过模型输出结果制作的标签共策划营销活动八场,接触客户24135人,客户订购量4146,活动转化率高达到17.18%。而同期相同营销渠道的未使用该模型标签的5G平档迁移类营销活动的平均准化率仅为3.74%。
5.结论
在5G套餐用户营销的实践中,通过解耦用户换套餐意愿和套餐档位匹配,并且在套餐匹配时对于家庭套餐纳入宽带流量和HTV电视开机次数两个套餐维度进行五维度的权重匹配,相比传统营销模型,可以获得很好的5G套餐营销转化率。