熊先凯 王雪颖 程 琳
重庆第二师范学院 数学与信息工程学院 重庆 400065
摘 要电视节目推荐类算法已有十分成熟的算法,本文旨在一些常用算法的基础上添加新的视频推荐模式来适应更加宽泛的手机视频用户。先利用群组划分的方法将不同喜好种类的用户分组,与其它聚类方法不同的是,在分组的环节添加除开用户评分和单人喜好综合矩阵的第二群组划分,将存在多种共同爱好的用户分组借此来将同组用户的喜好相互推荐的目的。
关键词视频推荐 群组划分 协同过滤
中图分类号 TP391 文献标志码 A DOI:
0 引 言
网络时代飞速发展,智能手机的愈发轻便且功能强大,通过手机浏览视频的人数已超过其余任何电子设备。手机视频用户大多倾向于短视频且特点与以往与传统的电视节目播放有所不同。用户通过手机浏览视频属于个人行为,不论是在家中或公共场合,大多浏览行为都是针对用户个人,而电视节目推荐往往需要综合一群人的喜好来进行。更重要的是,手机与用户的生活等息息相关,已经属于个人隐私的范畴,其浏览的视频内容就包含了相当的私密性不可能随意与他人分享。这就导致了每个用户实际的偏好十分宽泛,用户自由隐蔽的选择视频存在巨大的变动性,新奇事物的视频或羞于与人分享的视频等都可能被用户选择。
如果可以把相同爱好的用户划到同一分组,并将每个用户不同的偏好直接性的推荐给同组用户,同组推荐的视频不考虑偏好权值,相当于推荐全新类型视频推荐给用户,若用户并无兴趣,则将该类视频权值调低并减少推荐次数,若用户对于系统源于同好分组推荐的视频大多不感兴趣,则将其移除该分组。
1技术背景概述
1.1群组划分
聚类分析(cluster?analysis)是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。?聚类分析也叫分类分析(classification?analysis)或数值分类(numerical?taxonomy)。聚类与分类的不同在于,聚类所要求划分的类是未知的,但是这同时也是聚类方法的优越之处。
本文聚类只要有两个方面,一是基于项目,二是基于用户。项目的划分就是对视频类别的划分,每个视频都含有多个标签,把每个视频进行分类后群组基本不变,因为视频的类别是不会随意变动的。用户的划分就是对存在相同兴趣的用户进行分组,组内用户相互推送新的视频,这里的推荐范围我们将其扩大化,用户组内的推荐不要求用户对该视频的偏好率多大。
K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。让簇内的点尽量紧密的连在一起,而让簇间的距离尽量的大。
如果用数据表达式表示,假设簇划分为(C1,C2,...Ck)(C1,C2,...Ck),则目标是最小化平方误差E:
其中是簇CiCi的均值向量,有时也称为质心,表达式为:
基于用户的聚类划分选用马尔可夫聚类算法(MCL),其核心是建立多点之间的相关性矩阵,然后通过加权、标准化矩阵、添加自环等优化,最后Expansion。重复上述几步直至稳定,将矩阵化为聚簇。
以上是邻接矩阵的概率化公式,之后重复Expansion和Inflation两个操作并标准化即可。
2具体模块实现
Inflation操作,每次对矩阵内元素进行r次幂方,再进行标准化。为了解决Expansion所导致的概率趋同问题,Inflation就是将概率矩阵中的每个值进行了一次幂次扩大,这样就能强化紧密的点,弱化松散的点。
将结果化为聚簇。
2.2协同过滤
一个同时考虑播放量和用户个人评分的加权公式——Weighted Rating (WR):
其中v是视频的播放量,m是被记入该系统的最低播放量,r是用户喜爱的投票数,c是所有视频的平均播放量。
参数:‘m’的值选用80%的截断,这意味这播放量95%以下的视频不被计入该次加权推荐系统。
基于K-Means的聚簇1将类型相似的视频进行划分,基于MCL的聚簇2将相同兴趣的用户进行划分,最后由协同过滤添加一些评分细节并生成最终的推荐列表,具体使用次序如下:
图一
用户经过一段时间的浏览后,个人数据初具规模时进行MCL聚类,将个人数据当成一个簇,放入所有用户的数据库中相互联系,通过Expansion和Inflation等操作暴露簇于簇之间的关系。综合用户群以及用户给自对视频的兴趣权重,如下样表
空白处是用户未进行的视频评分,用所有评过分用户的平均值代替:
其中用户组(Clusters)若干,每个组的人数(Members)各不同。至此,用户的个人数据库等同于最终的推荐列表,它源自以上三个推荐列表,在层层推荐下,不断过滤掉不感兴趣的视频,最终逐渐成型的视频推荐列表就能很好的适W应用户的要求。
3实验结果分析
通过前表的数据已知用户1对已浏览视频的兴趣权重,我们可以通过它推荐出新的视频:
图
4结 语
本文针对现在最流行的小视频进行用户视频浏览推荐系统的优化。提出了混合多种聚类算法进行更详细的群组划分,并通过协同过滤不断提高用户对推荐视频喜爱的精准度。为了不断接近用户的兴趣,引入了基于K-Means的视频类型划分,基于MCL的用户群组划分,最后采用Weighted Rating的方式对协同过滤进行优化。由上述实验结果表明,本文具有如下有点:(1)层层优化的推荐使用户的推荐列表成长性高,能更好的推荐到符合用户独特口味的视频。(2)后期更加依赖于用户聚簇的交互式推荐,较少了后期用户的计算压力。
参 考 文 献
[1]李晓瑜. 协同过滤推荐算法综述[J]. 商丘师范学院学报, 2018, v.34;No.285(09):13-16.蔡维华,
[2]翁小兰, 王志坚. 协同过滤推荐算法研究进展[J]. 计算机工程与应用, 2018, 54(001):25-31.
[3]毛勇. 基于协同过滤的推荐算法研究[J]. 计算机时代, 2018, No.313(07):32-35.
[4]张文, 崔杨波, 李健, et al. 基于聚类矩阵近似的协同过滤推荐研究[J]. 运筹与管理, 2020, 029(004):171-178.
[5]王余斌, 王成良, 文俊浩. 基于用户评论评分与信任度的协同过滤算法[J]. 计算机应用研究, 2018, 35(005):1368-1371,1402.
[6]周世兵, 徐振源, 唐旭清. K-means算法最佳聚类数确定方法[J]. 计算机应用, 2010.
[7]陈豪. 基于混合模式的个性化视频推荐方法研究[D].
\重庆第二师范学院2019年度大学生科研项目"基于群组划分与混合协同过滤的视频推荐"(KY20190234)