校园移动互联网业务个性化推荐算法研究
时间:2013-12-03 11:09 文章来源:http://www.lunwenbuluo.com 作者:徐婷肖 点击次数:
摘要:随着移动互联网技术的普及和移动互联业务的爆炸性增长,互联网业务个性化推荐技术日益受到重视,其中协同过滤算法是应用最为广泛的推荐算法之一,但是在校园移动互联网应用中,传统的协同过滤算法难以准确定位目标用户的最近邻,因此其推荐效果并不理想。本文将业务影响权重参数引入协同过滤算法中以便更加精确计算校园用户间的相似度,同时采用层次分析法(APH)确定权重数值,最后采用实际收集的数据进行算法仿真实验,结果表明该算法较传统协同过滤算法具有较好的推荐精度。
关键词:个性化推荐;协同过滤算法;APH;相似度计算
随着移动通信网络的发展和智能手机的普及,移动互联网业务日益丰富着人们的生活,移动增值业务的数量也呈现爆炸性的增长[1],[2]。与此同时,不论是用户还是运营商都感觉到了类型繁多的业务和多元化的用户需求之间信息连接的迫切性,移动互联业务的个性化推荐研究由此进入了人们的视线。其中,协同过滤算法是应用最为广泛的推荐算法之一。
协同过滤算法由Goldberg等在1992年提出,其主要原理是如果某些用户对一些业务的评价很相似,那么他们对其他业务的评价也会很相似。目前协同过滤算法主要分为两类:1)基于用户的协同过滤算法:该算法的关键在于寻找与目标用户具有相似兴趣的最近邻居,将这些邻居的选择推荐给目标用户。2)基于项目的协同过滤算法:该算法的关键在于使用目标用户对相似项目的评分来预估该用户对某个新项目的评分,根据评分的高低来决定推荐的次序[3]。总体来看基于用户的协同过滤算法更适用于移动互联网业务的个性化推荐。
1传统的基于用户的协同过滤算法
该算法的核心思想是根据用户对各种业务的评价情况统计出与目标用户兴趣最为接近的用户群,称为目标用户的"最近邻居"。目标用户对某个未曾使用的业务的评价可以基于他的"最近邻居"对该项业务的评价结果预测得到。根据不同业务的预测评价决定该业务的推荐排序。移动增值业务中,传统的协同过滤推荐算法是按照以下步骤进行:
(1)建立不同用户对于各项业务的评分矩阵R(m,n),代表共有m个用户和n种增值业务,矩阵元素Rij代表用户i对业务j的评分,取值区间一般位于[0,1]之间。
(2)为目标用户寻找最近邻居集。通过计算用户之间的相似度,为目标用户形成相似度从大到小排列的邻居集合。用户i和用户j的相似度的计算采用Pearson相关度计算公式:
式中,用户i和用户j共同评分过的业务集合为Iij,Ri,k表示用户i对业务k的评分,和表示用户i和j对业务的平均评分。
(3)根据目标用户的最近邻居集合对某项业务的评分来预测目标用户对该项业务的评分,并根据预测评分的高低决定业务的推荐排序。用户u对项目i的预测评分为:
式中,Su是目标用户u的最近邻居集合。和分别表示用户u和用户n对增值业务的平均评分。Sim(u,m)表示用户u和用户n之间的相似度。Rn,i表示用户n对业务i的评分。
很明显,该算法在计算用户相似度时,并没有权重值,或者说对每项业务赋予相同权重,因此对某些用户群体,如校园互联网用户,该算法是不适用的,需要进行改进。
2校园移动互联网用户的特殊性
校园用户是目前移动互联网增值业务的主要用户群体之一,他们年龄段集中,学历经历相似,时间较空闲,集聚性强同时经济能力有限,因此他们对于增值业务的选择有一定的趋同性。从我们收集分析的1000份在校大学生增值业务使用情况的调查问卷的数据看来,有多项业务开通比率超过50%,其中最高的彩信业务开通比率接近70%。在此情况下,如果采用传统的相似度计算方法,那么就很难真正区分出真正具有相同兴趣的用户。因此对于相似度计算算法必须进行改进以适应校园用户的特殊性。
3算法的改进
为使用户间相似度的计算值能够更加准确地描述校园用户间个人兴趣的相似度,我们对被校园用户过于广泛使用的业务赋予较低的权值,这样用户间的相似度计算值将会更加精确。
为了将我们对各项业务重要性的定性分析转变为具体权值,在此引入了层次分析法(APH)。该方法由美国运筹学家T.L.saaty于上世纪70年代提出,是一种将定性和定量结合起来的系统分析方法,它将人的主观判断数量化。在此处应用该方法,我们可以用收集的实证数据和经验判断各业务之间的相对重要程度,并给出每种业务的影响权重。层次分析法的一个重要特点就是用两两重要性程度之比的形式表示出两个方案的相应重要性程度等级。在本文里我们对所涉及业务进行两两对比,并按其重要性程度评定等级。
在此处运用AHP方法,大体可分为以下三个步骤:
步骤1:分析各增值业务间的关系,建立主观判断的客观化标度;
步骤2:对各项业务的重要性进行两两比较,根据上表的标度方法构造两两比较的判断矩阵;
步骤3:由判断矩阵计算被比较业务对于该准则的相对权重,并进行判断矩阵的一致性检验。
通过AHP法的应用,我们能够获得各项业务的影响权重。设增值业务k的影响权重为Wk,那么用户i和用户j的相似度计算公式为:
根据公式(2)计算目标用户对于各项未选取增值业务的预测评价后,我们就可以获得针对目标用户的推荐序列了。
4实验研究
为了验证该算法,我们通过问卷调查的方式收集了1000名在校大学生对于11种常用移动互联网增值业务的使用和兴趣情况的数据。根据问卷结果首先建立了用户打分矩阵,同时根据各项业务的使用率建立其两两比较的判断矩阵。对判断矩阵进行归一化处理后,得到各业务权重值如下表,并通过一致性验证。
我们将各业务权值代入公式3,获得了各用户间相似度数值,为每个用户选取相似度最高的N名用户作为其最近邻居集合,得到每名用户的推荐列表。将推荐列表与用户自己提供的兴趣列表相比,本文所提出的算法比传统的协同过滤算法推荐精度提升了15%以上。
5结论
本文主要根据移动互联网校园用户的特点,对基于用户的协同过滤算法个性化推荐应用过程和算法的改进进行了论述。我们将业务影响权重引入了用户间相似度的计算过程中,并使用层次分析法来将经验判断转化为权重数值。改进后的算法提升了对业务的推荐精度,算法仿真效果良好。由于移动增值业务种类繁多,我们此次仅选取了部分常用业务来进行实验验证,因此如何建设自适应性权重计算模型,以便当业务种类扩展时,能够简单快捷的自动计算业务影响权重,将是我们今后研究的重点。
[参考文献]
[1]MobilePholleResearchRePort(2007-l0-30),http://bbs.8.i.eo;n/toPledetail.html?id=19284.
[2]Accomplishmentinstanceofmaintargetincommunicationindustryin2007.
[3]AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:Asurveyofthestate-of-the-artandpossibleextensions.IEEETransactionsonKnowledgeandDataEngineering,2005,17(6):734-749.
- 论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
- 论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
-
- 论文投稿客服QQ:
2863358778、
2316118108
-
- 论文投稿电话:15380085870
-
- 论文投稿邮箱:lunwenbuluo@126.com