时间:2015-04-16 11:47 文章来源:http://www.lunwenbuluo.com 作者:王春才等 点击次数:
3 算法实现过程
具体思路如下:
①对日志信息进行处理与分析[4],通过用户浏览或购买过某产品的信息所表现出的用户兴趣,将其从隐性信息转化为显性评分值;
②通过度量项目间的相似性,选取出k个最相似的项目形成k个相似项目的集合,具体的相似性计算方法如公式(1)所示;
③通过目标用户u的最近邻集合,利用公式(2)产生用户u对目标项目的评分;
④得到用户对目标项的评分后,可按评分大小取其前N项对用户u进行推荐,从而完成全部推荐过程。
4 实验与分析
为了验证算法的精确性,使用绝对偏差MAE(Mean Absolute Error)[5]作为度量算法精确度的标准,并与Item-Based协同过滤推荐算法进行比对分析。
实验中,指定项目聚类的数目为80。在最近邻选取时只选取与目标项目最为相似的前6项,对目标项目的最近邻数目由10个增至50个,其间隔为10。分别计算基于Web日志与聚类的协同过滤推荐算法与Item-Based协同过滤推荐算法的MAE,实验结果如图1所示。
由实验结果可知,随着目标项目的最近邻数目的逐渐增加,两算法的MAE值均逐渐降低,当最近邻的数目达到50时,两算法都获得了最低的MAE,从而获得了最佳推荐效果。但自始至终基于Web日志与Item-Based协同过滤推荐算法的MAE值均小于Item-Based协同过滤推荐算法的MAE值。由此可见,基于Web日志与聚类的协同过滤推荐算法相较于Item-Based协同过滤推荐算法具有更高的推荐精度。
5 结语
本文所提出算法的推荐精度较传统的Item-Based协同过滤算法高,具有一定优势,不仅提高了协同过滤算法的效率,还解决了User-Based算法中用户过多不易寻找与目标用户具有相似爱好的用户群的瓶颈,节约了用户搜索产品的时间,并可以同时提高商家效益,从而实现用户与商家的共赢。
参考文献:
[1] 杜英. 基于协同过滤技术的个性化推荐系统研究[D].天津:天津师范大学,2012.
[2] BING LIU.Web数据挖掘[M].北京:清华大学出版社,2013.
[3] 李雪,左万利,赫枫龄,等.传统Item-Based协同过滤推荐算法改进[J].计算机研究与发展, 2009:394-399.
[4] 王泽彬,金飞,李夏,等.Web数据挖掘技术及实现[J].哈尔滨工业大学学报,2005,37(10):1403-1405.
[5] 马宏伟,张光卫,李鹏.协同过滤推荐算法综述[J].小型微型计算机系统,2009,30(7):1282-1288.
联系方式
随机阅读
热门排行