关键字 |
信息重载,关键字查询,快速检索,内容推荐,推荐系统。 |
我的介绍。 |
网络是一个重要的媒体,以满足用户谁寻求任何主题的信息。由于社交网络网站和在线用户生成内容系统的爆炸式增长,个性化是每个网站的理想功能。在门户网站上浏览时,时间更少,搜索引擎产生的数据量更多。为了优化传递给用户的内容,大多数搜索引擎使用内容推荐。为用户提供有用项目建议的软件工具和技术称为内容推荐。推荐系统是信息过滤系统的一个子类,它预测用户对商品的评价或偏好。推荐系统给出的建议是基于用户的决策过程,比如买什么,读什么,看什么。术语内容项用于表示系统推荐给用户的内容。 |
近年来,推荐系统被广泛应用。推荐系统的主要特点是能够吸引用户的兴趣,并为用户提供更好的响应。主要应用领域是电影,新闻,书籍,研究文章,搜索查询和产品,如服装,花式,电子产品等。此外,还有餐馆、人寿保险、金融服务、笑话、专家、推特粉丝等的推荐系统。 |
在下面的第一部分中,我们描述了构建推荐系统最常用的方法,如协同过滤、基于内容的预测器、基于知识的方法、人口统计过滤和基于混合内容的协同过滤方法。第二部分对不同方法进行了比较。第三部分论述了门户网站内容推荐的优势,最后是本文的结语部分。 |
2推荐技术 |
不同的技术[8]用于搜索引擎的内容推荐。推荐系统通常通过以下两种方式之一产生推荐列表——通过协作或基于内容的过滤每种方法都有其优缺点。 |
A.协同过滤 |
在推荐系统中,最流行和应用最广泛的方法是协同过滤。这种方法根据用户过去的行为以及其他用户做出的类似决定建立一个模型,然后使用该模型预测用户的项目。在图1中,CF系统收集用户反馈作为内容项的用户评分,并利用其他用户之间的异同。两个用户在品味上的相似度是根据用户评分历史中的相似度来计算的。这就是为什么这项技术被称为协同过滤,意思是人与人之间的关联在与项目相关的内容不多或内容难以分析的领域,我们使用CF。该系统有能力推荐与用户相关的项目。这两点是协同过滤相对于其他方法的优势。因此CF系统被广泛应用于开发推荐系统。基于CF的推荐有四个问题,分别是:[2] |
•稀疏性:用户项目评价矩阵是稀疏的,因为大多数用户不评价大多数项目。因此,即使是最受欢迎的项目也只有很少的评级。所以很难找到评分相似的用户。当系统具有较高的物品与用户比率时,或者当系统处于使用的初始阶段时,就会出现此问题。 |
•第一评级问题:除非用户之前对某个商品进行过评级,否则该商品无法被推荐。新内容项出现此问题。 |
•冷启动:为了做出准确的建议,CF系统需要大量用户的现有数据。 |
•可扩展性:有数百万的用户和产品。因此,需要大量的计算能力来计算推荐。 |
B.基于内容 |
在这种方法中,推荐来自一组具有相似特征的项目。基于内容的预测方法是基于项目的描述和用户偏好的配置文件。在图2中,使用CB系统关键字来描述商品,并创建user profile来表示该用户喜欢的商品。用户配置文件的创建基于两种类型的信息。一个是用户的偏好,另一个是用户的交互历史。系统首先学习与用户过去喜欢的东西相似的东西。然后基于项目特征的加权向量创建基于内容的用户配置文件。项目的相似度是根据与比较项目相关的特征来计算的。权重表示项目对用户的重要性。喜欢或不喜欢是用户直接反馈的一种形式,所以它可以用来分配更高或更低的权重。 Various candidate items are compared and best matching items are recommended. As an example, if a user has rated a video as comedy category then he/she gets further recommendation from that category. CB method can uniquely characterize each user. The main disadvantages of content based predictor are: |
•推荐网站新内容的能力有限。[1] |
•系统是否能够从用户操作中学习用户偏好。 |
•当系统被限制推荐用户已经使用的同类型内容时,推荐系统的价值小于可以推荐其他服务的其他类型内容的价值。 |
C.基于知识的方法 |
基于知识的系统[5]使用关于用户和产品的知识。雷竞技官网在图3中,基于知识的方法基于对用户需求和偏好的推断来推荐商品。在这种方法中,首先要了解某些产品的特性如何满足用户的需求和偏好,以及该产品如何对用户有用。然后估计一个相似度函数,以确定用户需要匹配多少推荐。相似度可以直接解释为用户推荐的来源。基于知识的方法的优点是,它没有“上升”的问题,因为它的推荐不依赖于任何用户评级数据库。用户对了解信息空间很感兴趣,他们会根据自己的需求制定更多的细节。这种方法的判断是独立于个人口味的,因此不需要收集关于特定用户的信息。这种方法有一些缺点。为了提出有用的建议,系统需要一个知识库。 This knowledge base need frequent updating to keep up with the ever-changing consumer ratings and preferences. This system only gives static suggestions so user gets what is contained in the database. |
D.人口统计过滤 |
该系统根据用户的人口统计资料推荐商品。[3]该方法使用不同的人口统计属性,如年龄,性别,职业,用于推荐目的。通过结合用户在不同位置的评分,为不同的人口统计位置生成不同的推荐。基于人口统计的推荐简单有效。例如,将根据用户的语言或国家将用户发送到特定的Web站点。在人口统计推荐中,图4的建议可能是基于用户的年龄。这种方法主要应用于市场营销领域。人口统计属性避免冷启动问题。[4] |
E.混合推荐系统 |
我们描述的所有方法都有各自的优点和缺点。因此,我们采用了一种混合推荐系统,将两种或两种以上的推荐技术结合起来,以获得更好的内容优化。最流行的混合方法是结合基于内容的预测器和协同过滤推荐系统。通过将内容和协作结合起来,可以开发出一个优雅而有效的框架。因此得名基于内容的协同过滤器(CBCF)这可以通过不同的方式实现:分别进行基于内容和协作的预测,然后将它们结合起来;通过在协同过滤器中添加基于内容的预测;通过将两种方法统一为一个方法。在图5中,基于内容的协同过滤器比纯基于内容的预测器或纯协同过滤器性能更好在CBCF中,基于内容的预测器用于增强现有的用户数据,然后通过协同过滤提供个性化的建议。 This method is effective and provides more accurate recommendation to a user. CBCF [6] also overcome problems like cold start and sparsity problem. It also overcome first rater problem. CBCF can improved by improving content based predictor or collaborative filtering methods. |
推荐制度的优点 |
•提高用户满意度。 |
•增加销售物品的数量。 |
•销售更多样化的内容。 |
•提高用户忠诚度。 |
•更好地理解用户的需求。 |
结论 |
本文分析了用于内容推荐的各种技术,并进行了比较。内容推荐是网站的一个重要环节。所以要正确选择方法。第一种方法是协同过滤,它根据用户过去的行为以及其他用户做出的类似决定建立一个模型,然后使用该模型预测用户的选择。基于内容的预测方法是基于对商品的描述和用户偏好的分析。基于知识的系统使用关于用户和产品的知识。雷竞技官网人口统计过滤系统根据用户的人口统计资料推荐项目。混合方法将基于内容的预测器和协同过滤相结合。在这些方法中,应用最广泛的是混合法。它克服了单一推荐方法的缺点。 |
表格一览 |
|
表1 |
|
|
数字一览 |
|
|
参考文献 |
- 边江,董安磊,何晓峰,Srihari Reddy,常毅,“基于用户行为的在线内容优化分析”,《计算机工程学报》,第25卷,第1期。9日,2013年
- Prem Melville和Raymond J. Mooney和RamadassNagarajan,“改进推荐的内容增强协同过滤”,Proc。第18届全国人工智能大会),第187-192页,埃德蒙顿,加拿大,2002年7月。
- Francesco Ricci和LiorRokach和BrachaShapira,“推荐系统介绍”,推荐系统手册,施普林格,2011,第1-35页。
- LailaSafoury和Akram Salah,“利用用户统计属性解决推荐系统中的冷启动问题”,《软件工程讲义》,第1卷,第3期,2013年8月。
- Robin Burke,“基于知识的推荐系统”,加州大学欧文分校信息与计算机科学系。
- Basu, Haym Hirsh, William Cohen,“推荐分类:在推荐中使用基于社会和内容的信息”AAAI-98论文集,1998
- 基于维基百科/知识和基于人口特征的内容推荐。
- 维基百科/内容推荐方法及其分类。
- PrzemyslawKazienko和PawelKolodziejski,“电子商务推荐方法的个性化集成”,国际计算机科学与应用杂志ã 2006科技数学研究基金会第3卷第3期,第12-26页
- Robin Burke,“混合网络推荐系统”,计算机科学学院,电信和信息系统
- 德保罗大学,美国伊利诺伊州芝加哥市沃巴什大道243号
|
传记 |
Neethu拉吉是佩鲁蒙工程学院计算机科学系的技术硕士(M-tech)。她获得了科钦科技大学的学士学位(B-tech)。主要研究方向为数据挖掘、图像处理、网络安全等。 |
Suja Rani M S他是佩鲁蒙工程学院信息技术系的助理教授。她获得了MS大学的技术硕士学位和喀拉拉邦大学的技术学士学位。主要研究方向为计算机网络与数据挖掘等。 |