关键字 |
点击数据、概念、本体、搜索引擎、用户偏好。 |
介绍 |
移动搜索引擎最重要的难点之一是用户之间的交互,而移动设备的外形尺寸较小,搜索引擎受到限制。在万维网上有大量的信息,这是丰富的,个人电子设备无处不在。在个性化移动搜索引擎中,各种各样的概念和各种各样的本体被使用。在移动搜索引擎中,用户的位置是重要的关键因素之一,与特定位置相关的信息同样重要。个性化搜索引擎捕获用户位置并提供与该位置相关的信息。利用点击数据法不断优化搜索引擎的检索优势。 |
与位置相关的信息分为内容和位置概念。用户偏好是由基于本体的、全面的用户配置文件准备的,这些用户配置文件用于适应个性化的排名功能,以便对搜索结果进行排名调整。个性化的移动搜索引擎服务器是值得信赖的管理繁重的任务。服务器根据用户的内容和位置偏好准备和重新排序搜索结果,比他们回到客户端更快。个性化的移动搜索引擎客户端保存特定用户的档案记录并维护用户的隐私。个性化移动搜索引擎在基于本体的用户配置文件中配置内容和位置偏好,这些内容和位置偏好来自点击和GPS数据,不需要用户额外的努力。 |
目前已有大量的个性化相关研究工作,旨在满足用户对Web信息渗透的多样化需求。本文利用点击率数据、用户偏好以及本体等信息,为读者提供个性化移动搜索引擎的研究基础。 |
文献综述 |
PMSE:个性化移动搜索引擎[1] |
Kenneth Wai-Ting Leung, Dik Lun Lee和Wang-Chien Lee提出了一种实用的个性化移动搜索引擎方法,假设元搜索方法能够在商业搜索引擎上回复,完成无可争议的搜索。在个性化移动搜索引擎过程中,用户请求由客户端处理,客户端提交给个性化移动搜索引擎服务器。服务器返回结果和用户点击数据,以获得用户的唯一首选项。个性化移动搜索引擎的服务器对于管理繁重的任务是值得信赖的。服务器根据用户的内容和位置偏好在搜索结果返回客户端之前就准备和重新排序。个性化的移动搜索引擎客户端保存特定用户的档案记录并维护用户的隐私。为了验证所提出的方案,在个人计算机上建立了基于android的个性化移动搜索引擎客户端原型和服务器。为了正确区分与查询相关的概念的多样性及其与用户的相关性,内容和位置随机性的思想用于计算与位置相关的信息量和与查询相关的内容以及用户对内容或位置信息的兴趣。 |
1)优点:在该方案中,隐私参数能够在保持良好排名质量的同时缓解隐私体验的平滑控制。 |
2)未来的范围:为了提高个性化移动搜索引擎的个性化效果,将探索如何利用来自GPS和点击率数据的标准旅行模式和查询模式 |
挖掘用户偏好使用间谍投票搜索引擎个性化[2] |
Wilfred Ng, Lin Deng和Dik Lun Lee介绍了一种新的搜索引擎个性化方案。他们提出了一种新颖的技术,利用点击率数据挖掘用户对搜索引擎结果的偏好,并揭示偏好,以适应搜索引擎的排名功能,以提高搜索质量。这种挖掘技术被称为SpyNB(间谍朴素贝叶斯)。在本文中,他们通过考虑两个主要的研究问题来解决搜索引擎调整的困难。偏好提取是研究的问题之一,一是识别用户的偏好,二是排名功能优化,搜索引擎的排名或检索目的根据用户的偏好进行优化。关键思想是使用新颖的技术SpyNB(间谍朴素贝叶斯)来创建一组偏好,并将其输入到排名支持向量机算法中,以优化排名函数。 |
1)优点:提出的算法SpyNB用于个性化元搜索引擎增强了排名优势,并能够提供用户的特定兴趣。 |
2)未来范围:在其他需要半监督学习的分类环境中增强SpyNB。也齿轮间谍系统朝着RSVM在一条直线上通过投票排序来挖掘偏好。 |
基于个性化概念的搜索引擎查询聚类 |
Kenneth Wai-Ting Leung, Wilfred Ng和Dik Lun Lee介绍了一种有效和高效的方法来提供个性化的查询建议,该方法捕捉了用户的概念偏好。这一目标通过两个新的步骤来实现。首先,在线方法从查询给出的搜索结果的网页片段中提取概念,并利用这些概念来识别该查询的相关查询;其次,提出了一种新的两阶段个性化聚类算法,该算法能够提供个性化查询聚类。 |
1)优点:该方法可以有效地根据用户的概念需求提出个性化的查询建议,提高预测精度和计算成本。 |
2)未来的范围:增强用户偏好和概念之间的关联,以获得额外个性化和准确的查询建议,并将点击量数据和概念关系图集成到排名算法中。 |
使用点击数据优化搜索引擎[4] |
Thorsten Joachims介绍了一种利用点击率数据机械优化搜索引擎检索优势的方法。自然地,一种更好的信息检索方法将重要的或最有可能的文档放在排名的前面,相关性文档的数量较少排在后面。主要目标是建立一种技术,利用点击数据进行准备,特别是查询搜索引擎的日志记录与用户在现有排名中点击的链接的日志相关联。点击数据可以大量获取,并且可以以低成本记录。借助支持向量机机制,实现了学习检索功能的过程。这种技术非常适合于风险最小化框架。 |
1)优点:在该方法中,采用支持向量机算法,该算法面向膨胀程序,并扩展到非线性排序函数。 |
2)未来工作:在这个框架中,也有可能探索使算法健壮的机制来对抗“垃圾邮件”。 |
将联合训练应用于点击数据的搜索引擎适配[5] |
谭庆昭,柴晓勇,Wilfred Ng, Lee Dik-Lun提出了一种新的算法技术,在协同训练框架(RSCF)中排序支持向量机。基本上,该算法将搜索结果中包含用户使用或点击的内容的点击率数据作为输入,并产生可调整的排名作为输出。通过分析点击数据,RSCF将数据区分为包含已扫描对象的有标签数据集和包含未扫描对象的无标签数据集。然后,与未标记的数据相比,对标记的数据进行改进,以获得更好的数据集用于训练排名器。 |
1)优点:该方法通过对点击率数据的学习,能够获得更好的搜索结果检索优势,并且在网页搜索过程中不会给用户带来任何负担。 |
2)未来工作:改进了将点击数据的会话识别到日志文件中的方法,并在积累中提供个性化需求,使搜索引擎适应用户。 |
优化的移动搜索引擎[6] |
E.Chaitanya, Dr.Sai Satyanarayana Reddy, O.Srinivasa Reddy他们提出了一个优化的个人移动搜索引擎,它考虑用户的偏好,并分析相关概念类型的点击量数据。用户的位置是移动搜索中的重要因素之一,因此优化后的个人搜索引擎将这一概念分为内容概念和位置概念。GPS系统不仅用于识别用户的位置,还用于收集位置相关信息。通过本体对偏好进行控制,进一步实现了搜索结果的个性化排序功能。为了将与查询相关的概念类型化,其与用户的相关性需要平衡链接内容和位置方面的权重。在该方案中,客户端将点击数据收集并存储在本地,并负责保护隐私,为在优化个人搜索引擎服务器上执行做好准备。 |
1)优点:确定内容和位置概念的独特特征,使用客户机-服务器体系结构提供逻辑策略,将它们合并到移动环境的相同解决方案中。保密参数可以在保持良好排名优势的同时,平滑地控制隐私体验。 |
2)未来工作:从GPS和点击数据中增强正常的旅行模式和查询模式。 |
结论 |
我们了解到个性化移动搜索引擎是用户之间的接口,搜索引擎由于移动设备的小形式因素而受到限制。确定内容和位置概念的区别特征,以使用客户机-服务器体系结构提供逻辑策略。机密性参数使隐私体验的平滑控制成为可能,从而保持良好的排名优势。通过本体对偏好进行控制,进一步实现了搜索结果的个性化排序功能。为了将与查询相关的概念类型化,其与用户的相关性需要平衡链接内容和位置方面的权重。 |
本文将为读者提供个性化移动搜索引擎的研究基础。 |
鸣谢 |
感谢神秘的推荐人对本文的内容和质量提出的宝贵建议。作者非常感谢我们校长为开展这项工作提供必要的便利。我们感谢我们的部门主管为指导我们执行这一审查文件所作的勤奋努力。 |
|
表格一览 |
|
表1 |
|
|
参考文献 |
- Kenneth Wai-Ting Leung, DikLun Lee和wang - chilee,“PMSE:个性化移动搜索引擎”,《IEEE知识与数据工程汇刊》第25卷第4期,2013年4月。
- Wilfred Ng, Lin Deng和DikLun Lee“利用间谍投票挖掘用户偏好以实现搜索引擎个性化”ACM互联网技术汇刊,第7卷,第3期,2007年8月,第1-28页。
- Diego Kenneth Wai-Ting Leung, Wilfred Ng和DikLun Lee,“基于个性化概念的搜索引擎查询聚类”,ieee知识与数据工程汇刊,第20卷,no。2008年11月11日
- Thorsten Joachims《使用点击数据优化搜索引擎》第八届ACM SIGKDD国际会议论文集:知识发现和数据挖掘,ISBN: 1-58113-567-X。
- 谭清钊柴晓勇吴迪伦李德伦《基于联合训练的点击数据搜索引擎适应性研究》;在DASFAA的程序。2004年,519 - 532。
- E.Chaitanya, Dr.SaiSatyanarayana Reddy, O.Srinivasa Reddy“优化的移动搜索引擎”,(计算机科学与工程学报),2014,第5卷,第3期,第1 - 4期。
- S.Karthika, S.Gunanandhini, a。Vijayanarayanan,“基于Android的高效搜索引擎检索系统使用本体”,IJREAT国际工程与先进技术研究杂志,第一卷,第1期,2013年3月。
- Akshaya V Deshmane, Reshma A Sawant, Anant A Kaulage“个性化移动搜索引擎的调查”,《计算机科学与管理研究》,2013年10月,ISSN 2278-733X。
|