所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

认知信息检索的概念、过程和技术综述

Parul Kalra Bhatia* 1, Chetna Choudhary2, Deepti Mehtrotra博士3.以及阿卜杜勒·瓦希德医生4
  1. 印度北方邦诺伊达的阿米提大学IT系
  2. 印度北方邦诺伊达的阿米提大学IT系
  3. 印度北方邦诺伊达阿米提大学I- Block 44区ASCS主任
  4. HOD CS与it, MAMUU,中央大学,海德拉巴,安得拉邦,印度
通讯作者:Parul Kalra Bhatia,电子邮件:(电子邮件保护)
有关文章载于Pubmed谷歌学者

更多相关文章请访问全球计算机科学研究杂志

摘要

“认知”一词指的是意识或知识的思维过程。在认知科学方面,它提供了信息处理、资源概念化、知觉技能和认知心理学相关主题之间的桥梁。通过检索基于认知概念、过程和技术的信息,可以在结构和伤亡的轮廓中表示当前用户的信息需求、他们的问题状态和领域工作或感兴趣的领域。这种多表征方法导致认知过程在感知、注意、解释、理解和记忆等方面对人类行为交互进行多任务处理。在相关反馈实现技术的帮助下,使用知识域可视化验证并提供可靠性指标来计算用户行为,培训框架为用户提供如何继续搜索和检索信息

关键字

认知信息检索,人类行为交互,多任务处理,多表征。

认知科学

认知科学是神经科学、人工智能、哲学、心理学、语言学、人类学、社会学和教育学[1,16]强调人类大脑情感、智力和行为,关注信息的多学科科学研究领域。它代表了人类神经系统和计算机、机器人、推理机等机器中的知觉、语言和记忆推理等处理过的信息。它有助于从低水平的学习到高水平的决策和计划的分析。

认知信息

认知信息学(CI)继承自认知科学和信息学领域。CI提供了概念理论和数学计算,为机械、电气、电子和计算机工程等基于知识的科学和工程奠定了基础。它形成了足以统一处理过的信息和解释交际信息的结构和组织的模式的计算系统。CI的目标是实现工程解决方案,如文本、数据挖掘和web、交流机器人、多媒体、多模态交互系统、实时或虚拟环境,以实现分布式协作工作[14]

认知信息检索(cir)

CIR是一个跨学科的研究领域,包括从信息科学到认知科学的研究,这有助于在人为因素的基础上与人类计算机进行交互。CIR被定义为与人机交互过程相关的复杂的人类信息,这些信息嵌入到个人的日常社会和生活环境中。CIR是人类信息条件的重要组成部分,对Web和IR系统设计新方法的开发至关重要。目前,信息检索(IR)研究起源于三个独立的领域:信息科学、计算机科学和社会科学领域的贡献。然而,这三个社区并没有真正地相互交流,并且使用不同的方法。作者从因变量、自变量和受控变量的角度考察了这些不同的方法。由于IR服务于寻找信息的目标,而这些目标主要服务于用户的工作任务(或其他兴趣)的目标,作者建议在上下文或任务中为用户的信息搜索[3]提供一个可能的协调领域。
新兴的框架、模型和理论为CIR提供了更复杂的观点,包括多任务处理、相关性反馈、人类信息行为(HIB)、纵向过程模型和可视化技术[3]信息科学、计算机科学、认知科学、人为因素和相关学科领域的研究人员和学生。学者们正在为各自的研究工作调查CIR,研究人员正在更广泛地考虑信息寻求者,而不仅仅是IR系统的用户以及使用过程中可能出现的技术问题。[3]

认知信息检索的概念、过程与技术

图像

概念

基于相关性反馈的CIR研究理念,借助用户与IR系统的交互。研究用户的认知行为,以文档的形式提供有价值的输入,以分析、设计、评估用户档案的完整图景。[3]

概念化CIR的关键概念

(一)相关性
(b)认知和互动
(c)多表征方法。

相关性:

相关性概念目前形成了对IR系统的修正反馈的基础,允许系统修改其匹配算法,使其更准确地匹配真实的信息需求,而不是用户最初表示的信息需求,在交互中由用户的查询表示。目前,我们根据系统检索主题相关文档的能力来评估系统性能;因此,我们构建了检索主题相关文档的系统。鲁斯温认为,这种强烈的相关性观点——基于主题的相关性的单一、客观现实——已经成为更自然主义方法和系统发展的主要障碍

认知和互动:

当用户与环境刺激互动并对其做出反应时,他们的认知方面形成了IR系统。从认知的角度来看,信息需求作为用户在交互中的概念基础是有问题的。Cole、Beheshti、Leide和Large随后指定了他们希望详细研究的用户-系统交互的术语和定义。它试图将信息需求重新定义为用户-系统交互的概念基础。为此,交互被表示为一系列交互状态:用户的任务或问题状态,以及用户的认知状态,即用户与IR系统交互过程中可能出现的每个任务或问题的各种需求状态。反过来,IR系统向用户展示有可能与用户的认知、任务或信息需求状态保持一致的信息刺激。系统刺激消息在交互中的作用是刺激用户在选择状态下进行操作。当用户处于选择状态时,用户的知识结构理解并整合了一个信息过程。[3]

Poly-representational方法。:

Birger Larsen和Peter Ingwersen[4]描述了一种用户和文档表示方法,它基于多表示原则,为IR系统提供了比当前简单的基于请求的系统所允许的更全面的用户和文档集。对用户而言,多重表征由用户的各种并发信息需求、情绪状态、任务、组织约束等构成,是用户认知空间的多重延伸表征。对于文档集,多重表示包括引用链接、同义词库术语、选择器(例如,期刊名等)、索引器术语和作者的标题、标题等,这是文档集的多管齐下表示。然后在系统用来将用户与IR系统数据库的文档集匹配的算法中表示多重表示。结果是一种认知的重叠——用户的认知空间和来自不同搜索系统的文档表示的不同配置的信息空间。[5,6,3]

认知信息检索过程

多任务处理:

[3]分析用户在与IR系统交互时的多任务信息行为。目前,IR系统要求用户按顺序进行搜索,并且主要是基于指定查询来支持有限类型的搜索,这些查询选择文档或Web站点来完成单个信息任务。然而,IR系统用户在从IR系统访问信息时自然会同时进行多任务处理。用户可以从多个主题开始他们的IR系统交互,也可以从单个主题开始,然后在搜索过程中开发其他主题。研究人员将这种行为定义为自然行为,并研究了允许用户从一个任务切换到另一个任务的可能机制,而表面上是为了一个主题或任务从IR系统访问信息。在认知IR框架内建模多任务的过程,从Saracevic(1997)的用户-IR系统交互分层模型开始。[7,3,8]他们将中心问题定义为用户在单个主题或任务(在搜索IR系统的层面上)的问题识别、系统问题等各个层次之间的协调,以及用户在与IR系统交互时的更广泛的思维(在查找信息的层面上),这涉及协调多个搜索任务和多个主题任务[3,9]。

人类互动行为(HIB):

人类使用电子信息检索(IR)系统已有50多年的历史,从实验系统发展到全面的Web搜索引擎和数字图书馆。图书馆与信息科学(LIS)、认知科学、人为因素和计算机科学领域一直是开展研究的主要学科,这些研究旨在为各种信息相关行为建模人类与IR系统的交互。随着技术问题的掌握,研究人类与红外系统交互的理论和应用框架已经从以系统为中心演变为以用户为中心或以认知为中心的方法。然而,专注于用户与IR系统交互的认知信息检索(CIR)研究在很大程度上仍然资金不足,并且通常不包括在面向计算和系统设计的会议上。但是,以IR为中心的研究仍在继续,有迹象表明,学术界和Web搜索业务中的一些IR系统设计师正在意识到,用户行为研究可以为系统设计和评估提供有价值的见解。[3]
CIR研究是CIR在更广泛的人类信息行为(HIB)框架内的集成,该框架构成了人类信息条件。CIR的HIB视角寻求创建对CIR的更全面的理解,考虑到发生人- ir系统交互的HIB上下文。(3、15)
研究的新方向还应该研究信息任务和非信息任务之间的相互作用,以及开始概念化用户在搜索过程中参与的所谓中断HIB行为,如虚荣心搜索。‖这些HIBs应该根据这些行为在多任务搜索会话期间在个人搜索和搜索任务之间提供协调或切换机制时可能发挥的作用进行分析。[3]

认知信息检索技术:

相关反馈

戴安·凯利检查了研究人员用于研究与IR系统交互的用户的隐含相关性反馈行为的技术。隐相关反馈技术可以为解决这一问题提供一些方法。基于用户需求收集和文档偏好的隐式关联反馈技术有助于与系统的自然交互。作者引用了她自己以前的工作,即观察用户行为,然后将行为分为五个类别,描述所观察到的行为的潜在意图。由此产生的五个类别是:检查、保留、引用、注释和创建。Kelly随后回顾了隐雷竞技苹果下载性相关反馈研究,以说明此类研究是如何进行的,以及反馈通常是如何测量和使用的。作者得出结论,通过采用度量形式的验证和可靠性检查,可以表示用户与系统的实际交互(例如,这些研究假设文档在浏览器窗口中显示的时间长度等同于用户阅读文档的时间)[3,8]

知识领域可视化(KDV):

Peter Hook和Katy B’orner分析了各种可视化表示技术,以提高教育知识领域可视化(KDVs)的可用性。KDVs可视化特定主题或广泛主题的信息空间,向用户指示给定信息空间中的某种结构。它们可以被合并到IR系统中,或者在前端,作为主题空间的概述,以帮助用户制定对系统数据库的访问点,或者在系统的后端,在结果列表中。主题或领域结构的可视化表示有助于用户(尤其是领域新手)识别进入信息空间的最相关入口点,并有助于用户将KDV表示的客观知识空间集成到用户的主观图像中。KDVs有助于用户组织信息搜索、信息访问和管理其与IR系统的交互以及在系统数据库中找到的信息的搜索任务。作者主要感兴趣的是如何利用人类视觉和人类空间认知的工作方式,将知识领域可视化,从而促进学术知识的用户国际化。(10, 3)

培训框架:

Wendy Lucas和Heikki Topi描述了红外系统信息搜索训练用户的技术。作者将这些搜索训练技术置于更广泛的信息搜索视角中。搜索过程的不同阶段导致用户认知过程不同,需要不同的训练模型。在每个搜索阶段,用户都会经历一个搜索过程。搜索过程的Lucas和Topi模型[11]的第一阶段是用户信息需求的表达。阶段2是将需求概念化为可执行查询。阶段3是为给定的IR系统制定概念性查询。第4阶段是将查询输入到搜索界面。第五阶段是用户对搜索结果的理解和解释。每个阶段都需要不同的信息搜索训练程序,这些程序又取决于搜索过程的阶段。 [11, 13] The second Lucas and Topi search training strategy is to gather user errors and then specifically train users on correcting these errors. Categories of user errors are conceptual knowledge errors, semantic knowledge errors, and technical knowledge errors (Sormunen and Pennanen, 2004). Examples of user errors from the Excite study of Spink, Wolfram, Jansen, and Saracevic (2001) are the infrequent use of Boolean operators and errors when the Boolean operators are used, such as errors in capitalization, the use of the ampersand instead of AND, etc.[12,3]

总结与展望

本文的目标是对CIR的概念、技术和过程进行概述。它展示了人类信息条件如何与日益增长的需求,与红外系统相互作用,本文针对信息科学,计算机科学,认知科学,人为因素和相关学科领域的研究人员,教育工作者,学生和从业者。认知概念的潜能通过多表征方法显现在关联交互信息中,并被处理成多任务人类行为。因此,要实现上述方法,我们需要相关反馈、KDV和培训框架等技术。

参考文献

  1. Paul Thagard,认知科学,斯坦福哲学百科全书(2008年秋季版),Edward N. Zalta(编)。
  2. Paul Thagard,认知科学,斯坦福哲学百科全书(2008年秋季版),Edward N. Zalta(编)
  3. 鲁斯温,相关性的综合方法,?《认知信息检索的新方向》(A. Spink and C. Cole主编),pp. 61â '  ' ' 80,荷兰:施普林格,2005。
  4. 拉森b;Ingwersen p;Kekà ¨alà ¨¨en, J. 2006。ir中的多表征连续统。在IIiX:第一届信息交互国际会议论文集,88â '  ' 96。美国纽约:ACM。
  5. 信息检索交互。伦敦:Taylor Graham, 1992。
  6. 信息检索交互的认知视角:认知IR理论的要素,文献学报,第52卷,第1期。1、1996年3月,pp. 3ÃⅰÂ ' Â - 50
  7. 萨拉塞维奇,T.(1997)。信息检索交互分层模型:扩展与应用。美国信息科学学会学报,34,313-327。
  8. 评价与用户互动信息检索系统的方法?[2009]《信息检索基础与发展趋势》Vol. 3, no . 1â '  ' - 2 (2009) 1â '  ' 224。
  9. J. Allan等人。信息检索和语言建模方面的挑战。阿默斯特大学研讨会,2002年
  10. rner, K.,教育知识领域可视化:导航、理解和内化学术知识和专业知识结构的工具?,多德雷赫特:施普林格,2005,187-208。
  11. Wendy Lucas, HeikkiTopi,?需要帮忙吗?训练对网络搜索的影响?,Proceedings of the International Conference on Information Technology: Computers and Communications (ITCCÃÂ03) 0-7695-1916-4/03 $17.00 © 2003 IEEE
  12. Sormunen, E. &Pennanen, S.(2004)。在基于网络的学习环境下,自动化辅导对IR教学的挑战。Inf. Res, 9:论文169[可在http://InformationR.net/ir/9-2/paper169.html上获得]。
  13. Wendy Lucas, HeikkiTopi,?使用过程图来改善系统用户知识共享?,CHIMIT’07 ,March 30-31, 2007, Cambridge, MA, U.S.A.Copyright 2007 ACM 1-59593-635-6/07/0003
  14. http://www.cognitiveinformatics.com/en/what-is-cognitive-informatics
  15. 艾琳·w·巴·杰克逊;Olive, Kenneth E. MD,田纳西东部小型农村医院的伦理委员会?南方医学杂志:2009年5月- 102卷-第5期-第481-485页
  16. http://en.wikipedia.org/wiki/Cognitive_science
  17. http://www.iamcalm.com/category/neuroscience-research/
全球科技峰会