关键字 |
QAS、PQC本体,不。 |
介绍 |
问答系统是为了满足用户特定信息的需要。在这些系统在自然语言问题是问然后用于识别关键词,名叫身份,问题类型,然后用来制定数据库查询。本体知识的概念化[1],本体都写在猫头鹰展览的层次结构,提出了一种将本体存储在数据库中,这样他们可以查询无论层次性质,并提出了一种架构的问答系统用于处理自然语言问题,从知识库中检索答案。 |
相关工作 |
到目前为止提出的问题回答系统是完全基于文档分析,例如在[6]的作者提出了一个系统被称为棒球这是最早的问答系统,这是一个项目回答问题关于棒球比赛在美国联赛一个赛季。系统能回答窄的领域内的问题统计编制在美国联盟玩的季节用浅解析技术在自然语言查询识别团队和统计问题。[7]中作者提出了一个问题回答系统命名月球也是基于窄域问答,在[8]8日TREC会议作者首次提出QA轨道,需要回答似是而非的问题通过返回一个文本片段包含答案的问问题。[9]中,作者提出了第一个基于web的问答系统是不同于早期的问答系统,因为这个系统是使用web作为语料库中提取答案的问题与先前的系统,是基于固定大小的语料库。一些基于web的系统开始,回答总线,AskMAR等。[10]中作者提出了中国QAS问答系统命名,这是特定于语言的,形态分析和解析这个系统更加困难因为它的特定于语言的注释和符号。 |
建议的体系结构 |
OBQAS的建议的体系结构包括三个功能组件。问题处理模块,查询公式模块,应选择模块。 |
答:问题处理模块 |
问题处理模块包含两个组件PQC和词法分析器。词法分析器进一步组成的两个组件问题类型标识符和关键字标识符。提出了一个自然语言问题(NLQ)直接喂PQC这个模块。 |
PQC是先前缓存时自然语言问题提出了系统是这个缓存记录之前问的问题如果刚比赛之前问问题然后回答这个问题直接从缓存检索否则它存储在列表的顶部。先前缓存的问题是保持在线性列表堆栈,堆栈指针指向最新问题问。 |
问题是然后交给词法分析器解析它的关键字和命名实体识别问题。这些识别关键字查询配方设计师。 |
b .查询配方设计师 |
查询配方设计师包括查询公式引擎和查询集群命名实体识别,问题类型和关键字提取NLQ传递给查询公式引擎,查询集群包含查询语法根据问题类型制定使用查询语法。表2[2]包含的各种问题类型查询中查询语法存在集群。 |
c .答案选择器 |
查询中查询制定形成模块提出了关系数据库返回答案,这个问题的答案返回给用户,也存储在PQC随着问题列表的顶部。 |
d .创建数据库 |
系统是基于本体和本体都写在OWL文档关联到一个特定的域是在xml这些文档之间有一个层次结构的对象出现在文档的xml文档的形式存储在关系表的xml模式。 |
模拟 |
步骤1:首先系统介绍了XML文档[4]的本体是派生的, |
<部门建筑物= " 101 " > |
<雇员id = " 901 " > |
<名称> John Doe < /名称> |
<手机> 408 555 1212 < /电话> |
<办公室> 344 > < /办公室 |
< /员工> |
<雇员id = " 902 " > |
彼得·潘<名称> < /名称> |
<手机> 408 555 9918 < /电话> |
<办公室> 216 > < /办公室 |
< /员工> |
< /部门> |
步骤2:分层表示的本体之上。 |
|
步骤3:数据库创建的本体 |
•创建表部门(deptID char (8), deptdoc xml); |
通过这个命令将创建一个表包含2列的关系 |
他们部门id和deptdoc存储在其层次结构如图所示: |
步骤4:用户查询的自然语言: |
NLQ:什么是员工的名字和电话号码408 - 222 |
这自然语言解析查询来确定: |
我)问题类型:什么 |
2)关键词:电话号码408 - 222 |
iii)命名实体:名称、员工 |
查询公式是一个内部过程,由配方设计师的查询引擎 |
从部门选择员工姓名 |
在哪里 |
Xmlexist (“$ DEPTDOC /部门/员工[电话号码= ' 408 - 222 ']”) |
检索到的答案是彼得·潘。 |
结论 |
QAS这里提出的目的不仅符合问答但其架构简单使其高效检索的答案。系统可以提高如果本体可以自动更新就像web存储库更新通过页面刷新[5]技术。 |
表乍一看 |
|
|
数据乍一看 |
|
|
引用 |
- b . Chandrasekaran和约翰·r·约瑟夫森”本体是什么,为什么我们需要它们?“IEEE智能系统1月/ 2月问题页。20-26,1999。
- 问答系统一种新的模式,Mohammad Reza Kangavari莎米拉·Ghandchi海豹打捞器Golpour,世界科学院、工程和技术18 2008。
- IBM db2 9.7纯xml信息管理云计算中心的能力,IBM加拿大实验室。
- http://www.ibm.com/developerworks/data/library/techarticle/dm - 1006 - queriespurexml/dm - 1006 - queriespurexml pdf.pdf
- 乐观Madaan等。/ (IJCSE)计算机科学与工程国际期刊卷。02、03号,第758 - 753页,2010年。
- 绿色,B。,Wolf, A., Chomsky, C., and Laughery, K. "BASEBALL: an automatic question answerer," in: Readings in natural language processing , Morgan Kaufmann Publishers Inc., pp. 545-549, 1986.
- 森林,西澳“自然语言理解的进步——应用程序月球地质学、“美国信息处理学会联合会,441 - 450年,1973页。
- e . vooorhees“TREC-8问答跟踪报告”,在NIST的特殊出版500 - 246:第八文本检索会议(TREC-8), 77 - 82年,1993页。
- j·林和卡茨。”知识问答从web使用注释和知识挖掘技术”,在CIKM 03:第十二学报》国际会议信息和知识管理,纽约,纽约,美国,123年第4期,2003年。
- 黄Gai-Tai Hsiu-Hsen姚明,“中文问答系统”,《计算机科学与技术。卷19日4号,479 - 488页,2004年。
|