所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

印地语接口数据库

Himani耆那教徒的* 1,Parteek Bhatia2
  1. 塔帕尔大学,计算机科学与工程系的邦,印度
  2. 塔帕尔大学,计算机科学与工程系的邦,印度
通讯作者:Himani Jain,电子邮件:himani88jain@gmail.com
相关文章Pubmed,谷歌学者

访问更多的相关文章全球研究计算机科学杂志》上

文摘

印地语接口的必要性变得越来越准确的原生人们使用数据库来存储数据。大量的电子政务应用,比如农业、天气预报、铁路、遗留问题等使用数据库。轻松使用这样的数据库应用程序,人们更乐于用印地语,这些应用程序需要接受一个简单的句子在印地语,和过程生成一个SQL查询,进一步在数据库上执行的生产结果。因此,任何接口在印地语将这些人的资产。本文的体系结构将用户输入的印地语查询映射到SQL查询。

关键字

印地语接口数据库自然语言接口数据库、记号赋予器,解析器,语义上纠正的

介绍

图像
•每个关系令牌对应于一个属性标记或标记的值。
这意味着(a)数据库关系匹配关系令牌和牌是兼容的数据库元素匹配的属性或值和(b)的关系令牌连接到相应的属性或值令牌。
下一节讨论一些已经存在的文献调查系统。然后它处理系统细节和属性/值图。最后,论述了系统的体系结构。

文献调查

已经有许多系统是NLIDB时代的开始。最著名的NLIDB六十年代和年代早期的月球[4],自然语言接口数据库包含月球岩石的化学分析。对接用户参与对话,帮助他/她制定他/她的查询。梯子可能与大型数据库和它可以配置为使用接口不同的底层数据库管理系统(DBMS)。聊天- 80[5]的著名NLIDBs早期的年代。这是完全在Prolog实现。它把英语问题变成了Prolog表达式,进行了评估对Prolog数据库。
问[6][7]发展1983年,允许终端用户系统教新单词和概念交互过程中在任何时候。它实际上是一个完整的信息管理系统,提供它自己的内置的数据库,并与多个外部数据库交互的能力,电子邮件程序,和其他计算机应用。所有的应用程序连接到问都可以通过自然语言向终端用户请求。用户用英语陈述他/她的请求,并要求透明地生成合适的请求到适当的基础系统。

系统细节

图像

SQL查询

从工作中选择不同的描述公司=“惠普”平台=“UNIX”;
一个从一个完整的句子标记映射到一组数据库元素,满足条件1到3是一个有效的映射。如果句子标记只包含不同的令牌和至少一个令牌匹配wh-value的价值,我们将相应的句子在语义上是容易处理的。
”图。1”显示了标记与属性的关系。的问题找到一个从问题的完整标记映射到一组数据库元素的语义约束减少graph-matching问题感到满意。We use the max-flow algorithm to eciently solve成像仪
属性。最后,我和E都链接到水槽节点t .列的两个实例包含数据库属性节点。单位优势从每个数据库属性节点本身确保只有一个单位的流动实际上遍历每一个这样的节点。这些边缘是必需的,因为不止一个分贝值是符合给定的数据库属性和DB属性可以匹配多个属性令牌。然而,一个有效的映射的定义需要每个数据库属性只被使用一次。图为解释为一个流网络的能力在每条边是1,除非另有指示。边缘的能力从E T属性标记的数量。边缘的能力从我到T值标记的数量-属性标记的数量。That dierence is 2 in our example. The maximum flow through the network in this example is 3. In fact, the maximum flow in any graph constructed by the system matcher is equal to the number of value tokens because each value token has to participate in the match produced by the algorithm.
图像
图像
图像
图像
图像
图像
图像

结果

如果句子标记只包含不同的令牌和至少一个令牌匹配wh-value的价值,我们将相应的句子在语义上是容易处理的。In this example, results show that  matches with , so there is one-to-one match between the sentence tokens and the database elements that satisfies the semantic constraints in the set of conditions for semantically tractable sentences. So applying results we can say that, a question q is said to be semantically tractable relative to a given lexicon L, and an attachment function AF if and only if q has at least one complete tokenization T such that:
1)所有标记T是不同的。
2)T包含至少一个wh-token。
3)存在一个有效的映射(尊重AF和L)从T E组数据库元素。
印地语句子的解析使它完全理解这句话,有助于生成最后的查询。

结论

该系统接受查询在印地语翻译成SQL查询,通过与相应的映射印地语单词,印地语单词的帮助下数据库维护。那么这个数据库上执行SQL查询来提供输出给用户。

引用

  1. Akshar巴拉蒂,Rajeev Sangal Dipti Misra Sangal,“夏克提标准格式指南”,语言技术研究中心,中心国际信息技术研究所、海得拉巴,印度。
  2. ILTM财团,“ILMT系统”,IIT海德拉巴,Gachibowli,海德拉巴,2007年2月。
  3. 安娜玛利亚Popescu Oren Etzioni,亨利Kautz”,对自然语言接口数据库的理论”,华盛顿大学计算机科学西雅图,佤邦98195,美国。
  4. 西澳森林,m . Kaplan和B.N.韦伯,“月球科学自然语言信息系统:最终报告”,BBN报告2378年,螺栓贝拉尼克和纽曼公司,剑桥,麻萨诸塞州,1972年。
  5. D。沃伦·f·佩雷拉,“一个有效的解释自然语言查询容易适应系统”,计算语言学,July-December 1982年,页3 - 4,110 - 122。
  6. 林丙辉汤普森和F.B.汤普森,“引入问,一个简单的知识系统”,在首届会议程序应用自然语言处理、圣莫尼卡,加利福尼亚州,1983,pp。17-24。
  7. 林丙辉汤普森和F.B.汤普森,“问的是移动式半个瞌睡的方法”,ACM交易信息系统后,1985年4月,页185 - 203。