所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

先进的多媒体回答一代通过Web抓取信息

Ramakrishnan.R1,Jayalakshmi.A2和Priyadharshani.S3
  1. 副教授,MCA、斯里兰卡Manakula Vinayagar工程学院,Puducherry,印度
  2. PG学生,MCA、斯里兰卡Manakula Vinayagar工程学院,Puducherry,印度
  3. PG学生,MCA、斯里兰卡Manakula Vinayagar工程学院,Puducherry,印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

先进的多媒体回答一代通过抓取信息网络成为一个非常流行的替代现有的社区问答。不幸的是,文本答案可能无法提供足够的自然和容易掌握的信息。这将是更好的,如果有一些额外的视频和图片,直观地演示过程。因此,文本答案cQA可以显著增强通过添加多媒体内容,它将提供答案寻求更广泛的信息和经验。在我们的系统中用户的问题进行了分析,从用户的需求已经确定,那么适当的介质的回答应该从网上搜索,然后将提交给用户。模型

关键字

刮,CQA MMQA E-VSM, POS尾随者。

介绍

问答(QA)技术在自然语言自动回答一个问题。它定义为寻找和提取的任务包含的文本回答特定的问题,在自然语言表示,从文本文档的集合或一个语料库(Molla Vicedo, 2007)。QA系统可分为两种类型,根据不同的应用领域:Open-Domain问答(ODQA)或Restricted-Domain问答(RDQA)系统。第一种是关心的各种问题(如印度的总理是谁?),第二种类型是正确地适应一个特定的区域(如抗生素是什么需要热的人吗?在医学领域),从而获得更精确的结果对于一个特定的主题。
尽管aQA取得重大进展的一年一年地评估练习,他们主要集中在短期和简单的问题;更复杂的问题通常是研究较少。除了虚构的,列表和定义问题,还有其他类型的问题通常发生在现实世界中,包括有关的过程(“如何”),原因(“为什么”)或意见,等。不同于简单的问题,这些复杂问题的答案可能不定位在一个文档的一部分,而且它并不少见,不同的答案都散落在文档的集合。
下一个技术的出现是社区问答(cQA)。是只支持文本的答案。但是,文本答案可能无法提供足够的信息。的问题“什么是要遵循的步骤安装SQL server 2005”和“如何准备咖啡”,答案是所描述的长句子。显然,这将是更好的,如果有一些视频和图片,直观地演示过程。因此,有必要加强文本与图片和视频等多媒体内容回答。
然后下一个计划是小说出现多媒体问答(MMQA)在我们的论文提出了。这种技术可以丰富提供了数以千计的文本答案cQA与适当的媒体数据。它由三部分组成:
1。答案中选择
2。查询生成多媒体搜索。
3所示。多媒体数据选择和表示。
其余的论文描述了项目的工作流程,从文本QA多媒体QA。

文献综述

QA的早期调查从1960年代开始。在开放域互动QA[1],问题处理,文档检索和答案抽取和一个额外的组件是用户造型(嗯)组件,介绍了克服传统标准QA系统无法满足用户的个人需求。自动化测试不提供糟糕的回答复杂的问题。在知识共享和雅虎回答[3],一个用户发布一个问题,和其他usersreply直接与他们的回答这个问题。知识共享,除此之外,它还允许用户分享的建议,意见等。
在社区问答系统,它只提供了基于纯文本的答案,这可能无法为用户提供足够的信息。所以需要多媒体的答案。
一些研究成果已经穿上多媒体QA,旨在使用多媒体QA回答问题。2008年的方法提出了基于照片的质量主要集中在寻找图像的物理对象和向用户呈现的答案的文本和图像。仍然有缺乏视频所需的一些问题的答案。然后研究表现在视频检索和它在2011年实现。它试图找到适当的youtube视频,谷歌视频,为用户等问题
每个研究提供答案分别实现多媒体内容但没有完全满足用户。所以需要提供多媒体的组合的答案。
这项技术被称为多媒体出现问题回答(MMQA)在2013年。这种方法的主要目的是丰富答案文本与图片或视频或图像等多媒体内容和视频。
正如前面介绍的,传统的自动文本QA,基于社区的QA都取得了极大的成功。前方法主要解决了简单和似是而非的问题,而后者方法可以回答详细和复杂的问题通过利用互联网用户的情报。然而,到目前为止,QA的研究主要集中在文本和现有MMQA研究工作可以轻易处理某些问题在狭窄的领域或只支持question-independent单一媒体类型,如纯视频和纯形象。此外,现有的不应该深入了解用户的需求,这是处理复杂的和通用的关键问题在广泛的领域。除了,回答中确定答案可用性预测,和媒体选择答案都不是使用过。

研究方法

现有的系统使用一个新颖的骗局,回答问题在cQA使用媒体数据通过使用文本的答案。对于一个给定的QA一对,我们计划先预测哪种类型的媒介是适合丰富原始文本的答案。后,它会自动生成一个查询根据QA的知识然后执行多媒体搜索与查询。最后,基于用户的问题的答案应该是面对文本或文本和图像或文本和图像和视频。
在这个项目中,我们提出一个新的方案,可以丰富提供了数以千计的文本答案cQA与适当的媒体数据。
它包含三个主要部分:
1。答案中选择
2。查询生成多媒体搜索。
3所示。多媒体数据选择和表示。

答:答案中选择:

鉴于一双QA,预测文本答案是否应该富含媒体信息,并应该添加什么样的媒体数据。具体来说,我们将分类为四类:文本,文本+视频,图片+文字,文字+图片+视频。这意味着该计划将自动收集图片,视频,或者图片和视频的结合丰富的原始文本的答案。

b .查询一代多媒体搜索:

为了收集多媒体数据,我们需要生成的信息查询。鉴于一双QA,这个组件提取三个查询的问题,答案,分别和QA。最丰富的查询将选择一个三级分类模型。

c .多媒体数据选择和表示:

基于生成的查询,我们通过搜索引擎收集图像和视频数据。然后执行互动评估和重复删除获得一组精确的、有代表性的图像或视频丰富文本的答案。

的设计方法和技术

项目中使用的各种技术和算法
1。阻止算法&停止词删除。
2。朴素贝叶斯
3所示。三元文本分类
4所示。POS直方图

答:阻止算法:

语言规范化的阻止算法是一个过程,在这一个词的变体形式减少常见的形式,
例如,
连接
连接
连接- - - >连接
连接
连接
重要的是欣赏,我们使用的意图阻止提高红外系统的性能。它不是一个词源或语法的练习。事实上从词源学的或语法的观点,阻止算法容易犯很多错误。此外,阻止算法——至少这里提出的适用于书面,口语,语言的形式。

b . Stopwords删除:

它已经在建立红外系统抛弃传统的常见词语言——stopwords在索引。更现代的方法是指数一切,这大大帮助寻找短语为例。Stopwords仍然可以作为一个可选的消除从查询的检索方式。在这两种情况下,一个列表的stopwords语言是有用的。
让stopwords可以通过排序的列表的文本语料库对语言词汇频率,并向下列表中选择单词被丢弃。
stopword列表连接以各种方式阻止算法:
阻止算法本身可以用来检测和去除stopwords。人会添加到irregular_forms表是这样的,
”“,/ * * /空字符串
“我/是/是/是/ / / " / * * /
”/ / / /“/ * * /
“做/确实/ / / " / * * /
这样的话“我”,“是”等映射到空字符串(或其他值)很容易被认出来。

c .朴素贝叶斯:

朴素贝叶斯分类器是基于贝叶斯定理与预测之间的独立性假设。朴素贝叶斯模型很容易建立,没有复杂的迭代参数估计对于非常大的数据集特别有用。尽管它的简单,朴素贝叶斯分类器经常出奇的好,被广泛使用,因为它通常优于更复杂的分类方法。
贝叶斯定理提供了一种方法计算后验概率,P (c / x), P (c)、P (x)和P (x / c)。朴素贝叶斯分类器假设的影响预测的价值(X)在给定类©独立于其他预测因子的值。这个假设被称为类条件独立。
方程
c | P (x) = P (x1| c) * P (x2* P (x / c)3P / c) * (c)
P (c | x)是类的后验概率预测
P (c)是类的先验概率
P (x | c)是可能预测给定类的概率
P (x)是预测的先验概率

d .三元文本分类使用E-VSM一定频率计数算法:

三元是每两个相邻元素的序列在一连串的令牌,这通常是字母、音节,或工作;他们- gram n = 2。三元的频率分布,用来简单字符串常用统计分析的文本在许多应用程序中,包括在计算语言学,密码学,语音识别,等等。跳过三元词对这可能允许差距(避免连接词,或者允许一些依赖项的模拟。
E-VSM商店所有的每一个字的位置重复的文档中。位置矢量的长度只不过是这个词的出现频率。可以利用这些位置向量在文档中找到ngram的频率。三元是文本处理中最常用的语法。以下是算法来计算三元频率称为形式[7]。

大肠POS直方图:

对于查询,包含很多复杂的动词就很难检索意义的多媒体效果。我们使用POS薄铁片给每个单词的词性问题和答案。

实验设计

下面的实验进行了评估各种方法。

答:答案中选择方法的评价

我们第一次评估我们的答案中选择的方法。它由两种技术:基于问题的分类、基于回答分类。

1)基于问题的分类:

25种不同的问题应该准备等各种类型的问题是/否类型,选择类型,数量类型、枚举类型、描述类型。然后用50个成员应该进行实验。基于成员提供的结果作了分析和计算结果。最后关键字用于为用户找到答案中发现了问题。
下表描述了类和类相关的特定的关键词。

2)回答基础分类:

答案基于分类使用三元执行功能和动词形式出现在回答。两三元和动词的结合使用达到更好的结果。

b .评估查询生成方法:

接下来,我们评估查询生成和选择的方法。三个查询生成的问题,回答问题和答案。后生成三个查询一个信息最丰富的查询应该选择。这可以执行使用POS(词性)技术。

结果与讨论

一些问题和相应的结果,这个问题一直在下面讨论
1)需要文本作为输出的问题
2)需要imageas输出的问题
的问题我们方法显示了图像香蕉是什么结果。
2)问题需要文本+视频输出
上面的问题是如何使咖啡。从我们系统预测用户的期望和问题提供了文本和视频结果给用户。

结论

在本文中,我们描述一个示意图的方法,丰富了文本的答案在CQA相应的媒体数据。我们计划先进MMQA决定什么类别的结果应该呈现给用户为了让用户更容易理解。我们的计划应该搜索适当的通过网络多媒体的答案。算法用于计算三元使用E-VSM (Enhanced-Vector空间频率计数方法使回答的基础分类更有效的一般方法相比,在现有系统中使用。我们的方法对复杂的查询也产生良好的结果。

表乍一看

表的图标
表1

数据乍一看

图1 图2 图3
图1 图2 图3

引用












全球技术峰会