ISSN在线(2320 - 9801)打印(2320 - 9798)
一个。F Donfack假名,学士优素福 大学数学系,Ahmadu贝洛,Zaria,尼日利亚。 |
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
本文定义了一个方法的实现之间的互操作性描述逻辑本体通过匹配。考虑使用的匹配技术层次和逻辑结构的本体和建议之间的一对一匹配概念的本体分析的结构和逻辑定义这些概念。
关键字 |
本体、描述逻辑映射、互操作性 |
介绍 |
本体[14]用于模型的知识通过清晰地定义语义的概念在给定的域和它们之间的关系没有任何歧义以这样一种方式,它可以被理解为人类和电脑。尽管各种本体语言的标准化,没有标准化应该如何构建本体。直接后果是,本体是不相容的即使是那些代表相同的域。术语中使用一个特定的本体可能模棱两可而被其他本体建模相同的域。这将导致不一致的解释和使用的知识系统。因此,本体系统之间的互操作性在语义级别不再是可能的。因此,本体则面临相同或更困难的问题对异质性和其他信息[15]。许多研究工作已经在最近的时间来确定应该如何构建本体,试图克服语义互操作性的问题。描述逻辑(1、12)提供一个逻辑方法在构建本体通过使用逻辑构造函数和提供方式推理的内容。很多评论[2、3]显示如何使用描述逻辑在构建本体为了解决模棱两可的解释之间的冲突条款和未能显示了如何实现它们之间的互操作性的方法。 |
因为有许多描述逻辑语言和他们不同于语法和表达能力,也没有标准化的元数据(实体),一个人不能承担一个本体相同的域。很明显,不同的本体构建器可以使用不同的元数据,代表同一个对象或使用不同的逻辑定义(不同的语法)定义相同的对象。利用本体建模领域的主要目的是提供一个共同理解的领域建模。如果本体建模相同的域不能互操作,我们不能谈论共同的理解。这限制了不同本体之间共享知识。这个问题的方法是确定一个平台,相不同的本体。文献在如何协调不同本体仍然缺乏[18]。本体映射的元素往往作为尝试。回顾现有系统的本体映射显示,大多数的系统实现语义映射通过执行语法比较深入分析或通过使用类实例的比较(5、10、13)。句法分析指的可能是由特殊的字典,通过使用一个词汇的同义词条款或任何其他技术分解的元数据,可以帮助你找到上面的技术之一的同义词。 In natural language, some Jargons used may not be easily interpreted so as to derive their syntactic similarities. It reveals that an analysis of description logics Ontologies based on the logical constructors used in defining concepts may be useful in solving such problems since they are natural language independent. This paper takes SHIQ as an example and describes a mapping approach, that relies mostly on the organization of logical operators that are used to define concepts to predict the semantic similarities between Ontologies. |
下一节定义了本体和分类本体之间的类型不匹配,可以存在,第三节简要概述SHIQ描述逻辑和第四节描述了一个方法的执行逻辑基于描述逻辑的本体之间的映射。 |
本体和本体不匹配 |
本体是一个正式的规范和共同理解的领域,试图减少之间的差距,人和机器处理信息[9]。本体有一个角色的相关定义和概念用于描述数据。他们开发的知识共享和重用[11]。使用本体的核心目标是交换的数据不仅在常见的句法层面,而且在一个共享的语义层面。本体的改善成为一个非常重要的技术知识的交换。例如,在万维网,本体的使用已经开始取代老式的方式交换业务数据通过标准化的逗号分隔格式标准语法(如XML / RDF),坚持通过本体语义规范。然而,一个实体的存在各种各样的意见要求高效的方法来比较两个实体为了使两党之间的通信。然而,确定这些语义映射是一个艰巨的任务,因为各种本体之间的不匹配。 |
一般来说,本体建模相同的环境之间的差异被发现在两个主要级别:语言水平和本体的水平。 |
存在几种本体语言在语法和表达不同。因为这些差异,比较不同语言本体变得不足,除非技术发展到一个共同的语言解释的语法。 |
差异本体建模相同的环境中会发生两个本体是否使用相同的语言。[11]分类两个级别的本体之间的不匹配可能发生:第一级是在语言层面上不匹配时本体本体都写在不同的本体语言。本体在此级别之间的不匹配是由于各种本体语言之间的异质性。这是由于语言的语法和表达能力之间的不匹配。一般来说,不同的本体语言语法总是有一些差异。相同的定义在不同的语言中可能出现不同。逻辑结构允许在一种语言用另一种语言可能不被允许。语言的表达能力可能会导致一些定义可能在一些语言相同的定义可能不是用另一种语言表达。例如它可以代表这一事实的人都有两个子结点使用SHIQ的基数限制,SHOQ和许多表达本体语言,这样的表现是不可能在酒精度。对一些定义,有些语言直接构造函数来表示定义而对其他语言,必须结合使用一个构造函数来表示相同的定义。 |
第二个层次是本体级别。在这个级别不匹配被视为不同的域建模的方式。不匹配在本体论层面上发生在两个或两个以上的本体描述(部分)重叠域相结合。这些不匹配时,可能发生本体在相同的语言编写,以及当他们使用不同的语言。[17]分类本体水平不匹配的概念化和说明不匹配本体,使明确区分这两个不匹配。 |
概念化不匹配指的是不同的方式解释一个域(概念化),从而导致不同的本体论概念或不同的这些概念之间的关系。一个说明不匹配,另一方面,是指不同的概念化的方式是确定的。结果之间的不匹配使用的术语,定义,和组合都不匹配。(11、16、17)详细描述本体之间的区别。图1总结了本体之间的差异,可以发现。每当本体间发生的不匹配,需要比较本体,并找出什么程度相互重叠和适合为了带来一个令人满意的语义互操作性。 |
描述逻辑 |
描述逻辑(DLs)是一个家庭的知识表示形式,可以用于表示应用程序的术语的知识域结构化和正式易于理解的方式。理解意味着没有歧义在解释它们的含义由人类和计算机系统。他们的特点是使用各种从简单的构造函数来构建复杂的概念,强调关键的可判定性推理任务,提供声音,完整和(经验)驯良的推理服务[14]。推理能力DLs可以使用逻辑推理推断出额外的信息从这些事实陈述明确本体[18]。 |
DLs由以下组件:表示单数的对象实体的实例在我们感兴趣的领域,概念集合或事情,属性描述方面,性质,功能,特点,或参数对象可以有和关系描述的概念和个人可以彼此相关。习惯上分离成三组:assertional(一盒)当中的奥秘公理,术语(TBox)公理和关系(RBox)公理。 |
一盒公理捕捉当中的奥秘的知识叫人。 |
例如,父亲(彼得)是一个概念断言声称,彼得是概念的实例的父亲。hasChild(彼得,阿米娜)是一个角色断言声称,彼得的父母阿米娜TBox公理描述概念之间的关系。例如,一般概念包含如母亲¢父母定义的母亲作为纳入母公司的概念。Figure2定义在[3]中显示了一个示例Tbox。 |
RBox公理是指角色的属性。它捕获之间的相互依赖关系的角色考虑知识库。例如角色包含motherOf一个¢parentOf。本体是可以满足的,如果一个解释存在满足公理。当一个本体不满意任何解释,它是不可满足的或不一致。 |
我解释我=(ΔI)由一组ΔI称为域的我,和一个解释函数,每个原子概念映射到一组我⊆ΔI,每个角色R一个二元关系RI,我x的子集,每个名字一个一个元素aI¯ΔI。 |
存在几个DLs,分类基于构造函数的类型和公理,他们允许,通常在SROIQ构造函数的一个子集。描述逻辑的片段是酒精度SROIQ,允许没有RBox公理,只有,¬,∃和∀作为构造函数的概念。酒精度的扩展包括及物地封闭原始角色通常是用字母s这个基本DL在几个方面扩展。其他字母用于DL名字暗示了一个特定的构造函数,我逆等角色,共通性O(即。,concepts having exactly one instance), qualified number restrictions Q, and role hierarchies H. So, for example, the DL named SHIQ is obtained from S by allowing additionally the role hierarchies, inverse roles and qualified number restrictions. The letter R most commonly refers to the presence of role inclusions, local reflexivity Self, and the universal role U, as well as the additional role characteristics of transitivity, symmetry, asymmetry, role disjointness, reflexivity, and irreflexivity [18]. Although DLs have a range of applications, OWL is one of its main applications. OWL is based on Description Logics but also features additional types of extra-logical information such as ontology versioning information and annotations [23]. The main building blocks of OWL are indeed very similar to those of DLs, with the main difference that concepts are called classes and roles are called properties[18]. |
OWL DL的大部分地区确实可以被视为一种句法SROIQ的变体。在许多情况下,这的确是足够的操作员SROIQ的象征转化为相应的运营商名称猫头鹰。 |
本体的映射 |
鉴于本体O1、O2,映射本体O1、O2意味着每个概念的本体O1,我们试图找到一个相应的概念,即有相同的含义,在本体O2。概念之间的映射是最大的识别元素之间的一一对应关系的定义相比用作提示识别给定的本体之间的相似性。映射支持的概念之间的异同的分析来预测他们的语义兼容性。 |
为了统一和便于本体转换为层次树,本体映射中定义否定范式(NNF),也就是说,否定只出现在概念名称的前面。任何SHIQ概念定义可以很容易地转化为一个等价的一个NNF推动否定向内使用德摩根定律和下面的等价。 |
为便于比较,我们可以采用代表本体层次树,然后应用图匹配技术来遍历两棵树和树的元素之间的相似度计算。使用包含(GCI)为SHIQ一般的概念,它定义了概念通过使用包含另一个更一般的概念,本体转换为树,树的上层的概念,贯穿了下面这些。本体表示为一棵T = (N, E),其中N是一个有限集的节点和E¯N×N是一组定向边缘。树的节点代表概念名称和边缘之间发生两个节点代表的作用以及相关的构造函数,这是连接这两个概念的关系。 |
从更高层次的概念包含的低水平,这意味着,更高层次的概念更将军(从目的意义),而低层次的概念更加具体。树的根被认为是概念和顶部的叶子概念是原子概念,不包含其他的概念。 |
答:本体匹配 |
我们比较操作符用于定义概念,是构造函数的作用定义为每个rolei序列的一部分。好理解的语义定义的一个特定概念,有必要理解语义相关联的所有其他概念的定义。例如,如果我们定义母亲:母亲haschid.person的女人。捕捉的意义概念的母亲,我们首先需要理解女人的意义和人以及haschild的关系。我们需要参考自己的定义来推断出的母亲。比较不仅是执行概念相比较,还有相关的概念定义。 |
用于捕获两个本体概念的语义基于三大要点: |
首先,定义的概念,这是两个概念的定义,存在哪些类型的运营商和关系的定义,什么是运营商之间的相似之处和关系。这意味着比较这两个概念的定义。它需要执行笛卡尔rolei对比。concepti中使用这两个概念的定义。 |
我们推断出两个概念的相似性比较,他们包含的概念。相似的概念也将包含类似儿童的概念。比较在所有执行这两个概念的定义,使用每个父概念。我们比较所有的边离开这两个概念比较。对于两个给定的概念比较,我们执行一个笛卡儿积的每个节点的孩子的数量。为每条边离开节点的概念在第一本体相比,其最佳匹配检测从所有的边缘节点(概念)的第二本体。比率的平均价值然后定义所有边的最佳匹配值和数字离开第一个概念。获得的值然后给相似的水平的方式两个概念包含其他概念。 |
第三,在现实世界中,有两件事是相似的,如果他们产生相似的元素。自从本体只是一个现实世界的模型,如果两个概念是相似的,那么它可能包含的概念可能是相似的,或者至少以某种方式相关。对于每一对概念相比较,我们指的是他们的父母有多相似预测自己的相似之处。 |
例如,两个本体的图3,图4的匹配可以建立 |
图4显示了两个本体转换为层次树。节点是用概念来表示。边表示概念之间的关系。鉴于两棵树(图4),如果执行映射概念之间的人类在tree2 tree1和人,然后两个概念之间的比较将定义边缘所代表的是动物与人类和边缘连接人的人。父母之间的相似性是动物和人将被考虑。他们的继任者之间的相似之处,这是男人和女人的概念人力和父亲的人。 |
b比较技术 |
执行映射在搜索空间,两棵树的遍历和节点递归地比较。我们采用了一种优化的方法比较减少映射的总数。节点相比,只有其中一个概率是相似的。 |
从两棵树的m和n个节点分别同时两棵树的遍历和执行节点元素的比较和相关作用的元素。毕竟第二棵树的节点已经与第一棵树的根相比,下一个节点进行比较(除了根节点)选择基于他们的祖先的相似性。决定对节点之间的相似性是在本地执行。第一个树的根节点后与第二棵树的所有节点相比,我们可以决定对其相似性的第二棵树的节点。在第二棵树的一个节点的情况被发现是类似与当前选择的节点的第二棵树,下一个比较只是表现在他们的继任者。如果没有发现类似的节点为当前选中的节点,我们认为,当前选中的节点没有类似的第二棵树节点,然后比较其继任者第二棵树的所有节点。 |
相比任何一对节点视为一个候选映射将检查和最相似的概念(如果存在)基于相似性度量的定义,被认为是映射的概念。这个过程是递归地执行,直到所有节点的树比较第二棵树的所有节点。 |
c .相似性评价 |
实体之间的相似性的两个本体定义为可能的水平的两个元素是相似的。我们定义了一个本体实体作为一个函数的相似性测量进行比较如下 |
Sim函数返回一个对概念间的相似度,这是一个值在0和1之间,1代表完美匹配和零不匹配。 |
一个实体之间的相似性计算本体O1和一个实体本体论的O2是使用广泛的相似度函数来执行的。定义相似度函数,我们定义一般假设本体表示并确定本体的特点将有助于确定相似度函数来测量不同本体的两个实体之间的相似性。树的层次结构,基于包容的概念意味着每个概念的定义只有一次,因此在图上只出现一次。基于此,很可能每个实体在第一本体可能最多只有唯一一个类似的概念在第二本体。这减少了两个本体之间的映射的任务各自之间的一对一映射的概念。 |
SHIQ本体定义使用概念名称、角色名称之间的关系发生概念和可能限制这种关系,以及构造函数将这些概念。树的每个元素的不同进行比较。 |
每一对概念相比,逻辑比较关联概念的逻辑符号执行他们的邻居。这种比较是相关权重定义逻辑运算符决定的重要性概念定义的相似之处。因为这些运营商使用的语言没有任何关系,他们被认为是主要是基于点的比较。他们比较是基于直接逻辑比较。我们的映射方法是使映射尽可能自由的语法比较。我们指定一个高权重的逻辑比较逻辑中使用构造函数的定义。 |
只要有必要,一般当本体是建立在相同的自然语言,语法比较可能被用来支持逻辑比较但非常低的体重就可以进行这项语法比较元数据作为标签名称或概念的作用。两个相同的条件,即拥有相同的语法和如果他们使用相同的情况下,可能有相同的意义。建模时使用相同的语言,相同的世界很难发现知识建模者使用了完全不同的词汇表定义的概念和作用。一般来说,他们可能会选择相同的概念名称来表示相同的或不同的概念名称但高度相关的语法表示相同的东西。例如,一个可以决定使用“studentname”来表示学生的名字,而另一个构建器可以使用“student_name”为同一目的。编辑距离(ed)引入的Levenshtein作为相似性函数的基本措施。这个编辑距离背后的想法是测量最小数量的令牌插入,删除和替换需要将一个字符串转换成另一种形式。实现我们的编辑距离是两个字符串之间基于最长公共子序列。两个字符串之间的差异可以很容易地获得最长公共子序列的长度减去两倍的LCS的两个字符串的长度的总和。因此,编辑距离定义为: |
Ed (string1 string2相等)= | string1 | + | string2相等| 2 | (LCS (string1, string2相等)|) |
然后一个对称函数。ed (string1 string2相等)= ed (string1 string2相等) |
基于编辑距离,我们定义语法相似函数0之间的最大值和最小值的比值之间的两个字符串的长度,string1 string2相等-他们的编辑距离最小的两个字符串的长度。 |
Simsyntax函数返回两个字符串的相似度,这是一个值在0和1之间,1代表完美的匹配和零坏匹配。它认为的数量变化,必须将一个字符串转换成其他的数量和重量这些变化对短的两个字符串的长度。图5显示了所有执行的比较对于一个给定的一对概念演绎他们的相似之处 |
d .相似性聚合。 |
一双候选人的比较给出了几个相似值两个本体概念的O1, O2。这些值的计算概念相似度的家长,相似性的概念定义和包含概念的相似度的计算。我们定义一个聚合值,给出了相似度值的映射。这些值被分配不同的权重,表示每一个高于获得价值的重要性,影响最终的相似度值。我们定义两个概念之间的相似度的结果: |
重量父(分数)+重量概念定义(分数概念定义)+重量概念包容(分数概念包容)/总重量(3.1) |
语法比较,(指的是图4)应避免当两个本体不是在相同的自然语言。我们只分析基于相似性的符号(构造函数)。这意味着分数的概念定义和包含的概念将主要依赖于逻辑构造函数。(它将不再考虑任何语法比较) |
大肠的解释 |
本体概念之间的映射本体O2 O1和概念提供了一个表格表示整个可能的映射和其相似值的相似度计算。这些值被用来从本体O1、O2获得概念之间的映射。每个表条目包含两个概念的比较和他们相似的得分。 |
由于每个概念图中只出现一次,每个概念在本体O1最多只能有一个类似的概念在本体O2。我们定义的阈值,使得两个概念的最小值可以被视为是相似的。自相似性概念分数在0到1的范围,1代表的完美匹配和0坏匹配,然后选择阈值作为一个积极的值在0和1之间。这个阈值定义的水平,可以表示两个概念在语义上是相似的。 |
整个表扫描来确定表条目具有最高的价值。相应的概念被认为是最相似的概念。他们的价值与阈值比较。如果该值大于阈值,然后他们最相似的概念。对于每个表条目有两个概念,它们从表中删除,因此没有其他概念可以被映射到它们。这个过程是迭代,直到没有相似性高于阈值获得的价值。 |
结论 |
本文描述了一个SHIQ本体之间的互操作性的匹配技术。代表源本体层次树构造节点代表概念和边缘代表角色的地方。概念之间的相似性是评估不仅基于语法的概念和作用,但更重视本体的层次结构。拟议的方法希望对解决互操作性问题提供了一个框架以促进本体之间的交流知识。 |
引用 |
|