ISSN在线(2320 - 9801)打印(2320 - 9798)
R.Santhya1,S.Latha2,Prof.S.Balamurugan3,S.Charanyaa4
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
本文详细介绍各种方法的文献有效发现匹配的依赖性。匹配的概念依赖(MDs)最近提出了目标识别用于指定匹配规则。类似条件的函数依赖,MDs也可以应用于各种数据质量检测违反完整性约束等应用程序。发现问题的相似性约束匹配依赖性考虑从一个给定的数据库实例。这个调查将推动很多研究领域的信息挖掘。
关键字 |
数据匿名化、匹配的依赖关系(MDs)对象,相似性约束、信息挖掘。 |
介绍 |
需要发布敏感数据在最近几年公共变得奢侈。近期已出现大幅上升,保护数据库中的数据质量社区由于大量的一个¢dirtyA¢数据源自不同。这些数据通常包含重复、矛盾和冲突,由于各种错误的男性和机器。除了成本的处理大量的数据,手动检测和删除一个¢dirtyA¢数据肯定的做法,因为人类提出清洗方法可能再次介绍不一致。因此,数据依赖关系,已广泛应用于关系数据库的设计建立完整性约束。因此保护个人隐私和保证社会网络数据的效用成为一个具有挑战性和有趣的研究课题。在本文中,我们做了一个调查在匹配的依赖和可能的解决方案提出了文学和效率是一样的。 |
二世。近似推理的函数依赖关系 |
在本文中,作者描述了FD推理问题。FD推断的问题,在这个特定的关系一个¢r找到FD的设置,相当于所有FD的集合在r。近似依赖推理是接管措施错误的关系。这些误差值为0,如果依赖持有和价值是1如果依赖不持有。 |
在数据库设计的完整性约束条件定义了数据库状态所允许的。这些存在于几类的依赖关系,所以函数依赖是最重要的一个类。本文只考虑FD,叫他们只是依赖。 |
本文另一个依赖近似依赖推理。在结果不需要是准确的。所以本文包含两种不同的结果。推断的问题在给定的函数依赖关系¢r”当代显示三项措施的依赖,接着展示了输出多项式算法准确。在覆盖的FD集在给定的关系,结果表明近似技术实现好的结果的依赖推理问题。 |
三世。度量函数依赖 |
本文作者介绍了度量函数依赖问题,而合并来自不同数据源的数据然后将数据格式的一个小差异。这将使传统的FDs,违反,不存在任何的语义 |
FDs,定义了功能属性之间的关系。在FD关键关系非常特殊的FDs,这些将提供数据库规范化处理的设计。条件函数依赖关系以及近似固有可能不给确切的结果而缺乏鲁棒性。所以以上这些问题介绍了多功能显示这些数据将用于捕捉小的变化。 |
本文的算法来验证指定显示.specifically通用指标以及欧氏距离空间。 |
Dom (x)是一个属性的域x = x的序列属性A1, A2……Ak,然后Dom (x) = Dom (A1) * Dom (A2) *……* dom (Ak)。 |
本文数据问题处理的失败和错误。所以我们引入FD的指标。结果显示声音和现实。 |
第四。发现功能和函数依赖关系数据库 |
本文描述的研究开发基础,有效的近似方法在给定的功能依赖关系数据库,这是基于分区的数学理论,最小非平凡函数依赖聪明的算法可以找到使用水平。FD定义了关系数据库的属性之间的关系。州,属性值唯一地标识的其他属性值 |
本文的新发现算法的发现功能和近似函数依赖。这种方法是基于分区的行编号从关系和广度优先或聪明的搜索进行水平分区和依赖关系可以有效地评估 |
诉改善数据质量通过有效利用数据语义 |
在本文中,作者展示了数据质量问题的问题。这是在最近一年增加,重要的问题。所以许多的发现¢数据qualityA¢或一个¢数据misinterpretationA¢问题。e数据语义的问题考虑。硬币(COnetext和交换)技术提出了知识存储和知识处理方法。 |
硬币是一个基于知识的中介技术,这将使有意义的异构数据库的使用。这枚硬币是不仅对中介也对包装技术和中间件服务。包装是物理和逻辑网关来提供统一的访问网络上的不同来源。 |
本文的框架了解房子持有问题提出了硬币,本文技术用于存储和应用捕获知识,将来的工作是收集数据,确定企业的类型房子持有知识。其次探讨硬币技术在企业控股和延长硬币捕获技术,存储、维护和应用房子持有知识。 |
VI。自动发现的相关性和软函数依赖 |
在本文中,我们介绍绳,一个有效的工具来自动发现之间的相关性和软FD列。绳子搜索列可以通过候选人对有用的依赖关系和灵活的设置使用启发式的修剪无前途的候选人。绳子可以用作数据挖掘工具,生产依赖图,所以我们关注使用绳索在查询优化一般。这种方法相对容易实现。绳子可用于配合查询反馈系统,如学习optimization.etc狮子座。。 |
七世。有效的发现使用分区功能和近似的依赖关系 |
本文作者给出了新方法寻找基于分区函数依赖集的行对自己的属性值。这些分区使简单而非常有效的和行很容易识别。有效在实践中是一个新的算法被用于实验。运行时间是提高几个数量级在先前发表的结果。这些也将适用于更大的数据库。 |
八世。一个高效的算法发现功能和近似的依赖关系 |
在本文中,作者定义了函数依赖的发现。这是一个重要的数据库分析技术.Tane,寻找一种有效的算法函数依赖从大型数据库。些是基于分区的行,这将使FD的vality。T他的分区将使FD的发现更加容易和高效。基准数据库运行时间提高了几个数量级的过去。所以这个算法也适用于大型数据集。 |
第九。一个算法的推断函数依赖关系 |
在本文中,作者描述了依赖推理问题。它是用来发现的FD集将在给定的数据库关系。问题是指数的数量属性和应用程序数据库设计、查询优化、人工智能,所以我们开发这两个算法是减少计算的横向超图的问题。另一个是基于反复排序关系对的属性集。 |
x的结论和未来的工作 |
本文详细的对各种方法的文献有效发现匹配的依赖性。匹配的概念依赖(MDs)最近提出了目标识别用于指定匹配规则。类似于函数依赖(有条件),MDs也可以应用于各种数据质量检测违反完整性约束等应用程序。发现问题的相似性约束匹配依赖性考虑从一个给定的数据库实例。这个调查将推动很多研究领域的信息挖掘。 |
引用 |
|