所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

使用各种扰动数据隐私保护技术

Kavitha年代,拉贾vadhana P
PG学者,计算机科学与工程系,N.G.P.理工学院博士,安娜大学,哥印拜陀、印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

数据隐私是一个大问题在各个领域中起着重要作用的数据发布。数据发布了数据分析的信息的目的是收集来自各种组织。收集到的信息应该保护所有者的标识记录。这是主要的问题之前发布数据到其他组织。隐私的记录应由特定的组织会为别人发布的数据分析的目的。涉及各种技术数据发布的隐私保护。其中微扰技术是一个重要的方法来扰乱可以发布的数据记录的数据为进一步使用其他组织。它是用于数据隐私和准确性。在本文中,我们将讨论各种摄动技术,用于数据隐私。

关键字

数据隐私;摄动;隐私保护;数据挖掘;随机数据扰动

介绍

有大量的应用,比如金融、教育和医疗领域,需要隐私保护数据挖掘可进一步用于挖掘有用的信息。数据应保持数据所有者的声誉和监管维护隐私的敏感信息,在另一个案件中也应该有助于发现新知识的模式。这样做是有必要性的时候采购第三方的数据记录所有者[1]。这可以通过使用各种技术,如匿名化,微扰,等等,为隐私保护数据发布匿名化是一种启发式方法[2]数据扰动是一个重建的方法用于数据挖掘隐私保护[3]。
答:数据扰动
这是一个技术维护数据隐私。这种技术变化数据记录的值没有改变底层数据的意义。它使用两种技术数据的概率分布和数据失真通过构建决策树分类器添加噪声或任何其他数据的原始数据分类数据发布前可以进一步重建的记录所有者知道采样数据用于改变原始数据。这主要是处理数据的机密性[4],[5]。
1)概率分布的方法
概率分布的技术将由同一分布的样本数据或原始数据本身[6]。
2)价值失真
价值失真变化通过添加加法或乘法噪声值原始数据的数据直接[6]。
类型的数据扰动
上面的两个方法是适用于所有类型的数据扰动,以保护数据隐私。类型主要分为三种类型。
1)旋转微扰
在这种方法中两个属性的值矩阵的旋转但价值保护的意义。变形技术应用的价值首先选择一双属性然后他们的价值观扭曲旋转这两个值[7]。
2)投影扰动
扰动是通过选择数据值的数据在高维空间和数据在低维空间中随机变化。这可以预测列或行智慧[8]。
3)几何扰动
这是一个混合动力技术的组合旋转,平移和添加随机噪声值给定的数据值矩阵来提供高质量的数据保留主要用于集群[9]。

数据扰动

在所有这些数据扰动方法是通过使用随机值矩阵乘法或加法噪声扰动之前数据发布的隐私保护数据[10]。
答:旋转微扰
1。柯克·陈,凌刘[11]
随机旋转微扰技术,多个列数据值被转换在单一列变换。因此它会导致查询隐私在多维旋转扰动。在这个技术的几何分布随机矩阵应该考虑增加隐私数据的价值。这个问题的新方法和统一的度量隐私和隐私也保护多列。这个指标有助于分析旋转(ica重建攻击扰动的问题。本文还证明了更高的隐私和旋转不变分类器精度也比其他扰动技术保护。
2。音译,洁王;刘连;长江张[12]
本文随机旋转微扰技术的缺点是处理,因为这种技术的问题不能保持旋转的几何属性随机矩阵用于分类以保护隐私。这里的数据矩阵是垂直分区,每个分区的数据子集矩阵随机旋转矩阵是用来扰乱原始数据的价值。这些数据是由第三方用于数据分析的目的。这种集中式算法还处理隐私问题保持矩阵的几何性质和分类用于分类的准确性之前发布的数据。
3所示。Murat Kantarcioglu李Liu和Bhavani Thuraisingham [13]
一个名为C4.5决策树分类器的新分类器提出了保护数据隐私以及分类和重构原始数据的高精度摄动数据。它减少了计算和通信成本的时间。有一些数据挖掘技术可以直接应用于摄动数据由于扰动过程,将保留数据的性质。数据挖掘分类器如朴素贝叶斯分类器可以应用于加性扰动数据和基于欧几里得的直接数据挖掘工具,例如,.k-Nearest邻居分类器,支持向量机,神经网络感知器可以应用于乘法扰动数据。但信息损失将减少在这个过程中,在应用过程中另一个问题是性能。在与其他技术相比扰动随机数据旋转提供高隐私以及决策树分类器离开努力解决分配问题。
b .投影扰动
1)鹰鹏唱、香港沈、回田[14]
在隐私保护数据挖掘。随机投影(RP)是获得更多关心其效率高。如[8]中所述,原始数据集与m属性当k乘以乘以一个随机矩阵可以有k (m > k)系列的数据是数据分析的摄动,可以发表。摘要不同的先验知识被认为是基于重建数据之前欠定的独立分量分析(UICA)和最大后验(MAP)方法用于相关性但属性应该是相互独立的。证明UICA和地图优于主成分分析(PCA)用于扰动时通过增加数据的隐私和提供更高的安全性。
c .几何扰动
1)柯克·陈,凌刘[15],[16]:
几何扰动非常有效扰动技术,隐私保护数据发布在一党。摘要多党提出了保护隐私的合作开采几何扰动。对于这种方法三个协议即简单、谈判和空间适应协议使用随机或扰动的生成优化的算法。这三种协议的性能分析表明,简单的协议有问题不能提供保证隐私数据提供者和加密使用所以无法轻易共享公共的数据发布,但是空间适应协议可以提供更好的可伸缩性、灵活性的分布数据和整体满意度在保护隐私大空间适应协议给出更好的结果在改善隐私当有多个数据提供者。
一个随机几何扰动方法提出了保护隐私数据分类。在随机几何扰动G (X) = RX + ? + ?有三个线性组合、旋转、翻译和距离几何扰动扰动在数据挖掘保持几何类边界摄动的数据。多列隐私评估模型和统一的隐私是设计和提出解决不变分类器问题和保护naive-inference攻击,ica)攻击,和distance-inference攻击。
2)陈温驯,戈登太阳,凌刘[17]
提高准确性和保证隐私可以提高通过使用任务/面向模型的扰动。很多流行的数据分类模型可以使用几何扰动因为摄动数据集的训练和测试的数据类似于训练和测试原始数据的准确性。本文的潜在攻击几何扰动进行了分析和证明了随机优化方法与geo-metric扰动将提供一个令人满意的妥协以更少的隐私保证准确性。这个框架有助于分析更多的袭击和优化几何扰动。

结论

在本文中,我们分析了各种扰动技术可用于隐私保护数据发布。数据发布最近获得了更大的影响因此,数据隐私也获得了更大的影响应保存在数据发布。我们详细讨论的问题和它的每种类型的扰动技术的优点。我们主要集中在随机数据扰动,实现在微扰技术,还讨论了提高效率的改进来自攻击者的隐私。在这些微扰技术的分析,认为几何分布提供了更高的隐私和数据效用与其他技术相比在隐私保护数据挖掘。

引用


















全球技术峰会