ISSN:2229-371X
昆图马拉拉tha#1和AkkarabaniBharaniPradeep库马尔2
|
对应作者 :昆图马拉拉塔电子邮件:kuntumallalatha@gmail.com |
相关文章at普梅德,学者谷歌 |
访问更多相关文章计算机科学全球研究杂志
隐私现在是主要关头保护数据隐私是数据分发中的一个重要问题远程测量技术通常旨在保护个人隐私,对发布数据质量影响最小最近推出数模型,以确保隐私保护并/或尽可能减少信息损耗即,它们进一步提高匿名策略的灵活性,使之更接近现实,并满足人民的不同需求各种建议和算法同时设计本文概述距离测量技术保护隐私远程测量模型 主要的实现方式 远程测量算法策略 分析优缺点并简单回顾所完成的工作最后,我们通过分析现有工作完成远程测量技术的进一步研究方向
关键字 |
隐私、距离度量、近距离性、匿名性 |
导 言 |
匿名数据发布近些年来得到了研究界的极大关注,因为需要在许多数据传播应用中预防“链路攻击”[1]举例说,公司想向社会学科学家提供表支付记录,称为微数据属性薪资敏感化,即出版物必须确保无对立方无法精确推算雇员薪金年龄和Zipcode准标识符[2]属性,因为它们可用于连接攻击恢复雇员身份信息技术的进步使各种组织(例如普查机构、医院)收集了大量敏感个人数据(例如普查数据、医疗记录)。这些数据研究价值巨大,常常为公众利益发布,但对个人隐私构成风险。典型解决方式是数据匿名后公诸于众具体地说,匿名化应谨慎进行,以便所发布数据不仅防止对立方推断敏感信息,而且对数据分析仍然有用。发布表为研究者提供有用信息向表内数据个人提供披露风险因此,我们的目标是将披露风险限制在可接受的水平上,同时实现最大效益实现该目标的方法是在发布前对数据匿名第一步匿名清除清晰标识然而,这还不够,因为对立方可能已经知道表上某些个人的准标识值。 |
知识可来自个人知识(例如亲身了解某个个人)或公开使用的其他数据库(例如选民登记表),其中包括清晰标识符和准标识符常用匿名法泛化化,用不那么具体但语义一致性的值替代准识别值 |
PriVACYSKYLINE: |
隐私多维知识 |
隐私技术处理知识数据可分组成文件箱或桶称D数据变D*竞争者还可能获取外部知识广义地说,我们可以使用逻辑表达式模拟外部知识,可能包含变量表示表达式不包含变量地面表达式可用原创数据集评价,并返回真假重构R满足表达式EifeE true onR(D*)[3] |
我们考虑 |
a.目标个人知识:趣味实例级知识类举个例子 Tom没有癌症 |
b.了解他人:类似地,对手可能拥有目标以外的个人信息举例说 加里感冒 |
C.同值家庭知识:我们认为最直觉类知识与不同个人相关知识是知道个人集团(或家庭)有相同的敏感值。举个例子 {Ann,Cary,Tom}可能是一个同值家庭, 意指如果其中任何一个有敏感值(如Flu), 所有其他都往往有相同的敏感值披露和净化数据,提高计算效率数级比最已知技术大知识为人知时使用高效技术另一点是,图中个人关系并不清楚 |
最廉价保值 |
数据挖掘方法应用变换,当数据挖掘方法或算法应用时会降低底层数据的有效性私密性与精度间自然取舍取舍受特殊算法影响 使用该算法保护隐私关键点是维护数据最大实用性而不损及隐私约束泛泛概述保护隐私数据挖掘的不同实用方法设计实用算法有效处理某些类型数据挖掘问题的问题得到了解决。 |
采矿协会规则隐私约束 |
关联规则采掘是数据采掘重要问题之一,因此我们专门用几章讨论这个问题。隐私保护关联规则挖掘问题有两个方面:当数据输入受扰动时,精确判定受扰动数据关联规则是一个挑战性问题。在此例中,我们努力确保互连输出规则不导致敏感数据泄漏数据库群称关联规则隐藏[5],统计群称应急表隐私保护输出关联规则隐私问题简单化详细调查关联规则从数据库社区的角度展开讨论 |
密码分享隐私法 |
在许多情况下,多方或愿分享汇总私有数据,不泄漏端端敏感信息[6]举例说,拥有敏感销售数据的不同超级商店似可相互协调,了解汇总趋势而不泄漏单个商店趋势这需要安全加密协议,供不同方共享信息数据可分两种方式分布在不同网站:隐私数据挖掘领域为数据流领域,数据以无限速增在这种情况下,隐私保护问题颇具挑战性,因为数据正逐步发布此外,数据流快速性质排除使用过去数据历史的可能性 |
数据流和隐私数据挖掘这两个题目相对较新,已经对数据流随机化工作[7],其他工作处理数据流基于匿名化问题[8]这两种方法都讨论,其中分别调查隐私和随机化 |
NT关闭 |
更灵活版本保护隐私在这些模型中,我们使用两个属性间距离测量命名为计数在此我们使用各种距离度量识别属性间距离 基于信息增益和这些属性关系密切与其他匿名技术相比,这可以更加灵活,但单靠它并不足以测量,但我们需要多维技术,可与这种方法并用,对保密个人信息大有帮助。可见NT近距离方法9可分布全数数据 |
应用以上技术后表形式为匿名版通过使用距离测算方法近距离可以看到匿名性 属性之间的距离小分数表示它们彼此相近, 将最后数字替换为'*'可隐藏病人原创细节 |
NT距离限制: |
a.无计算程序执行 |
b.迄今有效方法与泛化和抑制或切片合并 |
C.不同属性间失联关系: 这是因为每个属性均分化, |
.数据实用性如果使用极小t.(小t)将导致计算时间增加 |
距离度量测 |
曼哈顿距离函数计算距离曼哈顿距离2Ems之和X=(X1X2等)和Y=(Y1Y2etc.)之间的距离公式 |
欧几里得距离二分二分xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx |
位置ofapointinaEuclideann-space表示二分Euclidean规范或Euclidean长度或矢量测量矢量长度:值免包损耗,估计误差增增量随跳计数线性增长,增速慢慢慢于spot计数值显示只有随机前游计数对提供更好的源定位隐私无效 |
上方程中点输出矢量扫描线段从欧几里得空间源头[11](矢量尾巴)到该空间点视其长度从尾部到尾部的距离为实值,便清晰可见欧几里得差仅仅是欧几里得距离的特例:欧几里得间距点间距离有方向从ptoq)表示它可能由另一种向量表示 |
三维空间(n=3)从p向q向箭头,也可以视之为q相对p的方位也可以称移位向量,如果p和q代表连续两分位同点的两个位置 |
欧几里得距离pq |
一维性 |
在一个维度中,实行两点之间的距离是数字差的绝对值x和二分线误差 |
在一个维度中,有单偶化变换度量法(换句话说,由规范导引距离法),最长至尺度因子长度,即欧几里得距离法高维中还有其他可能的规范 |
二维性 |
欧几里得平面中,如果p=(p1,p2)和qq=(q1,q2)则距离由 |
等同Pythagorian定理[12]取之以极坐标软点对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角对角 |
上方距离测量使用dithlose函数(n.t)提高隐私性,同时发布个人敏感信息 |
结论 |
本文描述近距离技术中各种距离度量法保护个人隐私同时发布像医院数据感知等微数据 |
引用 |
|