所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

防止袭击社交网络使用卫生处理技术

P。Lakshmi Punyavathi1,Naresh Sammeta2和SD。艾克塔岜沙3
  1. M。理工大学的学生,CSE的部门。,Quba College of Engineering & Technology, A.P, India
  2. 助理教授,CSE的部门。智慧化K工程与技术学院,印度钦奈
  3. 助理教授,CSE的部门。,Quba College of Engineering & Technology, A.P, India
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

在线社交网络例如Facebook动态利用各种各样的人。这些框架许可客户传播经验自我和与他们的朋友。一点的信息发现在这些框架计划是私有的。但可以想象利用学习估计排放想象私有数据的信息。在这种风险,它是关于如何分派决心伏击利用放电个人个人通信信息怀疑私人数据。然后设计三种可能的卫生处理的框架可以作为一个多元化的环境。到那时,探索这些技术的广大和尝试使用框架总推理发现敏感属性的数据集。它表现出可以减少两相邻的广大和社交聚会的计算通过使用净化时间描述。

关键字

社会网络分析、人际关系组织调查、信息挖掘,非正式的社会保护。

介绍

在线社交网络的应用程序允许他们的客户接口策略独特的协会。作为一个真正的产品的一部分,这些框架许可人浏览一遍的知识对自己至关重要的方法框架。例如,Facebook是一个通常人际关联,所以单独客户列出他们最珍视的活动、书籍和电影。话又说回来,LinkedIn是一个主框架;正因为如此,相关客户的微妙的元素不显眼的组件(即主人的生活。、推荐信、过去的职业等等)。根据这些地区收集广泛的个人信息的方式,人际关联应用程序供应商有一个特殊的开放入口通道:快速使用这些信息可能是重要的顾客及时推进。
当然,在实践中,保险可以让这些尝试的担忧。这个数据和个人安全的幻想使用之间的冲突提供了一个机会为保险的非正式社区数据挖掘,信息的透露,从人际关系组织数据没有滥用安全协会。安全问题的人在社交网络在图1中可以分为两个类别:保证数据发布后,和私人信息泄漏。安全的实例数据发布后将特定个人的ID在其发布后的数据集一般民众或付费用户特定的利用率。可能最直观标本这种安全的破裂(及其影响)是美国在线查找数据的侮辱。
私人信息泄漏,那么,相关的知识在个体不明确的传达,在任何情况下,相反,通过不同目的的累积投资和/或协会发布的人可能表达的细节。这种信息泄漏的轻浮表示是一个客户的情况,说,约翰,不进入他的政治伙伴关系,因为安全问题。然而,毫无保留地敞开他的“批准同性婚姻”。Utilizing this straightforwardly accessible data as for a general social affair interest, it is smoothly guessable what John's political association is. To a degree more unobtrusive is the most cherished film " The End of the Spear.1" It message that this is an problem both in live information (i.e., starting now on the server) and in any released data. In Interpersonal organizations data mining, it explore two cases in which customers inside an interpersonal association may need to guarantee their security.
答:我们的贡献
为了安全的保护,我们清洁微妙的元素和隐藏连接结构的图表。我们消除一些数据从客户机的配置和疏散几个同伴之间的连接。我们另外分析总结微妙的元素的影响品质更温和的品质。然后我们研究影响这些策略对对抗可能的派生攻击以及他们如何可以用来指导消毒。我们进一步证明这个消毒仍然允许利用框架的其他信息进行进一步的作业。同时,我们谈论“完美的安全”的想法在人际关系组织和给一个正式的保护定义适当的推导攻击检查。
b .概述
本文的其余部分由后需要:在第二节中,我们描述过去工作在该地区的非正式社区匿名化。在第三节中,我们显示我们的定义也保护和塑造策略,我们创建了匿名化非正式组织信息。在第四节中,我们给出一个投机的通用图处理算法。在第5部分中,我们描述我们的分析,我们获得的结果。在第6节,我们提出一些可能的未来的工作。

相关工作

在本文中,我们研究涉及众多地区强烈的检查。人际关系组织内部安全的区域包括一个巨大的宽宏大量,根据特征是如何保护。在[5],Backstrom等人考虑一个匿名攻击系统。在他们的模型中,该系统包括的中心和边缘。微妙的元素品质被排除在外。侵略者的目的是为了区分个体。进一步,他们的问题是完全不同的比考虑摘要,理由是他们忽视了微妙的元素和不考虑的兴趣点的存在对隐私的影响。干草et al。[6]和刘Terzi[7]考虑一些匿名的非正式群体的方法。尽管如此,我们的工作集中于产生微妙的元素的枢纽系统,独立不认识人。
不同的论文试图解释非正式社区内部私有数据。在[8],他通过奖学金等人考虑的方法获得私人数据连接通过贝叶斯系统连接在一个人际关系组织。蠕变时真正的人际关系组织,生活杂志,他们利用投机信用打破他们的学习计算。同样,与[8],我们给的方法可以帮助选择最好的微妙的元素或连接需要连根拔起保护保护。最后,我们调查的影响总推导系统的感应攻击。在[9],Zheleva Getoor提出几个社会图匿名化技术,基本上集中在认为匿名化聚集的中心和连接结构,随后一个匿名化的图表。尽管如此,他们的技术都集中在默默无闻的结构本身。例子,通过利用k - namelessness或t-closeness,取决于选择的半标识符,唯一性的一个重要组成部分信息可能会丢失。默默无闻的通过我们的技术保护,我们在每一个中心保持完整的独特性,它允许postrelease更多的数据信息。

算法

最近创建的微分安全定义[12]给出了有趣的假设的保证人。从本质上讲,它承诺的后效微分私人算法非常相似有或没有任何一个客户的信息。,不同保护确保一个记录的变化,不会改变过度的结果。话又说回来,这个定义不安全的建筑精确信息挖掘模型,可以预见敏感的数据。真的很多人不同的私人信息挖掘计算生产[13],可比精确非私人不同变体。因为我们的目标是放电丰富的非正式社区信息,预防敏感的兴趣点暴露通过信息挖掘系统,差动保护的定义并不是直截了当的材料在我们的情况。
答:正式的隐私的定义
上述保护定义可以连接到不同的区域。考虑的情况下我们需要选择是否排出一些私有数据(如饮食模式、生活方式),并与一些公开数据(如年龄、邮政区、祖细胞的死亡原因)。我们可能会担心是否显示数据可以用来制造一个信息挖掘模型预测个体的概率得到一个阿尔茨海默病。大多数人会认为这些数据是微妙的例如,当寻求健康保护或工作。我们的安全定义可以用来选择是否发布信息集,因为潜在的揣摩分析问题。
b .操作细节
显然,可以控制的兴趣点在三个方面:微妙的元素添加到中心,改变现有的微妙的元素和驱逐微妙的元素从中心。在任何情况下,我们可以全面秩序这三个例程为两个分类:麻烦和匿名化。包括和调整的兴趣点都可以视为系统的烦恼,呈现不同的“喧嚣”D下降顺序正确。连根拔起中心,尽管如此,可以被视为一个匿名化策略。
c .操纵链接信息
显然,微妙的元素可以控制在三个方面:增加点感兴趣的中心,改变现有的兴趣点和驱逐的兴趣点的中心。另一方面,我们可以全面描述这三个策略分为两个分类:麻烦和匿名化。包括和改变微妙的元素都可以视为例程的麻烦,呈现不同的“喧嚣”D减少订单的正确性。连根拔起中心,尽管如此,可以被视为一个匿名化系统。

伪代码

算法推广(Ω,G)
步骤1:G1←G
步骤2:在分类(G) -分类(G1)< =Ω
步骤3:←所有细节,可以进一步推广
步骤4:年代←getHighestInfoGainAttrib (s)
第五步:创(年代;G1)
第六步:结束
第七步:返回G1
我们给投机的总体布局算法1中准备。在每一个阶段,我们总结每一个兴趣点排序找出一个级别(3 - 5行)的品质可以进一步总结没有完整的疏散和保持一个破旧的精确投机。每一轮的末尾,我们“永远”存储个人兴趣点,给出了最佳安全储备基金(4号线)。在改变图表时,G1,满足安全的先决条件,我们认为它是准备出院。

仿真结果

答:数据采集
我们组成一个项目蠕变脸谱网系统组装信息为我们的调查。写在Java 1.6中,爬虫堆放一个概要文件,解析的元素的HTML,并将感兴趣的点在一个Mysql数据库。此时,履带存堆放所有的同伴当前概要文件和数据库内的同伴同伴船连接,可以允许配置文件后出去散步。由于Facebook的非正式组织,规模的爬虫是限制向前滑行概要文件在达拉斯/价值(DFW)系统。这意味着,如果两个人传授DFW系统外的一个典型的同伴,这不是反映在数据库内部。另外,一些个人授权保护极限在个人资料使得履带不能看到他们的概要的兴趣点。爬的总时间是七天。
因为在Facebook的个人资料是免费的信息结构内容,这是基本的信息被标准化。例如,大多数爱书的“圣书”和“精神文本”应该被视为相同的微妙的元素。此外,经常有拼写错误或品种相同的事情。我们利用的标准化体系是基于守望抽梗机中引入[14]。标准化利益点,分为词汇和每一个说遏制了看门人抽梗机然后重组。两个相同的兴趣点,标准化的价值被认为是同样的原因学习计算。总蠕变带来超过167000,几乎450万剖面微妙的元素,和超过300万friendshiplinks。在图中表示,我们有一个实质性的焦点聚集的中心,最极端的方式相关联长度16。只有22日的聚集客户没有在这个聚会。
b .实验装置
在我们的实验中,我们描述两个安排作业。主要是,我们想知道如果一个人在政治上是“进步”或“自由。”The second characterization undertaking is to figure out if an individual is "hetero" or "gay person." It is paramount to note that we consider people who would likewise be viewed as "androgynous" as "gay person" for this test. We start by pruning the aggregate diagram of 160,000 hubs down to just those hubs for which we have a recorded political association or sexual introduction to have sensible tests for the exactness of our classifiers and the effect of our purification. This decreases our general set size to 35,000 hubs for our political alliance tests and to 69,000 hubs for our sexual introduction tests. We then lead an arrangement of analyses where we uproot various subtle elements and a different arrangement of examinations where we evacuate various connections. We direct these evacuating up to 20 points of interest and connections, individually.
除c .细节
从结果可以看出,我们的系统,有效地减少分组差事的精度。Fig.1shows疏散微妙的元素的最深刻关联到一个类是精确的兴趣点和正常的分类器。荒谬地,也许是,我们连接分类器的精度同样减少了疏散的兴趣点。然后,研究了在区域4.4中,两个中心的微妙的元素与发现相似。我们从系统排出的兴趣点,“比较”中心的集合中心同样会改变。这可以表示精度的减少分类器的连接。
另外,我们看到,在图2中有一个安排疏散后的精度严重下降一个孤独的微妙的元素。在任何情况下,当看一看美国的信息,这可以澄清的疏散细节非常自尊的“温和”类的特征。当我们离开这个细节,绝对是“传统”的可能性减少,提示高数量的不准确的分组。当我们撤离第二细节,比较概率为“自由派”分组,然后类自尊概率开始模式下行速度更为顺畅。
虽然我们不知道这种行为在图2 b中,我们看到一个更不稳定的分组精确。据说,这似乎是由于更广泛的班级规模独特性的基本信息。由于或多或少95%的可访问的中心是“异性”和没有微妙的元素就有异常性的特征介绍的政治联系,即使是很小的变化可以影响特征以不寻常的方式精确。例如,当我们离开五微妙的元素,我们把描述精度,然而第六个和第七个的兴趣点,我们看到一个增量精确。在这一点上,我们又看到另一种精度下降,当我们撤离第八微妙的元素。
d .链接删除
如无花果。2 c所示,当我们撤离连接,我们有一个总的来说更稳定下行模式,只有几个特殊情况的“政治联系”测试。
e .联合切除
而每一个分组精确测量了下降,我们另外测试发生在我们的信息中设置事件疏散微妙的元素和连接。要做到这一点,我们直接进一步测试精度测试顺序连根拔起后0的兴趣点和0连接(测量精确),0微妙的元素和10个连接10微妙的元素和0连接,和10的兴趣点和10个连接。我们选择这些数字,理由是连根拔起后12连接,我们观察到,开始各种隔离一些中心或单一的集会,分离中心。此外,当我们感兴趣的疏散13分,44%的“政治协会”信息集和33%的我们的“性介绍”信息集合剩下不到四微妙的元素。由于我们的目标是保持效用潜在信息放电后,我们决定撤离不帮助这个微妙的元素和连接。
我们提到这些设置为0的兴趣点,0连接;10微妙的元素,0连接;0的兴趣点,10个连接;10微妙的元素,10个连接撤离,分别。模仿,我们需要计精确不同比例的命名与分类器的无标号图。为此,我们收集了破旧的大多数访问中心,正如上面讨论过的。然后我们得到一个不规则的阶段,这破旧利用Java能力隐式积累类。接下来,我们单独的破败成测试组和一组准备,根据想要的比例。
f .泛化实验
每一个微妙的元素之一,可分为几类:宗教、政治联系,运动,书籍,音乐,引文,节目/电影、聚会。由于缺乏可靠的主体力量,也就是说,谁能权威来源分类给定引文没有额外的人类信息,引用从所有考试被处理。生产DGH对于每一个行动,书,和显示/电影,我们利用谷歌注册。生产的DVD音乐,我们利用最后一个。调频标签框架。生产指挥系统的聚会,我们利用订单标准收集的Facebook页面。
g .卫生处理对其他攻击技术的影响
我们进一步测试的疏散微妙的元素作为一个匿名化方法利用好坏参半的独特安排计算来测试我们的系统的可行性。为每一个微妙的元素被连根拔起,我们开始疏散的兴趣点的显示数量按照技术描绘区域4。然后我们十倍交叉执行批准在这组100次,并进行了疏散0-20微妙的元素。这些测试的结果显示在无花果。3 a和b。从这些数据可以看到,我们的策略是可行的在减少系统对那些微妙的元素的顺序我们委托敏感。
在特定精度减少波动通过微妙的元素被连根拔起的数量和用于描述特定的计算,我们看到,说实话减少分类器的精确在宽范围。我们看到,直接复发最轻微的影响,精确的大约减少了10%。另外选择树是最影响,大约35%产权分组精度降低。这表明,利用贝叶斯分类器进行净化,这使得它简单区分个体的兴趣点,使一个类马克更有可能,我们可以减少一组更大的分类器的精度。

结论和未来的工作

不同的私人信息泄漏问题在人际关联。展览,使用这两种关系协会和目的的投资一起给喜欢怀疑仅限制在不显眼的组件。以相似的方式,它检查的影响消除的目的投资和协会等敏感信息泄漏。同时,发现情况下总推理并不能提高使用基本框架识别中心附近的游戏计划。当它加入总影响的结果影响与个人的结果,它开始看到放电含蓄的片段和亲属关系接口一起是绝对最好的技术来降低分类器的精度。这可能是不可行的在保持人际关联。然后再一次,此外展览,通过清算只是投资的目的,大大减少邻近分类器的精度,满足我们最伟大的精度,已完成通过任何的组合分类器的极限。
它以相似的方式承认充分利用了轮廓信息时选择热情隐藏的目的。适应考试可能可以想象在个体如何限制访问框架可以选它不引人注目的组件来收藏。同样,未来的工作可以调节感知图结构的中心要点检查是否删除或修改这些中心可以减少信息泄漏。

数据乍一看

图1 图2一个 图2 b
图1 图2一个 图2 b
图2 c 图3一 图3 b
图2 c 图3一 图3 b

引用
















全球技术峰会