关键字 |
协同过滤,同态加密,隐私,推荐系统。 |
介绍 |
现在大多数人都在使用在线服务进行日常活动,这需要与服务提供商共享个人信息。比如社交网络和网上购物。 |
社交网络:在社交网络中,人们与其他人分享图片和视频等个人信息。服务提供商接收这些数据并将其转发给第三方。提供推荐的一个常见服务是使用协同过滤来查找朋友、群组和事件,并从用户那里收集所需的数据。 |
网上购物:在网上购物中,为顾客提供各种各样的建议引起了电子商务的发展。从用户的选择和点击,向客户提供适合的产品或服务的建议[2]。 |
在这类服务中,基于协同过滤技术的推荐系统收集和处理用户的个人数据[3]。人们从这些在线服务中受益,但服务提供商直接访问私人数据对用户有潜在的隐私风险,因为这些数据可能被滥用或泄露给其他方。这些在线服务中的隐私考虑似乎是可以增加电子商务增长的最重要因素之一。因此,保护用户隐私对个人和企业都有好处。 |
为用户生成推荐的技术很大程度上依赖于收集用户个人信息的方式。这些信息可以像配置文件一样由用户自己提供,或者服务提供商可以观察用户的操作,如单击日志。一方面,更多的用户信息有助于系统提高推荐的准确性。另一方面,用户的个人信息存在服务隐私风险,因为服务提供商没有可靠的保证不滥用用户的数据。经常可以看到,每当用户进入系统时,服务提供商就声称对用户提供的信息拥有权利,并授权自己将数据分发给第三方,以实现自己的利益[5]。 |
该方法的执行主要取决于用户参与计算的次数,自供系统工作;用户需要大量到场。这在推荐的准确性/正确性和系统中的用户数量之间产生了一个权衡。此外,该算法的输出对服务器是可用的,这对用户的隐私造成了威胁。因此,随机化技术被认为是高度不安全的。 |
相关工作 |
Canny等人(2002)[7]提出了一种基于分析模型的保护用户隐私的方法,采用了与[8]中相似的方法。Canny使用加密的用户数据,而Polat和Du暗示通过随机化技术来保护用户的隐私[9,10]。 |
Polat等人(2003)[9]使用(RP)随机摄动技术。一些技术允许用户在不暴露身份的情况下隐藏个人信息,但数据集的质量没有保证,因此提出了一种新的系统,即用户先隐藏自己的个人数据,然后将其发送到中心位置,数据收集器无法获得用户隐私数据的隐藏信息。雷竞技官网Atallah等人(2004)[11]提出了保护隐私的协同预测和基准测试,以增加使用加密技术的局部预测和数据相关性的可靠性。 |
Erkin et al.(2012)[2]也提出了基于密码技术的协议,该协议在计算上比[12]、[13]中的对应部分更高效。用于在在线应用程序中向用户生成建议的加密协议。为了克服用户主动参与的问题,Erkin引入了同态加密方案和安全多方计算(MPC)技术,通过使用半可信的第三方,即隐私服务提供商(PSP),无需检查用户的私人数据,即可正确执行分配的任务,从而实现隐私增强推荐系统。通过包括这个第三方PSP,用户将他们的加密数据上传到服务提供商,通过在服务提供商和隐私服务提供商之间使用协同过滤技术,无需与用户交互,就生成了建议。 |
如图1所示。Erkin et al(2012)[2]提出的协议是隐藏可能损害用户隐私的信息。SP、PSP和其他用户都不知道用户评分、相似度计算和推荐的详细信息。首先,用户通过加密隐藏他们的个人数据,并将其发送给服务提供商。为了生成建议,服务提供商和PSP运行一个加密协议,而不与用户交互。为此,以前使用了Paillier系统。该密码系统用于加密用户的隐私敏感数据。 |
P. Paillier et al(1999)[14]介绍了一种称为Paillier技术的方案:用Paillier技术定义为- |
|
其中n是两个大素数p q g的乘积,生成一个n阶的子群,r是在Zn公钥是(n, g),私钥是(p,q)。Paillier密码系统的同态性可以很容易地验证,如下所示: |
|
协同滤波技术与Paillier系统结合使用,Paillier系统包括以下3步[3]: |
1)比较一个用户和其他用户的相似之处。 |
2)通过将相似度值与阈值进行比较,选择最相似的用户(L)。 |
3)根据大多数相似用户的平均评分(L),生成推荐。 |
寻找相似用户,A和B用向量表示其中M个项和小的正整数。 |
余弦相似度: |
|
在计算余弦相似度之后,服务提供者将相似值与阈值δ进行比较。将与A相似度超过δ的L用户的评分求和并除以L,此结果作为推荐。 |
问题与方向 |
在当前的Paillier密码系统中存在一些问题和关注,本单元将对这些问题进行研究。本单元还为现有技术中的问题提供了一些可能的解决方案。在Paillier系统中,用户的积极参与是必须的,这使得系统既耗时又复杂。这是因为用户必须执行所有的加密和解密次数,这使得系统成本很高。此外,用户交互可能会损害系统的安全性,造成用户的隐私。同样,大数据系统变得昂贵,这使得系统效率较低[2],[7]和[8]。 |
要解决上述问题,需要适当的解决方案。因此,将与RSA (Rivest, Adi Shamir和Leonard Adleman)和ElGamal算法合作。实现将使用JSP (Java脚本语言)工具和SQL server 2008。 |
解决方法如下: |
1.使用RSA算法: |
使用RSA算法的加解密过程,对用户的隐私数据进行安全保护,并向用户提供建议。 |
2.使用ElGamal算法: |
比较相似的用户,相似值与阈值,根据找到忠诚/不忠诚的用户,并通过这些计算为用户提供建议,将由ElGamal算法完成。 |
因此,本文认为Elgamal体系比Paillier体系更适合和更有优势。上述问题,如低安全性,复杂性和低效率的帮助下,这个Elgamal系统将解决。与Paillier系统相比,Elgamal系统(即Elgamal算法)简单得多,独立的部分私钥是Paillier加密中的一个分解秘密,这使得它效率低下。 |
困难问题的算法: |
1.用户数据 |
2.使用ElGamal算法加密数据 |
a.选择一个150位的大素数p |
B.选择两个随机整数1≤q, x < p |
c.计算y=qxmodp |
d.公钥:p, q, y;私钥:x |
e.数据加密R:选择a |
随机t,计算c2=qtmod p和c1=ytRmod p |
f.密文c= (c1, c2) |
3.向服务提供商发送密文 |
4.计算特定用户与所有其他用户之间的相似度 |
5.向隐私服务提供商发送相似信息 |
6.解密相似之处 |
R=c1/c2x mod p+c2c1 |
7.计算推荐 |
a.寻找相似用户 |
b.计算最相似用户的评分数L和和 |
c.计算建议 |
8.发送推荐给用户。[15] |
Elgamal算法示例: |
Alice想发送消息M=100给Bob |
1.选择一个大质数p=139, q=3 |
2.计算公钥: |
44 = 312mod 139 |
3.公钥=44,私钥=12 |
随机选择t =52 |
计算t= 4452d 139 =112 |
C1= 352 mod 139=38 |
C2= 100 * 112 mod139= 80 |
4.C= (c1, c2) = (38,80) |
5计算t= 3812mod 139=112 |
T-1 = 112-1 mod 139= 36 |
6.恢复消息 |
M=t-1C2 mod p= 36*80 mod 139=100 [16] |
结论 |
本文包括对以前用于用户个人数据安全的各种技术的调查。综合调查表明,以往的系统采用的是多方计算技术,存在一些问题或缺点。因此,为了避免这些问题,我们可以使用两种算法来帮助我们为个人和企业带来利益,与现有的私人推荐系统相比,该系统更加安全,高效和廉价。 |
|
数字一览 |
|
|
图1一个 |
图1 b |
|
|
参考文献 |
- 2009年社交网站列表[在线]。可用:http://en.wikipedia.org/wiki/List_of_social_networking_websites
- Z. Erkin, M. Beye, T. Veugen和R. L. Lagendijk,“使用同态加密和数据打包有效地生成私人推荐”,IEEE信息取证与安全学报,Vol.7, No. 3, 2012年6月。
- G. Adomavicius和A. Tuzhilin,“面向下一代推荐系统:最先进的技术和可能的扩展的调查”,IEEE传输。"。数据中。,vol. 17, no. 6, pp. 734–749, Jun. 2005.
- N. Ramakrishnan, B. J. Keller, B. J. Mirza, A. Y. Grama和G. Karypis,“推荐系统中的隐私风险”,IEEE互联网计算。,第5卷,no。6,第54-63页,11月/ 12月2001.
- N. Kroes,“数字议程”,布鲁塞尔,2011年5月19日。
- S. Zhang, J. Ford,和F. Makedon,“从随机扰动评级中获得私人信息”。第六届SIAM数据挖掘国际会议论文集,59-69页,2006。
- j·f·卡尼。《基于因子分析的隐私协同过滤》,载《SIGIR》第238-245页,美国纽约,2002年,ACM出版社。
- j·f·卡尼。“有隐私的协同过滤”,《IEEE安全与隐私研讨会》,第45-57页,2002。
- H. Polat和W. Du,“使用随机摄动技术保护隐私的协同过滤。《ICDM》,2003年第625-628页。
- H. Polat和W. Du。,“SVD-based collaborative filtering with privacy”. In SAC ’05: Proceedings of the 2005 ACM symposium on applied computing, pages 791–795, New York, NY, USA, 2005, ACM Press.
- M. atallah, M. Bykova, J. Li, K. Frikken和M. Topkara,“私人协作预测和基准测试”,2004年ACM电子社会隐私研讨会(WPES ' 04),纽约,NY, 2004年,第103-114页,ACM。
- 厄金,贝耶,维根和r。L. Lagendijk,“隐私增强推荐系统”,载于《第三十一篇论文》。《比荷卢联盟信息理论》,2010,第35-42页。
- Z. Erkin, M. Beye, T. Veugen和R. L. Lagendijk,“有效计算私人推荐”,在Proc. Int。声学、语音和信号处理(ICASSP),布拉格,捷克共和国,2011年5月,第5864-5867页,2011。
- P. Paillier,“基于复合度残差类的公钥密码系统”,在Proc. Advances in crypology (EUROCRYPT ' 99), ser。林cs, J.斯特恩主编,1999年5月2-6日,第1592卷,第223-238页,施普林格。
- 在线可用:http://en.wikipedia.org/wiki/ElGamal_encryption
- 在线下载:http://ta.ramk.fi/~jouko.teeriaho/cryptodict/Elgamal.pdf
|