期刊鉴别 论文检测 免费论文 特惠期刊 学术答疑 发表流程

社会网络数据发布隐私保护技术综述(2)

时间:2015-12-26 15:35 文章来源:http://www.lunwenbuluo.com 作者:刘向宇,王斌,杨晓春 点击次数:

  攻击者可以将结点间连接情况,即社会网络图结构,作为背景知识来进行隐私攻击.社会网络图结构可具体分类为结点邻居图、社会网络子图、图查询等方面,为攻击者提供图结构背景知识.

  (1)结点邻居图

  在社会网络中,将距离结点u长度d之内的所有结点称为u的d-邻居结点,u的d-邻居结点及其相互之间的边构成的子图称为结点u的d-邻居子图.结点邻居图是一种常见的图结构背景知识.

  (2)子图

  在社会网络图中,攻击者可以将具有特殊连接模式的子图作为背景知识,从而为其进行隐私攻击提供结构唯一性的识别标记.

  文献针对结构唯一性子图导致隐私泄露的可行性进行了研究:在发布社会网络数据前,攻击者嵌入具有结构唯一性的子图,并建立该子图与目标结点之间的连接,当匿名化的社会网络数据发布后,攻击者首先识别嵌入子图,然后基于嵌入子图和目标结点之间的联系来识别目标结点.通过实验显示,嵌入由7个结点构建的特殊子图平均可以识别出70个目标结点.

  (3)图查询

  在社会网络中可以执行多种图查询,而针对某些结点或者边的图查询结果具有唯一性,从而为攻击者提供了进行隐私攻击的背景知识.

  例如:对于结点v,定义查询Q(v)为v的所有邻居结点度的升序序列.Q(Fred)=[2,2,4].如果攻击者将Fred的朋友的度信息作为背景知识,则可以在中识别出结点5即是Fred,因为只有结点5的度序列与Fred相同.文献评估了不同图查询作为背景知识的隐私攻击能力;而文献虽然没有定义可导致隐私泄露的图查询,但其提供的隐私保护技术可以防御部分或者全部图查询导致的隐私泄露.

  2.2结点信息

  对于某些社会网络隐私攻击,尤其是结点隐私攻击,攻击者会将结点自身的一些相关信息作为背景知识.

  (1)结点属性值

  社会网络中结点的属性值可以分类为标识属性和敏感属性.标识属性为攻击者提供了结点识别的背景知识,例如年龄、性别、籍贯、学历等,攻击者可以将网络中的结点标识属性值和其掌握的实体属性值进行链接匹配,从而识别结点的真实身份.文献研究了如何防范基于结点属性值的结点再识别隐私攻击,而文献侧重研究攻击者基于结点属性值进行边再识别隐私攻击.

  (2)结点度

  在社会网络中,结点度表示了该结点所代表的实体与社会中的其他实体之间的关系数目,在现实中,攻击者很容易收集到目标的度信息,并作为背景知识进行结点再识别、边再识别等隐私攻击.

  描述了如何基于结点度进行结点再识别攻击.只有结点A的度为2,其他结点的度均为1,因此,当攻击者掌握A的度为2的背景知识时,可以很容易地识别出A在社会网络中的位置.相似地,攻击者可以基于目标结点的度进行边再识别攻击.在文献中,假设攻击者背景知识为互为邻居的两个结点的度,结点C,D的度对(1,1).由于中具有度对(1,1)的边只有一条,所以攻击者识别出边CD的成功概率为100%.

  2.3边信息

  社会网络中,连接结点的边是其重要的组成部分,攻击者可以将边的相关信息作为背景知识,包括边连接关、边属性值等.

  (1)连接关系

  如果攻击者事先掌握了某些目标的边连接关系,则可以根据这些连接关系进行推演,从而获得隐私信息.文献[17,18,23]研究了连接关系可能导致的隐私泄露.参照表示基于连接关系的隐私攻击的图3,如果朋友关系被视为敏感关系,则可以基于图3(a)中u1和u2与结点friend1的连接关系推断出u1和u2具有朋友关系的隐私信息.

  (2)边属性值

  边上的属性值(标签、权重等)可以为攻击者提供隐私攻击的背景知识.例如在朋友网络中,边标签表示朋友之间的联系方式,可以是电话、短信、电子邮件等.如果攻击者知道某目标基本上仅采用电子邮件与其他朋友联系,基于此背景知识,攻击者能够以很大概率在社会网络中识别出这个目标结点.在加权社会网络图中,边权重可以作为攻击者的背景知识.文献研究了加权图中目标结点与其他结点相连接的边权重信息如何导致身份泄露.对于结点v,将与v相连接的边权重按照降序排序得到的序列定义为结点v的权重包,记作wv.例如,结点A权重包为wA=[wAB,wAD]=[2,1].如果攻击者掌握了结点A的权重包信息,则可以识别出中的结点1即为A,从而导致了身份泄露.

  2.4预测模型

  攻击者可以基于社会网络常识构建预测模型,从而推演目标的隐私信息.当前,社会网络中的预测模型主要分为两类:基于邻居的预测模型和基于兴趣组的预测模型.

  (1)基于邻居的预测模型

  所谓物以类聚,人以群分,在社会网络中,此种现象尤为明显.一般情况下,具有朋友关系的实体具有相同或相似的属性值,攻击者可以根据邻居属性值来推断目标的敏感属性值.在文献中,研究了采用贝叶斯网络来推演目标的敏感属性值.相似地,可以通过链接推演技术来预测和恢复社会网络中的敏感关系.很多链接推演技术均是基于社会人际交往常识,其中一项常识是:如果两个人具有很多共同朋友,则他们也很有可能是朋友.文献评估了在真实数据集Email-1和LiveJ-1上采用链接推演技术预测敏感关系的可行性.在实验测试中,如果两个结点的共同邻居数目大于阈值.,则认为两者在图中具有边连接.实验结果表明:当.增大时,正确预测率逐渐增高;当.=20时,Email-1和LiveJ-1数据集上的正确预测率分别达到了91.06%和66.5%.可以看出:攻击者可以凭借链接推演技术,以较高的概率推断出社会网络中的敏感关系.

  在社会网络中,结点之间具有不同的关系.基于常识可以知道,各种关系之间不是相互独立而是相关的.例如,具有同学关系的两个人是朋友的概率比没有任何关系的两个人是朋友的概率大.在文献中,研究了通过非敏感关系边采用noisy-or概率预测模型来预测敏感关系.seij=1表示结点i和j具有敏感关系s,如果边ek(k=1,…,n)的影响参数是.k,ek对于seij的影响是相互独立的,并且所有观察边对于seij的影响参数是.0,则基于noisy-or概率模型得到结点i和j具有敏感关系s的概率为1。

  (2)基于兴趣组的预测模型

  在社会网络中,实体加入不同的兴趣组,比如在豆瓣网中,每个用户可以凭借自己爱好加入诸如摄影、影视等方面的兴趣组.利用实体之间的朋友关系、加入兴趣组情况,可以对实体的隐私属性进行推测.其基本思想是:参加相同兴趣组的两个实体具有相同属性值的概率较大;参加相同兴趣组的数目越多,则两个实体具有相同属性值的概率越大.

  在文献中,基于实体参加兴趣组的情况,采用贝叶斯法则来推测未知属性值.由于每个兴趣组中组员属性值分布不同,即每个兴趣组对属性值的预测能力不同,文献提出了兴趣组细化的贝叶斯分类器,可以较高概率地预测未知属性值.在文献中提出的预测模型中,不仅考虑了实体参与兴趣组情况,也结合了实体之间的朋友关系,其属性值预测准确率高于文献中的预测模型.

  3、社会网络数据隐私保护技术

  针对不同背景知识可能导致的隐私泄露,提出了相应的社会网络隐私保护技术.本节分别从隐私保护方法、动态性、并行性等方面介绍当前社会网络隐私保护技术,并指出不同隐私保护技术的优缺点.

  3.1隐私保护方法


  •   论文部落提供核心期刊、国家级期刊、省级期刊、SCI期刊和EI期刊等咨询服务。
  •   论文部落拥有一支经验丰富、高端专业的编辑团队,可帮助您指导各领域学术文章,您只需提出详细的论文写作要求和相关资料。
  •  
  •   论文投稿客服QQ: 论文投稿2863358778 论文投稿2316118108
  •  
  •   论文投稿电话:15380085870
  •  
  •   论文投稿邮箱:lunwenbuluo@126.com

联系方式

  • 论文投稿客服QQ: 论文投稿2863358778
  • 论文投稿客服QQ: 论文投稿2316118108
  • 论文投稿电话:15380085870
  • 论文投稿邮箱:lunwenbuluo@126.com

热门排行

 
QQ在线咨询
咨询热线:
15380085870
微信号咨询:
lunwenbuluoli