本文作者:gufe-hfding
论文基本情况
今天是第一天,这个系列的论文分享主要是督促自己搞研究,可能是起点不太好,没有去分享国际顶会顶刊的论文,从国内的好中文论文开始。好歹算是起步了,今天分享的论文是南京邮电大学黄海平老师2020年发表在《计算机研究与发展》上的论文“带权值的大规模社交网络数据隐私保护方法”,标准引用格式如下:
黄海平, 张东军, 王凯, 朱毅凯, 王汝传. 带权值的大规模社交网络数据隐私保护方法[J]. 计算机研究与发展, 2020, 57(2): 363-377.
Huang Haiping, Zhang Dongjun, Wang Kai, Zhu Yikai, Wang Ruchuan. Weighted Large-Scale Social Network Data Privacy Protection Method[J]. Journal of Computer Research and Development, 2020, 57(2): 363-377.
原文链接看这里
论文主要内容
这篇论文主要针对带权社交网络数据的发布隐私保护,数据的基本假设是仅有社交网络的结构信息,不包含属性信息。确实,在社交网络中,不同重要程度的结构信息需要有不同程度的隐私保护,这也正是这篇论文的出发点意义。作者提出了一种非交互的差分隐私保护模型,通过建立单源最短路径的约束,使得对最短路径问题能够最大程度保证保护后的图,查询得到的最短路径不会发生路径剧烈变化,能满足差分隐私保护。保护后社交网络数据在图的特性上都发生了变化,但变化不大。
出发点和我们自己研究组之前的一个想法是差不多的,基于特征值占比对数据加噪,基于随机投影对社交网络的数据进行主要不同程度加噪,最大程度保留数据效用。
[1]王婷婷,龙士工,丁红发.大型社交网络的差分隐私保护算法[J].计算机工程与设计,2020,41(06):1568-1574.
[2]彭长根,赵园园,樊玫玫.基于最大信息系数的主成分分析差分隐私数据发布算法[J].信息网络安全,2020,20(02):37-48.
借鉴价值
论文有一定的意义,也值得借鉴。
- 本文的模型是针对单源最短路径约束模型的差分隐私保护,其通用性扩展之后的效果如何,还不明确,需要进一步考虑。
- 其他方法的对带权图结构数据进行隐私保护,比如考虑结构特征的k-匿名,是否也能抵抗图结构攻击?匿名效率上是否有所提升?
- 差分隐私保护效果,在本文中仅仅是用差分隐私预算来考量的,事实上差分隐私在图数据上的量化,还应当进一步深度考虑,比如加噪后图的边的变化程度?
- 本文用的数据是模拟数据,在真实网络数据上的效果如何,还不可知。
此外,我在考虑,是否该针对这个领域,写一篇综述论文,也帮助自己全面梳理下相关的研究进展,探清楚一些值得研究的问题该是什么,还有什么需要本领域的研究人员去做的。