作者
智能网络与网络安全教育部重点实验室(西安交通大学)
- Yating Lin
- Qinghua Zheng
香港科技大学
- Kamkwai Wong
- Yong Wang
- Rong Zhang
- Huamin Qu
大数据算法与分析技术国家工程实验室(西安交通大学)
- Bo Dong
摘要
对许多国家来说,逃税是一个严重的经济问题,因为它会破坏政府的税收制度,并导致不公平的商业竞争环境。最近的研究已经应用数据分析技术来分析和检测个体纳税人的逃税行为。然而,他们未能支持对涉及一组纳税人的关联方交易逃税(RPTTE)行为(如转让定价)的分析和探索。在本文中,我们介绍了税务系统,这是一个交互式的可视化分析系统,通过分析异构的税务相关数据来帮助税务人员挖掘和探索可疑的逃税群体。我们构建了一个纳税人网络,并将其与相应的贸易网络融合,以检测可疑的 RPTTE 集团。丰富的可视化旨在通过利润和拓扑数据分析,促进对相关纳税人之间可疑交易的探索和调查。具体来说,我们提出了一个精心设计的编码方案日历热图,以直观地显示通过关联方交易转移收入的证据。我们通过两个真实世界税务相关数据的案例研究和对领域专家的访谈来展示税务信息系统的有用性和有效性。
Introduction
Challenge
- 对逃税群体的检测依赖于对不同纳税人及其各种涉税属性之间的拓扑利益关系的分析,使得对逃税群体的探索变得相当复杂
- 会计原则的模糊性导致税务人员需要耗费大量时间进行审计,以人工检查是否有可疑团体进行逃税。即使是最近最先进的自动逃税群体检测方法也可能导致高误报率和大量可疑案件
- 关联大量金融数据和关联方交易及其分析非常耗时,使得对逃税集团可疑模式的调查变得复杂。
Controbutions
- 我们与两位主要专家(即一名来自省税务局的经验丰富的税务官员和一名来自中国一所大学的税务研究员)一起,制定了针对逃税群体的交互式挖掘和可视化探索的设计要求。
- 我们使用真实的税务数据集进行了两项案例研究,并与两位领域专家进行了结构良好的专家访谈,证明了税务专题信息系统的有效性和实用性。
Related Work
- 逃税检测方法
- 机器学习方法
- 基于网络的方法
- 金融数据的可视化技术
- 时间序列数据可视化
- 多元图可视化
- 金融犯罪可视化
Background and Data Description
- 纳税人和投资者简介
- 发票信息
- 审计记录
Requirement Analysis
- 为可疑RPTTE启用交互式配置群体检测
- 用多种标准对可疑逃税团体进行排名
- 支持共同利益的互动探索
- 提供方便的纳税人利润分析
System Design
TaxThemis 由三个主要模块组成:数据预处理模块、数据分析模块和可视化分析模块。
数据预处理模块执行数据屏蔽和网络构建。数据屏蔽的目的是避免暴露纳税人的身份,保证纳税人的隐私保护,这在这种敏感数据的探索中至关重要。网络建设是指从被掩盖的数据中提取投资和交易关系。受广泛使用的图挖掘算法的启发,我们构建了一个纳税人网络和一个贸易网络来建模这两种关系。
Case Studies
在本节中,我们将展示两个真实案例,以展示税务 Themis 如何帮助发现和探索任何可疑的 RPTTE 集团。这两个案例是专家在我们的专家交流中使用税务主题来探索逃税群体时发现的,这将在第 7 节中介绍。
- 超越财务指标:抓住狡猾的逃税者
- 走向深度税务检查:解开关联方交易谜团
Expert Review
我们进行了远程访谈,以验证税务信息系统的有用性和有效性。每个访谈部分持续 60 分钟,20 分钟通过共享我们的屏幕介绍系统和任务描述,接下来 30 分钟由专家自己在远程协助下使用我们的系统挖掘和探索可疑群体,最后 10 分钟对我们的系统进行评论。参与者是专家 E1 和 E2,他们从我们研究的开始阶段就是我们的合作者。他们帮助制定设计需求,给我们的设计迭代提供反馈,并评估我们的系统。
Discussion
虽然案例研究和专家访谈证实了税务信息系统的有效性和有用性,但它也有局限性,一些设计选择也需要进一步澄清。
由于屏幕尺寸有限,TaxThemis 适用于纳税人少于 15 人的可疑逃税团体。
Conclusion and Future Work
在本文中,我们介绍了 TaxThemis,一个交互式视觉分析系统,以帮助税务人员识别和检查可疑的逃税团体。该系统通过交互式分析处理流水线集成了传统的数据挖掘算法和可视化分析技术。我们通过使用真实世界税务数据集的两个案例研究和对两位领域专家的访谈,展示了税务专题信息系统的有效性和实
用性。
在未来的工作中,我们将考虑获取发票数据中包含单价的最新数据源。此外,可定制可疑性指标,以发现领域专家希望探索的模式,如税负差异和利润变化率。此外,我们的字形设计的视觉总结可以通过将拓扑模式作为一种广泛使用的模式匹配方法纳入投资关系来扩展。最后,我们希望提高我们的系统的有用性,为具有相似特征的人像组提供额外的视图,并允许用户在发现一个可疑案例时选择相似的案例。