TaxThemis: Interactive Mining and Exploration of Suspicious Tax Evasion Groups
论文传送门
作者
智能网络与网络安全教育部重点实验室(西安交通大学)
- Yating Lin
- Qinghua Zheng
香港科技大学
- Kamkwai Wong
- Yong Wang
- Rong Zhang
- Huamin Qu
大数据算法与分析技术国家工程实验室(西安交通大学)
- Bo Dong
摘要
对许多国家来说,逃税是一个严重的经济问题,因为它会破坏政府的税收制度,并导致不公平的商业竞争环境。最近的研究已经应用数据分析技术来分析和检测个体纳税人的逃税行为。然而,他们未能支持对涉及一组纳税人的关联方交易逃税(RPTTE)行为(如转让定价)的分析和探索。在本文中,我们介绍了税务系统,这是一个交互式的可视化分析系统,通过分析异构的税务相关数据来帮助税务人员挖掘和探索可疑的逃税群体。我们构建了一个纳税人网络,并将其与相应的贸易网络融合,以检测可疑的 RPTTE 集团。丰富的可视化旨在通过利润和拓扑数据分析,促进对相关纳税人之间可疑交易的探索和调查。具体来说,我们提出了一个精心设计的编码方案日历热图,以直观地显示通过关联方交易转移收入的证据。我们通过两个真实世界税务相关数据的案例研究和对领域专家的访谈来展示税务信息系统的有用性和有效性。
Introduction
Challenge
- 对逃税群体的检测依赖于对不同纳税人及其各种涉税属性之间的拓扑利益关系的分析,使得对逃税群体的探索变得相当复杂
- 会计原则的模糊性导致税务人员需要耗费大量时间进行审计,以人工检查是否有可疑团体进行逃税。即使是最近最先进的自动逃税群体检测方法也可能导致高误报率和大量可疑案件
- 关联大量金融数据和关联方交易及其分析非常耗时,使得对逃税集团可疑模式的调查变得复杂。
Controbutions
- 我们与两位主要专家(即一名来自省税务局的经验丰富的税务官员和一名来自中国一所大学的税务研究员)一起,制定了针对逃税群体的交互式挖掘和可视化探索的设计要求。
- 我们使用真实的税务数据集进行了两项案例研究,并与两位领域专家进行了结构良好的专家访谈,证明了税务专题信息系统的有效性和实用性。
Related Work
- 逃税检测方法
- 机器学习方法
- 基于网络的方法
- 金融数据的可视化技术
- 时间序列数据可视化
- 多元图可视化
- 金融犯罪可视化
Background and Data Description
- 纳税人和投资者简介
- 发票信息
- 审计记录
Requirement Analysis
- 为可疑RPTTE启用交互式配置群体检测
- 用多种标准对可疑逃税团体进行排名
- 支持共同利益的互动探索
- 提供方便的纳税人利润分析
System Design
TaxThemis 由三个主要模块组成:数据预处理模块、数据分析模块和可视化分析模块。
数据预处理模块执行数据屏蔽和网络构建。数据屏蔽的目的是避免暴露纳税人的身份,保证纳税人的隐私保护,这在这种敏感数据的探索中至关重要。网络建设是指从被掩盖的数据中提取投资和交易关系。受广泛使用的图挖掘算法的启发,我们构建了一个纳税人网络和一个贸易网络来建模这两种关系。
Case Studies
在本节中,我们将展示两个真实案例,以展示税务 Themis 如何帮助发现和探索任何可疑的 RPTTE 集团。这两个案例是专家在我们的专家交流中使用税务主题来探索逃税群体时发现的,这将在第 7 节中介绍。
- 超越财务指标:抓住狡猾的逃税者
- 走向深度税务检查:解开关联方交易谜团
Expert Review
我们进行了远程访谈,以验证税务信息系统的有用性和有效性。每个访谈部分持续 60 分钟,20 分钟通过共享我们的屏幕介绍系统和任务描述,接下来 30 分钟由专家自己在远程协助下使用我们的系统挖掘和探索可疑群体,最后 10 分钟对我们的系统进行评论。参与者是专家 E1 和 E2,他们从我们研究的开始阶段就是我们的合作者。他们帮助制定设计需求,给我们的设计迭代提供反馈,并评估我们的系统。
Discussion
虽然案例研究和专家访谈证实了税务信息系统的有效性和有用性,但它也有局限性,一些设计选择也需要进一步澄清。
由于屏幕尺寸有限,TaxThemis 适用于纳税人少于 15 人的可疑逃税团体。
Conclusion and Future Work
在本文中,我们介绍了 TaxThemis,一个交互式视觉分析系统,以帮助税务人员识别和检查可疑的逃税团体。该系统通过交互式分析处理流水线集成了传统的数据挖掘算法和可视化分析技术。我们通过使用真实世界税务数据集的两个案例研究和对两位领域专家的访谈,展示了税务专题信息系统的有效性和实
用性。
在未来的工作中,我们将考虑获取发票数据中包含单价的最新数据源。此外,可定制可疑性指标,以发现领域专家希望探索的模式,如税负差异和利润变化率。此外,我们的字形设计的视觉总结可以通过将拓扑模式作为一种广泛使用的模式匹配方法纳入投资关系来扩展。最后,我们希望提高我们的系统的有用性,为具有相似特征的人像组提供额外的视图,并允许用户在发现一个可疑案例时选择相似的案例。
TaxThemis: Interactive Mining and Exploration of Suspicious Tax Evasion Groups相关推荐
- Stanford University courses of computer science department(斯坦福计算机系课程设置)
斯坦福学科目前分为7个department:Business, Earth, Education, Engineering, Humanities & Sciences, Law, Medic ...
- VIS 2021论文
目录 Best Papers 1.Simultaneous Matrix Orderings for Graph Collections 2.IRVINE: Using Interactive Clu ...
- retrospective material for final English exam unit_5 Law
unit_5 Law Getting prepared - academic exploration 1 translation from Chinese into English ethical ( ...
- 【北邮国院大三下】Cybersecurity Law 网络安全法 Week3
北邮国院大三电商在读,随课程进行整理知识点.仅整理PPT中相对重要的知识点,内容驳杂并不做期末突击复习用.个人认为相对不重要的细小的知识点不列在其中.如有错误请指出.转载请注明出处,祝您学习愉快. 编 ...
- Graph Anomaly Detection with Deep Learning——子图检测
子图检测 采用传统非深度学习的异常子图检测 基于静态图的异常子图检测 基于动态图的异常子图检测 采用深度学习的异常子图检测 参考文献 论文:A Comprehensive Survey on Grap ...
- p2020开发_2020年最佳开发者社区
p2020开发 If you want to grow as a developer, I can't over-emphasize the benefits of joining a develop ...
- 反洗钱机器学习_为什么不使用机器学习来打击洗钱活动?
反洗钱机器学习 An interesting article in the MIT Tech Review, "The pandemic has changed how criminals ...
- 对外贸易常用词汇(中、英文对照)
对外贸易常用词汇(中.英文对照) 1. 商业科 A above par 高于票面值 absolute advantage 绝对优势 acceptance (l)承兑:承兑票据,(2)承诺 accept ...
- 从魔术师到统计学家 2
─────────────────────────────────────── 从魔术师到统计学家 (转载) 作者 lorentz (symplectic 的前世今生) ────────────── ...
最新文章
- parcel react_如何使用Parcel捆绑React.js应用程序
- 你应该将应用迁移到Spring 4的五个原因
- 简单解决XP共享连接数10限制
- redis value最大值_Redis 的 maxmemory 和 dbnum 默认值都是多少?对于最大值会有限制吗?...
- 计算机视觉开源库OpenCV之CommandLineParser使用方法
- Windows 技巧篇-电脑蓝光过滤,颜色校准调节蓝光,电脑源头过滤蓝光,保护眼睛,护眼软件原理
- 2048——Java控制台版本
- 前端小知识点(7):正则前瞻
- 水泵怎么做_暖通空调|水泵出入口阀门及相关基础知识
- Java控制台输入教程~~~~
- SQLSERVER 执行过的语句查询
- day6-day9代码片段
- win10+Ubuntu16.04 LTS双系统完美教程
- 2012第二届GIS制图大赛——公开课技术问题答疑(珍贵资源哦!)
- Android 集成腾讯播放器sdk(支持多格式,直播,m3u8等)重点是免费
- 工欲善其事之Redis可视化管理工具
- 配置org.springframework.scheduling.quartz.CronTriggerBean (转载)
- 爬虫中常见的反爬手段和解决方法
- STM32CubeMx + LWIP(实现UDP组播/MQTT/热插拔)系列 二 ----- CubeMx生成文件的简单介绍与热插拔
- SQLSever 2000 安装环境
热门文章
- 我去,脸皮厚啊,你竟然使用==比较浮点数?
- 小米4c+android+6,小米4c有什么接口?小米4c有HDMI接口吗?
- Ext4.0源码解读(分享二)
- 文字检测与识别项目整理
- 计算机哈利波特音乐,【拼装延时】LEGO乐高 哈利波特系列 75954 霍格沃茨大礼堂...
- coreldraw x7 分布_CorelDRAW-X7教程(全部)
- 小程序canvas生成海报保存至手机相册
- jacob的使用方法总结
- 美国大学生数学建模竞赛选题、经验以及准备材料
- Python列表去重的六种方法