风控业务中,团伙挖掘是非常核心的分析方法,甚至可以说是最重要的的分析方法。而团伙挖掘的基础就是关系数据,但是关系数据非常丰富多样,有些同学可能会疏漏或者不知道某些重要的关系导致挖掘深度不够。

我对自己遇到过的一些关系进行了全面的梳理(大家遇到过其他的也可以在区补充),希望能给你带来一定的启示作用。

商家规避网络,需要付出巨大的成本,比如规避设备指纹关联,需要更换设备或者购买最新的模拟器技术,为了规避支付网络,需要购买新的支付宝账号。

但是黑产从业人员反侦察能力不断提高,从简单违规到各种高科技违规,留下的信息越来越少,为了分析关联人员,关系也有了很大的演进,从简单可理解关系逐步到复杂抽象关系, 下面我们一一总结。

01、硬件设备关系

在互联网上,没人知道你是一条狗,互联网上无法知道一个真实的用户,因此设备指纹ID、WiFi等物理介质与用户ID形成的关系,变得非常重要。可根据最近N天内是否共同使用过一台设备、是否共同使用过同一个WiFi等指标衡量其中两个用户的关联强度,对于对抗初期的团伙挖掘,有非常重要的意义。

02、互联网关系物理地址

IP、Cookie等由用户进行网页浏览时形成的关系,一般来说,该类关系相对较弱,不进行直接应用,可以进行转换应用,比如用Ip转换后进行常用地址的统计,一般可以在盗号等场景使用效果非常不错。

03、社交关系数据 

支付宝好友、微信好友、抖音好友、微博关注等,也是非常重要的关系特征,可根据最近N天内联系次数、关系时长等指标来衡量两个人之间的亲密程度。

04、通讯录关系

手机通话关系、通讯录中的备注、账号填写的紧急联系人等数据、获取两个账号的父子、兄弟、同学、男女朋友等关系。

05、地址关系数据

收货地址、发货地址、注册地址、家庭住址等形成的关系,可以通过是否同一收货地址,收货地址相识程度等,计算两个用户紧密关系

06、营销活动形成的关系

拉新活动形成的关系、分享关系、推荐关系等,形成各种上下层级关系,如拼多多的砍一刀、要邀请有奖等,直接形成的业务关系,也是非常重要的。

07、资金往来关系

购物支付、购物代付、转账、微信转账、银行卡支付、银行卡转账、银行卡绑定、电话充值等,均能形成较强的关系,资金关系在大部分场景下,是极强的关系,但某些场景,可能比较通用,购物转账等,可能就不是很强的关系。很难形成团伙。

08、LBS地址位置数据 

一种简化方法,是用GeoHash将二维的经纬度转换成字符串,,如北京9个区域的GeoHash字符串,分别是WX4ER,WX4G2、WX4G3等等,每一个字符串代表了某一矩形区域不同的用户是否处于同一个区块。同一块的用户,可能存在比较紧密的关系。

09、文本、图片等内容关系 

商品的标题、前几位相似的昵称、相同图片或相似图片、视频中相似场景等内容关系 ,行为相似关系综合相似关系,比如店铺相似

1)图片关系:很多风险商家 ,店铺使用相同或相识的图片,风险用户,也可能使用相同或者相似的照片,利用图片的相识关系进行关系挖掘,也是非常重要的。

2)文本关系:商家店铺商品标题的相似性计算商家关系,评价内容相似性计算商家关系等

3)昵称关系:很多风险用户,采用系列的昵称,也是一个非常重要的关系特征

10、众包关系

一个群体移动刷单、移动进行流量点击、一个分散群体进行网络攻击等,各个攻击者之间本身不存在关系,但是受到同样的人或者共同的目标指使,这是最难防控的一种关系。若同一个体存在多次攻击,基本上有迹可循,若同一个体只存在一次攻击,那基本上无迹可寻,只能通过潜伏等方式进行防控。

该种关系可以通过同步行为,进行非常高效的挖掘,参考我的另一篇文章:SynchroTrap-基于松散行为相似度的欺诈账户检测算法

11、工商关系

投资关系、参股关系、董事监事等任职关系、注册邮箱、注册电话、注册地址、注册身份证等工商注册信息,也存在巨大的网络关系,当然,很多人会利用身份证注册大量公司, 再利用营业执照注册用户,同一个营业执照也可能存在大量的账号,这些关系都存在非常重要的作用。

12、产权关系

共用产权证明也是非常强的关系,比如两个账号绑定同一辆车、绑定同一个房产证明、婚姻证书等关系

13、代收代付关系

水电煤代缴费、网约车代预约、医院代挂号、淘宝购物代付款、代点外卖等,存在这些关系的一般都比较亲近或者存在某些利益关系,有非常强的关联性。可以在业务中挖掘类似的关系进行分析研究。

14、交互关系

买家浏览商品、买家点击商品、用户点击广告等,搜索词关系等,某些商搜索相同的词的用户可能存在某种特定的关系,同时点击某个商品的一群消费者可能也存在某些关系,通过挖掘,都能得到一些特殊的模式。

往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

【风控】团伙挖掘中的14大关系类型相关推荐

  1. 风控团伙挖掘中的14种关系总结

    大家好,我是小伍哥. 风控业务中,团伙挖掘是非常核心的分析方法,甚至可以说是最重要的的分析方法.而团伙挖掘的基础就是关系数据,但是关系数据非常丰富多样,有些同学可能会疏漏或者不知道某些重要的关系导致挖 ...

  2. 基础科研探索推进中的十大关系

    编者按 这篇文章论述了基础科研中的十大关系,对当前国内基础科研中存在的一些关系不清.学科不分和专业概念混淆等现象,给出了作者自己鲜明的看法和中肯的建议. 编者赞同作者的见解:科学认知是一种当前的&qu ...

  3. java中什么时候应用异常_生产Java应用程序中的十大异常类型-基于1B事件

    java中什么时候应用异常 Pareto记录原理:97%的记录错误语句是由3%的唯一错误引起的 在最新的数据整理帖子之后,我们收到了很多反馈和问题,我们发现97%的记录错误是由10个唯一错误引起的 . ...

  4. 生产Java应用程序中的十大异常类型-基于1B事件

    Pareto记录原理:97%的记录错误语句是由3%的唯一错误引起的 在最新的数据整理帖子之后,我们收到了很多反馈和问题,在该文章中,我们显示97%的记录错误是由10个唯一错误引起的 . 根据普遍的需求 ...

  5. UML中的6大关系(关联、依赖、聚合、组合、泛化、实现)

    UML定义的关系主要有六种:依赖.类属.关联.实现.聚合和组合.这些类间关系的理解和使用是掌握和应用UML的关键,而也就是这几种关系,往往会让初学者迷惑.这里给出这六种主要UML关系的说明和类图描述, ...

  6. 什么是HADOOP、产生背景、在大数据、云计算中的位置和关系、国内外HADOOP应用案例介绍、就业方向、生态圈以及各组成部分的简介(学习资料中的文档材料)

    1. HADOOP背景介绍 1. 1.1 什么是HADOOP 1.        HADOOP是apache旗下的一套开源软件平台 2.        HADOOP提供的功能:利用服务器集群,根据用户 ...

  7. Django框架(14.Django中模型类的关系,以及模型类关联查询)

    Django中模型类的关系,以及模型类关联查询 1.模型类关系 1.1 一对多关系 1.2多对多关系 1.3 一对一关系 1.4 一对多举例: 1.5 多对多举例: 1.6 一对一举例: 2.关联查询 ...

  8. 据挖掘中所需的概率论与数理统计知识

    据挖掘中所需的概率论与数理统计知识 ( 关键词:微积分.概率分布.期望.方差.协方差.数理统计简史.大数定律.中心极限定理.正态分布) 导言:本文从微积分相关概念,梳理到概率论与数理统计中的相关知识, ...

  9. 浅析消费金融风控之贷中、贷前、贷后风控(风控模型、决策引擎)

    消费金融迎来"爆发增长"期  预计到2020年,我国消费信贷总市场规模将达到45万亿元,年复合增长率将达到18%.前景广阔的消费金融市场,将成为我国经济发展的重要内驱力! 业务痛点 ...

最新文章

  1. 爬一爬那些年你硬盘存过的“老师”
  2. iOS - XML 数据解析
  3. 屡现黑马!2021THE泰晤士高等教育学科排名发布!斯坦福成为最大赢家,清华、北大强势逆袭!...
  4. 计算机网络的八股文自述(持续更新)
  5. openmediavault 4.1.3 插件开发
  6. Visual Studio找不到adb.exe错误解决
  7. Java中实现DES加解密的一个类
  8. /proc文件系统读出来的数据是最新的吗?
  9. 【Azure Show】|第三期 人工智能大咖与您分享!嘉宾陈海平胡浩陈堰平
  10. Snap svg 主要对象
  11. Python:通过SNMP协议获取华为交换机的ARP地址表
  12. NYOJ--975--关于521
  13. jaspersoft studio6.x 设计医院检查报告单样式
  14. 基于sklearn的西瓜数据集的SVR回归实现
  15. 面经_黑盒测试与白盒测试
  16. 【PyTorch】深度学习实战之PyTorch实现线性回归
  17. 得胃病者的饮食原则 养胃及食疗菜谱介绍做法
  18. 解决github官网进不去
  19. Android 蓝牙监听与扫描
  20. android 禁止跟随系统字体,Android 应用全局字体调节或禁止随系统字体大小更改...

热门文章

  1. 距离,margin padding ,width height 用法 ,记录
  2. ACdream 1431 Sum vs Product
  3. windows下自制动画层引擎 - 放两个demo
  4. oracle查询某个用户下的所有视图
  5. [CareerCup] 4.5 Validate Binary Search Tree 验证二叉搜索树
  6. 解析XML的4种方式及优缺点比较
  7. 【Weiss】【第03章】练习3.7:有序多项式相乘
  8. 字符串,枚举,数值之间的转换
  9. 线性回归与梯度下降法
  10. [Swift]LeetCode927. 三等分 | Three Equal Parts