关注 “番茄风控大数据”,获取更多数据分析与风控大数据的实用干货。

偶然翻开多年前的笔记,当时踏入数据行业就是从人生的第一条select的代码开始。还好多年前做的笔记,网络云盘还为我保存着,当时的一段代码,之前写的一长串的表连接:


SQL 
都说写SQL是一件超级没技术含量的事情,当回顾我上面的语句,至少嵌套了八九张表的内容,着实还是为里面的逻辑感到些许复杂。

当然,网络上关于SQL这方面知识的实在太多了,今天不主讲具体的语法结果。SQL跟很多工具一样,容易上手,想当初入门也是从一本《sql必知必会》入门的。简单如增删改查,但真正了解了里面的结构后才发现,SQL跟很多工具一样,容易上手但是精通还是需要下一番功夫。

例如,简单些的,了解过sql的语法顺序吗?


再稍微难一些的,是否使用过开窗函数?

之后再复杂一些就是关于sql语句效率书写的问题。

效率的优化是sql高手境界了体现。小白做数据筛选时,分不清in 跟 exit的区别。而且大表跟小表连接,哪个应该作为基表也是同样有讲究。这些技巧的掌握,当然必须要有大量的提数工作的支持,这个是目前很多速成班和课程无法学到的内容。教程内容,相对还是基础点。sql是基本都是基于业务理解去写的。很多真正的复杂的表的连接,还是要真正的项目和业务中才能接触到。

当然不是说教程不行,作为入门还是不错的。

所以sql除了要了解业务,要写得好,最难的仍是优化。这其中就得了解数据库的原理,才能写出优秀的代码,提升效率。

在成本跟时间上,有时间换成本的,也有成本换时间的。但作为一名优秀的技术人员,尽量在同样的环境下,提高代码的效率。像我刚入门时候,查询一个部门信息,直接selec * ,查询所有的字段,就直接把上百万条的服务器干死了,这样的错误在刚入门的时候,经常出现的。

再深入些学习,在往后的知识上,越来越了解知识的匮乏,存储过程、视图、锁、定时器……反正在数据的探索路上,sql能力仍在持续升级中。

Python 
Python要想学得好,代码实操也是必不可少,对里面的技巧和实操,更是应该积少成多。python在处理一些表的转置方面,无论是列转行,还是行转列,都有非常简单的实现方式。最重要的是,自带了很多优秀的函数,处理数据更是事半功倍。

比如enumerate函数,还能自动给数值添加索引。当时在开发评分卡模型时候,做分箱前需要做的等频分箱时,需要给到将变量的具体的分箱序号,就用到这个函数。

可以说,真是大大提升了效率。后来不管,在sas还是sql里,都基本找不到类似的函数可以替换。

除了函数比较多样,连算法包都非常丰富。常用的sklearn,常用的算法包就不一一介绍了。

SAS 
SAS作为一个传统、研究统计的分析软件,深得银行等持牌机构的青睐。目前很多商业机构也都是采购这套软件。

因为sas的模块化的内容也较多,个人常用的主要是base跟em。在base上面,代码相对比python的语法更严谨些。写惯了sas的人,初次接触python是非常不习惯的。看着python那段代码,非常别扭,还以为是乱来的节奏。这两者就像是数据分析软件上互相歧视的两者。

Sas说,我是标准的,你都是瞎来的。Python说,你太笨重了,还特么那么贵,看我多灵活。

Sas使用上,比较需要深入去掌握的是宏、数据步、过程步,而且关于里面的指针理解也需要一点的知识。而这些基础的知识,也常常让人挺抓急。

风控业务 
之后是关于风控上的业务的理解,这里需要了解的点也不少。具体的可以看下表(点击图片更清晰):


风控的指标跟业务定义,这样看起来也许不多。但当资产增多,增量叠加上存量时候,资产分析就会复杂很多。最复杂的是分析不同渠道、不同的APR,贷款周期的资产情况。

当要去计算某些产品的盈利情况的时候,如果再叠加上资金成本、数据征信、资产风险情况的时候,头都大了。这不年底到了,各家公司都在算来年的各种预算,这里面各种各样的预算方案,必须都会包括上述种种。
---------------------- --------------------- ------------------------------------- ----------------------
十年职场生涯,这个长期混迹在风控界和科技界,摸爬滚打的大叔,曾经就职于全国最大的固网运营商平台、国内最大的ERP软件公司和一家老牌的互金公司,如果你想了解他,欢迎关注 “番茄风控大数据”一起学习一起聊!

风控成长之路---必知必会工具与业务相关推荐

  1. 风控人必知必会的征信知识

    二代征信相比一代征信,报告内容更为翔实,我们梳理了下,主要在以下方面有所不同: 一:逾期情况包括信用卡逾期.贷款逾期等所有的逾期记录都会保留5年,逾期.呆账,过期销户的内容也会保留: 二:个人信息的完 ...

  2. 【系统分析师之路】系统分析师必知必会(需求分析篇)

    [系统分析师之路]系统分析师必知必会(需求分析篇) 系统分析师必知必会 需求分析篇 [系统分析师之路]系统分析师必知必会(需求分析篇) 1.什么是软件需求 2. 需求分类 2.1)业务需求 2.2)用 ...

  3. 【系统分析师之路】系统分析师必知必会(数据库上篇)

    [系统分析师之路]系统分析师必知必会(数据库上篇) 系统分析师必知必会 数据库上篇 [系统分析师之路]系统分析师必知必会(数据库上篇) 一. 数据库分片设计 1. 数据分片背景 2. 数据分片方法 1 ...

  4. 【系统分析师之路】系统分析师必知必会(软件工程)

    [系统分析师之路]系统分析师必知必会(软件工程) 系统分析师必知必会 软件工程篇 [系统分析师之路]系统分析师必知必会(软件工程) 一. 逆向工程/再工程 1)逆向工程 2)逆向工程概念 3)恢复信息 ...

  5. c2064 项不会计算为接受0个参数的函数_【JS必知必会】高阶函数详解与实战

    本文涵盖 前言 高级函数概念 函数作为参数的高阶函数 map filter reduce sort详解与实战 函数作为返回值的高阶函数 isType函数与add求和函数 如何自己创建高阶函数 前言 一 ...

  6. 【web必知必会】—— 图解HTTP(下)

    [web必知必会]-- 图解HTTP(下) 原文:[web必知必会]-- 图解HTTP(下) 上一篇<图解HTTP 上>总结了HTTP的报文格式,发送方式,以及HTTP的一些使用. 本文再 ...

  7. 程序员必知必会之blog篇

    程序员必知必会之blog篇 网易广州       赖勇浩(http://blog.csdn.net/lanphaday) 本文最初发表于恋花蝶的博客(http://blog.csdn.net/lanp ...

  8. 《MySQL必知必会》[01] 基本查询

    <MySQL必知必会>(点击查看详情) 1.写在前面的话 这本书是一本MySQL的经典入门书籍,小小的一本,也受到众多网友推荐.之前自己学习的时候是啃的清华大学出版社的计算机系列教材< ...

  9. linux运行界别,day7 Linux下必知必会文件(2)

    主要内容: 运行级别 Linux下面必知必会文件和目录 Linux启动流程 一.运行级别 1.运行级别分为0--6共七级 具体如下表: 级别 CentOS 6 (run level) CentOS 7 ...

最新文章

  1. 我的世界java版怎么添加光影,《我的世界》中国版光影添加教程 国服怎么添加光影?...
  2. GT Transceiver中的重要时钟及其关系(2)单个外部参考时钟使用模型
  3. HDU 2095 find your present (2)
  4. get√—搜索微信公众号【Dotnet跨平台】指定文章的办法
  5. ROS在类中发布和接受消息(自定义消息)
  6. JAVA:数组,排序,查找4
  7. python的print怎么输出utf-8的编码_原创反转精度算法:小数的终极编码
  8. style 里引用php变量,在VUE style中使用data中的变量的方法详解
  9. OpenCV 尺度不变特征检测:SIFT、SURF、BRISK、ORB
  10. 虚拟机提示找不到引导映像_从ISO镜像启动虚拟机,安装OS时提示no usable disks have been foun...
  11. linux上clion使用教程,linux clion使用教程
  12. 全志V3S学习笔记(二)PCF8563
  13. web前端工程师等级分布
  14. UE4学习日记——蓝图中的各种颜色代表什么
  15. 怎样制作文章视频gif插图?视频gif格式图片如何在线制作?
  16. 力扣刷题 DAY_79 贪心
  17. iOS证书(p12)获取解密公私钥
  18. sysvol 域控制器 文件_重建SYSVOL和NETLOGON共享(解决域安全策略和域控制器安全策略不能打开)...
  19. 【现控理论】(一、系统的传递函数矩阵)----学习笔记
  20. POJ1287 (最小生成树) 中文版

热门文章

  1. 语言图片渐入代码_这个可能打败Python的编程语言,正在征服科学界
  2. android webview 水平滚动,Android WebView不可滚动
  3. 山东传媒职业学院计算机专业,山东传媒职业学院计算机多媒体技术专业2017年在内蒙古文科高考录取最低分数线...
  4. exec是不是python的内置函数_Python内置函数(62)——exec
  5. 的usb驱动裁剪协议_飞利浦25W双USB-A口车载快充充电器拆解
  6. Python导函数的一些相关
  7. 《Objective-C开发经典教程》
  8. [SDOI2011]工作安排 BZOJ2245
  9. 库克跟乔布斯差几代iPhone? 解读iPhone十年变与不变
  10. ES6学习笔记第一章