商品参数

作者:

常国珍//赵仁乾//张秋剑著

出版社:机械工业出版社

出版时间:2018-07-01 00:00:00

版次:1

印次:1

印刷时间:2018-07-01

字数:250

页数:422

开本:16开

装帧:平装

ISBN:9787111603092

国别/地区:中国

版权提供:机械工业出版社

基本信息

书名:Python数据科学:技术详解与商业实践

定价:99.00元

作者:常国珍 赵仁乾

出版社:机械工业出版社

出版日期:2018-07-01

ISBN:9787111603092

字数:

页码:

版次:1

装帧:平装-胶订

开本:16开

商品重量:0.4kg

编辑推荐

(1)作者在IT行业有超过20年的研发经验,在金融和数据科学领域有超过12年的实践经验,是金融界知名的数据科学家,在R/Python/SAS等技术领域有深厚的积累。

(2)本书从3个维度展开,技术维度:全面讲解数据分析、数据挖掘和机器学习的核心技术;业务维度,围绕具体的业务生命周期展开技术知识点的讲解;实践维度,列举的是商业案例,通过案例为数据科学从业者提供工作模板。

内容提要

本书共19章,第1章介绍数据科学中涉及的基本领域;第2~3章介绍与数据工作紧密相关的Python语言基础;第4章讲解描述性统计分析在宏观业务领域的分析;第5章讲解数据规整、清洗的重要技能;第6章介绍数据科学领域实用的统计检验;第7章讲解当被解释变量为连续变量时,如何使用线性回归作预测;第8章讲解使用逻辑回归作评分卡模型;第9章讲解另外一个可解释模型——决策树。第10~12章分别讲解了BP神经网络、朴素贝叶斯、近邻域、支持向量机的原理和在决策类模型中的运用;第13~14章作为一个整体讲解商业分析场景下的信息压缩;第15章以产品推荐作为案例,讲解发现事件与事件伴生关系的关联分析和序列分析算法;第16章使用欺识别案例讲解当被解释变量分布极 端不平衡时的处理方法;第17章继续使用欺识别案例讲解集成学习算法;第18章讲解了使用效应分解和ARIMA方法实现宏观业务指标预测;第19章用案例展现了分类和聚类模型的CRISP-DM和SEMMA流程。

目录

目录

前言

第1章数据科学家的武器库

1.1数据科学的基本概念

1.2数理统计技术

1.2.1描述性统计分析

1.2.2统计推断与统计建模

1.3数据挖掘的技术与方法

1.4描述性数据挖掘算法示例

1.4.1聚类分析——客户细分

1.4.2关联规则分析

1.5预测性数据挖掘算法示例

1.5.1决策树

1.5.2KNN算法

1.5.3Logistic回归

1.5.4神经网络

1.5.5支持向量机

1.5.6集成学习

1.5.7预测类模型讲解

1.5.8预测类模型评估概述

第2章Python概述

2.1Python概述

2.1.1Python简介

2.1.2Python与数据科学

2.1.3Python2与Python3

2.2Anaconda Python的安装、使用

2.2.1下载与安装

2.2.2使用Jupyter Notebook

2.2.3使用Spyder

2.2.4使用conda或pip管理

第三方库

第3章数据科学的Python编程基础

3.1Python的基本数据类型

3.1.1字符串(str)

3.1.2浮点数和整数(float、int)

3.1.3布尔值(Bool:True/False)

3.1.4其他

3.2Python的基本数据结构

3.2.1列表(list)

3.2.2元组(tuple)

3.2.3集合(set)

3.2.4字典(dict)

3.3Python的程序控制

3.3.1三种基本的编程结构简介

3.3.2顺承结构

3.3.3分支结构

3.3.4循环结构

3.4Python的函数与模块

3.4.1Python的函数

3.4.2Python的模块

3.5Pandas读取结构化数据

3.5.1读取数据

3.5.2写出数据

第4章描述性统计分析与绘图

4.1描述性统计进行数据探索

4.1.1变量度量类型与分布类型

4.1.2分类变量的统计量

4.1.3连续变量的分布与集中趋势

4.1.4连续变量的离散程度

4.1.5数据分布的对称与高矮

4.2制作报表与统计制图

4.3制图的步骤

第5章数据整合和数据清洗

5.1数据整合

5.1.1行列操作

5.1.2条件查询

5.1.3横向连接

5.1.4纵向合并

5.1.5排序

5.1.6分组汇总

5.1.7拆分、堆叠列

5.1.8赋值与条件赋值

5.2数据清洗

5.2.1重复值处理

5.2.2缺失值处理

5.2.3噪声值处理

5.3RFM方法在客户行为分析上的运用

5.3.1行为特征提取的RFM方法论

5.3.2使用RFM方法计算变量

5.3.3数据整理与汇报

第6章数据科学的统计推断基础

6.1基本的统计学概念

6.1.1总体与样本

6.1.2统计量

6.1.3点估计、区间估计和中心极限定理

6.2假设检验与单样本t检验

6.2.1假设检验

6.2.2单样本t检验

6.3双样本t检验

6.4方差分析(分类变量和连续变量关系检验)

6.4.1单因素方差分析

6.4.2多因素方差分析

6.5相关分析(两连续变量关系检验)

6.5.1相关系数

6.5.2散点矩阵图

6.6卡方检验(二分类变量关系检验)

6.6.1列联表

6.6.2卡方检验

第7章客户价值预测:线性回归模型与诊断

7.1线性回归

7.1.1简单线性回归

7.1.2多元线性回归

7.1.3多元线性回归的变量筛选

7.2线性回归诊断

7.2.1残差分析

7.2.2强影响点分析

7.2.3多重共线性分析

7.2.4小结线性回归诊断

7.3正则化方法

7.3.1岭回归

7.3.2LASSO回归

第8章Logistic回归构建初始信用评级

8.1Logistic回归的相关关系分析

8.2Logistic回归模型及实现

8.2.1Logistic回归与发生比

8.2.2Logistic回归的基本原理

8.2.3在Python中实现Logistic回归

8.3Logistic回归的极大似然估计

8.3.1极大似然估计的概念

8.3.2Logistics回归的极大似然估计

8.4模型评估

8.4.1模型评估方法

8.4.2ROC曲线的概念

8.4.3在Python中实现ROC曲线

第9章使用决策树进行初始信用评级

9.1决策树概述

9.2决策树算法

9.2.1ID3建树算法原理

9.2.2C4.5建树算法原理

9.2.3CART建树算法原理

9.2.4决策树的剪枝

9.3在Python中实现决策树

9.3.1建模

9.3.2模型评估

9.3.3决策树的可视化

9.3.4参数搜索调优

第10章神经网络

10.1神经元模型

10.2单层感知器

10.3BP神经网络

10.4多层感知器的scikitlearn代码实现

第11章分类器入门:近邻域与朴素贝叶斯

11.1KNN算法

11.1.1KNN算法原理

11.1.2在Python中实现KNN算法

11.2朴素贝叶斯分类

11.2.1贝叶斯公式

11.2.2朴素贝叶斯分类原理

11.2.3朴素贝叶斯的参数估计

11.2.4在Python中实现朴素贝叶斯

第12章高级分类器:支持向量机

12.1线性可分与线性不可分

12.2线性可分支持向量机

12.2.1函数间隔和几何间隔

12.2.2学习策略

12.2.3对偶方法求解

12.2.4线性可分支持向量机例题

12.3线性支持向量机与软间隔化

12.4非线性支持向量机与核函数

12.4.1核函数

12.4.2非线性支持向量机的学习

12.4.3示例与Python实现

12.5使用支持向量机的案例

第13章连续变量的特征选择与转换

13.1方法概述

13.2主成分分析

13.2.1主成分分析简介

13.2.2主成分分析原理

13.2.3主成分分析的运用

13.2.4在Python中实现主成分分析

13.3基于主成分的冗余变量筛选

13.4因子分析

13.4.1因子分析模型

13.4.2因子分析算法

13.4.3在Python中实现因子分析

第14章客户分群与聚类

14.1聚类算法概述

14.2聚类算法基本概念

14.2.1变量标准化与分布形态转换

14.2.2变量的维度分析

14.3聚类模型的评估

14.4层次聚类

14.4.1层次聚类原理

14.4.2层次聚类在Python中的实现

14.5基于划分的聚类

14.5.1kmeans聚类原理

14.5.2kmeans聚类

作者介绍

作者简介

常国珍

数据科学专家和金融技术专家。北京大学会计学博士,中国大数据产业生态联盟专家委员会委员。

2005年进入数据科学领域,先后在亚信、德勤等企业从事电信、金融行业数据挖掘工作,现就职于中银消费金融有限公司数据管理部。专注于消费金融领域的数据治理、客户智能与风险智能。

赵仁乾

数据科学家,在电信大数据和机器学习领域有丰富的实践经验。

现就职于北京电信规划设计院任高级经济师,负责通信、ICT项目工程与业务咨询,专注电信市场数据分析,重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析、大数据及人工智能运营规划等。

张秋剑

大数据专家和金融行业技术专家,上海师范大学计算机科学技术硕士。

现任星环科技金融事业部总监,大数据技术架构行业顾问专家,云析学院发起人,AICUG社区联合发起人,曾在IEEE等期刊发表多篇论文。目前主要为银行、证券和保险等行业客户提供大数据平台及人工智能平台的整体规划和项目建设等工作。

文摘

序言

python数据科学常国珍_《PYTHON数据科学:全栈技术详解》常国珍//赵仁乾//张秋剑著【摘要 书评 在线阅读】-苏宁易购图书...相关推荐

  1. python推荐算法课程_Python数据科学:全栈技术详解4-推荐算法

    作者:Ben,多本数据科学畅销书作家,先后在亚信.德勤.百度等企业从事电信.金融行业数据挖掘工作. 配套学习教程:数据科学实战:Python篇 https://edu.hellobi.com/cour ...

  2. python 3标准库道格_《PYTHON 3标准库 [美] 道格·赫尔曼》[美] 道格·赫尔曼(Doug Hellmann)著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: [美] 道格·赫尔曼(Doug Hellmann)著 出版社:机械工业出版社 出版时间:. 版次:. 印次:. 印刷时间:. 页数:. 开本:. ISBN:9787111608950 ...

  3. python scrapy 框架的简单使用爬虫苏宁易购图书信息

    python scrapy 框架的简单使用&&爬虫苏宁易购图书信息 前言 第一步: 分析网页 1.1 找到要爬取的数据位置 分类信息 图书信息 价格信息 1.2 分析如何获取数据 正则 ...

  4. 虫术python绝技下载_《虫术——Python绝技》梁睿坤著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: 梁睿坤著 出版社:电子工业出版社 出版时间:2018.6.30 版次:1 开本:16 ISBN:9787121344565 版权提供:电子工业出版社 基本信息 书名:虫术--Pyth ...

  5. vlan配置实例详解_网工知识角|MUXVLAN技术详解,基本原理一篇搞定

    学网络,就在IE-LAB 国内高端网络工程师培养基地 MUX VLAN(Multiplex VLAN )提供了一种通过VLAN进行网络资源控制的机制.通过MUX VLAN提供的二层流量隔离的机制可以实 ...

  6. python程序设计与案例教程王小银_《Python程序设计与案例教程》王小银著【摘要 书评 在线阅读】-苏宁易购图书...

    目录 *1章程序设计基础与Python概述 1.1程序设计与程序设计语言 1.1.1程序设计与计算思维 1.1.2程序设计语言 1.2Python语言概述 1.2.1Python语言的发展 1.2.2 ...

  7. mysql数据库技术与项目李锡辉_《MySQL数据库技术与项目应用教程 李锡辉 ,王樱 9787115474100 人》李锡辉,王樱著【摘要 书评 在线阅读】-苏宁易购图书...

    商品参数 作者: 李锡辉,王樱著 出版社:人民邮电出版社 出版时间:人民邮电出版社 版权提供:人民邮电出版社 基本信息 书名:MySQL数据库技术与项目应用教程 定价:45.00元 作者:李锡辉 ,王 ...

  8. python3程序设计基础答案刘德山_《PYTHON3程序设计/唐永华》唐永华 刘德山 李玲著【摘要 书评 在线阅读】-苏宁易购图书...

    章  初识Python 1 1.1  程序设计语言  1 1.1.1  程序设计语言的概念  1 1.1.2  编译与解释  2 1.2  Python语言  2 1.2.1  Python的历史   ...

  9. python开发实践教程 于京_《Python开发实践教程》于京、宋伟 著著【摘要 书评 在线阅读】-苏宁易购图书...

    前言 第一章 通过求三角形面积步入Python程序世界 案例1-1 求三角形面积 导读 知识梳理与扩展 小结 练习一 第二章 常用运算.使用自定义函数 案例2-1 用函数的方法计算三角形面积 导读 案 ...

最新文章

  1. 获取Http协议的请求行,请求头
  2. 内存的字符与打印出来的字符集的区别
  3. JQuery 动态生成元素添加点击事件
  4. Jquery 寻找父、子、兄弟节点
  5. mysql移动文件后打不开_Windows端MySQL data目录迁移(貌似会启动不了)
  6. Rust 逆袭!位列 Stack Overflow 2018 最受欢迎编程语言榜首
  7. 网页打开Android APP
  8. 捕获事件要比冒泡事件先触发
  9. 错误使用 xlim (line 31) 范围必须为包含递增的日期时间值的 2 元素向量
  10. 三步完美完成wordpress外链跳转
  11. C语言方差和标准差公式,方差概念及计算公式.docx
  12. 计算机上的闹钟怎么设置方法,pconline,教您电脑闹钟怎么设置
  13. 【图论·习题】白银莲花池
  14. 阿里云上的ssh反向代理
  15. hdu 校赛 油菜花王国
  16. 会议OA(会议排座送审)
  17. linux查看nas剩余大小,老徐玩NAS 篇二:我的群晖储存空间哪儿去了——100%破案的教程...
  18. 华为鸿蒙系统x2,华为多款机型开启鸿蒙尝鲜:微博已适配HarmonyOS小尾巴
  19. 学习编程可以从事哪些行业
  20. MapReduce编程规范及实践(流量统计)

热门文章

  1. [附源码]java毕业设计时事资讯平台
  2. C++ 开源游戏服务器框架
  3. Python 20行简单实现有道在线翻译
  4. conda 克隆环境及导入新环境/conda环境移植
  5. 毕业生档案、户籍、三方协议等问答
  6. 再创佳绩 2021数字经济科技创新应用颁奖盛典,冲量在线荣获最佳金融科技大数据应用奖
  7. 零知识证明系列之三——入门zkSNARK
  8. HAC集群中,计划重新初始化数据库使用原集群配置的操作方法
  9. linux的xml文件格式,linux – 如何将非UTF-8格式的xml文件转换为符合UTF-8的xml
  10. SQL字符串开头模糊匹配