大数据分析与机器学习技术已成为各行各业实现数字化变革的关键驱动力。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了大数据分析与机器学习技术的商业应用实战。全书共16章,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型的原理和代码实现,每种模型都配有一到两个典型案例,涵盖金融、营销、医疗、社会科学、企业办公与管理等多个领域。本书适合具备一定数学知识和编程基础、希望快速在工作中应用大数据分析与机器学习技术的读者阅读,也适合Python编程爱好者或对大数据分析与机器学习技术感兴趣的读者参考。

前言如何获取学习资源章 Python与数据科学1.1 大数据分析与机器学习概述131.1.1 大数据分析与机器学习的应用领域131.1.2 机器学习的基本概念141.1.3 Python在数据科学中的作用161.2 Python编程环境部署与基本操作161.2.1 Python的安装161.2.2 Pycharm的安装与设置181.2.3 Jupyter Notebook的使用221.3 Python基础知识概要28第2章 数据分析利器:NumPy、pandas与Matplotlib库2.1 NumPy库基础292.1.1 NumPy库与数组292.1.2 数组与列表的区别302.1.3 创建数组的几种方式312.2 pandas库基础332.2.1 二维数据表格DataFrame的创建332.2.2 Excel工作簿等文件的读取和写入382.2.3 数据的选取与处理412.2.4 数据表拼接472.3 Matplotlib库基础512.3.1 基本图表绘制512.3.2 数据可视化常用技巧562.4 案例实战:股票数据读取与K线图绘制612.4.1 初步尝试:股票数据读取与可视化622.4.2 进阶实战:股票K线图绘制65第3章 线性回归模型3.1 一元线性回归733.1.1 一元线性回归的数学原理733.1.2 一元线性回归的代码实现753.1.3 案例实战:不同行业工龄与薪水的线性回归模型773.2 线性回归模型评估833.2.1 模型评估的编程实现833.2.2 模型评估的数学原理843.3 多元线性回归873.3.1 多元线性回归的数学原理和代码实现873.3.2 案例实战:客户价值预测模型88第4章 逻辑回归模型4.1 逻辑回归模型的算法原理924.1.1 逻辑回归模型的数学原理924.1.2 逻辑回归模型的代码实现944.1.3 逻辑回归模型的深入理解954.2 案例实战:客户流失预警模型984.2.1 案例背景984.2.2 数据读取与变量划分984.2.3 模型的搭建与使用994.3 模型评估方法:ROC曲线与KS曲线1044.3.1 ROC曲线的基本原理1054.3.2 案例实战:用ROC曲线评估客户流失预警模型1084.3.3 KS曲线的基本原理1114.3.4 案例实战:用KS曲线评估客户流失预警模型112第5章 决策树模型5.1 决策树模型的基本原理1155.1.1 决策树模型简介1155.1.2 决策树模型的建树依据1165.1.3 决策树模型的代码实现1195.2 案例实战:员工离职预测模型1235.2.1 模型搭建1235.2.2 模型预测及评估1265.2.3 决策树模型可视化呈现及决策树要点理解1315.3 参数调优:K折交叉验证与GridSearch网格搜索1385.3.1 K折交叉验证1385.3.2 GridSearch网格搜索139第6章 朴素贝叶斯模型6.1 朴素贝叶斯模型的算法原理1456.1.1 一维特征变量下的贝叶斯模型1456.1.2 二维特征变量下的贝叶斯模型1466.1.3 n维特征变量下的贝叶斯模型1476.1.4 朴素贝叶斯模型的简单代码实现1476.2 案例实战:肿瘤预测模型1486.2.1 案例背景1486.2.2 数据读取与划分1486.2.3 模型的搭建与使用149第7章 K近邻算法7.1 K近邻算法的原理和代码实现1527.1.1 K近邻算法的基本原理1527.1.2 K近邻算法的计算步骤1537.1.3 K近邻算法的代码实现1557.2 案例实战:手写数字识别模型1577.2.1 案例背景1577.2.2 手写数字识别的原理1577.2.3 手写数字识别的代码实现1597.3 图像识别原理详解162第8章 随机森林模型8.1 随机森林模型的原理和代码实现1668.1.1 集成模型简介1668.1.2 随机森林模型的基本原理1678.1.3 随机森林模型的代码实现1688.2 案例实战:股票涨跌预测模型1708.2.1 股票基本数据获取1708.2.2 股票衍生变量生成1738.2.3 多因子模型搭建1818.2.4 模型使用与评估1848.2.5 参数调优1868.2.6 收益回测曲线绘制188第9章 AdaBoost与GBDT模型9.1 AdaBoost算法原理1909.1.1 AdaBoost算法的核心思想1909.1.2 AdaBoost算法的数学原理概述1919.1.3 AdaBoost算法的数学原理举例1949.1.4 AdaBoost算法的简单代码实现2009.2 AdaBoost算法案例实战:信用卡精准营销模型2019.2.1 案例背景2019.2.2 模型搭建2019.2.3 模型预测及评估2029.2.4 模型参数介绍2059.3 GBDT算法原理2069.3.1 GBDT算法的核心思想2069.3.2 GBDT算法的数学原理概述2089.3.3 GBDT算法的数学原理举例2089.3.4 GBDT算法的简单代码实现2139.4 GBDT算法案例实战:产品定价模型2149.4.1 案例背景2149.4.2 模型搭建2149.4.3 模型预测及评估2179.4.4 模型参数介绍2190章 机器学习神器:XGBoost与LightGBM算法10.1 XGBoost算法原理22310.1.1 XGBoost算法的核心思想22410.1.2 XGBoost算法的数学原理概述22410.1.3 XGBoost算法的简单代码实现22510.2 XGBoost算法案例实战1:金融反欺诈模型22610.2.1 案例背景22610.2.2 模型搭建22610.2.3 模型预测及评估22810.2.4 模型参数调优23010.3 XGBoost算法案例实战2:信用评分卡模型23310.3.1 案例背景23310.3.2 多元线性回归模型23410.3.3 GBDT回归模型23510.3.4 XGBoost回归模型23710.4 LightGBM算法原理24110.4.1 LightGBM

python大数据分析入门实例-Python大数据分析与机器学习商业案例实战相关推荐

  1. 大数据 python和java_大数据入门选择Python还是Java?

    原标题:大数据入门选择Python还是Java? java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承.指针等概念,因此Java语言具有功能强大和简单易用两 ...

  2. 【数据分析入门】python数据分析全过程梳理与代码实现

    文章目录 数据分析 数据获取 探索分析与可视化 预处理理论 分析建模 评估模型 数据分析 数据获取 [数据分析入门]python数据分析之数据获取方法 探索分析与可视化 [数据分析入门]python数 ...

  3. Python基础编程入门实例:恺撒密码

    文章目录 Python基础编程入门实例:恺撒密码 一.什么是恺撒密码 二.程序运行环境 三.恺撒密码:加密 3.1.恺撒密码加密实例程序 3.2.恺撒密码加密实例程序运行结果 四.恺撒密码:解密 4. ...

  4. 视频教程-Python零基础入门教程-Python

    Python零基础入门教程 从2012年从事互联网至今有7年软件编程经验,曾任职国内北京互联网公司,中南林业大学授课Python 现任逻辑教育Python课程负责人,精通Python语言,精通人工智能 ...

  5. 大数据入门:Scala大数据黄金语言

    在大数据的学习当中,关于编程语言选择的部分,是很多人在学习初期非常关注的.在企业大数据平台开发场景下,Java语言是主流选择,其次涉及到Spark部分,就不得不提到Scala语言.今天的大数据入门分享 ...

  6. Python机器学习经典案例实战-韦玮-专题视频课程

    Python机器学习经典案例实战-3710人已学习 课程介绍         Python在机器学习领域应用是非常广泛的,比如,我们可以使用机器学习进行验证码识别,使用机器学习实现计算机视觉项目,或者 ...

  7. 可以单独打开anaconda中的python莫?_Python入门必备,大数据,人工智能编程必备软件-Anaconda...

    如果说通用的编程神器是微软的VS Code,那么Python编程必备神器是Anaconda 适用人群:Python编程入门新手,大数据分析工作者,人工智能工作者,创投,金融分析师等 适用平台:Wind ...

  8. azw3 python数据分析 活用pandas库_Python数据分析 活用Pandas库 数据科学教程数据分析入门图书 Python编程入门数据处理...

    内容介绍 本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手.具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和 ...

  9. python快速编程入门例题-Python快速编程入门,打牢基础必须知道的11个知识点 !...

    Python被誉为全世界高效的编程语言,同时也被称作是"胶水语言",那它为何能如此受欢迎,下面我们就来说说Python入门学习的必备11个知识点,也就是它为何能够如此受欢迎的原因. ...

最新文章

  1. openssl qt 生成秘钥_关于openssl作的rsa生成密钥及加解密
  2. 全球及中国汽车后市场规模格局及经营趋势研究报告2021-2027年
  3. Python之一行代码
  4. VTK:线性挤压用法实战
  5. springboot的yml自定义值的笔记
  6. Python之数据重塑——【stack()方法和unstack()方法、pivot()方法】
  7. FCKEditor在Asp.net环境下的配置安装
  8. rp软件app流程图_Axure制作流程图的图文操作
  9. 【ubuntu】SSH安装及配置
  10. 调频连续波雷达基本原理(1)-测距原理详解
  11. 串口抓包/截断工具的安装及使用详解
  12. 毕马威明确从事区块链行业所需的四大技能
  13. js中Array对象。concat,concat,pop,push,reserve,shift,slice,splice,toString,toLocaleString,unshift
  14. 以前的的华为手机可不可以用鸿蒙系统_现在买华为手机以后可以换成鸿蒙系统吗?...
  15. 讯搜安装报错You need a working C++ compiler to compile Xapian
  16. 逐浪海棠居刻本字-第一款基于unicode13标准构建的中文字库
  17. 说一说我们合肥黑马程序员
  18. aws iam入门之简介
  19. Nick英语入门班笔记
  20. python 读excel每行替换_Python脚本操作Excel实现批量替换功能

热门文章

  1. Springboot接入微信支付、支付宝支付
  2. 计算机软考通过 单位不聘用,软考证书是不是得聘用才有用呢?
  3. 雅可比(Jacobi)迭代法解线性方程组的Matlab实现
  4. 搭建个人专用的谷歌搜索镜像站---学习笔记
  5. conda安装虚拟环境时发生ClobberError
  6. 【MIT博士论文】数据高效强化学习
  7. 抢鞋软件bot服务器系统,国内bot抢鞋软件
  8. 神经网络学习远离_使您的企业远离黑暗的网络
  9. python报错invalid,Python 報錯 SyntaxError: invalid syntax 解決方法
  10. python 简单网络编程