机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书基于Python语言,实现了10个典型的实战案例,其内容涵盖了机器学习的基础箅法,主要包括统计学习基础、分类、贝叶斯网络、文本分析、图像处理等机器学习理论。此外,还介绍了机器学习的推荐技术应用。本书深入浅出,以实际应用的项目作为案例,实践性强,注重提升读者的动手操作能力,适合作为高等院校本科生、研究生机器学习、数据分析、数据挖掘等课程的实验教材,也可作为对机器学习感兴趣的研究人员和工程技术人员的参考资料。

章集装箱危险品瞒报预测

1.1业务背景分析

1.2数据提取

1.3数据预处理

1.3.1数据集成

1.3.2数据清洗

1.3.3数据变换

1.3.4数据离散化

1.3.5特征重要性筛选

1.3.6数据平衡

1.4危险品瞒报预测建模

1.5模型评估

第2章保险产品推荐

2.1业务背景分析

2.2数据探索

2.3数据预处理

2.4分类模型构建

2.5平衡数据集

2.6算法调参

2.7模型比较

第3章图书类目自动标引系统

3.1业务背景分析

3.2数据提取

3.3数据预处理

3.4基于贝叶斯分类的文献标引

3.4.1增量训练

3.4.2特征降维与消歧

3.4.3权重调节

3.5性能评估与结论

3.6基于BERT算法的文献标引

3.6.1数据预处理

3.6.2构建训练集

3.6.3模型实现

第4章基于分类算法的学习失败预警

4.1业务背景分析

4.2学习失败风险预测流程

4.3数据收集

4.4数据预处理

4.4.1数据探查及特征选择

4.4.2数据集划分及不平衡样本处理

4.4.3样本生成及标准化处理

4.5随机森林算法

4.5.1网格搜索及模型训练

4.5.2结果分析与可视化

4.5.3特征重要性分析

4.5.4与其他算法比较

第5章自然语言处理技术实例

5.1业务背景分析

5.2分析框架

5.3数据收集

5.4建立模型

5.4.1文本分词

5.4.2主题词提取

5.4.3情感分析

5.4.4语义角色标记

5.4.5语言模型

5.4.6词向量模型Word2vec

第6章基于标签的信息推荐系统

6.1业务背景分析

6.2数据预处理

6.2.1现有系统现状

6.2.2数据预处理

6.3内容分析

6.4基于协同过滤推荐

6.4.1用户偏好矩阵构建

6.4.2用户相似度度量

6.5基于用户兴趣推荐

6.6“冷启动”问题与混合策略

6.6.1冷启动问题分析

6.6.2混合策略

第7章快销行业客户行为分析与流失预警

7.1业务背景分析

7.2数据预处理

7.2.1数据整理

7.2.2数据统计与探查

7.3用户行为分析

7.3.1用户流失风险评估

7.3.2流失风险预警模型集成

第8章基于深度学习的图片识别系统

8.1业务背景分析

8.2图片识别技术方案

8.3图片预处理——表格旋转

8.4图片预处理——表格提取

8.5基于PaddlePaddle框架的文本识别

8.5.1环境安装

8.5.2模型设计

8.5.3模型训练

8.5.4模型使用

8.6基于密集卷积网络的文本识别模型

8.6.1训练数据生成

8.6.2DenseNet模型训练

8.6.3文本识别模型调用

第9章分辨率图像重建

9.1数据探索

9.2数据预处理

9.2.1图像尺寸调整

9.2.2载入数据

9.2.3图像预处理

9.2.4持久化测试数据

9.3模型设计

9.3.1残差块

9.3.2上采样PixelShuffler

9.3.3生成器

9.3.4判别器

9.3.5损失函数与优化器定义

9.3.6训练过程

9.4实验评估

0章人类活动识别

10.1业务背景分析

10.2数据探索

10.3数据预处理

10.4模型构建

10.5模型评估

附录机器学习复习题

python机器学习实战_Python机器学习实战案例相关推荐

  1. python文件审计_Python代码审计实战案例总结之CRLF和任意文件读取

    文章目录 介绍 CRLF和任意文件读取的审计实战 CRLF 审计实战 urllib CRLF漏洞(CVE-2019-9740和CVE-2019-9947) httplib CRLF 漏洞 任意文件读取 ...

  2. python机器学习库_Python机器学习库 Top 10,你值得拥有!

    随着人工智能技术的发展与普及,Python超越了许多其他编程语言,成为了机器学习领域中最热门最常用的编程语言之一.有许多原因致使Python在众多开发者中如此受追捧,其中之一便是其拥有大量的与机器学习 ...

  3. python datasets 下载_Python机器学习·微教程

    Python目前是机器学习领域增长最快速的编程语言之一. 该教程共分为11小节.在这个教程里,你将学会: 如何处理数据集,并构建精确的预测模型 使用Python完成真实的机器学习项目 这是一个非常简洁 ...

  4. python线性拟合模型_Python机器学习-线性回归模型篇

    一.What机器学习是什么 机器学习简单来说,是从数据中归纳出有用的规则,它是一种新的编程方式,它不需要人类来总结经验.输入逻辑,人类只需要把大量数据输入计算机,然后计算机就可以自动总结经验归纳逻辑, ...

  5. python机器学习彩票_Python机器学习及实战kaggle从零到竞赛PDF电子版分享

    Python机器学习及实战kaggle从零到竞赛PDF电子版分享 本书面向对机器学习感兴趣的专业认识,帮助从零开始一步一步掌握机器学习的奥义,在阅读的过程中由浅入深,慢慢步入机器学习的殿堂,零基础也可 ...

  6. python预测糖尿病_Python数据挖掘 | 实战案例之预测糖尿病

    今天给大家讲解一个实战案例:如何根据现有数据预测糖尿病.在这个案例开始之前,希望大家回忆一下大学里讲过的线性回归的知识,这是数据挖掘里非常重要的一部分知识.当然,鉴于大家都学过,本篇就不再赘述. 一. ...

  7. python写的hadoop实战_python api 实战

    如何在 Apache Flink 中使用 Python API? 作者:孙金城(金竹)整理:韩非 本文根据 Apache Flink 系列直播课程整理而成,由 Apache Flink PMC,阿里巴 ...

  8. python 降维 聚类_python数据挖掘实战之四:聚类

    计划写一下本学期选修的<机器学习与商业数据挖掘>课程的一系列实战笔记,本篇是第四节课的内容--聚类. 聚类 聚类分析(cluster analysis)是常见的数据挖掘手段,其主要假设是数 ...

  9. python 数学期望_python机器学习笔记:EM算法

    完整代码及其数据,请移步小编的GitHub 传送门:请点击我 如果点击有误:https://github.com/LeBron-Jian/MachineLearningNote EM算法也称期望最大化 ...

  10. python网络爬虫_Python爬虫实战之网络小说

    今天和大家分享的是python爬虫实战,由于本人最近迷上了看网络小说,学生党又穷,只能看看网络dao版小说,现在这类dao版小说网站可以说非常的多,但是所有的网站进去都可以看见一大把的广告信息,非常影 ...

最新文章

  1. R语言与数据分析(9)R与Excel
  2. R语言_高级数据管理
  3. hadoop之 参数调优
  4. 行走方案问题(动态规划实现)
  5. linux pcl 转图片,PCL转图片工具Mgosoft PCL To Image Converter
  6. 【Java】《Java编程的逻辑》第3章 类的基础 笔记+感悟分享
  7. JPG,动态GIF,BMP一些常用解决办法
  8. debian uefi legacy 区别_电脑硬盘格式有Legacy与UEFI,选择哪一个好?千万别选错了!...
  9. C++基础学习-20120516
  10. 博文视点大讲堂20期:Windows 7来了——知道你所不知道的Windows 7
  11. Android攻城狮—TextView实现跑马灯
  12. 开源的49款Java 网络爬虫软件
  13. 哪位大神了解LEACH算法的可以解释下,LEACH算法构成网络结构时是用在随机部署网络节点的还是确定性部署网络节点呢?
  14. 阿帕奇apache服务器和webDav服务器快速配置。
  15. Ubuntu下安装网易有道词典
  16. 木马可以损坏计算机硬件么,台式电脑总是自动重启怎么处理
  17. 使用svg-sprite-loader 遇到的问题
  18. vue老项目升级vue-cli3.0问题总结
  19. 零基础学java的最佳学习方法
  20. asp毕业设计——基于asp+access的订单管理系统设计与实现(毕业论文+程序源码)——订单管理系统

热门文章

  1. c#--实例选号器--实现打印、序列化方式保存、二维码
  2. 3 行为型模式之 - 观察者模式
  3. 在JS中关于堆与栈的认识function abc(a){ a=100; } function abc2(arr){ arr[0]=0; }
  4. setupdll在CAB安装过程中的一些处理方法
  5. Python向数据库表格里插入万级数据
  6. Triplet Loss
  7. DPDK-VPP 学习笔记-01
  8. linux下显示网卡设备及驱动信息intel shell脚本
  9. Elasticsearch(三)
  10. python中字符串是对象吗_python中字符串对象提供了很多方法来操作字符串