Python机器学习核心预测算法

  • Python机器学习核心预测算法
    • 第2章 通过理解数据来了解问题
      • 2.1 解剖一个新问题
        • 2.1.1 属性和标签的不同类型决定模型的选择
        • 2.1.2 新数据集的注意事项
      • 2.2 分类问题:用声呐发现未爆炸的水雷
        • 2.2.1 “岩石 vs. 水雷”数据集的物理特性
        • 2.2.1 “岩石 vs. 水雷”数据集的统计特征

Python机器学习核心预测算法

关于本书的学习及上机实现的笔记。

第2章 通过理解数据来了解问题

2.1 解剖一个新问题

note: 机器学习数据集通常对应列一个属性,行对应一个观察,但也有例外。例如,有些文本挖掘问题的数据矩阵就是另外的形式:列对应一个观察,行对应一个属性。
属性(预测因子、特征、独立变量、输入)
标签(结果、目标、依赖变量、响应)

2.1.1 属性和标签的不同类型决定模型的选择

a、数值变量;
b、类别(因子、因素)变量
例如惩罚回归算法只能处理数值变量,SVM、核方法、K最近邻也是同样。第4章将介绍将类别变量转换成数值变量的方法。
当标签是数值的,就叫做回归问题。当标签是类别的,就叫做分类问题。如果分类结果只取2个值,就叫作二元分类问题。如果取多个值,就是多类别分类问题。
可以吧一个回归问题变成二元分类问题。

2.1.2 新数据集的注意事项

需要检查的事项:
1、行数、列数
2、类别变了的数目、类别的取值范围
3、缺失的值:当数据规模较大时,可以直接丢失;当数据规模小特别是生物数据且有多种属性时,需要找到方法把丢失的值填上(遗失值插补),或者使用能够处理丢失数据的算法。
4、属性和标签的统计特性

2.2 分类问题:用声呐发现未爆炸的水雷

2.2.1 “岩石 vs. 水雷”数据集的物理特性

 运行时出现问题row = line.strip(' ').split(",")TypeError: a bytes-like object is required, not 'str'原因:Python3和Python2 在套接字返回值解码上有区别,需要decode(‘utf8’)具体解释参考链接:https://blog.csdn.net/NockinOnHeavensDoor/article/details/78765781https://www.fujieace.com/python/str-bytes.html

由程序 rockVmineSummaries.py 得到

另外一个重要的观察,如果数据集的列数远远大于行数,那么采用惩罚线性回归的方法则有很大可能获得最佳预测,反之亦然。
由程序 rockVmineContents.py 可以确定哪些列是数值型的,哪些列是类别型的。分析结果:前60列是数值型,最后一列都是字符串。这些字符串值是标签。

try…except…else…是Python中异常处理的方法,
详见(https://www.runoob.com/python/python-exceptions.html)

2.2.1 “岩石 vs. 水雷”数据集的统计特征

由程序 rVMSummaryStats.py 得到该数据集的统计特征,

Python机器学习预测算法相关推荐

  1. 《Python机器学习——预测分析核心算法》——2.4 基于因素变量的实数值预测:鲍鱼的年龄...

    本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.4节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...

  2. 《Python机器学习——预测分析核心算法》——2.2 分类问题:用声纳发现未爆炸的水雷...

    本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.2节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...

  3. python模型预测_《Python机器学习——预测分析核心算法》——1.5 构建预测模型的流程...

    本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第1章,第1.5节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...

  4. 《Python机器学习——预测分析核心算法》——2.5 用实数值属性预测实数值目标:评估红酒口感...

    本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.5节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...

  5. 惩罚线性回归---Python机器学习:预测分析核心算法

    惩罚线性回归 参考教材:Python机器学习预测分析核心算法,书中代码较为过时,借用sklearn等工具包进行了重写. 实践中遇到的绝大多数预测分析(函数逼近)问题,惩罚线性回归和集成方法都具有最优或 ...

  6. python分类预测_《Python机器学习——预测分析核心算法》——2.6 多类别分类问题:它属于哪种玻璃...

    本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.6节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...

  7. 【数学建模】机器学习预测算法(KNN、随机森林、网格搜索对决策树、支持向量机)(Python代码实现)【2021华为杯】

    目录 1 题目 2 数据集介绍及建模目标 3 问题 4 简化描述 5 Python代码实现 1 题目 乳腺癌是目前世界上最常见,致死率较高的癌症之一.乳腺癌的发展与雌激素受体密切相关,有研究发现,雌激 ...

  8. python机器学习预测_使用Python和机器学习预测未来的股市趋势

    python机器学习预测 Note from Towards Data Science's editors: While we allow independent authors to publish ...

  9. 【Mo 人工智能技术博客】采用 Python 机器学习预测足球比赛结果

    采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻.比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题.甚 ...

  10. python模型预测足球_采用 Python 机器学习预测足球比赛结果!买谁赢就谁赢!

    采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻.比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题.甚 ...

最新文章

  1. 基于群集的Hyper-v Server副本
  2. python概述_Python-概述
  3. leetcode206:反转链表
  4. 【转载】浅析输入法原理
  5. lightoj1027(期望dp)
  6. [转载] Python快速编程入门课后程序题答案
  7. windows 架设SVN服务器
  8. Valgrind User Manual
  9. matlab 默认颜色顺序,MATLAB:设置行的颜色和样式顺序并行应用
  10. 16、先天八卦与后天八卦各自有什么用途?
  11. Calc3: Partial Derivative
  12. 安卓篇-我自己的第一个安卓程序(附源码链接)
  13. 自媒体新手经常犯,自媒体平台发布作品没收益?分析了这5个原因
  14. SQL基础培训25-SQL开发思路畅谈与开发规范
  15. StatusBarUtil 状态栏工具类
  16. 【读书笔记】Profressional ASP.Net MVC2
  17. discuz如何实现自动提交url收录
  18. UGUI 九宫格的使用
  19. linux FHS pdf,linux FHS(Filesystem Hierarchy Standard)
  20. KeyBERT和labse提取字符串中的关键词

热门文章

  1. angular6之Http服务
  2. Spring框架——day04参数校验和文件上传
  3. HDU 3047 Zjnu Stadium 带权并查集
  4. cocos2d-x设计模式发掘之五:防御式编程模式
  5. [百万级]通用分页存储过程.[千万级]实现千万级数据的分页显示!
  6. igxe本地机器人怎么用_RPA 9.0 前瞻系列 - 机器人共享
  7. debian查询端口进程_Linux入门-端口和进程号
  8. Mac 升级 catalina 后无法创建文件,Read-only file system
  9. Mozilla Apache/Nginx/Lighttpd/HAProxy SSL 配置生成器
  10. hightec教程_如何用VectorCAST/C++做单元集成测试?