Python机器学习预测算法
Python机器学习核心预测算法
- Python机器学习核心预测算法
- 第2章 通过理解数据来了解问题
- 2.1 解剖一个新问题
- 2.1.1 属性和标签的不同类型决定模型的选择
- 2.1.2 新数据集的注意事项
- 2.2 分类问题:用声呐发现未爆炸的水雷
- 2.2.1 “岩石 vs. 水雷”数据集的物理特性
- 2.2.1 “岩石 vs. 水雷”数据集的统计特征
Python机器学习核心预测算法
关于本书的学习及上机实现的笔记。
第2章 通过理解数据来了解问题
2.1 解剖一个新问题
note: 机器学习数据集通常对应列一个属性,行对应一个观察,但也有例外。例如,有些文本挖掘问题的数据矩阵就是另外的形式:列对应一个观察,行对应一个属性。
属性(预测因子、特征、独立变量、输入)
标签(结果、目标、依赖变量、响应)
2.1.1 属性和标签的不同类型决定模型的选择
a、数值变量;
b、类别(因子、因素)变量
例如惩罚回归算法只能处理数值变量,SVM、核方法、K最近邻也是同样。第4章将介绍将类别变量转换成数值变量的方法。
当标签是数值的,就叫做回归问题。当标签是类别的,就叫做分类问题。如果分类结果只取2个值,就叫作二元分类问题。如果取多个值,就是多类别分类问题。
可以吧一个回归问题变成二元分类问题。
2.1.2 新数据集的注意事项
需要检查的事项:
1、行数、列数
2、类别变了的数目、类别的取值范围
3、缺失的值:当数据规模较大时,可以直接丢失;当数据规模小特别是生物数据且有多种属性时,需要找到方法把丢失的值填上(遗失值插补),或者使用能够处理丢失数据的算法。
4、属性和标签的统计特性
2.2 分类问题:用声呐发现未爆炸的水雷
2.2.1 “岩石 vs. 水雷”数据集的物理特性
运行时出现问题row = line.strip(' ').split(",")TypeError: a bytes-like object is required, not 'str'原因:Python3和Python2 在套接字返回值解码上有区别,需要decode(‘utf8’)具体解释参考链接:https://blog.csdn.net/NockinOnHeavensDoor/article/details/78765781https://www.fujieace.com/python/str-bytes.html
由程序 rockVmineSummaries.py 得到
另外一个重要的观察,如果数据集的列数远远大于行数,那么采用惩罚线性回归的方法则有很大可能获得最佳预测,反之亦然。
由程序 rockVmineContents.py 可以确定哪些列是数值型的,哪些列是类别型的。分析结果:前60列是数值型,最后一列都是字符串。这些字符串值是标签。
try…except…else…是Python中异常处理的方法,
详见(https://www.runoob.com/python/python-exceptions.html)
2.2.1 “岩石 vs. 水雷”数据集的统计特征
由程序 rVMSummaryStats.py 得到该数据集的统计特征,
Python机器学习预测算法相关推荐
- 《Python机器学习——预测分析核心算法》——2.4 基于因素变量的实数值预测:鲍鱼的年龄...
本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.4节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...
- 《Python机器学习——预测分析核心算法》——2.2 分类问题:用声纳发现未爆炸的水雷...
本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.2节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...
- python模型预测_《Python机器学习——预测分析核心算法》——1.5 构建预测模型的流程...
本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第1章,第1.5节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...
- 《Python机器学习——预测分析核心算法》——2.5 用实数值属性预测实数值目标:评估红酒口感...
本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.5节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...
- 惩罚线性回归---Python机器学习:预测分析核心算法
惩罚线性回归 参考教材:Python机器学习预测分析核心算法,书中代码较为过时,借用sklearn等工具包进行了重写. 实践中遇到的绝大多数预测分析(函数逼近)问题,惩罚线性回归和集成方法都具有最优或 ...
- python分类预测_《Python机器学习——预测分析核心算法》——2.6 多类别分类问题:它属于哪种玻璃...
本节书摘来异步社区<Python机器学习--预测分析核心算法>一书中的第2章,第2.6节,作者:[美]Michael Bowles(鲍尔斯),更多章节内容可以访问云栖社区"异步社 ...
- 【数学建模】机器学习预测算法(KNN、随机森林、网格搜索对决策树、支持向量机)(Python代码实现)【2021华为杯】
目录 1 题目 2 数据集介绍及建模目标 3 问题 4 简化描述 5 Python代码实现 1 题目 乳腺癌是目前世界上最常见,致死率较高的癌症之一.乳腺癌的发展与雌激素受体密切相关,有研究发现,雌激 ...
- python机器学习预测_使用Python和机器学习预测未来的股市趋势
python机器学习预测 Note from Towards Data Science's editors: While we allow independent authors to publish ...
- 【Mo 人工智能技术博客】采用 Python 机器学习预测足球比赛结果
采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻.比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题.甚 ...
- python模型预测足球_采用 Python 机器学习预测足球比赛结果!买谁赢就谁赢!
采用 Python 机器学习预测足球比赛结果 足球是世界上最火爆的运动之一,世界杯期间也往往是球迷们最亢奋的时刻.比赛狂欢季除了炸出了熬夜看球的铁杆粉丝,也让足球竞猜也成了大家茶余饭后最热衷的话题.甚 ...
最新文章
- 基于群集的Hyper-v Server副本
- python概述_Python-概述
- leetcode206:反转链表
- 【转载】浅析输入法原理
- lightoj1027(期望dp)
- [转载] Python快速编程入门课后程序题答案
- windows 架设SVN服务器
- Valgrind User Manual
- matlab 默认颜色顺序,MATLAB:设置行的颜色和样式顺序并行应用
- 16、先天八卦与后天八卦各自有什么用途?
- Calc3: Partial Derivative
- 安卓篇-我自己的第一个安卓程序(附源码链接)
- 自媒体新手经常犯,自媒体平台发布作品没收益?分析了这5个原因
- SQL基础培训25-SQL开发思路畅谈与开发规范
- StatusBarUtil 状态栏工具类
- 【读书笔记】Profressional ASP.Net MVC2
- discuz如何实现自动提交url收录
- UGUI 九宫格的使用
- linux FHS pdf,linux FHS(Filesystem Hierarchy Standard)
- KeyBERT和labse提取字符串中的关键词
热门文章
- angular6之Http服务
- Spring框架——day04参数校验和文件上传
- HDU 3047 Zjnu Stadium 带权并查集
- cocos2d-x设计模式发掘之五:防御式编程模式
- [百万级]通用分页存储过程.[千万级]实现千万级数据的分页显示!
- igxe本地机器人怎么用_RPA 9.0 前瞻系列 - 机器人共享
- debian查询端口进程_Linux入门-端口和进程号
- Mac 升级 catalina 后无法创建文件,Read-only file system
- Mozilla Apache/Nginx/Lighttpd/HAProxy SSL 配置生成器
- hightec教程_如何用VectorCAST/C++做单元集成测试?