Python人工智能经典算法之机器学习第三篇
5.2 基本数据操作1.索引操作1.直接 -- 先列后行2.loc -- 先行后列,索引值3.iloc -- 先行后列,索引值的下标4.ix -- 先行后列,混合索引2.赋值操作1.对象[""]2.对象.close3.排序1.dataframe对象.sort_values()by -- 按照什么排序ascending -- 升降序对象.sort_index()注意:by这个参数可以接受多个值,优先按照第一个索引排序,如果相同,按照后面的2.series对象.sort_values()对象.sort_index()
5.3 DataFrame运算1.算术运算直接使用方法, add, sub ...也可以用符号2.逻辑运算2.1 逻辑运算符号<、 >、|、 &直接判断2.2 逻辑运算函数对象.query("")对象.isin([])3.统计函数对象.describe()统计函数summean...mode -- 众数idxmax -- 最大值的索引idxmin -- 最小值的索引4.累计统计函数函数 作用cumsum 计算前1/2/3/…/n个数的和cummax 计算前1/2/3/…/n个数的最大值cummin 计算前1/2/3/…/n个数的最小值cumprod 计算前1/2/3/…/n个数的积5.自定义运算[***]apply(func, axis=)func -- 自己定义的函数
5.4 Pandas画图对象.plot()kind --line -- 折线图barbarh -- 条形图旋转histpiescatter
5.5 文件读取与存储1.csv1.读取-- pd.read_csv参数:usecols -- 需要哪列2.存储 -- 对象.to_csv参数:columns -- 保存哪列2.hdf1.读取 -- pd.read_hdf()2.写入 -- 对象.to_hdf()注意:保存文件是****.h53.json1.读取 -- pd.read_json()2.写入 -- 对象.to_josn()参数:orient -- 按照什么方式进行读取或者写入lines -- 是否按照行读取和写入4.推荐使用hdf1.压缩方式,读取效率快2.压缩后,节省空间3.支持跨平台5.6 高级处理-缺失值处理[*****]判断数据是否为NaN:np.any(pd.isnull(movie)) # 里面如果有一个缺失值,就返回Truenp.all(pd.notnull(movie)) # 里面如果有一个缺失值,就返回False处理方式:存在缺失值nan,并且是np.nan:1、删除存在缺失值的:dropna(axis='rows')注:不会修改原数据,需要接受返回值2、替换缺失值:fillna(value, inplace=True)value:替换成的值inplace:True:会修改原数据,False:不替换修改原数据,生成新的对象不是缺失值nan,有默认标记的对象.replace()to_replace -- 替换前的值value -- 替换后的值
5.7 高级处理-数据离散化1.什么是数据离散化把一些数据分到某个区间,最后用不同的符号或者数字表达2.数据离散化apipd.qcut() -- 把数据大致分为数量相等的几类pd.cut() -- 指定分组间隔数量统计:对象.value_counts()3.one-hot编码就是把数据转换成为0,1统计类型别名:哑变量,热独编码api:pd.get_dummies()
5.8 高级处理-合并pd.concat()axis=pd.merge()left -- 左表right -- 右表on -- 指定键how -- 按照什么方式进行拼接
5.9 高级处理-交叉表与透视表1.什么交叉表,透视表就是探索两列数据之间的关系2.pd.crosstab()返回具体数量3.对象.pivot_table()返回占比情况
5.10 高级处理-分组与聚合1.api对象.groupby()参数:as_index -- 是否进行索引注意:可以对数据进行对此分组,需要里面传递一个列表进行完成.
Python人工智能经典算法之机器学习第三篇相关推荐
- 朴素贝叶斯算法_机器学习第三篇:详解朴素贝叶斯算法
一.统计知识 01|随机事件: 1.概念 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...
- [推荐]ORACLE SQL:经典查询练手第三篇(不懂装懂,永世饭桶!)
[推荐]ORACLE SQL:经典查询练手第三篇(不懂装懂,永世饭桶!) [推荐]ORACLE SQL: 经典查询练手第三篇(不懂装懂,永世饭桶!) --通过知识共享树立个人品牌. 本文与大家共同讨论 ...
- [Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)
从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了自定义情感词典(大连理工词典)实现情感分析和情绪分类的过程.这篇文章将详细讲解自然语言处理过程,基于机器学习 ...
- 2023年软件测试经典面试题(全三篇)【包含答案】做完面试进入大厂不是梦
文章目录 前言 软件测试经典面试题(一)共25题 软件测试经典面试题(二)共16题 软件测试经典面试题(三)共16题 一.软件测试基础 二.Linux 三.Python 四.MySQL 五.Web 六 ...
- 人工智能(10)---机器学习知识体系篇(初级篇,中级篇,高级篇)
机器学习知识体系篇(初级篇,中级篇,高级篇) 下面是自己总结一套人工智能机器学习整个知识体系,一起学习,有总结不到位的希望大家给出纠正! 一 人工智能基础语法篇 二 人工智能中级篇 三 人工智能高级篇
- matlab实现鬼波信号压制算法 代码实践--第三篇 拉东域鬼波压制
第三篇 matlab实现 拉东域鬼波压制方法 本篇用来介绍拉东域鬼波压制的实现思路和压制效果 该方法可用于水平拖缆.斜缆数据的鬼波压制 算法实现思路见3.3节,除了文中代码外,需配置鬼波压制算法工具包 ...
- 机器学习第三篇:详解朴素贝叶斯算法
一.统计知识 01|随机事件: 1.概念 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...
- python数据预测模型算法_Python机器学习 预测分析核心算法
第1章关于预测的两类核心算法 1.1为什么这两类算法如此有用 1.2什么是惩罚回归方法 1.3什么是集成方法 1.4算法的选择 1.5构建预测模型的流程 1.5.1构造一个机器学习问题 1.5.2特征 ...
- python的knn算法list_机器学习实战学习笔记1——KNN算法
一.KNN算法概述: 1.KNN算法的工作原理是: (1)存在一个训练样本集,并且知道样本集中每一数据与所属分类的对应关系,即每个数据都存在分类标签. (2)若此时输入不带标签的新数据之后,将新数据的 ...
最新文章
- 微信小程序多项选择器_微信小程序三级联动之多列选择器
- Transformer又来搞事情!百万像素高清图轻松合成,效果迷人
- 互联网协议 — TLS 传输层安全协议
- VS调试dll详细过程记录
- python手机版怎么用-手机怎么运行python
- 《解释的工具:生活中的经济学原理 读书笔记6》
- 【MFC系列3】永远点不到的按钮
- GEF:使用Draw2D画流程图-(下)
- 【优化算法】非支配排序遗传算法(NSGA)【含Matlab源码 176期】
- showdoc修改json转表格格式
- iPad/iPhone 邮件 设置浙大邮箱
- Oracle EBS 笔记8
- 软件项目管理(第二版 宁涛)问答题(个人背诵)
- 关于左对齐和左对齐的一些简单理解和杨辉3角的算法思想
- IOS面试攻略(1.0)
- [渝粤教育] 四川大学 货币金融学 参考 资料
- 解决Vmware 16安装Windows7后安装VMware tools选项为灰色及无法成功安装问题
- android 4.4 x86 iso,安卓x86 4.4 iso下载
- 华为网络----OSPF重分发与优化(二)
- 4.4 ipu_param_mem.h头文件分析