Python人工智能经典算法之机器学习第三篇

5.2 基本数据操作1.索引操作1.直接 -- 先列后行2.loc -- 先行后列，索引值3.iloc -- 先行后列，索引值的下标4.ix -- 先行后列，混合索引2.赋值操作1.对象[""]2.对象.close3.排序1.dataframe对象.sort_values()by -- 按照什么排序ascending -- 升降序对象.sort_index()注意:by这个参数可以接受多个值,优先按照第一个索引排序,如果相同,按照后面的2.series对象.sort_values()对象.sort_index()
5.3 DataFrame运算1.算术运算直接使用方法, add, sub ...也可以用符号2.逻辑运算2.1 逻辑运算符号<、 >、|、 &直接判断2.2 逻辑运算函数对象.query("")对象.isin([])3.统计函数对象.describe()统计函数summean...mode -- 众数idxmax -- 最大值的索引idxmin -- 最小值的索引4.累计统计函数函数      作用cumsum  计算前1/2/3/…/n个数的和cummax  计算前1/2/3/…/n个数的最大值cummin  计算前1/2/3/…/n个数的最小值cumprod 计算前1/2/3/…/n个数的积5.自定义运算[***]apply(func, axis=)func -- 自己定义的函数
5.4 Pandas画图对象.plot()kind --line -- 折线图barbarh -- 条形图旋转histpiescatter
5.5 文件读取与存储1.csv1.读取-- pd.read_csv参数:usecols -- 需要哪列2.存储 -- 对象.to_csv参数:columns -- 保存哪列2.hdf1.读取 -- pd.read_hdf()2.写入 -- 对象.to_hdf()注意:保存文件是****.h53.json1.读取 -- pd.read_json()2.写入 -- 对象.to_josn()参数:orient -- 按照什么方式进行读取或者写入lines -- 是否按照行读取和写入4.推荐使用hdf1.压缩方式,读取效率快2.压缩后,节省空间3.支持跨平台5.6 高级处理-缺失值处理[*****]判断数据是否为NaN：np.any(pd.isnull(movie))  # 里面如果有一个缺失值,就返回Truenp.all(pd.notnull(movie))  # 里面如果有一个缺失值,就返回False处理方式：存在缺失值nan,并且是np.nan:1、删除存在缺失值的:dropna(axis='rows')注：不会修改原数据，需要接受返回值2、替换缺失值:fillna(value, inplace=True)value:替换成的值inplace:True:会修改原数据，False:不替换修改原数据，生成新的对象不是缺失值nan，有默认标记的对象.replace()to_replace -- 替换前的值value -- 替换后的值
5.7 高级处理-数据离散化1.什么是数据离散化把一些数据分到某个区间,最后用不同的符号或者数字表达2.数据离散化apipd.qcut() -- 把数据大致分为数量相等的几类pd.cut()  -- 指定分组间隔数量统计:对象.value_counts()3.one-hot编码就是把数据转换成为0,1统计类型别名:哑变量,热独编码api:pd.get_dummies()
5.8 高级处理-合并pd.concat()axis=pd.merge()left -- 左表right -- 右表on -- 指定键how -- 按照什么方式进行拼接
5.9 高级处理-交叉表与透视表1.什么交叉表,透视表就是探索两列数据之间的关系2.pd.crosstab()返回具体数量3.对象.pivot_table()返回占比情况
5.10 高级处理-分组与聚合1.api对象.groupby()参数:as_index -- 是否进行索引注意:可以对数据进行对此分组,需要里面传递一个列表进行完成.

Python人工智能经典算法之机器学习第三篇相关推荐

朴素贝叶斯算法_机器学习第三篇：详解朴素贝叶斯算法
一.统计知识 01|随机事件: 1.概念随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...
[推荐]ORACLE SQL：经典查询练手第三篇(不懂装懂，永世饭桶！)
[推荐]ORACLE SQL:经典查询练手第三篇(不懂装懂,永世饭桶!) [推荐]ORACLE SQL: 经典查询练手第三篇(不懂装懂,永世饭桶!) --通过知识共享树立个人品牌. 本文与大家共同讨论 ...
[Python人工智能] 二十三.基于机器学习和TFIDF的情感分类（含详细的NLP数据清洗）
从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了自定义情感词典(大连理工词典)实现情感分析和情绪分类的过程.这篇文章将详细讲解自然语言处理过程,基于机器学习 ...
2023年软件测试经典面试题（全三篇）【包含答案】做完面试进入大厂不是梦
文章目录前言软件测试经典面试题(一)共25题软件测试经典面试题(二)共16题软件测试经典面试题(三)共16题一.软件测试基础二.Linux 三.Python 四.MySQL 五.Web 六 ...
人工智能（10）---机器学习知识体系篇(初级篇,中级篇,高级篇)
机器学习知识体系篇(初级篇,中级篇,高级篇) 下面是自己总结一套人工智能机器学习整个知识体系,一起学习,有总结不到位的希望大家给出纠正! 一人工智能基础语法篇二人工智能中级篇三人工智能高级篇
matlab实现鬼波信号压制算法代码实践--第三篇拉东域鬼波压制
第三篇 matlab实现拉东域鬼波压制方法本篇用来介绍拉东域鬼波压制的实现思路和压制效果该方法可用于水平拖缆.斜缆数据的鬼波压制算法实现思路见3.3节,除了文中代码外,需配置鬼波压制算法工具包 ...
机器学习第三篇：详解朴素贝叶斯算法
一.统计知识 01|随机事件: 1.概念随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...
python数据预测模型算法_Python机器学习预测分析核心算法
第1章关于预测的两类核心算法 1.1为什么这两类算法如此有用 1.2什么是惩罚回归方法 1.3什么是集成方法 1.4算法的选择 1.5构建预测模型的流程 1.5.1构造一个机器学习问题 1.5.2特征 ...
python的knn算法list_机器学习实战学习笔记1——KNN算法
一.KNN算法概述: 1.KNN算法的工作原理是: (1)存在一个训练样本集,并且知道样本集中每一数据与所属分类的对应关系,即每个数据都存在分类标签. (2)若此时输入不带标签的新数据之后,将新数据的 ...

Python人工智能经典算法之机器学习第三篇

Python人工智能经典算法之机器学习第三篇相关推荐

最新文章

热门文章