5.2 基本数据操作1.索引操作1.直接 -- 先列后行2.loc -- 先行后列,索引值3.iloc -- 先行后列,索引值的下标4.ix -- 先行后列,混合索引2.赋值操作1.对象[""]2.对象.close3.排序1.dataframe对象.sort_values()by -- 按照什么排序ascending -- 升降序对象.sort_index()注意:by这个参数可以接受多个值,优先按照第一个索引排序,如果相同,按照后面的2.series对象.sort_values()对象.sort_index()
5.3 DataFrame运算1.算术运算直接使用方法, add, sub ...也可以用符号2.逻辑运算2.1 逻辑运算符号<、 >、|、 &直接判断2.2 逻辑运算函数对象.query("")对象.isin([])3.统计函数对象.describe()统计函数summean...mode -- 众数idxmax -- 最大值的索引idxmin -- 最小值的索引4.累计统计函数函数      作用cumsum  计算前1/2/3/…/n个数的和cummax  计算前1/2/3/…/n个数的最大值cummin  计算前1/2/3/…/n个数的最小值cumprod 计算前1/2/3/…/n个数的积5.自定义运算[***]apply(func, axis=)func -- 自己定义的函数
5.4 Pandas画图对象.plot()kind --line -- 折线图barbarh -- 条形图旋转histpiescatter
5.5 文件读取与存储1.csv1.读取-- pd.read_csv参数:usecols -- 需要哪列2.存储 -- 对象.to_csv参数:columns -- 保存哪列2.hdf1.读取 -- pd.read_hdf()2.写入 -- 对象.to_hdf()注意:保存文件是****.h53.json1.读取 -- pd.read_json()2.写入 -- 对象.to_josn()参数:orient -- 按照什么方式进行读取或者写入lines -- 是否按照行读取和写入4.推荐使用hdf1.压缩方式,读取效率快2.压缩后,节省空间3.支持跨平台5.6 高级处理-缺失值处理[*****]判断数据是否为NaN:np.any(pd.isnull(movie))  # 里面如果有一个缺失值,就返回Truenp.all(pd.notnull(movie))  # 里面如果有一个缺失值,就返回False处理方式:存在缺失值nan,并且是np.nan:1、删除存在缺失值的:dropna(axis='rows')注:不会修改原数据,需要接受返回值2、替换缺失值:fillna(value, inplace=True)value:替换成的值inplace:True:会修改原数据,False:不替换修改原数据,生成新的对象不是缺失值nan,有默认标记的对象.replace()to_replace -- 替换前的值value -- 替换后的值
5.7 高级处理-数据离散化1.什么是数据离散化把一些数据分到某个区间,最后用不同的符号或者数字表达2.数据离散化apipd.qcut() -- 把数据大致分为数量相等的几类pd.cut()  -- 指定分组间隔数量统计:对象.value_counts()3.one-hot编码就是把数据转换成为0,1统计类型别名:哑变量,热独编码api:pd.get_dummies()
5.8 高级处理-合并pd.concat()axis=pd.merge()left -- 左表right -- 右表on -- 指定键how -- 按照什么方式进行拼接
5.9 高级处理-交叉表与透视表1.什么交叉表,透视表就是探索两列数据之间的关系2.pd.crosstab()返回具体数量3.对象.pivot_table()返回占比情况
5.10 高级处理-分组与聚合1.api对象.groupby()参数:as_index -- 是否进行索引注意:可以对数据进行对此分组,需要里面传递一个列表进行完成.

Python人工智能经典算法之机器学习第三篇相关推荐

  1. 朴素贝叶斯算法_机器学习第三篇:详解朴素贝叶斯算法

    一.统计知识 01|随机事件: 1.概念 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...

  2. [推荐]ORACLE SQL:经典查询练手第三篇(不懂装懂,永世饭桶!)

    [推荐]ORACLE SQL:经典查询练手第三篇(不懂装懂,永世饭桶!) [推荐]ORACLE SQL: 经典查询练手第三篇(不懂装懂,永世饭桶!) --通过知识共享树立个人品牌. 本文与大家共同讨论 ...

  3. [Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了自定义情感词典(大连理工词典)实现情感分析和情绪分类的过程.这篇文章将详细讲解自然语言处理过程,基于机器学习 ...

  4. 2023年软件测试经典面试题(全三篇)【包含答案】做完面试进入大厂不是梦

    文章目录 前言 软件测试经典面试题(一)共25题 软件测试经典面试题(二)共16题 软件测试经典面试题(三)共16题 一.软件测试基础 二.Linux 三.Python 四.MySQL 五.Web 六 ...

  5. 人工智能(10)---机器学习知识体系篇(初级篇,中级篇,高级篇)

    机器学习知识体系篇(初级篇,中级篇,高级篇) 下面是自己总结一套人工智能机器学习整个知识体系,一起学习,有总结不到位的希望大家给出纠正! 一 人工智能基础语法篇 二 人工智能中级篇 三 人工智能高级篇

  6. matlab实现鬼波信号压制算法  代码实践--第三篇 拉东域鬼波压制

    第三篇 matlab实现 拉东域鬼波压制方法 本篇用来介绍拉东域鬼波压制的实现思路和压制效果 该方法可用于水平拖缆.斜缆数据的鬼波压制 算法实现思路见3.3节,除了文中代码外,需配置鬼波压制算法工具包 ...

  7. 机器学习第三篇:详解朴素贝叶斯算法

    一.统计知识 01|随机事件: 1.概念 随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件).随机事件通常用大写英文字母A.B.C等表示.随机 ...

  8. python数据预测模型算法_Python机器学习 预测分析核心算法

    第1章关于预测的两类核心算法 1.1为什么这两类算法如此有用 1.2什么是惩罚回归方法 1.3什么是集成方法 1.4算法的选择 1.5构建预测模型的流程 1.5.1构造一个机器学习问题 1.5.2特征 ...

  9. python的knn算法list_机器学习实战学习笔记1——KNN算法

    一.KNN算法概述: 1.KNN算法的工作原理是: (1)存在一个训练样本集,并且知道样本集中每一数据与所属分类的对应关系,即每个数据都存在分类标签. (2)若此时输入不带标签的新数据之后,将新数据的 ...

最新文章

  1. 微信小程序多项选择器_微信小程序三级联动之多列选择器
  2. Transformer又来搞事情!百万像素高清图轻松合成,效果迷人
  3. 互联网协议 — TLS 传输层安全协议
  4. VS调试dll详细过程记录
  5. python手机版怎么用-手机怎么运行python
  6. 《解释的工具:生活中的经济学原理 读书笔记6》
  7. 【MFC系列3】永远点不到的按钮
  8. GEF:使用Draw2D画流程图-(下)
  9. 【优化算法】非支配排序遗传算法(NSGA)【含Matlab源码 176期】
  10. showdoc修改json转表格格式
  11. iPad/iPhone 邮件 设置浙大邮箱
  12. Oracle EBS 笔记8
  13. 软件项目管理(第二版 宁涛)问答题(个人背诵)
  14. 关于左对齐和左对齐的一些简单理解和杨辉3角的算法思想
  15. IOS面试攻略(1.0)
  16. [渝粤教育] 四川大学 货币金融学 参考 资料
  17. 解决Vmware 16安装Windows7后安装VMware tools选项为灰色及无法成功安装问题
  18. android 4.4 x86 iso,安卓x86 4.4 iso下载
  19. 华为网络----OSPF重分发与优化(二)
  20. 4.4 ipu_param_mem.h头文件分析

热门文章

  1. IT业界的十大经典谎言[转载]
  2. Python37 安装pip
  3. 没有萨拉丁怎么搭配突击队?平民突击队搭配教程
  4. Tomcat 卸载(文件和服务)
  5. 超级码力在线编程大赛初赛 第3场
  6. 【阿冈感动】月最圆时写给乔月光的歌《爱是温暖的月光》
  7. 券商金股哪家强——利用信息比率评价主动风险回报
  8. 初中化学骨干教师培训需求调查分析--以贵州师范学院国培计划为例
  9. MEE | 浙大程磊组开发设计与构建合成菌群新方法
  10. Python |Python-word文档标题与页眉的添加