炼数成金数据分析课程---8、数据清洗

一、总结

一句话总结:

数据分析课程的实质是:介绍库中的函数:介绍py的3个常用的数据分析库(numpy,pandas,scipy)的函数的操作
实例:其实找几个实例,一下子就懂了
资源很多:网上的各种资源都不要太多,想学习还是非常容易的

1、一般数据处理中的合并数据分为哪几种?

索引上的合并
轴向连接:将数据按照行连接起来
合并重复数据

2、数据合并做轴向连接的方法?

-Numpy数组—concatenation
-Pandas对象——concat

3、pandas中数据重塑(行列互相转换)有哪些方法?

-Stack:将数据的列“旋转”为行
-Unstack:将数据的行“旋转”为列

4、长型数据和宽型数据的区别是什么?

长型数据:一天的多条数据被记录为多条
款型数据:一天的数据只有一条

5、根据长型数据和宽型数据的转换,你得到的启示是?

python做数据转换,数据分析,因为这些库的话真的是特别方便呢

6、DataFrame如何检测和去掉重复项?

data.duplicated():检测重复项
data.drop_duplicates():去掉重复项

7、数据分析课程的实质是什么?

介绍库中的函数:介绍py的3个常用的数据分析库(numpy,pandas,scipy)的函数的操作

8、Python内置的常用的字符串方法有哪些?

count  返回子串在字符串中的出现次数(非重叠)
split   通过指定的分隔符将字符串拆分为一组子串
replace  用另一个字符串替换指定子串
count  返回子串在字符串中的出现次数(非重叠)
endswith、startswith   如果字符串以某个后缀结尾(以某个前缀开头),则返回True join  将字符串用作连接其他字符串序列的分隔符
index  如果在字符串中找到子串,则返回子串第一个字符所在的位置。如果没有找到,则引发ValueError。
find  如果在字符串中找到子串,则返回第一个发现的子串的第一个字符所在的位置。如果没有找到,则返回-1
rfind  如果在字符串中找到子串,则返回最后一个发现的子串的第一个字符所在的位置。如果没有找到,则返回一1
replace  用另一个字符串替换指定子串
strip、rstrip、lstrip  去除空白符(包括换行符)。相当于对各个元素执行x.strip()
(以及rstip、lstrip)。译注10
split   通过指定的分隔符将字符串拆分为一组子串
lower.upper   分别将字母字符转换为小写或大写ljust、just用空格(或其他字符)填充字符串的空白侧以返回符合最低宽度的字符串

9、Pandas中矢量化字符串常用的方法有哪些?

字符串操作函数就那几个,甚至连记的必要性都没有,用的时候去找即可
cat   实现元素级的字符串连接操作,可指定分隔符
contains   返回表示各字符串是否含有指定模式的布尔型数组
count   模式的出现次数
endswith、startswith   相当于对各个元素执行x.endswith(pattern)或x.startswith(pattern)
findall   计算各字符串的模式列表
get   获取各元素的第个字符
join   根据指定的分隔符将Series中各元素的字符串连接起来
len   计算各字符串的长度
lower、upper   转换大小写。相当于对各个元素执行x.lower0或x.upper0
match  根据指定的正则表达式对各个元素执行re.match pad在字符串的左边、右边或左右两边添加空白符
center   相当于pad(side='both)
repeat   重复值。例如,s.str.repeat(3)相当于对各个字符串执行x*3
replace   用指定字符串替换找到的模式
slice   对Series中的各个字符串进行子串截取
split   根据分隔符或正则表达式对字符串进行拆分
strip、rstrip、Istrip   去除空白符,包括换行符。相当于对各个元素执行x.strip()、x.rstrip)、x.lstrip)

二、内容在总结中

转载于:https://www.cnblogs.com/Renyi-Fan/p/10989675.html

炼数成金数据分析课程---8、数据清洗相关推荐

  1. 炼数成金数据分析课程---7、数据分析简介

    炼数成金数据分析课程---7.数据分析简介 一.总结 一句话总结: 我终于知道他们是要做一些什么样的工作了 1.我们导入了数据,是否可以立即进行数据分析? 需要对数据做预处理:比如去除脏数据这些 2. ...

  2. 炼数成金数据分析课程---16、机器学习中的分类算法(交叉内容,后面要重点看)...

    炼数成金数据分析课程---16.机器学习中的分类算法(交叉内容,后面要重点看) 一.总结 一句话总结: 大纲+实例快速学习法 主要讲解常用分类算法(如Knn.决策树.贝叶斯分类器等)的原理及pytho ...

  3. 炼数成金数据分析课程---17、机器学习聚类算法(后面要重点看)

    炼数成金数据分析课程---17.机器学习聚类算法(后面要重点看) 一.总结 一句话总结: 大纲+实例快速学习法 主要讲解常用聚类算法(比如K-means等)的原理及python代码实现:后面学习聚类的 ...

  4. 炼数成金数据分析课程---13、回归分析

    炼数成金数据分析课程---13.回归分析 一.总结 一句话总结: 大纲+实例快速学习法 主要内容是回归分析的原理及编程实现 1.回归分析是什么? 通过建立模型来研究变量之间相互关系的密切程度.结构状态 ...

  5. python数据内容_炼数成金:Python数据分析内容分享

    相信看这篇文章的每一位朋友,都有过努力学习 炼数成金:Python数据分析     这个课程.提升自我的想法, 可是学习是一件非常反人性的事情,大多数人都是晚上想想千条路,早上醒来走原路.  也相信很 ...

  6. 炼数成金R七种武器之金融数据分析quantmod

    更多资源进群: 377215114 炼数成金<数据分析,展现与R语言>课程上线已经有18个月,至今已经培训了近千名学员,对在中国推动开源数据分析软件起到了重要作用.应广大受众的要求,我们在 ...

  7. 【备忘】2017年最新炼数成金机器读心术之神经网络与深度学习视频教程

    课程大纲: 第1课 跌宕起伏70年:神经网络发展概述:最简单的神经元仿生:单层感知器. 第2课 线性神经网络,BP神经网络,基于梯度下降的各种学习算法:BP神经网络应用:信用识别:为什么BP网络丌能支 ...

  8. 炼数成金邀请码:YY96

    dataguru 炼数成金 邀请码 YY96 学费减免 dataguru 炼数成精  邀请码 YY96 学费减免 炼数成金邀请码,使用邀请码报名课程可以减免50%固定学费哦! http://edu.d ...

  9. 炼数成金 优惠码 C183

    最近想学点大数据的分析,找到了炼数成金这个网站,感觉很不错,报名了一个课程,最近炼数成金正在搞活动,使用优惠码立即减一半学费,分享出我的优惠码 所有课程都可以使用!!!!!!!!!! 优惠码:C183

最新文章

  1. matlab 计算运行时间的办法
  2. csapp 、sicp 、深入理解计算机系统、 计算机程序的构造和解释
  3. java 调试 gdb_android gdb 调试实例演示(有源代码篇)
  4. SQL语句从入门到精通之笔记大全
  5. python常用的数据预处理方法
  6. [CODEVS 3044] 矩形面积求并
  7. Gradle 编译速度提升 70%!怎么做到的?
  8. 电子商务系统的设计与实现(九):后端管理系统功能细化
  9. 哪种人是软件设计中的稀缺型人才?
  10. vue 多个回调_Vue 进阶面试必问,异步更新机制和 nextTick 原理
  11. 如何知道自己的php安装在哪,如何知道安装了哪些PHP扩展
  12. Python 中缀表达式转换后缀表达式
  13. setInterval 函数
  14. 光敏传感器介绍及其软件应用
  15. 初中计算机授课教案模板,初中语文的教案模板(精选5篇)
  16. Android播放音频到耳机,Android应用开发之android插入耳机状态使用扬声器外放音乐...
  17. TI 参考设计 采用高分辨率位置插值的正弦/余弦编码器的接口
  18. 计算机连接公用网络受限,本地连接受限制不能上网的原因及解决方法
  19. 还原html默认打开方式,怎么还原打开方式,详细教您Win10系统下如何还原程序默认打开方式...
  20. 42个5G智慧教育应用场景,告诉你5G将如何改变教育

热门文章

  1. Keepalived+LVS+Nginx负载均衡之高可用
  2. C#正则表达式匹配字符串中的数字
  3. div+css内容需注意
  4. [Usaco2005 Open]Disease Manangement 疾病管理 BZOJ1688
  5. saltstack state模块-状态管理
  6. luvit 被忽视的lua 高性能框架(仿nodejs)
  7. MySQL 5.7 SYS SCHEMA
  8. 【Unity3D】资源对象、预设、查找对象、组合模式等知识点
  9. error: device not found - waiting for device -
  10. 解决phpQuery(DOMDocument)解析部分HTML会产生乱码的问题