时隔多天,终于又要开始我的博客生涯了,经过这个月的python数据分析和机器学习,总结了一些经验,同时也收获了一些大佬的优秀博客,感兴趣的可以观看我的收藏夹,废话不多说,直接进入正题。

数据分析大致分为数据处理,模型建立,模型测试这3部,这篇文章主要是讲解对数据进行处理

为了对数据进行分析,首先要了解学习python的熊猫库pandas,下面是一些基础简单的操作方法,python调用方法如下

import pandas as pd

python通过pandas读取csv文件的方法

df= pd.read_csv("xxx.csv")
#输出文件内容前五列
print(df.head())
#输出csv所有内容
print(df)

查看csv某列数据的方法

pandas.read_csv(‘file_name.csv’, usecols = [0,1,2,3])
#简单方法
df["属性列名称"]

pandas删除csv数据某些列的方法

droplabels= ['x_cat4','x_cat5','x_cat8','x_cat9']
data=df.drop(droplabels,axis=1)

pandas对NAN数据清洗的方法

#将表格中含有nan数值的列进行删除,返回非空数据和索引值的Series
df.dropna()
'''
dropna(axis=0,how=’any’,thresh=None),how参数可选的值为any或者all.all仅在切片元素全为NA时才抛弃该行(列)。thresh为整数类型,eg:thresh=3,那么一行当中至少有三个NA值时才将其保留。
'''
data.fillna(0)                      #将nan替换为0
print(data.fillna(data.mean()))     ### 用每列特征的均值填充缺失数据
print(data.fillna(data.median()))    ### 用每列特征的中位数填充缺失数据
print(data.fillna(method='bfill'))   ### 用相邻后面(back)特征填充前面空值
print(data.fillna(method='pad'))     ### 用相邻前面特征填充后面空值
#参考博客:https://blog.csdn.net/qq_21840201/article/details/81008566

pandas对csv文件数据的更改的方法

#更改某列属性数值和类型
df = df[df['涨跌幅']!='None']
df['涨跌幅'] = df['涨跌幅'].astype(np.float64)
df = pd.DataFrame(a, dtype='float') #数据类型转化
#参考链接:http://www.45fan.com/article.php?aid=19070771581800099094144284
#对数据全部遍历读取并更改,参考如下
for i in df.index:df["id1"][i]=1

pandas的iloc的使用方法和作用

X = df.iloc[:, data.columns != 'label']  # 取出不包括 label其他的列df.iloc[:3, :2]           #使用.iloc ,我们只选择了.iloc的前3行和2列

计算某列元素数量的方法

sum= len(data[data.label == 'BENIGN']) #计算BENIGN的数量
len(df)

pandas对文件进行保存的方法

#df为要保存的数据,xxx.csv为保存的文件
df.to_csv('xxx.csv', index=False, sep=',')

以上是pandas对数据进行处理的简单功能,其中含有一些参考学习的博客,感兴趣的同学可以观看学习。有了这些基础知识,我们才能对数据集进行处理,接下来就是如何使用的问题了,下面讲解简单的套路。
1.首先观察数据,通过代码检测每一列的数据类型再进行考察,检测是否存在NAN值,可以删除该列,也可根据情况进行数值的变动。
2.数据集中可能存在部分列属性为time属性,一般不要直接将该列删除,可通过将其转化为浮点类型
3.字符串类型向数值类型的转换,部分字符串需要进行转换,这个就视情况而定了。
说了这么多,真实情况下也不一定用上,主要是明白数据的处理方法和手段,同时对于数据分析,我也是刚接触不久,现在也还在努力学习。现在将最近自己网上学习到的知识回报给csdn。

最后提一个小小的要求,如果觉得我写的不错的话,可以给我一个赞吗?点关注就更好了,有啥不对的地方也可以在评论区提出,十分感谢你们的参与,希望我们一起进步。

python数据分析——简单且有用的代码相关推荐

  1. Python超简单实现跳动爱心代码/opencv/几十行代码/新手也能学会

    Python超简单实现跳动爱心代码/opencv/几十行代码/新手也能学会 1.OpenCV逐帧处理视频获得坐标像素点 从网上寻找带有此同款爱心视频,原视频出处--<点燃我,温暖你>,截取 ...

  2. python数据分析图表展示_1行代码实现Python数据分析:图表美观清晰,自带对比功能丨开源...

    公众号关注 "视学算法" 设为 "星标",DLCV消息即可送达! 萧箫 发自 凹非寺 转自 | 量子位 你是否也在朋友圈看过这样的小广告: 「你要悄悄学Pyth ...

  3. python数据分析简单实例-利用Python进行数据分析――基础示例

    编辑推荐: 来源csdn ,文章通过美国官方网站的几个案例详细讲解了Python数据分析,介绍较为详细,更多内容请参阅下文. import json import numpy as np import ...

  4. 《Python数据分析与挖掘实战》代码问题

    本文转自:http://blog.csdn.net/qq_27469517/article/details/53482563 整个第四章都是数据预处理. 4.1是数据清洗.就是处理无关数据,缺失或者异 ...

  5. python画简单的图形的代码-Python实现画图软件功能方法详解

    概述 虽然Python的强项在人工智能,数据处理方面,但是对于日常简单的应用,Python也提供了非常友好的支持(如:Tkinter),本文主要一个简单的画图小软件,简述Python在GUI(图形用户 ...

  6. python开启新代码块_20课零基础快速学python完成简单邮件完整邮件代码块

    通过前两节课的学习, 我们已经掌握了模块的使用,能够解决现实中的问题.纸上得来终觉浅,绝知此事要躬行.以前小K给大家说过,实战项目是编程快速成长的一个途径.到现在应该是我们的第三个项目了,项目需求越来 ...

  7. python与数据分析的课程报告_【最新】python数据分析课程报告论文(附代码数据)...

    用python进行数据分析 一.样本集 本样本集来源于某高中某班78位同学的一次月考的语文成绩.因为每位同学的成绩都是独立的随机变量,遂可以保证得到的观测值也是独立且随机的 样本如下: grades= ...

  8. python数据分析实训心得_Python代码在实践过程中的经验总结

    Python代码在实践过程中的经验总结 关于Python脚本,在具体的实践过程中经常会遇到一些问题,下面将其总结,便于使用.考虑使用 Logger(logger 怎么配置,需要输出哪些信息 - 可以反 ...

  9. python实现日历功能_基于python实现简单日历

    本文实例为大家分享了python实现简单日历的具体代码,供大家参考,具体内容如下 首先要理清楚逻辑,日历的难点在于如何使用基础知识将周几与对应的日期进行对应,我这里利用了1917年1月1日为星期1,计 ...

  10. 0代码就能做Python数据分析,这个Jupyter插件,用起来就像Excel一样简单

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 加载一个Jupyter插件后,无需写代码就能做数据分析,还帮你生成相应代码? 没错,只需要加载这个名为Mito的小工具包,用Python做数 ...

最新文章

  1. 计算机视觉开源库OpenCV梯度之Sobel算子
  2. php三种web开发技术,三种WEB开发主流技术ASP-PHP-JSP的评价
  3. java面向对象结课总结_java面向对象课程总结
  4. 【Java用法】java 8两个List集合取交集、并集、差集、去重并集
  5. 字符串处理 —— 回文串相关 —— Manacher 算法
  6. Mac OS X将CSV格式转换为Excel文档格式,Excel转CSV中文乱码问题
  7. 理论 | 分库分表需要考虑的问题及方案
  8. 有用的正则表达式或JS方法
  9. 微信为什么没有公众号导航
  10. 在 vue/cli 中使用 Module Federation
  11. CSS之cursor用法
  12. android定位和地图开发实例
  13. 微信推送封面尺寸_微信公众号文章封面图尺寸应该是多大?
  14. 【Scrum】借由数个冲刺,实现产品的敏捷开发!
  15. 专访马化腾:首次开谈个人经历、管理心得、技术创新、微信的诞生等
  16. CSS实现自定义虚线
  17. winXP和win2003双系统下启动NTDETECT错误解决方法
  18. 各坐标系转换,百度、高德、wgs84、cgcs2000坐标系互转
  19. 扇贝编程可以用c语言吗,扇贝编程手机版下载_扇贝编程app下载 v1.1.41 - 87G手游网...
  20. 如何撤销命令make install的安装结果,或者如何卸载Linux 库library ?

热门文章

  1. 捋一捋Python中的List(上)
  2. ACM——01——1003: 【入门】求任意三位数各个数位上数字的和 【运算符】
  3. 咖说 | 哪怕遭受攻击,DeFi协议也很快能“春风吹又生”?
  4. 企业开票信息税号查询接口不是万能的
  5. 一些可供参考的游戏出海技术架构与经验总结
  6. php dingo和jwt,laravel dingo/api添加jwt-auth认证
  7. 16S多样性测序,到底该选啥引物?!
  8. python爬房源信息_Python爬取链家二手房源信息
  9. java 生成格林威治时间
  10. 人、机客户服务质量 - 实时透视分析