# -*- coding: utf-8 -*-
# author:zjpimport numpy as np
import pandas as pddf1 = pd.DataFrame(pd.read_csv('E://azjp/data/example1.csv', header=0))
#DataFrame 的D和F要大写,header=0 指定列名所在行数
df2 = pd.DataFrame(pd.read_excel('E://azjp/data/example1.xlsx'))array = np.random.permutation(20)  #生成随机数列表
#df1.to_csv("D://df_test.csv", index=False)  #保存CSV文件,index=False表示不保存索引
df1.columns  #查看列名
df1.values  #查看数据表中的数值,以数组的形式返回,不包含表头信息
print(df1.info())  #查看数据表的整体信息,这里返回的信息比较多,包括数据维度、列名称、数据格式和所占空间等信息
'''
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 19 entries, 0 to 18
Data columns (total 7 columns):
分子公司    19 non-null object
片区      19 non-null object
服务站     19 non-null object
工程师     19 non-null float64
主任      19 non-null float64
新员工     19 non-null int64
总计       19 non-null float64
dtypes: float64(3), int64(1), object(3)
memory usage: 876.0+ bytes
'''
df1.describe() # 描述性统计(最大值最小值等等)
df1.head(3)  # 查看前三条数据
df1.tail(3)  # 查看后三条数据
df1a = df1.loc[((df1['engineer'] > 100) & (df1['director'] > 100)), :]  #条件判断与条件组合
df1['engineer'].dtype #查看数据格式的函数,可以一次性查看数据表中所有数据的格式,也可以指定一列来单独查看
df1['engineer'].isnull()  #检验空值的函数,返回的结果是逻辑值,包含空值返回True,不包含则返回False
df1['片区'].unique()  #Unique是查看唯一值的函数,只能对数据表中的特定列进行检查,返回的结果是该列中的唯一值
df1b = df1.dropna(how='any')  #删除有NA的样本
df1c = df1.fillna(value=0)  #0替换NA值
df1d = df1.fillna(df1['newemployees'].mean())  #该列的平均值替换NA
df1['engineer'] = df1['engineer'].map(str.strp)  # 清除字符串里的空格
df1['engineer'].astype(int)  #用来更改数据格式,将engineer字段的值修改为int格式
df1.rename(columns={'engineer': 'engineers'})
df1['engineer'].drop_duplicates(keep='last')  #删除重复值,设置keep='last'保留最后出现的重复值
df1['engineer'].replace('asd', 'brg')  #用brg替换asd

Python数据处理基础操作相关推荐

  1. 【python数据处理基础】--数据读取、清洗数据

    python 数据处理实战 目录 数据读取 选择特列 清洗数据 目录 随着网络数据的爆发式的增长,数据处理工作日益显示出它的重要性,我们的目的是从大量的杂乱无章的数据中找出对我们的工作有益的数据或者发 ...

  2. Python语音基础操作--4.3共振峰估计

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  3. Python语音基础操作--11.2基于GMM的说话人识别模型

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  4. Python语音基础操作--6.3ADPCM编码

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  5. Python语音基础操作--2.3声强与响度

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  6. Python语音基础操作--10.2隐马尔科夫模型的孤立字识别

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  7. 一次性掌握所有 Python 画图基础操作

    pythonpythonpython 画图介绍 嘿!彩蛋!感觉有帮助就三连呗! 本文以实用为第一目标,保证读者在看完此文之后可以迅速上手 pythonpythonpython 画图,掌握所有画图的基本 ...

  8. Python语音基础操作--5.1自适应滤波

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

  9. Python语音基础操作--10.1基于动态时间规整(DTW)的孤立字语音识别试验

    <语音信号处理试验教程>(梁瑞宇等)的代码主要是Matlab实现的,现在Python比较热门,所以把这个项目大部分内容写成了Python实现,大部分是手动写的.使用CSDN博客查看帮助文件 ...

最新文章

  1. 国家队基金押注,国内商用车ADAS龙头进军乘用市场
  2. Scrapy项目 - 数据简析 - 实现腾讯网站社会招聘信息爬取的爬虫设计
  3. 【物联网】WiFi基础知识
  4. HTML5 header元素
  5. 线性代数第九版pdf英文_《Linear Algebra Done Right》线性代数复习及部分习题解答(3.C)...
  6. linux java new date_Linux java Tomcat 项目中 new Date 获取时间 8小时 时差
  7. Ubuntu16.04安装显卡驱动错误及解决方案
  8. Java开发技术大杂烩(三)之电商项目优化、rabbitmq、Git、OSI、VIM、Intellj IDEA、HTTP、JS、Java...
  9. 选择排序是外面循环的array[i]与内循环的array[j]比较。冒泡排序是内循环的相邻两个值做比较修改...
  10. 奇怪的信 c语言 整数位数为偶数求和
  11. 鸿蒙3.0系统下载,鸿蒙os3.0系统官网版-华为鸿蒙os3.0下载官网手机版-66街机网
  12. Base64、32、16 编码解析
  13. DoS攻击原理和防御方法
  14. oracle oem登录xdb,XDB sys_nc_oid$递归调用的案例一则
  15. bzoj5369 [Pkusc2018]最大前缀和(状压dp)
  16. element tabs 的基础类型下划线不显示
  17. 【Android Studio】ImageView / ImageButton 图片太大或者太小解决方法
  18. 2021-2022上学期 奖状的清单
  19. Python pandas 筛选 Excel 特定行和列全集
  20. 利用PIL库创建空白图像

热门文章

  1. 受用一生的高效PyCharm使用技巧(三)
  2. 深度整形外科:使用手绘草图进行鲁棒且可控的图像编辑
  3. MySQL高级---04
  4. 如何在Linux系统中安装DBeaver通用数据库工具
  5. DCS任务编辑器文件无法正常加载,一直停在‘正在读取。。’
  6. 据说这些用来问一两年工作经验的人(吓死宝宝了)
  7. vlan的端口隔离及端口优化——“道高一尺魔高一丈”
  8. 【OpenCV】之LUT函数
  9. 【信奥赛一本通】 1413:确定进制(详细代码)
  10. gitlab mysql 配置_Gitlab安装配置及使用