这是06年的建模题目中的excel文件,我想这用python处理一下,只需要获取出版社代码为P115的数据,所以需要筛选。

Paste_Image.png

1、首先我先选择我所需要的那八行数据

'出版社代码'

'出版社在您心中的位置'

'学科类别',

'定价'

'教材内容新颖,保持学术前沿水平'

'教材的作者是相应领域的权威,所以课程理论基础扎实'

'教材印刷及排版质量'

'教材价格'

2、以P115为键值进行筛选

Paste_Image.png

3、获取我们所需要的数据

使用df=Datafram(data,columns=[])#data的是原数据,coulumns是我们所需要的索引,df是一个新的pandas的对象。

Paste_Image.png

一般列数较大的话我用的pycharm显示不出来,所以其余的部分在下面是完整的。

4、然后进行下一布以某一列数据进行排序

data1=data1.sort_values(by='学科类别')

Paste_Image.png

Paste_Image.png

over 排序完成

接下来就可以用这些数据画图然后看看这些东西互相是怎么个关系

所有代码在这里,挺简单的,换一个别的东西随便就可以用了

import xlrd

import pandas as pd

import xlwt

for i in range(2001,2006):#处理从2001年到2005年的数据

string=str(i)#转化成字符串

data = pd.read_excel('附件2_问卷调查数据(五年).xls',sheetname=string)#pandas读取excel的函数

if (i == 2001) or (i == 2002) or (i == 2005):#为什么这里要用if语句呢,因为我得到的excel文本,有两个sheet的想要索引的

df = data[data.出版社代码 == 'P115']#字符有不一样的,一个前面有空格一个前面没有空格

else:

df=data[data.出版社代码== ' P115']

#下面这个语句是以这键值重新组合成一个pandas,以columns里的为索引

data1=pd.DataFrame(df,columns=['出版社在您心中的位置','学科类别','定价','教材内容新颖,保持学术前沿水平','教材的作者是相应领域的权威,所以课程理论基础扎实','教材印刷及排版质量','教材价格'])

print(df)

data1=data1.sort_values(by='学科类别')#sort是以学科类别为标准排序

data1.to_excel(string+'.xls',sheet_name='string', encoding='utf-8')

#储存到当前目录下,但是有一点我不知道可不可以做好,这个可以储存到五个excel里面,但是我弄不出来把他们放到一个excel

# 里面的五个标签页里,好气啊

介绍个利器:

df.课程名称.str.len()<3

这个表示所有这一个列表的字符串长度不超过3

几天后简化的版本

import pandas as pd

for i in range(2001,2006):

df = pd.read_excel('重新处理.xls',sheetname=str(i))

df['课程名称'] = df['课程名称'].astype(str)#转换类型

df=df[(df.教材获得方式 == 1)&(df.是否为旧书 == 1)&(df.课程名称<='72')&(df.课程名称>='0')]

df=pd.DataFrame(df,columns=['A出版社在您心中的位置','课程名称','学科类别','教材内容新颖,保持学术前沿水平','教材的作者是相应领域的权威,所以课程理论基础扎实','教材印刷及排版质量','教材价格'])

df = df.sort_values(by='课程名称')#排序

df=df.reset_index(drop=True)#重建索引

df.to_excel(str(i)+'.xls',sheet_name='string', encoding='utf-8')#保存文件

一些其他的代码,不用看了

import pandas as pd

import numpy as np

A=[]

for x in range(2001,2006):

Z=[]

X=[]

df = pd.read_excel('满意度新.xlsx',sheetname=str(x))

X = df.课程名称.value_counts()

df=df[df.出版社代码=='P115']

df = df.reset_index(drop=True) # 重建索引

Z=df.课程名称.value_counts()

for i in range(1, 73):

try:

print(X[i])

except KeyError:

X[i] = 100000000

print(X[i])

for i in range(1,73):

try:

print(Z[i])

except KeyError:

Z[i]=0

print(Z[i])

for i in range(1, 73):

A.append((Z[i]/X[i])*100)

print(A)

A=np.array(A).reshape(72,5)

A=pd.DataFrame(A)

A.to_excel('占有率新的.xls')

# for i in range(1,73):

# Z.append(list(df[df.课程名称 == i].mean()))

# Z=pd.DataFrame(Z)

# Z=Z.fillna(0)

# Z.to_excel(str(x) + 'p115满意度.xls', sheet_name='string', encoding='utf-8') # 保存文件

#

python怎么筛选excel数据_python 利用pandas处理excel数据(获取特定值,排序,筛选)...相关推荐

  1. python pandas excel数据处理_Python利用pandas处理Excel数据的应用

    python如何将列表导出为csv文件 import pandas as pd list=[[1,2,3],[4,5,6],[7,8,9]] column=['column1','column2',' ...

  2. Python实现大学绩点计算——利用pandas对excel处理

    Python实现大学绩点计算--利用pandas对excel处理 pandas处理excel pandas读取excel pandas创建新的excel 编写代码计算大学绩点 更新时间 pandas处 ...

  3. python 将excel文件转换为txt文件_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

  4. python excel文件转换成字符串_python利用pandas将excel文件转换为txt文件的方法

    python将数据换为txt的方法有很多,可以用xlrd库实现.本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件. 直接上代码: ''' function:将 ...

  5. pandas 排序 给excel_python 利用pandas处理excel数据(获取特定值,排序,筛选)

    这是06年的建模题目中的excel文件,我想这用python处理一下,只需要获取出版社代码为P115的数据,所以需要筛选. Paste_Image.png 1.首先我先选择我所需要的那八行数据 '出版 ...

  6. python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例

    功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...

  7. python pandas处理excel 统计数据_python使用pandas处理excel数据

    使用Python Pandas库读取excel文件(.xlsx, .xls). 使用pandas的 read_excel()方法来读取excel数据,可以读取第一个sheet,指定的sheet,多个s ...

  8. python怎么读取石墨表格_Python用Pandas读写Excel

    Pandas是python的一个数据分析包,纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速便捷地处理数据的函数和方法. 读者福利,也有安装包 ...

  9. c语言读取excel表格_利用pandas处理excel表格

    这不是一篇详细介绍pandas的文章,只是我在利用python处理excel表格时找到的一些临时方案,为了避免忘记,记录在这里,也可能对你有帮助. pandas在对excel处理上使用的是xlrd和x ...

  10. 利用Pandas拆分Excel的单元格为多行并保留其他行的数据

    利用Pandas拆分Excel的单元格为多行并保留其他行的数据 1. 需求 2. Pandas解决需求 2.1 准备工作 2.2 Python程序执行 3. Pandas实现需求过程详解 3.1 碎碎 ...

最新文章

  1. 史玉柱:10个企业管理智慧,成功的企业都这么做
  2. java文字转语音支持ubuntu系统_9个(实时)语音转文字APP分享(推荐收藏)
  3. [emacs] python代码折叠
  4. linux vfs open函数,Linux VFS中open系统调用实现原理
  5. Mysql 中 delete 与 left join 的问题
  6. BAT架构师进阶:大型网站架构书籍推荐
  7. MATLAB教程(1) MATLAB 基础知识(4)
  8. Python部分知识点
  9. JS实现鼠标点击展开/隐藏表格行
  10. python调用外部程序 退出_Python调用外部程序——os.system()和subprocess.call
  11. UMLChina公众号文章精选(20220821更新精选)
  12. 驾培行业现状改革创新探索互联网+品牌服务模式
  13. 在简历中使用STAR法则
  14. Python IDLE编写代码 输入反斜杠\显示为人民币符号¥
  15. Mybatis中用到的设计模式
  16. 浅谈4款低功耗电流测试“神器”
  17. Bash cp 命令详解
  18. 时序逻辑电路实践练习1
  19. jq和js的关系_jQuery与JavaScript有什么关系?
  20. 基因数据处理5之GRCH38数据源和查看信息

热门文章

  1. 微信网页版(在电脑上聊微信)
  2. 数据结构、栈和队列、树和二叉树
  3. win10如何开启自带虚拟机
  4. C语言——设置flag的优点
  5. C#多线程和线程池 【转】
  6. 永中word页码怎么从第二页开始_Word文档”双面打印“全攻略,解决打印难题!...
  7. html编辑中,出现报错 semi-.colon excepted css(………)
  8. 智能插帧,打造丝滑视频体验
  9. 视频插帧论文阅读(一)——FLAVR
  10. 服务器虚拟化有什么好处