Python实验、Pandas数据处理与分析

1、内容

1、程序题
现有如下表格数据,请对该数据进行以下操作:
(1)创建一个结构如上图所示的 DataFrame 对象。
(2)将图中的 B 列数据按降序排序。
(3)将排序后的数据写入到 CSV 文件,取名为 write_data.csv。
2、程序题
现有如下图所示的两组数据,其中 A 组中 B 列数据存在缺失值,并且该列
数据为 int 类型,B 组数据均为 str 类型。
(1)使用 DataFrame 创建这两组数据。
(2)使用 B 组的数据对 A 组中的缺失值进行填充,并保持数据类型一致。
(3)将合并后 A 组中索引名为 key 的索引重命名为 D。
3、北京租房数据统计分析
(1)读取链家北京租房数据;
删除数据中的重复值和缺失值;
将“户型”一列统一调整为“x 室 x 厅”格式;
将“面积”一列调整为数值格式;
使用箱形图检查“面积”和“价格”列中是否存在异常数据;
使用“区域”和“小区名称”新增“位置”一列,形如“北京市 xx 区 xx”;
(2)对“户型”、“面积”和“价格”以及每平米价格等信息进行简要的
统计分析,如每平米价格的最大值、最小值、平均值,“面积”的分箱区间统计,
“户型”的种类统计等

2、源代码清单

1、程序题

import pandas as pd
df_example=pd.DataFrame({'A':[1,2,7,3], 'B':[5,2,4,0], 'C':[8,4,2,5],'D':[8,9,3,2]}) df_example=df_example.sort_values(by='B',ascending=False)
print(df_example)
df_example.to_csv(r'E:\实验数据\write_data.csv',index=False)

2、程序题

import numpy as np
import pandas as pd
group_A=pd.DataFrame({'A':[2,3,5,2,3], 'B':[5,np.nan,2,3,6], 'C':[8,7,50,8,2], 'key':[3,4,5,2,5]},dtype=int)
group_B=pd.DataFrame({'A':[3,4,5], 'B':[3,4,5], 'C':[3,4,5]},dtype=str)
com=group_A.combine_first(group_B)
com.rename(columns={'key':'D'},inplace=True)
print(com)

3、北京链家数据分析

(1)读取链家北京租房数据;
import pandas as pd
import numpy as np
import seaborn as sns
file = open(r'E:\实验数据\链家北京租房数据.csv')
data=pd.read_csv(file)
print(data)
#删除数据中的重复值和缺失值
data.drop_duplicates()
#将“户型”调整为“X室X厅”格式
data['户型']=data['户型'].str.replace('房间','室')
print(data['户型'])
#将“面积”一列调整为数值格式
data['面积(㎡)'] = data['面积(㎡)'].map(lambda x: str(x)[:-2])
data['面积(㎡)']=data['面积(㎡)'].apply(pd.to_numeric)
data['面积(㎡)']=data['面积(㎡)'].astype(dtype='int')
print(data['面积(㎡)'].dtypes)
#使用箱型图检查“面积”和“价格”列中是否存在异常数值
data.boxplot(column=['价格(元/月)','面积(㎡)'])
#使用“区域”和“小区名称”新增“位置”一列,形如“北京市 xx 区 xx”
data['位置'] = '北京市'+data['区域'].map(str)+'区'+data["小区名称"].map(str)
print(data)
(2)对“户型”、“面积”和“价格”以及每平米价格等信息进行简要的统计
分析,如每平米价格的最大值、最小值、平均值,“面积”的分箱区间统计,“户
型”的种类统计等。
price_static1=np.mean(data['价格(元/月)']/data['面积(㎡)'])
price_static2=np.max(data['价格(元/月)']/data['面积(㎡)'])
price_static3=np.min(data['价格(元/月)']/data['面积(㎡)'])
area_static=pd.cut(data['面积(㎡)'],bins=25).value_counts()
house_type_count=data.groupby('户型')
print('每平米价格平均值',price_static1)
print('每平米价格最大值',price_static2)
print('每平米价格最小值',price_static3)
print('面积的分箱区间统计结果:\n',area_static)
print('北京链家现有户型种类及数量为:',house_type_count['户型'].count())

Python实验、Pandas数据处理与分析相关推荐

  1. Python+大数据-数据处理与分析-pandas快速入门

    Python+大数据-数据处理与分析-pandas快速入门 1.Pandas快速入门 1.1DataFrame和Series介绍 1)DataFrame 用来处理结构化数据(SQL数据表,Excel表 ...

  2. Python+大数据-数据处理与分析(三)-数据清洗

    Python+大数据-数据处理与分析(三)-数据清洗 1. 数据组合 1.1 数据聚合简介 在动手进行数据分析工作之前,需要进行数据清理工作,数据清理的主要目标是: 每个观测值成一行 每个变量成一列 ...

  3. 轩小陌的Python笔记-Pandas 数据处理

    Pandas 数据处理 一.数据IO操作 pandas IO操作主要是读取和写入有特定格式的文件,如CSV文件.TXT文件: # 本质上pd.read_csv和pd.read_tablepd.read ...

  4. 【Python】Pandas数据挖掘与分析时的常用方法

    今天我们来讲一下用Pandas模块对数据集进行分析的时候,一些经常会用到的配置,通过这些配置的帮助,我们可以更加有效地来分析和挖掘出有价值的数据. 数据集的准备 这次我们需要用到的数据集是广为人所知的 ...

  5. python多光谱遥感数据处理、图像分类、定量评估及机器学习方法

    普通数码相机记录了红.绿.蓝三种波长的光,多光谱成像技术除了记录这三种波长光之外,还可以记录其他波长(例如:近红外.热红外等)光的信息.与昂贵.不易获取的高光谱.高空间分辨率卫星数据相比,中等分辨率的 ...

  6. 基于python多光谱遥感数据处理、图像分类、定量评估及机器学习方法

    普通数码相机记录了红.绿.蓝三种波长的光,多光谱成像技术除了记录这三种波长光之外,还可以记录其他波长(例如:近红外.热红外等)光的信息.与昂贵.不易获取的高光谱.高空间分辨率卫星数据相比,中等分辨率的 ...

  7. 基于 python 多光谱遥感数据处理、图像分类、定量评估及机器学习方法

    普通数码相机记录了红.绿.蓝三种波长的光,多光谱成像技术除了记录这三种波长光之外,还 可以记录其他波长(例如:近红外.热红外等)光的信息.与昂贵.不易获取的高光谱.高空间分辨 率卫星数据相比,中等分辨 ...

  8. python subplot_气象编程 | 一个简单的风数据处理和分析案例(Python版)

    添加新云天气象小编微信或QQ:130188121,及时获取或发布气象升学.就业.会议.征稿及学术动态信息!最新热点文章:行业动态 | 2020中国气象现代化建设科技博览会行业动态 | "远征 ...

  9. 使用python和pandas进行同类群组分析

    背景故事 (Backstory) I stumbled upon an interesting task while doing a data exercise for a company. It w ...

  10. python从2 1 2 2 2 63_Python从零开始第三章数据处理与分析python中的dplyr(2)

    目录 第二章(pandas) Python从零开始第三章数据处理与分析python中的dplyr(2) =============================================== ...

最新文章

  1. python2 python3编码_Python2和Python3编码问题-从底层出发
  2. 【C 语言】文件操作 ( 文件加密解密 | 加密解密原理 | 对称加密 | 非对称加密 | 散列函数 )
  3. 图像处理与计算机视觉:基础,经典以及最近发展(4)图像处理与分析
  4. [z]IE6各种不兼容问题
  5. 帝国cms纯php调用,帝国CMS模板中:使用php调用最新文章的代码(非灵动和万能标签)...
  6. JavaScript类型转换的有趣应用
  7. .NET Core 3.0中的新功能和增强功能
  8. Axure高保真移动端智能数据监控+用户画像+饼状图+条形图+折线图数据统计+抖音直播app用户数据统计+智慧移动端主播粉丝、评论、播放量大数据统计+套餐购买、续费套餐prd流程
  9. vs2010 打开 vs2012 的解决方案
  10. Caused by: org.apache.ibatis.ognl.OgnlException: source is null for getProperty(null, mil_id)
  11. 我关于读书的一点小体会
  12. 小甲鱼鱼c论坛python作业_[全套55讲]鱼C论坛小甲鱼Python课后题试题.doc
  13. devexpress gridview属性详细(全部属性以及常用属性)
  14. 基于Html+Css+javascript的体育网站
  15. 高精度定位赋能行业创新,Petal Maps Platform 创新地图平台能力
  16. 智慧城市(大数据,物联网,云计算之应用)
  17. 计算机科学丛书之第9章和第10章代码
  18. 2022.12.23-Python100day-day05-面向对象编程
  19. java中正则表达式Pattern与Matcher类使用详解(find、group)
  20. Win10家庭版组策略打不开怎么办

热门文章

  1. 卡耐基的这100句话,畅销85年,改变了很多人
  2. 如何转型成为数据分析师
  3. [Linux 驱动] -- 电源管理芯片之 Regulator 用法 与具体使用实例
  4. 013 两个重要极限之一
  5. ui界面设计是什么:ui设计常用软件
  6. 关于Win10系统-svchost大量占用网速及自动更新问题——完美解决
  7. EMUI10安装java_速升级!荣耀Play推EMUI 9.1正式版更新:方舟编译器和EROFS系统来了 - IT之家...
  8. Python 爬虫——爬取文章自动发送QQ群
  9. 隧道炉检测,工业烤箱第三方检测
  10. SQL数据库快照删除