【项目01】 商铺数据加载及存储

文件可以在–我的资源列表下载,我设置的免费,后台给我加到1的

1.作业要求:

1、成功读取“商铺数据.csv”文件
2、解析数据,存成列表字典格式:[{‘var1’:value1,‘var2’:value2,‘var3’:values,…},…,{}]
3、数据清洗:
① comment,price两个字段清洗成数字
② 清除字段缺失的数据
③ commentlist拆分成三个字段,并且清洗成
4、结果存为.pkl文件

2.商铺数据情况

用excl打开


用记事本打开

完整代码为:

import os
os.chdir('D:/桌面/')
f = open('商铺数据.csv','r',encoding = 'utf8')#清洗comment数据
def fcm(s):if '条' in s:return(int(s.split(' ')[0]))else:return('缺失数据')#清洗price数据
def fpr(s):if '¥' in s:return(s.split('¥')[-1])else:return('缺失数据')#commentlist拆分成三个字段,并且清洗成数字,注意参量
def fcml(s):if len(s)==3:quality = float(s[0][3:])envi = float(s[1][3:])service = float(s[2][3:])return([quality,envi,service])else:print('缺失数据')
n=0
data = []
for line in f.readlines()[1:20]:str=line.split(',')classify = str[0]name = str[1]comment = fcm(str[2])star =str[3]price = fpr(str[4])address = str[5]quality = fcml(str[-1].split('                                '))[0]evi = fcml(str[-1].split('                                '))[1]service = fcml(str[-1].split('                                '))[2]n+=1if '缺失数据' not in []:data_lst = [['classify',classify],['name',name],['comment',comment],['star',star],['price',price],['address',address],['qualith',quality],['evi',evi],['service',service]]# data.append(dict(data_lst))data.append(dict(data_lst))print('%i条数据成功读取'%n)else:continue
f.close()import pickle
pic = open('C:/Users/Hjx/Desktop/data.pkl','wb')
pickle.dump(datalst,pic)
pic.close()
print('finished!')

3.代码实现

对整个作业的要求进行分析,结合所学内容,制定代码模块计划。
在数据清洗过程中需要构建三个函数,分别完成:清洗成数字和拆分片段。
对于csv文件,其特点为以‘,’分割,这就为数据单元的划分和取出提供了便利。划分的数据单元为列表。
对源csv文件,进行处理;

import os
f = open('D:/桌面/商铺数据.csv')
for i in f.readlines()[:10]:str = i.split(',')#此时,每一个数据为
美食 望蓉城老坛酸菜鱼(合生汇店) 我要点评 该商户暂无星级 人均                                        ¥125 翔殷路1099号合生汇5F 口味8.3                                环境8.4                                服务8.5

作业1 读取商铺数据

import os
f = open('D:/桌面/商铺数据.csv')
for i in f.readlines():print(i)

作业3 数据清洗-comment,price两个字段清洗成数字

首先观察comment数据情况,发现有效数据为整数,其他为无效数据。同时数据源中还存在空白数据。

def fcom(s):if '条' in s:str = s.split(' ')return(str[0])else:return('数据缺失')
清洗comment字段,用空格分段,选取结果list的第一个为点评数

def fpri(s):if '¥' in s:str = s.split('¥')[-1]return(str)else:return('数据缺失')
清洗price字段,用¥分段,选取结果list的最后一个为人均价格

作业3 数据清洗-commentlist拆分成三个字段,并且清洗成数字


def fcoml(s):if len(s)==3:quality = float(s[0][3:])envi = float(s[1][3:])service = float(s[2][3:])return([quality,envi,service])else:print('缺失数据')
#清洗commentlist字段,price字段用空格分段,分别清洗出质量、环境及服务数据

Python数据分析实战01-商铺数据的清洗和存储(附资源文件)相关推荐

  1. 【数据分析项目实战】商铺数据加载及存储

    ''' [项目] 商铺数据加载及存储要求: 1.成功读取"商铺数据.csv"文件 2.解析数据,存成列表字典格式:[{'var1':value1,'var2':value2,'va ...

  2. Python数据分析实战之股票数据

    最近股市比较火.我们就利用这篇文章简单介绍下用 python 对股票数据做个简单的分析.数据集是从1999年到2016年上海证券交易所的1095只股票. 共1000个文件. 我们的分析思路大致如下: ...

  3. Python数据分析实战——杭州租房数据统计分析

    本案例将租房网站上的杭州地区的租房数据作为参考,运用所学到的数据分析知识来分析真实数据,并以图表的形式得到以下指标: 统计每个区域的房源总数量. 使用条形图分析哪种户型数量最多.更受欢迎. 统计每个区 ...

  4. python数据分析实例_python数据分析实例3-商铺数据加载及存储

    商铺数据加载及存储 在data文件夹存放有商铺数据.csv文件,路径:path = '../data/商铺数据.csv' 要求: 1.成功读取"商铺数据.csv"文件,并展示打印出 ...

  5. Python项目实战 —— 01. 疾病预测结构化数据

    Python项目实战 Python项目实战--目录 Python项目实战 -- 01. 疾病预测结构化数据 一.背景 二.解题思路 三.数据分析 3.1 数据清洗 3.2 数据分析 3.2.1 相关系 ...

  6. Python数据分析实战(3)Python实现数据可视化

    文章目录 一.数据可视化介绍 二.matplotlib和pandas画图 1.matplotlib简介和简单使用 2.matplotlib常见作图类型 3.使用pandas画图 4.pandas中绘图 ...

  7. python电影数据分析报告_【python数据分析实战】电影票房数据分析(二)数据可视化...

    在上一部分<[python数据分析实战]电影票房数据分析(一)数据采集> 已经获取到了2011年至今的票房数据,并保存在了mysql中. 本文将在实操中讲解如何将mysql中的数据抽取出来 ...

  8. 2020互联网数据分析师教程视频 统计学分析与数据实战 r语言数据分析实战 python数据分析实战 excel自动化报表分析实战 excel数据分析处理实战

    2020互联网数据分析师教程视频 统计学分析与数据实战 r语言数据分析实战 python数据分析实战 excel自动化报表分析实战 excel数据分析处理实战

  9. Python数据分析实战基础 | 初识Pandas

    这是Python数据分析实战基础的第一篇内容,主要是和Pandas来个简单的邂逅.已经熟练掌握Pandas的同学,可以加快手速滑动浏览或者直接略过本文. 01  重要的前言 这段时间和一些做数据分析的 ...

  10. Python数据分析实战学习

    Python数据分析实战学习\displaystyle\boxed{Python数据分析实战学习}Python数据分析实战学习​ AprilJulyOctober2015AprilJulyOctobe ...

最新文章

  1. android图片素材參考
  2. dede首页调用文章标题|概述|所在栏目
  3. 短视频SDK架构设计,短视频APP开发目标首选
  4. Hadoop—常见面试题
  5. Java 并发---ConcurrentHashMap
  6. 网路工程师要不要学mysql_网络工程师要学什么_网络工程师需要的技能
  7. 分类算法之朴素贝叶斯算法
  8. (九)ubuntu解决resolv.conf被重写问题
  9. 如何C语言编程二维数组五位学生总分,C语言编程题(有关二维数组的循环的)...
  10. 关于mysql数据库在输入password后,滴的一声直接退出界面的解决的方法(具体办法)...
  11. 2017年12款小型企业的最佳杀毒软件 你知道几个?
  12. Data URI scheme
  13. 集成系列:低代码对接泛微e-cology
  14. cJSON 轻量级json解析器 速度快
  15. Intellij IDEA 2018 安装和破解
  16. rad xe 5 使用教程_使用Rad轻松实现React在线样式
  17. Android的LogCat的使用
  18. 性能测试工具的 Coordinated Omission 问题
  19. 极路由系列 刷机方法
  20. 计算机符号系统c,附录c符号计算系统mathematica的.doc

热门文章

  1. 携手业内专家赋能AI时代--EpiK铭识协议发起开源知识运动
  2. 数显之家快讯:【SHIO世硕心语】古有《陋室铭》,现有《群之铭》!
  3. PHP解决抢购、秒杀、抢楼、抽奖等阻塞式高并发库存防控超量的思路方法
  4. 数据分析 | 数据预处理(归一化和标准化)
  5. C语言基础学习——基本数据类型(char型)
  6. 直接从国家统计局上找数据,并分析人口数据变化,做成可视化图
  7. 路由器的原理及其配置(一)
  8. 终结者2018java游戏_如何评价电影《终结者 2018》?
  9. NOIP2018:The First Step
  10. 怎么将pdf转换成word 三个简单妙招通通管用