大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧。可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团网相关数据,以一个消费者的角度去分析如何选择店铺。

数据获取与说明

本文将基于重庆市火锅数据进行分析,为啥是重庆的火锅,除了辣之外还因为其他城市的火锅店数量相比重庆的火锅店数量就是小巫见大巫。

除此之外,相信重庆人民对于火锅的评价会更加地道,所以我们打开重庆市美团网选择火锅进入店铺列表。接下来的操作就和之前类似了:F12—>找到数据包—>requests请求数据—>pandas清洗。

但是本文需要爬取两层数据,首先需要在店铺列表取得店铺id、店铺名和销量等相关数据,第二步还需要根据刚刚的店铺id进入每一个店铺请求评论数据,相关代码如下:

for k in url_list:
    url = k
    r = requests.get(url,headers = headers,proxies=proxies)
    data = r.json()['data']['poiInfos']
    for i in range(len(data)):
        ID = data[i]['poiId']
        biaoti = data[i]['title']
        junfen = data[i]['avgScore']
        pingjia = data[i]['allCommentNum']
        dizhi = data[i]['address'][0:3]
        junjia = data[i]['avgPrice']
        youhui = 1 if len(data[i]['dealList']) > 0 else 0
        df.loc[s] = [ID,biaoti,junfen,pingjia,dizhi,junjia,youhui]
        s = s + 1

来看下最终爬取并清洗完毕的数据,经过提取共有评论数据、店铺基本信息数据、评论标签数据

重庆火锅哪家强,Python 帮你探探店相关推荐

  1. 重庆火锅哪家强,Python帮你探探店

    前言 大家好,随着国内疫情逐步好转,一些美食店铺又渐渐开张了,疫情结束你最想吃什么?来一顿痛快的火锅肯定是少不了的活动吧.可是对于选择困难症的我来说,吃饭一小时,挑店一下午,所以今天本文将再次爬取美团 ...

  2. 1032 挖掘机技术哪家强 python

    为了用事实说明挖掘机技术到底哪家强,PAT 组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第 1 行给出不超过 105 的正整数 N,即参赛人数.随后 N  ...

  3. 1032 挖掘机技术哪家强 Python实现

    1032 挖掘机技术哪家强(20)(20 分) 为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过10 ...

  4. python数据结构与算法40题_Python数据结构与算法刷题(2)——挖掘机技术哪家强...

    前言 前文传送门: 正文 为了用事实说明挖掘机技术到底哪家强,PAT组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第1行给出不超过105的正整数N,即参赛人 ...

  5. php教程分享六星教育分享,要问PHP教程哪家强,六星教育来帮你忙!

    原标题:要问PHP教程哪家强,六星教育来帮你忙! 很多人学习PHP编程的时候,都不知道如何去选择合适的PHP教程.六星教育最近新推出PHP大神进阶班,专门针对需要技术进阶的同学,假如你具备1.2年的工 ...

  6. 【小盐巴学习笔记】—美团吃饭哪家强?Python词云分析告诉你

    [小盐巴学习笔记]-美团吃饭哪家强?Python词云分析告诉你 效果图 前言 一.爬虫分析 1.分析网址 2.分析数据 二.完整代码 1.爬取美团牛排店评论 2.绘制词云图 3.词云分析 总结 效果图 ...

  7. 腾讯课堂Python课程哪家强?

    腾讯课堂Python课程哪家强? 文章目录 腾讯课堂Python课程哪家强? 一.前言 二.数据读取和数据预处理 1.数据读取 2.数据处理 三.有多少人愿意花钱学Python? 四.多少价位的课买的 ...

  8. 【Python】1032 挖掘机技术哪家强 (20 分)

    为了用事实说明挖掘机技术到底哪家强,PAT 组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第 1 行给出不超过 10 ​5 ​​ 的正整数 N,即参赛人数. ...

  9. PAT1032挖掘机技术哪家强(Python和C)

    简单模拟 为了用事实说明挖掘机技术到底哪家强,PAT 组织了一场挖掘机技能大赛.现请你根据比赛结果统计出技术最强的那个学校. 输入格式: 输入在第 1 行给出不超过 105的正整数 N,即参赛人数.随 ...

最新文章

  1. JavaScript表达式--掌握最全的表达式,一切尽在掌握中,让表达不再是难事
  2. printf不能直接输出string类型
  3. UVA690 Pipeline Scheduling 流水线调度
  4. Zabbix3.0 安装Graphtree
  5. Android+Jquery Mobile学习系列(8)-保单/生日提醒功能
  6. 升级Tornado到4后weibo oauth登录不了
  7. 【NLP】蓦然回首:谈谈学习模型的评估系列文章(一)
  8. python ctypes实现api测试_Windows下通过Python 3.x的ctypes调用C接口
  9. PHP删除字符串最后一个字符的几种方法总结
  10. Java源码阅读--任重而道远(lang)
  11. CTF supersqli
  12. 阿里云云安全理工程师认证 部分题目 ACA
  13. poj3347——正方形覆盖(区间覆盖)
  14. uoj#750-[UNR #6]小火车【二分,折半,鸽笼原理】
  15. U3D里Humanoid动画系统问题与解决
  16. iOS开发 - 新特性的坑之应用字体根据系统字体大小而变化
  17. CAD引线标注文字大小怎么调整?
  18. ubuntu17.10键盘背光灯以及鼠标无效的问题
  19. 计算机win7卡顿如何解决方法,win7电脑运行很慢很卡怎么办
  20. 万般皆下品惟有读书高,面试各种后的领悟

热门文章

  1. python-zip方法
  2. PCB中英对照一、 综合词汇
  3. 保点发布RFID鲜肉跟踪方案
  4. JAVA IO系列----ObjectInputStream和ObjectOutputStream类
  5. 在gluster中配置distributed 卷
  6. ASP.NET伪静态 UrlRewrite(Url重写) 实现和配置
  7. 一次Nginx负载均衡的安装与配置
  8. MySQL数据库同步神器 - Gravity - 比Datax好用
  9. 面试官系统精讲Java源码及大厂真题 - 30 AbstractQueuedSynchronizer 源码解析(上)
  10. 3、MapReduce详解与源码分析