爬取数据

从App Store官网拿下评论数据做分析

App Store评论API:
https://itunes.apple.com/rss/customerreviews/page=1/id=/sortby=mostrecent/json?l=en&&cc=cn

钉钉在App Store的评论API:
https://itunes.apple.com/rss/customerreviews/page=1/id=930368978/sortby=mostrecent/json?l=en&&cc=cn

打开后发现对我们有用的数据就只有用户评分、评论标题、评论内容:

这仅是第一页的评论,通过测试发现最多可以查看10页的评论。

将数据保存到excel:

import requests
import pandas as pd
POPULATION_EXCEL_PATH = '钉钉评论.xlsx'flag = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
urllist = []
for i in flag:url = f"https://itunes.apple.com/rss/customerreviews/page={i}/id=930368978/sortby=mostrecent/json?l=en&&cc=cn"urllist.append(url)
rating = []  # 评分
title = []  # 标题
content = []  # 内容
for url in urllist:res = requests.get(url)data = res.json()['feed']['entry']for i in range(len(data)):rating.append(data[i]['im:rating']['label'])title.append(data[i]['title']['label'])content.append(data[i]['content']['label'])
data = {'打分': rating, '标题': title, '内容': content}df = pd.DataFrame(data)
writer = pd.ExcelWriter(POPULATION_EXCEL_PATH)
df.to_excel(excel_writer=writer, index=True,encoding='utf-8', sheet_name='钉钉评论数据')
writer.save()
writer.close()

查看excel保存的数据(按评分高低排序后):

学习参考微信公众号:早起python

Python学习:Python分析钉钉评论(一)爬取数据相关推荐

  1. python爬虫实践-01-携程酒店评论的爬取

    0 关键 携程网其最大的特点就是:基本上所有的有效数据都是通过Ajax异步请求获取的.本博客的主要内容为: 构造Ajax请求,获得返回的reviews数据,由于返回的数据为JSON格式,很好分析 判定 ...

  2. Python爬虫实战使用scrapy与selenium来爬取数据

    系列文章目录 实战使用scrapy与selenium来爬取数据 文章目录 系列文章目录 前言 一.前期准备 二.思路与运行程序 1.思路 2.运行程序 三.代码 1.代码下载 2.部分代码 总结 前言 ...

  3. 212:Python学习之爬虫篇——用Json方法爬取某音乐网站任意歌手的歌单

    引言 人生苦短,我用Python.这两天在学爬虫的时候跟着做某音乐网站的歌单爬取,稍作修改,实现了对任意歌手的歌单进行爬取,这里只取前三页.这个项目比较简单,也没有对结果进行储存,稍作修改,可以实现更 ...

  4. Python学习笔记 Mc喊麦DJ网 爬取下载

    # ***********************下面开始写代码******************************* 保存数据内容=[] def pzcx(n,lx):# 获取随机网址访问u ...

  5. Python爬虫实战(三):定时爬取数据存入SqlServer

    目录

  6. Python之手把手教你用JS逆向爬取网易云40万+评论并用stylecloud炫酷词云进行情感分析

    本文借鉴了@平胸小仙女的知乎回复 https://www.zhihu.com/question/36081767 写在前面: 文章有点长,操作有点复杂,需要代码的直接去文末即可.想要学习的需要有点耐心 ...

  7. python爬取虎扑评论_Python爬取NBA虎扑球员数据

    虎扑是一个认真而有趣的社区,每天有众多JRs在虎扑分享自己对篮球.足球.游戏电竞.运动装备.影视.汽车.数码.情感等一切人和事的见解,热闹.真实.有温度. 受害者地址 https://nba.hupu ...

  8. python爬取豆瓣电影评论_python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法...

    def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 ( ...

  9. Python 学习 02 —— Python如何爬取数据

    文章目录 系列文章 二.Python 爬 虫 1.任务介绍 2.简介 3.基本流程 3.1.准备工作 3.1.1.分析页面 3.1.2.编码规范 3.1.3.导入模块 3.1.4.程序流程 3.2.获 ...

最新文章

  1. 2021牛客寒假算法基础集训营1 题解
  2. Dao设计模式(Data Access Object)
  3. objcopy的详细说明
  4. 读取文件:TypeError: an integer is required (got type str)
  5. iOS如何随意的穿插跳跃,push来pop去
  6. gflags调试访问越界
  7. 不使用java内置函数,将String字符串转换为int类型
  8. 源码安装的php如何启动脚本,PHP源码编译安装管理常用脚本
  9. java 全局返回码设计_服务返回码的设计
  10. idea 编译内存溢出
  11. mysql存储过程的一个小例子
  12. android 快速请求取消,Android OkHttp + Retrofit 取消请求的方法
  13. Android 四大组件 之 服务(Service)
  14. 微机大作业—— 24秒倒计时器
  15. ValueError: Variable in_hidden/weights already exists, disallowed. Did you mean to set reuse=True or
  16. 如何在服务器查看文件,如何在服务器地址上查看文件夹
  17. 【本人秃顶程序员】美女程序员观点:程序员最重要的非编程技巧
  18. Redis底层数据结构详解(一)
  19. Keil uVision5软件的操作与编写基础(入门)
  20. 我的世界服务器物品栏变小了,我的世界如何改变物品大小 | 手游网游页游攻略大全...

热门文章

  1. 胶囊网络(CapsulesNet)理解
  2. python狗品种识别_kaggle之本地运行识别狗品种
  3. 李沐动手学深度学习V2-实战Kaggle比赛:狗的品种识别(ImageNet Dogs)和代码实现
  4. 旷野徒奔-Java底层篇(1.3)
  5. 【算法•日更•第十五期】信息奥赛一本通1594:涂抹果酱题解
  6. docker live-restore
  7. 实力亲测 | 如何用云盾WAF做漏洞急救
  8. python3安装win32api
  9. 51单片机ROM和RAM
  10. python画图大全_python画图教程