python爬取携程旅游景点评论

爬取网址:https://you.ctrip.com/
爬取评论全部代码

import requests
import json
import re
import time
import pandas as pd# 转换毫秒时间戳 1.转换成localtime 2.转换成新的时间格式(精确到秒)
def trans(timestamp):time_local = time.localtime(int(timestamp) / 1000)dt = time.strftime("%Y-%m-%d %H:%M:%S", time_local)return dt
# 75595 故宫
# 76613 恭王府
view_list = [['75595','故宫'],#['76613','恭王府'],#['75597','颐和园'],#['75599','天坛'],#['76625','圆明园'],# ['75598','北海公园'],
]
for data in view_list:time_list = []content_list = []name_list = []score_list = []for x in range(500):x = x + 1url = "https://m.ctrip.com/restapi/soa2/13444/json/getCommentCollapseList"payload = {"arg":{"channelType":2,"collapseType":0,"commentTagId":0,"pageIndex":x,"pageSize":1000,"poiId":data[0],"sourceType":1,"sortType":3,"starType":0},"head":{"cid":"","ctok":"","cver":"1.0","lang":"01","sid":"8888","syscode":"09","auth":"","xsid":"","extension":[]}}headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4173.2 Safari/537.36','cookie': '_RSG=AcK9V_YEBG7ur9DSkpbO1A; _RGUID=740b3a2f-df25-498a-a058-973b9c349d78; _RDG=281b4b8ffa2be023af3024778c85d3535f; _ga=GA1.2.2094831093.1618393109; MKT_CKID=1618393108670.2qaku.gj3w; ibulanguage=CN; ibulocale=zh_cn; cookiePricesDisplayed=CNY; Union=OUID=index&AllianceID=4897&SID=155952&SourceID=&createtime=1621216936&Expires=1621821735909; MKT_OrderClick=ASID=4897155952&AID=4897&CSID=155952&OUID=index&CT=1621216935915&CURL=https%3A%2F%2Fwww.ctrip.com%2F%3Fsid%3D155952%26allianceid%3D4897%26ouid%3Dindex&VAL={"pc_vid":"1618393095351.3issth"}; _RF1=203.93.121.22; MKT_CKID_LMT=1621216935930; _gid=GA1.2.232947876.1621216936; MKT_Pagesource=PC; StartCity_Pkg=PkgStartCity=2; GUID=09031023113948444957; _abtest_userid=8ffeb95c-a3d5-4a29-9b98-d8b1e37c1495; intl_ht1=h4=1_375126; __utma=1.2094831093.1618393109.1621225649.1621225649.1; __utmc=1; __utmz=1.1621225649.1.1.utmcsr=ctrip.com|utmccn=(referral)|utmcmd=referral|utmcct=/; __utmt=1; __utmb=1.1.10.1621225649; nfes_isSupportWebP=1; _gat=1; appFloatCnt=2; _bfs=1.7; _bfa=1.1618393095351.3issth.1.1621216932364.1621225645294.3.20; _bfi=p1%3D290510%26p2%3D290510%26v1%3D20%26v2%3D19; _jzqco=%7C%7C%7C%7C1621216936294%7C1.1123308241.1618393108722.1621225749459.1621225775042.1621225749459.1621225775042.undefined.0.0.8.8; __zpspc=9.3.1621225651.1621225775.6%232%7Cwww.baidu.com%7C%7C%7C%25E6%2590%25BA%25E7%25A8%258B%25E7%25BD%2591%7C%23','referer': 'https://detail.tmall.com/','Content-Type': 'text/plain'}response = requests.request("POST", url, headers=headers, data=json.dumps(payload)).texthtml1 = json.loads(response)# print(html1)comments = html1['result']['items']try:for i,element in enumerate(comments):# print(i,element)result = re.findall(r'([0-9]+)',element["publishTime"])# print(time[0])time_list.append(trans(result[0]))content_list.append(element['content'])name_list.append(data[1])score_list.append(element['score'])except:print('{}无数据了'.format(data[1]))break# print(i,x,element['content'])# time = re.findall(r"(.+?)",element["publishTime"])# print(i,time)time_df = pd.DataFrame(time_list,columns=['评论时间'])content_df = pd.DataFrame(content_list,columns=['评论内容'])name_df = pd.DataFrame(name_list,columns=['景点'])score_df = pd.DataFrame(score_list,columns=['用户评分'])pd.concat([time_df,name_df,score_df,content_df],axis=1).to_excel('{}数据.xlsx'.format(data[1]))

代码运行结果

python 爬取携程旅游景点评论相关推荐

  1. python爬取携程旅游评价信息词云图分析

    python爬取携程旅游评价信息词云图分析 前言 前面咱们已经分析过如何爬取携程旅游的相关信息,如果没有看过的,可以先跳转看一下前面的那篇博客:python 爬虫 一键爬取携程旅游团数据 这一篇呢,咱 ...

  2. python爬取携程景区用户评论

    python爬取携程景区用户评论(爬虫时遇到翻页但url不变问题时的解决办法) python爬取携程景区用户评论 Ajax页面加载的页面和普通页面的不同 解决办法 效果 python爬取携程景区用户评 ...

  3. python爬携程上出境游数据_python爬取携程旅游评价信息词云图分析

    python爬取携程旅游评价信息词云图分析 前言 前面咱们已经分析过如何爬取携程旅游的相关信息,如果没有看过的,可以先跳转看一下前面的那篇博客:python 爬虫 一键爬取携程旅游团数据 这一篇呢,咱 ...

  4. python 携程登陆,Python爬取携程信息

    python爬取携程景点评论信息 今天要分析的网站是携程网,获取景点的用户评论,评论信息通过json返回API,页面是这个样子的 按下F12之后,F5刷新一下 具体需要URL Request的方式为P ...

  5. python爬取携程机票并发送过滤后的机票信息到指定邮箱

    0x0 前言 在疫情发生之前,在知乎上刷到一个回答,说是用服务器实现一个自动爬取机票并将过滤后的机票信息发送到自己的邮箱中,感觉十分有趣.由于疫情原因无法返校,加上家和学校相隔接近3000公里,再加上 ...

  6. python中飞机票购买程序_「最低折扣机票查询」Python 爬取携程所有机票找出最低折扣机票,让你无忧回家过年 - seo实验室...

    最低折扣机票查询 前言 对于平时出行大多数人都是选择坐高铁,当然了如果这是对于距离比较近的行程是最划算的,如果对于路途长远的人言,提前购买飞机票价格可能比高铁票更加的便宜,如果我们可以爬取机票数据并分 ...

  7. Python爬取携程机票代码实例

    Python爬取携程机票代码实例 现在携程的页面是通过接口传递数据的,不能直接使用xpath进行解析,需要模拟调用接口的步骤 dcity是指出发地的城市编码 acity是指目的地的城市编码 其他参数是 ...

  8. python爬取携程酒店信息_不写代码玩转爬虫实例(3) - 抓取携程酒店信息

    背景需求 有不少朋友问永恒君携程网站的酒店信息怎么抓取,今天这篇文章来分享一下使用web scraper来快速实现抓取携程酒店信息. 例如,在携程官网搜索北京 密云水库的酒店信息, 可以搜索到非常多的 ...

  9. python 携程_python爬取携程和蚂蜂窝的景点评论数据\python爬取携程评论数据\python旅游网站评论数...

    本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.同时欢迎加入社交媒体数据交流群:99918768 前言 为 ...

最新文章

  1. flash player10.1 + FMS4中的p2p功能
  2. 下载linux操作系统一般的初始账号密码(虚拟机)
  3. linux oracle新建监听,linux 下 oracle图形界面(需配置监听,创建实例)
  4. 【Python】猜数小游戏(文件操作)
  5. phpStudy中Xdebug设置 phpStorm设置
  6. python输入三个商品_用python3采集shopify站点商品
  7. php-fpm linux_Linux下PHP-fpm配置
  8. MATLAB 图像处理基础(2)
  9. Xshell配合Screen之ssh会话永不断开
  10. Phonegap(Cordova)3.4 + Android 环境搭建
  11. 《软件工程导论》考研复习
  12. 先进的分销管理系统(ADMS)的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  13. js实现百度换肤功能
  14. 如何准备互联网产品岗面试
  15. vue利用Bscroll开发一个城市列表组件,带右侧字母导航栏
  16. 海康威视rtsp转rtmp(java稳定版)
  17. 为什么会有带www的域名和不带www的域名
  18. Excel VBA | 一键批量生成对账单
  19. 韩顺平循序渐进学java百度云_韩顺平.循序渐进学java从入门到精通视频教程及笔记与源码下载(94讲)...
  20. L2、L3协议开发之以太网交换机基础

热门文章

  1. 自写密码字典-解口令具体过程(海德拉)
  2. NIN:Network in Network
  3. 如何在矩池云上安装语音识别模型 Whisper
  4. 翻译 Duckietown an Open, Inexpensive and Flexible Platform for Autonomy Education and Research
  5. 写给产品经理的第4封信:关于产品经理的十万个为什么?你为什么要做产品经理?
  6. 用Matlab的.m脚本文件处理实验室数据
  7. 毕业找前端开发工作被拒没经验怎么办?
  8. 交换机与路由器技术-05-路由器工作原理
  9. . 显示隐藏文件夹选项消失时如何还原
  10. c语言一行黑白相间的瓷砖,磁砖样式——第八届蓝桥杯C语言B组(国赛)第二题...