数据说明:
携程网全国各城市酒店数据(含开业年份、装修年份、房间数、经纬度、评论数和评分、酒店全部图片、各房型的图片价格等等,详细见下面的字段说明部分),总计酒店基本信息735,476条,酒店图片98,309,133条,酒店基本房型2,206,284条

各城市的数量统计:

更新时间:
2022年7-8月

字段说明:
(1) 酒店基本信息(详情)表(ctrip_hotels_details_202208)
“hotel_id” – 酒店ID,与平台一致;
“name” – 酒店中文名称;
“name_en” – 酒店英文名称;
“short_name” – 酒店简称;
“province” – 所在省份;
“city_id” – 城市ID;
“city” – 所在城市;
“star” – 酒店星级;
“open_year” – 开业年份(共计有67.1w条有该信息);
“fitment_year” – 装修年份(共计有21.3w条有该信息);
“room_quantity” – 房间数(共计有71.3w条有该信息);
“zone” – 所属商圈;
“area” – 行政区;
“address” – 地址;
“phones” – 联系电话;
“main_photo” – 酒店主图(URL);
“lng_gd” – 高德经度;
“lat_gd” – 高德纬度;
“lng_bd” – 百度经度;
“lat_bd” – 百度纬度;
“comment_total” – 评论总数;
“total_score” – 总评分;
“health_score” – 卫生健康评分;
“enviromental_score” – 环境评分;
“service_score” – 服务评分;
“facilities_score” – 设施评分;
“recommend_percent” – 住客推荐率;
“honor_tags” – 荣誉标签;
“bullet_screen_info” – 视频弹幕信息:
“has_certificate” – 是否有“品质保证”;
“hotel_facilities_popular” – 酒店热门设施;
“hotel_facilities_full” – 酒店设施详细版;
“hotel_policy” – 酒店政策;
“hotel_awards” – 酒店获奖情况;
“images” – 酒店相册图(URL,更多更完整的图片见酒店相册表);
“description” – 酒店介绍;
“traffic” – 周边交通;
“video_url” – 视频介绍文件URL;
“min_price” – 最低房型价格;
“min_price_checkin_date” – 查询的入住日期;
“base_rooms” – 基础房型列表;
“updated” – 本条数据采集更新的时间;
“url” – 酒店URL;

(2) 酒店相册表(ctrip_hotels_pictures_202208)
“picture_id” – 图片ID;
“hotel_id” – 酒店ID(用于和酒店基本信息表关联);
“source” – 相册列表;
“category_name” – 图片内容列表;
“picture_title” – 图片标题;
“large_url” – 图片大图或视频URL;
“small_url” – 图片小图或视频封面图URL;
“is_video” – 是否是视频;
“picture_description” – 图片描述;
“updated” – 本条数据采集更新的时间;

(3) 酒店基本房型表(ctrip_hotels_base_rooms_202208)
“hotel_id” – 酒店ID(用于和酒店基本信息表关联);
“base_room_id” – 基本房型ID;
“base_room_name” – 基本房型名称;
“checkin_date” – 查询的入住日期;
“min_price” – 房型最低售价;
“base_room_cover_url” – 房型封面图URL;
“images” – 房型相册URL;
“additional_info” – 房间参数,例如面积、床型、可住人数、早餐、WIFI、是否禁烟等;
“room_facilities” – 房型内设施;
“updated” – 本条数据采集更新的时间;

在线示例数据:
(1) 酒店基本信息(详情)示例数据

(2) 酒店相册示例数据

(3) 酒店基本房型示例数据

数据格式:
CSV(UTF-8编码)。

文件大小:
酒店基本信息表 : 2.4GB;
酒店相册表:25GB(无图片文件);
酒店基本房型表:2.7GB;

按“酒店星级”(star字段)的数量统计:
无星: 196,610家
1星: 7,429家
2星: 447,150家
3星: 57,167家
4星: 22,013家
5星: 5,108家

​携程网全国各城市酒店数据​评论数据相关推荐

  1. 利用Python自动爬取全国30+城市地铁图数据

    数据来源 首先分析全国各个城市地铁图的数据来源,无非就是百度或者高德,这次选择用高德作为数据来源. 基本环境配置 版本:Python3 系统:Windows 相关模块: 安装请求库 pip insta ...

  2. 如何用Python自动爬取全国30+城市地铁图数据?

    阅读本文大概需要 3 分钟. 最近两天工作之余,开始涉猎python,自动爬取了全国30+城市地铁图数据,这里分享下整个爬虫过程 1. 数据来源 首先分析全国各个城市地铁图的数据来源,无非就是百度或者 ...

  3. 2001-2022年全国各城市气温数据(逐日、逐月、逐年)

    全国各城市平均气温数据(2001-2022) 1.数据说明:本数据是根据中国气象数据网发布的中国地面气候资料日值数据集V3.0处理而成,指标涵盖全国各城市. 2.数据来源:中国气象数据网.中国地面气候 ...

  4. 携程网国内酒店评论数据(超8163万条)

    本文原创作者: 数据超市 (http://www.data-shop.net) 本文原始链接:http://www.data-shop.net/2018/08/ctrip_hotel_comment_ ...

  5. 2021年全国重点城市poi数据下载

    2021年全国重点城市poi数据 写在前面的话 北京 上海 广州 深圳 杭州 南京 苏州 免责声明 写在前面的话 POI是"Point of Interest"的缩写,中文意思为& ...

  6. scrapy爬取酒店评论数据

    scrapy爬取酒店评论数据 代码 here:GitHub:scrapy_hotel_review 采用scrapy爬取酒店评论数据. 总共有28W条记录. 做某NLP任务,需要一些hotel rev ...

  7. 基于出行住宿评论数据的情感分析研究(酒店篇,含python代码)

    携程酒店评论数据: 链接:https://pan.baidu.com/s/1zUtfc6Ku6W2sx99XdqeWcA  提取码:vkzs 停用词汇总: 链接:百度网盘 请输入提取码  提取码:02 ...

  8. 全国/全世界城市Json数据大全

    全国/全世界城市Json数据大全 分享一个网站 地图选择器 上面可以选择 geojson 格式 或者 svg 格式.(最新的,每隔一段时间就会更新) 还有一个方式: 打开安装QQ的文件夹里面也是有全世 ...

  9. 2001-2022年全国各城市风速数据(逐日、逐月、逐年)

    2001-2022年全国各城市风速数据(逐日.逐月.逐年) 提供每日平均风速.每月平均风速(由当月的每日风速计算平均值得来).每年平均风速(由当年的每日风速计算平均值得来).2022年的数据截止到8月 ...

最新文章

  1. 学习笔记(3.29)
  2. 《C语言及程序设计》实践参考——当年第几天
  3. python: c_char_p指向的bitmap图像数据,通过c_char_Array最终赋值给PIL的Image对象
  4. javaio流_万字长文+思维导图帮你梳理 Java IO 流,还学不会你来打我(值得收藏)...
  5. USTC English Club Note20211110
  6. python 安装 HTMLtestRunner(转)
  7. Oracle入门(十四D)之常规函数
  8. javascript DOM事件总结
  9. Newtonsoft.Json 序列化和反序列化 以及时间格式 2
  10. 寄存器和存储器的区别_汇编语言 第二章 寄存器
  11. C语言编写的算数小游戏(附源码)
  12. 【JavaScript】打印星型金字塔
  13. 解决svn报错 : The pristine text with checksum 'e006b124faa4ddf60d8773d1855e6bfa56145874' was not fou
  14. 广西事业单位职称免计算机,2020广西事业单位职业能力倾向测试知识:为什么没有计算器?...
  15. Spring Security系列教程03--创建SpringSecurity项目
  16. adobe air linux centos,Adobe AIR(跨平台应用)
  17. 认沽期权长短仓应用法
  18. java中引用数据类型有哪几种
  19. python 信号.同步 day07
  20. dev c 扫雷程序代码c语言,C语言 扫雷程序的实现

热门文章

  1. CE1到9关详细教程
  2. ArcGIS Engine10.0轻松入门级教程(1)——必备基础知识
  3. sap清账使用反记账_【转】SAP反记账功能祥解
  4. sap 双ALV联动显示示例(备份)
  5. 怎么做抽奖活动_没有公众号怎么做刮刮乐链接
  6. 解决MySQL5.7在MAC下登录ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES)
  7. ACS 中PEAP的认证
  8. JavaScript中的alert
  9. 关于SIGHUP信号的讨论
  10. 如何对图片主题色进行提取