全国火车高铁站及车次数据爬虫(内含100W+数据,免费领取!)

具体代码丢了

思路如下:

  • 所需工具:Python、VBA、Arcgis、高德地图API
  • 数据来源:不记得了,之前爬过盛名火车站的,但是查了下,并不全。
  • 数据日期:这里的火车数据更新截止到2018-7月,可能以后还有新的火车站建设,有需要再搞
  • 数据总量:100W+吧,没仔细数

在相关网站上把各省各地的火车数据爬取下来,我爬完后是这个样

再通过一段VBA代码整理了一下,变成如下这样

可以具体到各地到各地的火车数据了,要克服的困难有:将上面的数据做成数据透视表的时候

数据透视表会按拼音顺序排列,这样的排列出来的火车数据是错误的,我想到的办法是在

火车车站名前加上1 、2、3这样的数字,便可解决。最后去掉即可

共有将近80W,还是挺多的

有了全国各地到各地的火车数据还不够

我还想把各地到各地的火车数据转化成各市到各市的

这里要用到一个叫Arcgis的地图工具

在这之前需要将各地的火车站转换成高德地图坐标,高德地图API提供了这么一个功能

用Python写一段代码即可实现,自己可以去高德地图开发者平台看看,挺简单的,不写具体的了

完成后如下:

接着在放到Arcgis里面操作

说实话,这个Arcgis自己琢磨了一天才会弄,有点无语,但是挺好用,蛮神奇

这里只列了高铁的数据,高铁的车型号一般为:G D C

以下就是各城市到各城市的高铁数据了

然后就完成了

数据列表如下:

  • 全国火车及高铁车次源数据
  • 全部火车车次汇总
  • 高铁车次源数据(就是把第一个sheet数据里的G D C车型的给提炼出来)
  • 高铁车次汇总
  • 城市-城市 的高铁源数据
  • 城市-城市 高铁车次汇总
  • 各高铁站经纬度(火车站也有)

共计应该有100W+吧

19.7.11更新

打算爬今年的数据了,其实不难的,按照步骤一步步来就okay了

加微信公众号:AInnee

(第二个字母是大写的i)发送“高铁数据+你微信号”,后台会加你并免费发你数据哦。

posted on 2018-08-31 10:14 田安Anne 阅读(...) 评论(...) 编辑 收藏

转载于:https://www.cnblogs.com/EvilAnne/p/9564228.html

全国火车高铁站及车次数据爬虫(内含100W+数据,免费领取!)相关推荐

  1. Springboot+vue火车高铁站订票管理系统

    开发一个具有良好人机交互界面的车票预定系统,实现车票销售自动化.主要功能:能用于所有售票处的客户资料和送票情况管理,能对客户累计购票情况进行统计分析,具有自动编号.快速查询.客户购票统计.送票员管理. ...

  2. Java高铁的速度是火车的两倍_亚洲最大的三座高铁站, 全部都是特等站, 毫无疑问都在中国...

    高铁,是如今大多数人都会选择的一种出行方式.众所周知,高铁具有安全便捷的优点,不同于火车,高铁的速度几乎是火车的两倍.当然,高铁的建设也能反映出这个城市的经济发展,今天就来带大家看一下亚洲最大的3座高 ...

  3. 城市中心区综合交通枢纽规划策略:以深圳市西丽高铁站为例

    " 写在前面: 综合交通枢纽是反映交通系统运行效率和服务品质的关键载体.在高密度城市中心区新建大型综合交通枢纽是一个非常复杂的系统工程,需要重点考虑站城融合.交通可持续发展.大客流组织以及多 ...

  4. 中国高铁站,为什么离市区这么远

    导读:中国最远的高铁站,叫北站. 作者:苏晚水,数据:CZ风云 乐乐 设计:杨波浪 豆浆 敏穗 来源:网易数读(ID:datablog163) 熊孩子.短视频外放.味道极重的泡面--坐高铁时要是遇上这 ...

  5. 车站广播系统采用计算机,高铁站广播系统

    高铁站自动广播系统是消防紧急广播与业务广播合二为一的广播系统,在平时作为车站业务广播使用,在有火灾报警信号时,切换为消防广播使用.在业务广播时,主要由自动广播及人工广播组成. 高铁站公共广播系统的车次 ...

  6. 高铁站检票口交通流时-空模式分析:以北京南,上海虹桥,广州南站为例

    高铁站检票口交通流时-空模式分析:以北京南,上海虹桥,广州南站为例 Hello everybody, welcome back to my channel !!! 对你没有看错,我这个研究空中交通的在 ...

  7. 2023年1月1日生效:2023年火车高铁儿童票最新规则及高铁火车2023儿童票怎么购买?

    原文来源:https://www.caochai.com/article-4108.html 2023年火车高铁儿童票最新规则: 自2023年1月1日起生效,儿童购买高铁火车票将执行最新规则:按购票儿 ...

  8. java基于springboot的火车高铁购票系统

    最优网络购票系统的主要使用者分为管理员和用户,实现功能包括管理员:首页.个人中心.用户管理.票务信息管理.列车信息管理.购票订单管理.改签订单管理.退票订单管理.系统管理,用户:首页.个人中心.购票订 ...

  9. 室内主动导航系统在高铁站场景应用分析

    高铁时代,使得中国城市之间的同城效应得到体现,铁路沿线将形成走廊产业经济带,有助于扩大地区间的分工,中国也将由此衍生出新的基础产业--高速铁路装备制造业.尤为重要的是,高铁提高了国内市场的统一性,各地 ...

  10. 2003-2021年高铁站开通时间

    2003-2021年高铁站开通时间数据 1.时间:2003-2021年 2.指标:高铁站名称.开通时间.所在省份.所在城市.所属线路名称.以及相关备注 3.指标说明: 高速铁路,简称高铁,是指设计标准 ...

最新文章

  1. Hibernate 和快照
  2. 查看tensorflow pb模型文件的节点信息
  3. Windows批处理
  4. VTK:图片之ImageOrder
  5. [51nod1847][算法马拉松23(飞越愚人节)F]奇怪的数学题
  6. VC多线程编程之线程创建与示例
  7. oracle中右表有过滤条件的left outer join
  8. 设计实用素材|促销海报设计技巧
  9. mysql 获取select结果_php如何操作mysql获取select 结果
  10. LaTex warning:Font shape `TU/ppl/bx/n' undefined(Font) using `TU/ppl/m/n' instead
  11. 前端开发学习Day3
  12. 如何调试JavaScript代码
  13. 什么U盘启动盘制作工具是纯净版的,没有捆绑软件和广告的?
  14. 计算机什么病毒有远程控制功能,怎样知道自己的电脑已被远程控制
  15. java fx scen,很好的JavaFX2.0基础教程
  16. 电话卡插到终端服务器通话时长,如何降低呼叫中心通话时长而不影响服务质量...
  17. 常见机器学习模型适用场景及优缺点
  18. KISSY基础篇乄KISSY之Node(2)
  19. 光电信息科学与工程可以考计算机研究生吗,光电信息科学与工程专业考研方向...
  20. POC-T框架学习————9、相关脚本深入学习五

热门文章

  1. 用Rust保存Windows聚焦图片
  2. php yar swoole 比较,Hprose 和 Yar 的性能比较
  3. 三分钟明白 Activity工作流 -- java运用
  4. 运放参数的详细解释和分析-part24, 输出阻抗Ro和Rout
  5. 利用Python爬取3万多条上海二手房信息,我得出的结论是?
  6. wps中word转html乱码,wps转word格式乱码了怎么办
  7. Java实现随机验证码和验证码图片渲染功能
  8. Unity AI 之 行为树 的简单介绍
  9. 捷宇高拍仪XY530 网页集成总结
  10. python制作动态的微信个人名片