第一步:给各个火车站按省归类

走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。

直到前几天,我遇到了下面这个网站:

真是踏破铁鞋无觅处,得来全不费功夫

所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春

这是个很简单的静态网页,直接开始写爬虫:

简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。

最后根据字典再把相应数据存入表格中

02

第二步:数据可视化

1.画出各省火车站数量热力图

由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。

2.画出排名前二十的柱状图

排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。

3.画出东北三省火车站数量占比饼状图

三个省占了全国21%的比重,这个比例还是相当大的,

4.画出黑龙江省内火车站位置散点图

大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。

由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。

03

那么为什么东北会有这么多火车站呢?

这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。

但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!

(亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)

(横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)

(吉林西站,过去叫做黄旗屯站)

(旅顺站 国内保存最完整的欧式站台)

虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。

源码获取私信小编01

用Python对全国火车站数量进行分析,发现东北三省竟然占了2成!相关推荐

  1. Python练手小项目(8)判断三条线能否围成三角形

    已知:三角形任意三条边的长度之和大于第三条边. 解题:定义3个变量a.b.c,让用户输入任意三个数字赋值给三个变量.判断三个变量中是否任意两个之和大于第三个数值. a = int(input('请输入 ...

  2. 基于Python的2013-2018全国城市空气质量分析

    基于Python的2013-2018全国城市空气质量分析 项目摘要 本项目使用pandas/numpy工具包对557424条空气质量数据进行导入及清洗,并使用matplotlib/seaborn/py ...

  3. 基于 Python 的全国空气质量监测与可视化分析平台

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目背景 空气质量优劣程度与一个城市的综合竞争力密切相关,它直接影响到投资环境和居民健康,因此越来越受到政府和 ...

  4. 使用python及相关库实现AQI分析与预测

    使用python及相关库实现AQI分析与预测 前言 一.需求背景 二.提出问题 三.数据预览 四.数据清洗 五.数据分析 六.总结 前言 一.需求背景 AQI(Air Quality Index),即 ...

  5. 数据可视化:利用Python和Echarts制作“用户消费行为分析”可视化大屏

    数据可视化:利用Python和Echarts制作"用户消费行为分析"可视化大屏 前言 实验目的: 准备工作: 一.创建项目: 二.建立数据库连接获取数据: 三.页面布局: 四.下载 ...

  6. Python爬取岗位数据并分析

    学Python也将近大半年了,最终也是为了能够找到一个待遇好点的,薪资高一点的工作,使得自己以后不愁吃穿,过点体面的生活.那想应聘Python岗位应该如何选择,其有何要求,薪资怎么样,这些都是我们会去 ...

  7. Python做文本挖掘的情感极性分析

    Python做文本挖掘的情感极性分析 数据挖掘入门与实战2017-03-23 21:25:41line阅读(27)评论(0) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本 ...

  8. python性能优化之函数执行时间分析_python性能优化之函数执行时间分析

    最近发现项目API请求比较慢,通过抓包发现主要是response时间太长,于是就开始进行优化工作.优化工作的关键一步是定位出问题的瓶颈,对于优化速度来说,从优化函数执行时间这个维度去切入是一个不错的选 ...

  9. python信用评分卡_基于Python的信用评分卡模型分析(二)

    上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...

  10. python主题建模_在PYTHON中进行主题模型LDA分析

    原文链接:在PYTHON中进行主题模型LDA分析​tecdat.cn 主题建模是一种在大量文档中查找抽象主题的艺术方法.一种作为监督无的机器学习方法,主题模型不容易评估,因为没有标记的"基础 ...

最新文章

  1. 函数返回类的对象与拷贝构造函数
  2. Objective C 中的nil,Nil,NULL和NSNull理解
  3. MongoDB学习之(一)安装
  4. 技术支持工程师自测评估下载
  5. 膜拜大牛!Android开发最佳实践手册全网独一份,终获offer
  6. matlab中solver函数_Simulink求解器(Solver)相关知识
  7. linux 截取列_Linux 常用命令汇总
  8. 【无标题】2022年“研究生科研素养提升”系列公益讲座在线测评本次测验答题时间为8月15日-26日,60分及格,每人有一次补考机会。
  9. 全球降雨、气温、干旱指数等数据集
  10. SRAM和DRAM详解
  11. 大数据平台核心架构图鉴,建议收藏!
  12. 唐诗欣赏静夜思用html设计,静夜思-古诗翻译译文赏析-李白诗歌网
  13. linux syslinux u盘,如何使用syslinux做一个开启U盘?
  14. 测试不同体重体型软件样子的,一种智能体型体重测量仪的设计
  15. 浅谈浏览器插件检测 和自定义协议的支持
  16. html5 图灵完备,css图灵完备
  17. python进阶_基础篇4(数据类型和列表)
  18. Neighbourhood Consensus Networks(NIPS 2018)特征点检测与匹配论文笔记
  19. linux shell 实现整点报时
  20. 已解决:上海张江高科技园区企业有哪些?(超级全总结)及张江人才公寓总汇

热门文章

  1. VUE前端+Node后台模拟打印机Web即时打印
  2. 已知p值自由度 求t值 matlab,统计学中的F值、P值和r分别表示什么意思,怎么求-如何查看f值-数学-敖篮友同学...
  3. 学生考勤系统设计mysql_学生考勤系统的设计与实现(Eclipse,MySQL)
  4. talemu---蒙特卡洛仿真软件产品介绍
  5. C++编程笔记(QT)
  6. xise php一句话木马,渗透利器 | 常见的WebShell管理工具
  7. 径向基和径向基神经网路
  8. linux 驱动移植实例,linux-2.6.22.6—驱动移植全记录
  9. Linux下发包工具sendip的使用
  10. 视频教程-【深入理解计算机网络】讲师解读计算机网络原理视频课程(下)-计算机网络