学习python数据分析,并带你感受东北充满文艺气息的火车站

点击上方“Python爬虫与数据挖掘”,进行关注

回复“书籍”即可获赠Python从入门到进阶共10本电子书

为有牺牲多壮志,敢教日月换新天。

大家好,帅鸟今天给大家分享一篇有意思的文章——给全国各省火车站数量来个排名,这也是我老早之前就想做的,但是之前思路有点偏,好在迷途知返,今天终于能给大家见面了。下面一起来看看排名情况吧。

01

第一步:给各个火车站按省归类

走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。

直到前几天,我遇到了下面这个网站:

真是踏破铁鞋无觅处,得来全不费功夫

所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春

这是个很简单的静态网页,直接开始写爬虫:

简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。

最后根据字典再把相应数据存入表格中

02

第二步:数据可视化

1.画出各省火车站数量热力图

由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。

2.画出排名前二十的柱状图

排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。

3.画出东北三省火车站数量占比饼状图

三个省占了全国21%的比重,这个比例还是相当大的,

4.画出黑龙江省内火车站位置散点图

大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。

由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。

03

那么为什么东北会有这么多火车站呢?

这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。

但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!

(亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)

(横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)

(吉林西站,过去叫做黄旗屯站)

(旅顺站 国内保存最完整的欧式站台)

虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。

------------------- End -------------------

往期精彩文章推荐:

  • 一篇文章教会你用Python抓取抖音app热点数据

  • 手把手教你进行pip换源,让你的Python库下载嗖嗖的

  • 手把手教你用免费代理ip爬数据

欢迎大家点赞,留言,转发,转载,感谢大家的相伴与支持

想加入Python学习群请在后台回复【入群

万水千山总是情,点个【在看】行不行

/今日留言主题/

随便说一两句吧~

用Python对全国火车站数量进行分析,发现东北三省竟然占了2成相关推荐

  1. Python练手小项目(8)判断三条线能否围成三角形

    已知:三角形任意三条边的长度之和大于第三条边. 解题:定义3个变量a.b.c,让用户输入任意三个数字赋值给三个变量.判断三个变量中是否任意两个之和大于第三个数值. a = int(input('请输入 ...

  2. 基于Python的2013-2018全国城市空气质量分析

    基于Python的2013-2018全国城市空气质量分析 项目摘要 本项目使用pandas/numpy工具包对557424条空气质量数据进行导入及清洗,并使用matplotlib/seaborn/py ...

  3. 基于 Python 的全国空气质量监测与可视化分析平台

    温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目背景 空气质量优劣程度与一个城市的综合竞争力密切相关,它直接影响到投资环境和居民健康,因此越来越受到政府和 ...

  4. 使用python及相关库实现AQI分析与预测

    使用python及相关库实现AQI分析与预测 前言 一.需求背景 二.提出问题 三.数据预览 四.数据清洗 五.数据分析 六.总结 前言 一.需求背景 AQI(Air Quality Index),即 ...

  5. 数据可视化:利用Python和Echarts制作“用户消费行为分析”可视化大屏

    数据可视化:利用Python和Echarts制作"用户消费行为分析"可视化大屏 前言 实验目的: 准备工作: 一.创建项目: 二.建立数据库连接获取数据: 三.页面布局: 四.下载 ...

  6. Python爬取岗位数据并分析

    学Python也将近大半年了,最终也是为了能够找到一个待遇好点的,薪资高一点的工作,使得自己以后不愁吃穿,过点体面的生活.那想应聘Python岗位应该如何选择,其有何要求,薪资怎么样,这些都是我们会去 ...

  7. Python做文本挖掘的情感极性分析

    Python做文本挖掘的情感极性分析 数据挖掘入门与实战2017-03-23 21:25:41line阅读(27)评论(0) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本 ...

  8. python性能优化之函数执行时间分析_python性能优化之函数执行时间分析

    最近发现项目API请求比较慢,通过抓包发现主要是response时间太长,于是就开始进行优化工作.优化工作的关键一步是定位出问题的瓶颈,对于优化速度来说,从优化函数执行时间这个维度去切入是一个不错的选 ...

  9. python信用评分卡_基于Python的信用评分卡模型分析(二)

    上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...

  10. python主题建模_在PYTHON中进行主题模型LDA分析

    原文链接:在PYTHON中进行主题模型LDA分析​tecdat.cn 主题建模是一种在大量文档中查找抽象主题的艺术方法.一种作为监督无的机器学习方法,主题模型不容易评估,因为没有标记的"基础 ...

最新文章

  1. R语言ggplot2可视化:使用热力图可视化dataframe数据
  2. 计算机专业只考408吗,关于计算机考研408的那些事儿
  3. layer.confirm 询问框 的层遮盖
  4. textjoin去重_SuperJoinText这个函数,弥补了TEXTJOIN的缺憾
  5. 【Python】Python里的复数运算
  6. cdh官方文档看后小结(含优化项)001
  7. Java-创建图片验证码descriptor
  8. smale学习之数学表达式(day3)
  9. ODbgscript 1.82.x Document
  10. 添加jackson_Jackson,最牛掰的 Java JSON 解析器
  11. 使用永恒之蓝漏洞攻击电脑
  12. SuiteCRM 跨站脚本漏洞复现(CVE-2020-14208)
  13. ROS创建Web代理(Web proxy)
  14. 小新air14 2020 i5-1035G1完美黑苹果
  15. 我们该如何全面提高程序的可读性
  16. 用python编程解一元二次方程
  17. php 除法,php中如何除法取整
  18. 脑图神器 XMind ZEN
  19. 这可是全网EVE安装最完整,最详细的图解,没有之一【安装图解】
  20. 【PHPWord】使用PHPWord替换模板变量大段文字并换行设置字体字号

热门文章

  1. 电脑散热风扇轴承分类
  2. Excel 表格打印篇(批量添加标题,同页打印,打印logo与页码)
  3. EDA技术与应用实验二(PowerShell实现)
  4. python语法糖是什么意思_Python中的甜蜜语法糖,甜甜的
  5. Layui Select四级联动效果触发
  6. 童年修复系列-SNES芯片组介绍及FPGA实现
  7. 线性代数————思维导图(上岸必备)(向量组)
  8. 最小二乘支持向量机--LSSVM分类及MATLAB代码实现
  9. 正则化方法拟合曲线c语言,过拟合(Overfitting)和正则化(Regularized)
  10. xshell 配置公钥 免密码登陆