用Python对全国火车站数量进行分析,发现东北三省竟然占了2成!
第一步:给各个火车站按省归类
走过的坑:之前我先去12306上把所有的火车站名字爬了下来,然后做个地图网站爬虫,爬取所有车站的详细地址信息,但是有几百个不常见的火车站搜不出来,遂作罢;然后又做个百度百科爬虫,逐个把火车站的地址信息提取出来,但是又是几百个火车站在百度百科没有地址信息,有的还是地铁站名(oh my god),遂又放弃。
直到前几天,我遇到了下面这个网站:
真是踏破铁鞋无觅处,得来全不费功夫
所有火车站都在,我不禁感慨了一下之前在坑里逝去的青春
这是个很简单的静态网页,直接开始写爬虫:
简单介绍一下上面的代码,很适合初学者练手,首先将第一个网页中把各省的链接找到(province_items),提取href组成url2,再把每个省和对应的火车站数量len(trainName)存入字典中。
最后根据字典再把相应数据存入表格中
02
—
第二步:数据可视化
1.画出各省火车站数量热力图
由图可以看出,从南至北火车站数量呈现递减趋势,我原本想着发达地区的火车站数量应该多一些,毕竟“要想富先修路”,但是实际并不是这样,看来东南沿海应该是水路航线多一些(我瞎猜的)。
2.画出排名前二十的柱状图
排名第一的是黑龙江,总共有302个火车站,另外我们可以发现东北三省都在前五名中,数量都在130以上,下面再深入研究一下东北三省的火车站数量。
3.画出东北三省火车站数量占比饼状图
三个省占了全国21%的比重,这个比例还是相当大的,
4.画出黑龙江省内火车站位置散点图
大家注意一下,上面热力图用的是Map函数,这里散点图用的是Geo函数,这俩是有区别的。
由图可以看出,黑龙江省内火车站相当密集,每条铁路线上火车站间隔也比较小。
03
—
那么为什么东北会有这么多火车站呢?
这是历史特殊时期的产物,上个世纪初期东北有丰富的煤矿资源,修建铁路主要是鬼子和毛子掠夺资源,这个就是东北三省铁路众多的主要原因。另外,东北三省虽然铁路秘籍,但是由于年代稍久了,铁路质量和规格不是很高。相对于南方来说,铁路是东北这边的主要交通工具,由于地域辽阔,修建铁路建设成本会相对较低。这就是这边有很多小火车站的原因。
但是历史也为东北留下了一些充满文艺气息的火车站,这些火车站既有时代的烙印,也有现代的美观,下面让我们一起感受一下吧!
(亚布力南站,是我国首个滑雪场火车站,位于黑龙江省尚志市亚布力镇)
(横道河子站,西洋画里的俄罗斯城堡,位于黑龙江省海林市的横道河子)
(吉林西站,过去叫做黄旗屯站)
(旅顺站 国内保存最完整的欧式站台)
虽然我不是东北人,更没有去过以上的火车站,但是看了照片心却心生向往,以后有时间一定要亲临其境感受一下艺术的气息。
源码获取私信小编01
用Python对全国火车站数量进行分析,发现东北三省竟然占了2成!相关推荐
- Python练手小项目(8)判断三条线能否围成三角形
已知:三角形任意三条边的长度之和大于第三条边. 解题:定义3个变量a.b.c,让用户输入任意三个数字赋值给三个变量.判断三个变量中是否任意两个之和大于第三个数值. a = int(input('请输入 ...
- 基于Python的2013-2018全国城市空气质量分析
基于Python的2013-2018全国城市空气质量分析 项目摘要 本项目使用pandas/numpy工具包对557424条空气质量数据进行导入及清洗,并使用matplotlib/seaborn/py ...
- 基于 Python 的全国空气质量监测与可视化分析平台
温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 1. 项目背景 空气质量优劣程度与一个城市的综合竞争力密切相关,它直接影响到投资环境和居民健康,因此越来越受到政府和 ...
- 使用python及相关库实现AQI分析与预测
使用python及相关库实现AQI分析与预测 前言 一.需求背景 二.提出问题 三.数据预览 四.数据清洗 五.数据分析 六.总结 前言 一.需求背景 AQI(Air Quality Index),即 ...
- 数据可视化:利用Python和Echarts制作“用户消费行为分析”可视化大屏
数据可视化:利用Python和Echarts制作"用户消费行为分析"可视化大屏 前言 实验目的: 准备工作: 一.创建项目: 二.建立数据库连接获取数据: 三.页面布局: 四.下载 ...
- Python爬取岗位数据并分析
学Python也将近大半年了,最终也是为了能够找到一个待遇好点的,薪资高一点的工作,使得自己以后不愁吃穿,过点体面的生活.那想应聘Python岗位应该如何选择,其有何要求,薪资怎么样,这些都是我们会去 ...
- Python做文本挖掘的情感极性分析
Python做文本挖掘的情感极性分析 数据挖掘入门与实战2017-03-23 21:25:41line阅读(27)评论(0) 声明:本文由入驻搜狐公众平台的作者撰写,除搜狐官方账号外,观点仅代表作者本 ...
- python性能优化之函数执行时间分析_python性能优化之函数执行时间分析
最近发现项目API请求比较慢,通过抓包发现主要是response时间太长,于是就开始进行优化工作.优化工作的关键一步是定位出问题的瓶颈,对于优化速度来说,从优化函数执行时间这个维度去切入是一个不错的选 ...
- python信用评分卡_基于Python的信用评分卡模型分析(二)
上一篇文章基于Python的信用评分卡模型分析(一)已经介绍了信用评分卡模型的数据预处理.探索性数据分析.变量分箱和变量选择等.接下来我们将继续讨论信用评分卡的模型实现和分析,信用评分的方法和自动评分 ...
- python主题建模_在PYTHON中进行主题模型LDA分析
原文链接:在PYTHON中进行主题模型LDA分析tecdat.cn 主题建模是一种在大量文档中查找抽象主题的艺术方法.一种作为监督无的机器学习方法,主题模型不容易评估,因为没有标记的"基础 ...
最新文章
- 函数返回类的对象与拷贝构造函数
- Objective C 中的nil,Nil,NULL和NSNull理解
- MongoDB学习之(一)安装
- 技术支持工程师自测评估下载
- 膜拜大牛!Android开发最佳实践手册全网独一份,终获offer
- matlab中solver函数_Simulink求解器(Solver)相关知识
- linux 截取列_Linux 常用命令汇总
- 【无标题】2022年“研究生科研素养提升”系列公益讲座在线测评本次测验答题时间为8月15日-26日,60分及格,每人有一次补考机会。
- 全球降雨、气温、干旱指数等数据集
- SRAM和DRAM详解
- 大数据平台核心架构图鉴,建议收藏!
- 唐诗欣赏静夜思用html设计,静夜思-古诗翻译译文赏析-李白诗歌网
- linux syslinux u盘,如何使用syslinux做一个开启U盘?
- 测试不同体重体型软件样子的,一种智能体型体重测量仪的设计
- 浅谈浏览器插件检测 和自定义协议的支持
- html5 图灵完备,css图灵完备
- python进阶_基础篇4(数据类型和列表)
- Neighbourhood Consensus Networks(NIPS 2018)特征点检测与匹配论文笔记
- linux shell 实现整点报时
- 已解决:上海张江高科技园区企业有哪些?(超级全总结)及张江人才公寓总汇
热门文章
- VUE前端+Node后台模拟打印机Web即时打印
- 已知p值自由度 求t值 matlab,统计学中的F值、P值和r分别表示什么意思,怎么求-如何查看f值-数学-敖篮友同学...
- 学生考勤系统设计mysql_学生考勤系统的设计与实现(Eclipse,MySQL)
- talemu---蒙特卡洛仿真软件产品介绍
- C++编程笔记(QT)
- xise php一句话木马,渗透利器 | 常见的WebShell管理工具
- 径向基和径向基神经网路
- linux 驱动移植实例,linux-2.6.22.6—驱动移植全记录
- Linux下发包工具sendip的使用
- 视频教程-【深入理解计算机网络】讲师解读计算机网络原理视频课程(下)-计算机网络