数据挖掘利器 selenium实战案例--论文数据挖掘与可视化分析(下)
目录
- 一、发文量分析
- 1)各期刊发文占比,规划师期刊增刊多、发文量占优;
- 2)教育机构是期刊论文的主要生产温床;
- 3)规划师期刊中设计院和研究院机构的发文数量和占比异军突起;
- 4)发文量排名前20的机构
- 5)发文地域分布
- 二、文章影响力分析
- 1)作者被引频次
- 2)发文机构被引量
- 3)基金支助与被引频次的关系
- 三、 内容、关键词分析
- 1)根据关键词分析
- 2012-2022关键词分析
- 分年份关键词分析,热词整体呈现从“城市规划-新型城镇化-城市更新-城市规划“向”国土空间规划”发展。
- 2)根据摘要分析
- 三、论文网络分析
- 1.作者合作发文网络分析
- 1)作者合作发文比例平均达77%,合作发文的比例呈现上升趋势
- 2)作者间合作网络结构简单,作者间联系程度并不高
- ![](https://img-blog.csdnimg.cn/img_convert/e674d5deb740ed9ddfe6ef519ec9d9c4.png =180x120)
在上一篇文章说了用Python中的selenium包控制谷歌浏览器的方式,获取了城市规划领域2012年至2022年五种期刊的信息,清洗之后共8585篇论文文献,下篇说一下数据可视化。
一、发文量分析
1)各期刊发文占比,规划师期刊增刊多、发文量占优;
除了城市规划学刊是双月刊,其余期刊都为月刊,但规划师学刊近两年疯狂增刊,2021年发刊26期,可以改名为双周刊了。
2)教育机构是期刊论文的主要生产温床;
我们把发文机构分为四类,教育机构发表论文总量占比55.48%,比重过半。
3)规划师期刊中设计院和研究院机构的发文数量和占比异军突起;
4)发文量排名前20的机构
5)发文量排名前20的作者
5)发文地域分布
《省份间发文数量差异地图》(下图一)
发文作者的作者地址主要分布于北京、广东、上海、江苏、湖北、浙江达到了省份发文量的中位数483篇。
城市发文量分布图(下图二)
如果仅筛选有发文量的城市绘制城市密度图,结果会不一样,华东地区北部和广深地区的城市更密集,但这不够严谨,因为颜色深可能也只是代表其城市地域分布的更密集。尽管如此从图中还是能看到东西部地区的差异。
二、文章影响力分析
作者被引频次分为一次被引频次(引证文献的数量)和一次被引频次(引证文献的引证文献的数量,),本文没有特殊说明都是一次被引频次。
二级引证文献是指本文引证文献的引证文献,更进一步反映本文研究工作的继续、发展或评价。
1)作者被引频次
注:每段颜色代表一篇文章,颜色深浅代表此文章被引频次。且未设置第一作,论文署名就算此位作者的发文。
详细分布数据可以看下图:
2)发文机构被引量
3)基金支助与被引频次的关系
三、 内容、关键词分析
1)根据关键词分析
词云图反应相应关键词出现的频率,近十年总体来看”国土空间规划“占据主流,热度超过“城市规划”、“城市设计”、”城市更新“、”控制性详细规划“。北京、广州、上海、深圳等地理关键词的出现,反应了以其为研究对象的文章较多,侧面说明北上广深实际项目和城市规划发展质量较好。
2012-2022关键词分析
分年份关键词分析,热词整体呈现从“城市规划-新型城镇化-城市更新-城市规划“向”国土空间规划”发展。
- 2012_keywords
- 2013_keywords
- 2014_keywords
- 2015_keywords
- 2016_keywords
- 2017_keywords
- 2018_keywords
- 2019_keywords
- 2020_keywords
- 2021_keywords
- 2022_keywords
2)根据摘要分析
三、论文网络分析
1.作者合作发文网络分析
1)作者合作发文比例平均达77%,合作发文的比例呈现上升趋势
![image-20221228221730287](https://renhaifuchen-1315363329.cos.ap-nanjing.myqcloud.com/markdown_img/202212282217667.png
2)作者间合作网络结构简单,作者间联系程度并不高
通过Python的Networkx包构建作者之间的合作网络,发现8585位(不考虑重名)作者中:
合作网络密度低(0.0003)
作者网络绘图
平均而言一位作者需要和三到四位作者合作,从一位作者到任意一位作者平均需要通过四到五人,更加说明文章的合作率高,单独发文的作者数量少。
最高中心性的作者排名:王德(56人)、王兴平(51人)、张京祥(51人)、黄亚平(49人)、李贵才(47人)、李志刚(47人)、黄明华(45人)、袁媛(43人)。虽然比社交网络中心性低不少,但第一名作者还是和56人(0.557%)合作过文章。
- 作者网络中心度直方图
- 作者网络中心度直方图
3) 城市间合作网络
与其他城市的作者合作的密切度前8位是:北京、上海、南京、杭州、广州、重庆、武汉、天津。如下图:
带你用数据看世界
各大平台欢迎关注
数据挖掘利器 selenium实战案例--论文数据挖掘与可视化分析(下)相关推荐
- 数据挖掘利器 selenium实战案例--论文数据挖掘与可视化分析(上)
目录 一.数据挖掘 1 为什么选择又慢又占内存的selenium? 2 selenium获取知网信息流程图 1)selenium和ChromeOptions参数 2)构建期刊列表循环 3) 循环点击并 ...
- 实战案例 :电信客户流失分析与预测
本文所有代码都通过运行! 将从以下方面进行分析:1.背景 2.提出问题 3.理解数据 4.数据清洗 5.可视化分析 6.用户流失预测 7.结论和建议 本项目带你根据以上过程详细分析电信客户数据! 01 ...
- 数据分析实战项目--天猫交易数据可视化分析
导语:"学习的价值不在于记住多少,而在于应用多少",这是笔者两天前浏览博客时看见的一句话,深有感触.相信有不少uu们正处于头绪繁多,却又不知从何下手的状态.想起之前在数据分析中踽踽 ...
- Linux树莓派实战案例论文,树莓派|树莓派使用实例之:2 Pi R
很多人都对树莓派的硬件 hack 功能(译注:就是用户可以自己发挥想像力,把树莓派设计成自己想要的机器)感兴趣,而我看中的一点是树莓派的低耗电功能,我可以用它来代替现在在用的 Linux 服务器.在以 ...
- 【Pytorch神经网络实战案例】40 TextCNN模型分析IMDB数据集评论的积极与消极
卷积神经网络不仅在图像视觉领域有很好的效果,而且在基于文本的NLP领域也有很好的效果.TextCN如模型是卷积神经网络用于文本处理方面的一个模型. 在TextCNN模型中,通过多分支卷积技术实现对文本 ...
- Python 数据分析实战案例:京东用户行为分析
1.项目背景 项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议.本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境. 2.数据集介绍 ...
- 网络爬虫--24.【selenium实战】实现拉勾网爬虫之--分析接口获取数据
文章目录 一. 思路概述 二. 分析数据接口 三. 详细代码 一. 思路概述 1.拉勾网采用Ajax技术,加载网页时会向后端发送Ajax异步请求,因此首先找到数据接口: 2.后端会返回json的数据, ...
- 数据分析实战 | 银行 “信贷” 客户的可视化分析
作者:番茄酱的汪 来源:简书 客户信用等级影响因素 目标:总结出信贷需求较高人群特征,找到与信用等级相关程度较高的变量.帮助银行决定是否审批通过该客户并对审批通过的客户设定初始信用额度,有利于银行降低 ...
- 数据分析实战——星巴克门店数量可视化分析
星巴克门店分布可视化分析 项目介绍:使用python对星巴克门店分布进行可视化分析 数据背景:数据源来自与Kaggle: Starbucks Locations Worldwide | Kaggle, ...
最新文章
- (四)Thymeleaf标准表达式之——[3-6] 操作符(文本、算术、布尔、比较及相等)...
- BZOJ1036: [ZJOI2008]树的统计Count
- Jquery怎样返回上一页
- 科大星云诗社动态20210424
- Google 在开源上的贡献
- 【caffe-Windows】添加工程-以classification为例
- 跟着开涛springmvc学习(转)
- win10 + VS2010 + OpenCV2.4.10重编译OpenCV开发环境搭建
- 安装nvidia-docker
- mysqld install mysql default_Mysql_安装
- 微PE启动盘重装Windows 系统
- 项目经理面试必备20题
- 公司官网如何快速让百度收录?以及如何做网站流量?
- zephyr如何添加pwm支持
- mkdir: Failed on local exception: java.io.IOException: javax.security.sasl.SaslException: GSS initia
- java创建tensorfly对象,Tensorflow对象检测自定义数据集
- C# 一些零零碎碎的方法,都是些帮助类,留存,也希望能帮助到各位
- GBase 8s SQLCODE
- 《信息化项目软件运维费用测算规范》等两项北京地标正式报批
- 【评测】iPS细胞株-Alzheimer‘s disease (AD),LDLR和APOE4基因突变
热门文章
- Python爬取猫眼电影数据并对其进行数据可视化
- python 返回函数 变量_你如何设置一个变量等于由python函数返回的值
- MacOS下qt签名与公证
- Python学习-Scipy库稀疏矩阵的建立(面向列的稀疏矩阵、基于坐标格式的稀疏矩阵)
- GPS 校验和 代码_PSPad editor(代码编辑器)v5.0.4.507绿色版
- Quake1和2的pak资源文件格式说明
- Arduino学习总结(未完待续)
- 团队和做的直观图_直观,可靠的日期和时间处理,终于出现在Java中
- matlab批量改名字0001 0002,Matlab批量修改文件夹名字
- [考试反思]0909csp-s模拟测试41:反典