要求

对 CSE512: Data Visualization 完成探索性数据分析。

内容

数据选择

数据来源:1960-2017年世界银行的数据。世界银行通过气候变化、经济、教育、环境、两性平等、卫生和科学和技术等指标跟踪全球人类发展,世界银行提供的数据包括有:

选择主题为科学技术(science-and-technology)的数据进行分析,数据集的结构如下:

包含了各种科学技术的多种指标

探讨方向

科学技术是第一生产力,我国实现经济的腾飞需要科技的助力,进一步突破经济发展瓶颈需要科技的质变。是什么影响了我国科学技术的发展?是什么代表了科技发展水平?我国应如何进一步突破经济发展瓶颈、促进科学技术的发展?衡量科技发展的指标向来具有总体性而非个体性,我将通过数据中的多项度量探讨以上问题。

探索内容

专利申请

专利的申请量和拥有量应当是一个国家或地区科技水平高低的重要指标,可以从侧面反映一个国家或地区的创新能力、科技水平和市场化程度,衡量该国家或地区的科技产出和知识创新

对近几十年来的世界各国专利申请量变化作出折线图如下:

可以看到从2000年开始,中国发明专利申请数量呈井喷式增长,2000年时居民(包含非居民)专利申请总数为51906件,到2018年已经达到1542002件,18年间专利申请数量已经翻了近30倍。并且在2011年中国第一次在专利总量超过美国,跃升至第一位,成为提交国际专利申请量最多的国家,从而打破了美国长达40年的专利申请霸主地位。

同时,对2020年专利申请构成分析

可以看到,我国居民专利申请占大多数,而各国之间居民和非居民申请的比例差异很大,如在美国提交的所有申请中,有超过一半为非居民申请,而中国非居民申请人份额不到十分之一。

综上所述,中国专利申请的巨大增长体现了中国居民专利申请和专利保护意识的增强、知识产权保护增强,在自主专利申请数量方面已经超越美国和其他创新型国家。

但这是否意味着我们在创新方面是全球领导者

事实上,这种专利指标给我国科技、经济带来的影响远没有想象中那么大,表现为严重的投入产出不平衡

国际贸易中知识产权使用费收入和支出是衡量一个国家市场化知识价值创造能力的核心指标。我国知识产权使用费收入和支出一直处于逆差状态,这表明我国还不是有价值的知识产权创造强国。

中国 使用知识产权的支付费用知识产权使用费带来的收益进行可视化:

可以看到2017年之前。我国虽然专利数量十分巨大,但知识产权的支付费用知识产权使用费带来的收益不成正比,每年付给其他专利成果巨大的专利费用,而本国的专利成果费用带来的收益少之又少。直到2017年之后,中国的专利成果带来的收益才一路猛追,到2020年超过了支付的专利费用。

对比 美国 的收支比例:

可以发现,美国与我国的收支发展正好相反,美国在2017年之后在专利费用逐渐入不敷出,但是始终保持着知识产权贸易顺差。由于美国在之前近百年来积累的专利成果,所带来的专利收益是仍然庞大的。

我们不否认中国成为提交国际专利申请量最多的国家,从而打破了美国长达40年专利申请霸主地位的战略价值和意义,但在欢喜之余,我们更应该冷静地意识到申请专利数量背后存在的差距和问题。这反映了近年来“垃圾专利”申请的数量迅速增加,对专利事物的宏观调控一定程度上催生了泡沫。中国的技术创新仍处于大部分技术靠从外国购买技术专利的阶段。我国亟待强化知识产权创造、保护、运用能力,鼓励大力培育高价值专利。中国要跻身创新型国家前列乃至成为世界科技强国,在知识产权国际贸易上,必须至少是知识产权贸易顺差国。

综上所述,应当客观地认识我国发明专利申请数量及专利有效量,这些数字只能说明我们民众对专利意识的提升,并不能说明我国的科技创新能力的提高

科技期刊文章发表量和研发人员比例

 科技期刊文章在一个国家的科技创新活动中起着基础性的作用,是衡量一个国家科技产出的重要指标之一,全面掌握科技论文的产出情况,是了解和评价国家科技工作的一个重要方面

世界各国科技期刊文章发表量的统计分析得到如下:

可以看到,从2000年开始,中国科技期刊文章迎来“新春天”,到2004年之后,全球范围内的国家的科技期刊发表量已经进入平稳期,而中国仍然继续增长加速,到2016年超过美国,成为发表量最多的国家

再对比2000年之前2000年之后中国科技期刊文章发表总量:

1970至2000年

2000年之后

可以看到,2000年之后的中国科技文章发表总量比重不断上升,跃居世界第二,仅次于美国。而导致这种情况的原因很可能是中国在科技方面的投入加大、科研工作者比例增大

为了印证猜想,我们对中国(包含香港、澳门)的研发人员数(每百万人)可视化。

可以看到,我国科研人员越来越多,且增长速度越来越快从2000年到2018年科研人数翻了5倍。在2009年有减少趋势,可能受到2008年金融危机影响,科研人员就业减少。

对比国际环境下的研发人员投入

中国研发人员虽然增长速度较快,但远低于发达国家中每百万人研发人员数的平均值,和主流发达国家相比差距依然很大

当然,我国人口基数庞大,不太可能追求在研发人员比例这一指标上在全球排位靠前。例如以色列和丹麦人口较少,其科研人员比例居世界第一和第二,仅仅看研发人员的比例不具有较大参考性。

整体看来,我国更多的科研工作者走上国际舞台,更加重视国际论文的撰写,大大促进了中国科技事业的基础发展。但我们也应该认识到,我国论文发表量虽然高居榜首,但撤稿量也居于榜首。这反映了我国应提高论文质量,重复、剽窃“不可忽视”,端正学术态度。同时,在迈向创新型国家前列、建设科技强国的征程上,一定程度提升研发人员比例、拓展研发人员规模是必不可少的选项。

研究与发展支出(占GDP)

 科技是第一生产力不是一句口号,而是需要巨大的投入才能产生理想效果。

影响上述指标的一个根本原因就是国家对科学技术事业的重视程度,而最直接的表现就是国家对研究与发展支出(占GDP),即科技投入在GDP中的比例

当说到科技投入时,大多数人想都没想会认为欧美国家必然是这方面的佼佼者,让人信服的原因在于欧美国家引领了多次工业革命。但事实上当对数据可视化后却有惊人的发现:

可以看到,九十年代以来世界主要发达国家的科技投入呈平稳上升的趋势,但韩国从2000年之后,科技投入不断增大,在2003年超过美国、2009年超过日本,(2019年超过一直霸榜的以色列成为世界第一科技大国)。

而中国在2013年之前一直处于世界科技投入发展的平均值之下,每年稳定增长,在2013年之后逐渐接近平均值。

上述可以看到,韩国虽然和我国浙江省面积相当,但多次占据世界创新指数排行榜第一位,是一个创新强国。韩国重视基础基础科学领域和企业研发,这是值得我国学习和借鉴的。随着我国科研投入的不断加大,我相信未来我国的科技水平跟发达国家的差距会越来越小,未来我国会诞生出更多的高薪技术企业。

高科技产品出口

经济指标中可视化世界各国的国内生产总值

可以看出,中国从1990年开始启动经济加速,直到2009年超过日本,成为世界第二经济大国,但从2020年开始经济发展有所减缓。事实上,这正是受到我国从高数量到高质量的转型政策影响

中国经济应该由高端制造业来拉动。中国的人口红利正在失去,劳动力成本越来越高,于是服装生产、手机组装等低端制造业向东南亚迁移,而我国现在正好是转向高端制造、高附加值的产品制造的时期。

可视化2019年中国的高科技出口量

可以看到,在我国政府采取了一系列措施以后,到2019年我国高新技术产品的出口已经在世界占有很大比重,实现了弯道超车。高新技术产品出口规模的扩大为我国经济的发展,特别是国内生产总值的巨大增长做出了很大贡献。

而高科技出口的迅速扩大与之前提到的研发人员增多、科技论文发表量大、专利保护重视程度加大等有紧密关系。

尽管近几年出口规模不断扩大,但在出口的产品很多是附加值较低的产品。我们应认识到,低技术水平和低附加值的产业结构的劣势仍然存在,高新技术产业发展仍处于不平衡阶段。

教育

尽管我们从多个与科学技术相关的指标来衡量科技水平,但科技的发展根源在于教育

世界银行所给的数据中,中国大多数指标都缺失数据。我找到了能大致衡量相应科技水平的指标:高等教育学校入学(占入学总百分比)。对1990年全世界的高等教育学校入学率可视化:

         可以看到,世界上高等教育入学率高的地区主要集中在北美、欧洲和少数环太平洋发达国家。中国的高等教育入学率远远低于世界水平,主要原因与1977年刚恢复高考,教育制度仍不完善有关。

但我们从上面国内生产总值的可视化分析可以看到,在1990年,中国的经济开始加速度增长。这反映出,当时的经济发展的限制是中低端产业,科学技术所带来的影响较小

继续对2001年的全球高等入学率可视化:

可以看到,在二十一世纪初,中国的高等入学率才将近10%,世界上的高等教育核心仍然在老牌发达国家,新兴的东亚强国如韩国和日本也实现很大突破。中国的高等教育入学率还有很大差距,仍然处于探索阶段。

到2018年,中国首次超过50%,说明中国在近二十年在教育领域所做的尝试取得了较好成果,高等教育日渐正轨化,但与世界其他强大的国家相比,仍有很长一段路要走。

在人类社会的历史长河中,科技创新与高等教育一直相伴相随。要发展科技,必须做好高等教育。

完整动态变化图如下:

结论

本文通过世界银行的数据讨论和列出了科技强国可能的指标体系,对相应指标对中国科学技术发展的影响作出了简单的归纳与分析。建设科技强国需要全面推进创新体系建设这个系统工程,本文仅从狭义的科技维度展开分析,并不是说其他方面不重要,恰恰其他一些方面的发展对科技强国建设具有决定性影响。稳步增加科技投入强度是建设科技强国的最直接驱动力,重视加强基础研究是建设科技强国的战略选择,聚焦创造和发展战略性科技产业是建设科技强国的根本支撑。我国的科技强国之路仍有很长的路要走。

参考文献

https://zhuanlan.zhihu.com/p/321401625

http://www.bulletin.cas.cn/publish_article/2018/10/20181006.htm

http://www.ccpit.org/Contents/Channel_4133/2019/1101/1217541/content_1217541.htm

https://baike.baidu.com/item/%E7%A7%91%E6%8A%80%E7%BB%9F%E8%AE%A1%E6%8C%87%E6%A0%87/12748948#4

https://www.antpedia.com/news/34/n-2429234.html

https://www.sbvv.cn/chachong/5901.html

基于Tableau探索分析世界银行提供的关于科学技术的数据相关推荐

  1. 深度分析|一文读懂银行数据架构体系

    上一篇讲了银行数据仓库的系统架构,这次给大家讲讲数据架构.如果一个系统,没有数据架构,那肯定是在吹牛. 狭义的数据仓库数据架构用来特指数据分布,广义的数据仓库数据架构还包括数据模型.数据标准和数据治理 ...

  2. 个推0代码数据可视化实操 | 基于Tableau的中国奥运数据探索

    8月8日,东京奥运会正式落下帷幕.经过17天的激烈角逐,中国代表团在本届奥运会上共斩获38金32银18铜,位居奖牌榜第二,追平了在伦敦奥运会取得的境外参赛最好成绩. 奥运会期间,奖牌榜上的每一次变动都 ...

  3. 阿里CCO:基于 Hologres 的亿级明细 BI 探索分析实践

    CCO是Chief Customer Officer的缩写,也是阿里巴巴集团客户体验事业部的简称.随着业务的多元化发展以及行业竞争的深入,用户体验问题越来越受到关注.CCO体验业务运营小二日常会大量投 ...

  4. 判断用户是否存在再进行新增_基于tableau从商业分析模型角度对业务数据进行多维度分析--【商业分析类】...

    基于tableau从商业分析模型角度对业务数据进行多维度分析 常规商业数据分析方法: 财务多维指标 客户生命周期 客户价值RFM 客户留存分析 购物篮关联分析 漏斗转化ABtest 以下内容主要从商业 ...

  5. 拍拍贷业务数据探索分析-基于R语言

    ======================================================= 1.前言 根据百度百科和官网:拍拍贷成立于2007年6月,公司全称为"上海拍拍 ...

  6. 【金猿产品展】亚信科技“数据探索分析平台”——深挖数据价值,助客户高效管理和经营生产...

    亚信科技产品 本产品由亚信科技投递并参与"数据猿年度金猿策划活动--2020大数据产业创新服务产品榜单及奖项"评选. 大数据产业创新服务媒体 --聚焦数据 · 改变商业 亚信科技数 ...

  7. 信息科学前沿计算机,基于信息时代背景分析计算机科学技术前沿发展策略

    卢五威 摘要:基于信息科技化时代下,计算机科学技术发展机遇与挑战并存.为了促进计算机科学技术的快速前进,理当科学把握信息时代背景所带来的动力与阻力,方可真正发挥出计算机科学技术的内在能量.但就当前局势 ...

  8. 【MRO】麦思博:MSUP2017 TOP 100 全球经典案例 -《江泽浩:基于物联网智能分析的设备预测性维护》

    作者:江泽浩    来源:数据科学和人工智能 授权 产业智能官 转载 由麦思博(msup)有限公司主办的,以"人工智能时代的研发战略演进"为主方向的第六届全球软件案例研究峰会,于1 ...

  9. tableau商业分析一点通 数据下载_干货分享:谁说设计师不会做数据分析

    上上周手术一结束,拖着疲惫的身体回伦敦,开学,搬家,整理学生公寓房间,全部一个人来,半条命基本去了.不过我还是熬过来了.这段时间都没有文章更新.先和大家说声抱歉.从明天起,我就开始恢复更新频率啦. 今 ...

  10. 如何利用 Kyligence+tableau提高分析效率?

    文章目录 前言 Tableau 如何连接kyligence Tableau+kyligence架构图 提高tableau查询性能 操作步骤 提高实时性 提高数据安全性 提高查询server工作簿性能 ...

最新文章

  1. html大文件占用内存,[Flutter] 大文件上传之随传随处理(避免占用大量内存)
  2. easyui框架前后端交互_Vue+ElementUI+.netcore前后端分离框架开发项目实战
  3. api权限管理系统与前后端分离实践
  4. Hadoop核心组件以及发行版
  5. Feign-自定义配置
  6. STARTUPINFO结构
  7. dll文件的c++制作dll文件的c++制作
  8. JavaScript 设计模式核⼼原理与应⽤实践 之 结构型设计模式
  9. 从XMLHttpRequest中获取请求的URL
  10. System 类 和 Runtime 类的常用用法
  11. anaconda新建环境在PyCharm执行import ssl失败
  12. dreamweaver排列顺序怎么用_「化妆教程」粉底液是怎么用的?用在哪个具体步骤顺序...
  13. 使用delphi开发人工智能程序(环境搭建)
  14. mysql建三行三列表格_制作好的表格怎样才可以成重新编辑
  15. ARM920T MMU and Cache
  16. 华为手机克隆在哪个文件夹_华为手机克隆软件怎么使用?手机克隆APP操作步骤以及下载地址详细介绍[多图]...
  17. C# word类库 光标移动
  18. GD2016noip获奖名单
  19. 51单片机c语言程序执行顺序,51单片机程序执行流程详细分析
  20. 微信小程序 定位 获取经纬度城市街道等位置信息

热门文章

  1. Windows C语言开发环境实践
  2. matlab变压器温度仿真
  3. mpush 服务端配置 for windows 服务自动运行
  4. 淘客基地【推好单-好券】安卓IOS更新公告
  5. 数字信号处理设计与仿真分析
  6. 如何解决hash冲突,ThreadLocal如何解决哈希冲突
  7. 计算机专业论文答辩ppt,计算机行业毕业论文答辩PPT.pptx
  8. 数据库的基本语句(mysql举例)
  9. windows10卸载edge浏览器并将chrome设为默认浏览器
  10. JUnit 5预期异常