[严肃内容]鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示

一、鲁索(Rousseau)教授简介

比利时情报学家、国际科学计量学与信息计量学学会前会长罗纳尔德·鲁索(Ronald Rousseau)教授,国际著名信息计量学专家,被誉为信息计量学之父。

1979年获比利时科学院奖,2001年获国际科学计量学领域最高奖普赖斯(Price)奖。

鲁索和刘玉仙博士,2012,北京

鲁索教授是本网刘玉仙博士、研究员的博士导师。刘玉仙博主是信息科学类杰出博士研究奖(The 2011 Emerald/EFMD Outstanding Doctoral Research Award in the Information Science category)得主。

二、鲁索(Rousseau)与皮尔逊相关系数(Pearson product-moment correlation coefficient)的实质

Ronald Rousseau 等人在2003年发现:“Pearson’s r is probably not an

optimal choice of a similarity measure in ACA”,这里的 Author cocitation analysis (ACA) 是“作者共引分析”。

“皮尔逊相关系数可能不是定量计算‘作者共引分析’相关性的好指标”,真是吓死人了!

皮尔逊相关系数的定义是:

由于rXY计算时减去了“均值”,该系数反映的是两个随机变量X和Y之间波动性之间的“相关性”,而不是“均值”之间的相关性。

下面用几幅图片直观示意一下皮尔逊相关系数的意义。

不难发现,对于两个“均值”不为 0 的时间序列X和Y,

皮尔逊相关系数反映的是其中波动成分之间的“相关性”,即下图:

而不是其“稳定成分/均值”(虚点线)之间的相关性!请参见下图:

所以,分析作者们之间的“共引”情况时,皮尔逊相关系数反映的是“作者们之间共引变化”之间的“相关性”,而不是真正的“共引/稳定成分/均值”之间相关性的强度!

三、鲁索(Rousseau)教授该发现的价值预估

罗纳德·鲁索(Ronald Rousseau)等人2003年的这个发现,真是吓死人了!俺可不敢说出该发现的广泛影响。它绝对是人类21世纪的“重要”科技发现之一。傻以为:在22世纪,鲁索的这个发现应该被评为“人类 21 世纪一百项重要科技成就”之一!

(1)如果认为【牛顿力学】是“第 1 流”是,【麦克斯韦电磁场方程】是“第1.3流”的,

(2)那么,Ronald Rousseau 等人2003年可能首创并将引发一个“第4.5流”上下的重大科技发现。

也许是比“激光和光纤 Laser and Fiber Optics”更重大的发现(发明);很有可能在“高速公路 Highways”水平上下。

最有可能的前途或许是:数据分析不大可能发展成一门符合现今数学分支严格性标准的那种“硬”科学分支,而会以一个其领域没有明确界定的实体而存在,……

上面截图和引用的文字,请看:陈希孺院士,1998,《数理统计学简史》第276页。

四、什么是“相关性”?怎样量化度量“相关性”?都是目前未解难题

就是阿Q,一时也没有办法。

俺找了又找,还没有找到“科学”地计算“相关性”的单一量化指标。

五、俺能提出定量计算“相关性”的新指标吗?

就是阿Q“眼里的阿Q”(简写为“QQ”,不是网站qq),一时也不敢夸下海口。

参考资料:

[1] 武夷山,2015-01-23,“大概近似正确”的评价精选

[2] Per Ahlgren, Bo Jarneving, Ronald Rousseau. Requirements for a co-citation similarity measure, with special reference to Pearson's correlation coefficient, Journal of the Association for Information Science & Technology, 54(6): 550–560, 2003.

[3] 罗纳德·鲁索_百度百科

[4] Ronald Rousseau: Homepage

[5] Derek de Solla Price Memorial Medal

2001 - Ronald Rousseau (Belgium) - Leo Egghe (Belgium)

[6] 美国国家工程院. Greatest Engineering Achievements of the Twentieth Century [EB/OL].

[7] 中国科学院,院士,陈希孺

相关链接:

[1] 2020-7-14,破除论文“SCI至上”:给定量化科技评价研究的一些建议

[2] 2020-06-17,敬请慎重使用和看待“数据统计与分析”的结果

[3] 2020-06-07,[求证] 二十世纪最伟大的工程成就:关键时间与起因

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!

转载本文请联系原作者获取授权,同时请注明本文来自杨正瓴科学网博客。

链接地址:http://blog.sciencenet.cn/blog-107667-1242781.html

上一篇:[随感] 未来的人类教育模式

下一篇:[讨论] 住监狱是否能做出更好的科技成果?

皮尔逊相关系数php,科学网—[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示 - 杨正瓴的博文...相关推荐

  1. matlab mic系数_科学网—最大信息系数 (Maximal Information Coefficient, MIC)详解(1) - 彭勇的博文...

    最大信息系数 (Maximal Information Coefficient, MIC)详解(1) 四年前看过的一篇论文,当时还在组会上报告过,很确信当时把它弄懂了,由于当时是用机器学习的方法来做预 ...

  2. 计算机安全会议2017,科学网-第四届中国密码学与数据安全学术会议(CCDS2017)在衡阳师院召开-李浪的博文...

    7月26日,由西电密码公社.智能信息处理及应用湖南省重点实验室.衡阳师范学院嵌入式计算与信息安全研究所组织,衡阳师范学院计算机科学与技术学院承办的第四届中国密码学与数据安全学术会议(CCDS2017) ...

  3. 无线无法解释服务器域名,科学网—Ubuntu 17.10 WIFI无线网络无法解析DNS域名的解决方法 - 徐勇刚的博文...

    把笔记本电脑(联想Y460)的操作系统从Ubuntu 16.04LTS升级到了Ubuntu 17.10, 发现WIFI无线网络能够连接上, 但就是上不了网, 比如无法访问百度(www.baidu.co ...

  4. 差分电荷密度怎么画_科学网—差分电荷密度图、电荷局域密度图(ELF)的画法及分析 - 叶小球的博文...

    关注: 1) 电荷密度图.差分电荷密度图及ELF的原理 2)  计算方法及参数设置 影响ELF准确性的参数有哪些?  在计算效率与准确性/精确性之间权衡. Ecut, KPOINTS? 3)  画法及 ...

  5. c语言 宏 变长参数,科学网—C/C++中处理变长参数函数(Variadic Function)的几个宏 - 彭彬的博文...

    近日在模式中进行非线性方程组求解时遇到变长参数函数的问题,以前从来没有自己写过变长参数的函数,于是补了一下课,将近日对该小问题的学习和理解整理如下. 一.变长参数函数(variadic functio ...

  6. openacc的Linux安装教程,科学网—opensuse 13.1 系统 openACC编译器使用及GPU并行编程环境配置 - 马小军的博文...

    本文讲述opensuse13.1系统openACC编译器使用及GPU并行编程环境配置. 这里以笔记本显卡驱动为NVIDIA为例 在安装前,请确保系统已经安装kernel-devel ,kernel-s ...

  7. matlab批量生成灰度图像_科学网—matlab彩色图像的批处理转换为灰度、二值和主成分图图像 - 金秀良的博文...

    这段代码主要用来进行图像的批处理转换为灰度.二值和主成分图图像,希望给大家借鉴.其中 RGB to bw可以直接实现,但是效果不好,所以先用RGB to gray,之后再gray to bw.RGB ...

  8. matlab流量结构分析,科学网-分享求解“结构分解分析(SDA)”各项均值的MATLAB程序-计军平的博文...

    点此下载(MATLAB File Exchange) [2015.02.18补充]其他研究人员的MATLAB代码 Sayago-Gomez, Juan Tomas, (2014), Matlab Co ...

  9. 2018ei期刊目录计算机,科学网—2018年智能计算与信息系统国际会议(ICIS2018)征文期刊EI检索 - 周建国的博文...

    2018年第二届智能计算与信息系统国际会议(2018 the 2nd international conference on intelligent computing andinformation ...

最新文章

  1. 计算机信息管理技术 互联网,计算机信息管理技术在网络安全中的运用思路
  2. 批量设置word文档的页面格式 word vba代码注释
  3. poj1182 and 携程预赛2第一题 带权并查集
  4. python运维开发之第八天(socket)
  5. SQL50道练习题(1-15)
  6. 实训41 2018.6.2
  7. Windows 的开发好痛苦
  8. 听听【八年阿里架构师】怎样讲述Dubbo和Spring Cloud微服务架构
  9. 把用户输入的文本转义(主要针对特殊符号和emoji表情)
  10. LINUX SHELL判断文件、目录是否存在
  11. Hierarchy Viewer的基本使用
  12. 回到现实的民营航天,离商业化还有多远?
  13. 微信小程序-计算器小程序《从零开始学微信小程序》
  14. 2.微处理器:8088功能结构图【BIU 和 EU】 + 8088【内部各寄存器】的解释
  15. python复数的概念及运算_python 复数运算
  16. Hadoop集群搭建07_克隆搭建Linux集群环境
  17. 关于开源项目《Scavenger》
  18. 计算机cdef盘无法显示,科技常识:如何解决电脑CDEF盘都打不开出现ldq
  19. 使用过滤器做一个过滤敏感词实例
  20. Multi-AP Specification V2.0 中文翻译 第12章

热门文章

  1. Python和numpy下载安装方法
  2. 如何通过ssh远程连接自己的主机(Linux)?
  3. Lua C API 的正确用法
  4. 系统动力学:非线性世界的视角
  5. Autolisp no function definition
  6. 微信小程序与VS webapi局域网内联调
  7. 巨型冰山惊现格陵兰,好莱坞大片场景上演
  8. 列举一些 MacBook Pro 必需的外设和应用程序推荐
  9. apache 基本vhost配置
  10. word宏命令批量修改图片大小