撰文 戚译引

一项新研究证明,由于人为疏忽和论文数据库缺陷的共同作用,标题带有连字符的论文引用次数统计结果偏低,这一规律适用于各个学科。

本次研究的数据来自全球两大引文索引数据库—— Scopus 和 Web of Science。Scopus 属于爱思唯尔(Elsevier)旗下,它的统计数据被用于 QS 全球高校排名的评估,而 Web of Science 提供关于期刊影响因子和 h 指数(h-index)的权威统计结果。

这项研究由香港大学(University of Hong Kong)计算机科学荣誉教授 T.H. Tse 与伍伦贡大学(University of Wollongong)研究人员合作完成,于 5 月 7 日在《IEEE 软件工程学报》(IEEE Transactions on Software Engineering)发表。

粗心的同行

连字符会导致引用数量减少,一部分是由人为疏忽导致的。研究人员在论文中指出:“输入错误的一个很可能的原因是,当作者们引用标题中含有连字符的论文时,他们可能会漏掉其中一些连字符。”

这个结论与先前的另一项研究相符。先前的研究发现,许多研究人员不会检查引用文献的标注,甚至从别人的论文中直接复制粘贴部分参考文献列表,导致错误的引用被一再重复。

论文中还指出,如果一个科学家在引用某篇文献的时候出现了错误,他就很可能在接下来几年发表的多篇论文中继续犯同样的错误,因为错误的信息已经被储存在文献管理软件中(如 BibTex)。

不同学科中,论文标题中连字符数量与平均引用次数之间的关系。图片来源:University of Hong Kong

担心研究成果被抢发?这家近 10 分的期刊决定接受“第二名”论文投稿 | 生涯频道 | 领研网​www.linkresearcher.com

引用越多,损失越大

研究人员还发现了一种“累进税现象”。累进税(progressive tax)指税率按应纳税额的增加而逐级提高的税制,在这里指的是当你的论文引用数量越多,因为连字符标注疏忽而损失的引用数比例也就越大,论文中称之为“连字符税”。具体而言,当引用数 <20 的时候,标题中连字符数量对论文的引用次数影响不大;而当引用数 >180 的时候,标题中连字符数量将产生很大的负面影响。

出于同样的原因,和较晚发表的论文相比,较早的论文更容易受到标题中连字符数量的影响。在经历二次、三次引用的时候,如果先前的论文在参考文献中把标题写错了,这个错误可能会被重复;就算先前的论文写对了,下一个引用的人也可能犯错。

论文标题中的连字符甚至还会拉低期刊影响因子。以《IEEE 软件工程学报》为例,研究分析发现,该期刊在某一年的影响因子与其前两年中发表的论文“标题含‘-’率”(即有多大比例的论文标题中含有至少一个连字符)之间有显著的负相关。

一个连字符的 N 种写法

研究人员指出,他们选择连字符来测试系统的鲁棒性,是因为它的用法格外模糊。一个“-”可以代表至少 6 个不同的事物——连字符、减号、短破折号、长破折号、横杠(horizontal bar)、表单符号。

不同的数据库可能会对连字符进行不同的处理,最终导致汇总统计结果出现混乱。例如,一篇论文的原始标题是“Metamorphic Model-based Testing Applied on NASA DAT —an experience report”,前一个“-”是连字符,后一个“—”是破折号。Scopus 和 Web of Science 的系统都把破折号修改成连字符,Scopus 还在连字符后面加了一个空格;IEEE 数字图书馆把“—”替换成两个连字符“--”;ACM 数字图书馆和 Google Scholar 干脆把它换成了冒号。

同一篇论文在不同数据库中的不同显示。图片来自论文。

因此,如果某个科学家通过其他渠道读到了这篇论文,然后进行引用,他就很可能在参考文献中列出一个和原始文献不一样的标题,导致系统无法准确识别引用情况。研究人员还真的找到了这样的案例——有人引用了这篇论文,并且将标题中的破折号写成了冒号,而 Web of Science 的数据库没有把这次引用算进去。

数据库该升级了

先前有研究发现,平均而言,论文引用数量与标题长度负相关。显然较长的标题中更有可能含有更多的连字符,但是经过进一步分析,研究人员发现对于含有同样数量的连字符的文章,标题长度对引用数没有明显的影响。

研究人员总结:“根据研究结果,我们质疑引用数和期刊影响因子的可靠程度,因为论文标题中的连字符数量与论文和期刊的实际质量无关。”

如果根据这个结论建议研究人员避免在标题中使用连字符,可能对某些学科不太公平,比如化学。要求所有人认真检查参考文献标注、保证不犯错也不太现实。研究人员认为,一个成熟的论文数据库系统应该具备足够的鲁棒性,学会自行纠正人为的标注错误,以及更好地兼容其他系统的数据。

PS:或许是受到研究结果的启发,这篇论文的标题中使用了冒号,但没有用连字符。

捏造的参考文献竟被引用400次!科学家为何会被“幽灵文献”欺骗? | 生涯频道 | 领研网​www.linkresearcher.com

论文信息:

Metamorphic Robustness Testing: Exposing Hidden Defects in Citation Statistics and Journal Impact Factors, Zhi Quan Zhou ; T.H. Tse ; Matt Witheridge

DOI: 10.1109/TSE.2019.2915065

https://ieeexplore.ieee.org/document/8708940

对‘pthread_create’未定义的引用_全球两大引文数据库,都在悄悄少算引用次数...相关推荐

  1. ubuntu 编译c程序报错:对‘pthread_create’未定义的引用

    在ubuntu里编译c多线程代码,命名包含了头文件<pthread.h>,却还是编译报错,说对'pthread_create'未定义的引用 原因: pthread库不是Linux系统默认的 ...

  2. 对pthread_create未定义的引用

    pthread库不是Linux系统默认的库,连接时需要使用库libpthread.a,在编译中要加-lpthread [kou@localhost practive]$ gcc creat.c /tm ...

  3. pthread_create未定义的引用

    在ubuntu使用gcc编译时出现"pthread_create未定义的引用"问题. 解决如下:在编译时加入-l pthread.例如gcc thread.c -o thr -l ...

  4. 编译Linux程序出现“对‘pthread_create’未定义的引用”

    在学习Linux程序设计POXIS线程的时候,编译一个段简单的代码,就出现下面的错误: 1 /tmp/cc2FQJTh.o:在函数'main'中: 2 1-thread.c:(.text+0x29): ...

  5. 美通企业日报 | 施耐德电气全球两大设计中心落户西安;托福全球开放下午场考试...

    要闻 瑰珀翠全新伊芙琳玫瑰系列全球首发 国内最隐秘的高尔夫球场之一 -- 富春山居度假村 施耐德电气全球两大设计中心落户陕西西安 托福全球开放下午场考试,缩短重考周期 生物科技公司Semma获福泰制药 ...

  6. 施耐德电气全球两大设计中心落户陕西西安

    以"共享新时代机遇,共创高质量发展"为主题的陕西省政府国际高级经济顾问会议在西安举行.全球能效管理和自动化领域的数字化转型专家施耐德电气应邀作为顾问企业之一,为陕西省经济发展献言建 ...

  7. 特别报道:从全球两大黑客年会看攻击趋势

    要认识现今黑客功力,每年7月陆续在美国举办的全球两大黑客活动──黑帽大会(Black Hat)与Defcon,就是见识顶尖黑客大显身手的好时刻.今年会议上,黑客们不仅试图入侵现场ATM提款机.无线网络 ...

  8. 一人之下双词条鸿蒙,《一人之下》张怀义的两大秘密,都是人人梦寐以求的!...

    原标题:<一人之下>张怀义的两大秘密,都是人人梦寐以求的! 张怀义到底隐藏着什么秘密?个人认为各大势力会对张怀义感兴趣的原因一个是功法(炁体源流),一个就是长生不老的秘密.下面具体说明一下 ...

  9. 对‘pthread_create’未定义的引用_【学习贴士】引用文献不积极,APA Guideline 帮助你...

    我当年写论文的时,有时候不怕听到老师说今天要读哪一本书,最怕是老师说要用什么文献引用格式,APA引用格式可是我的老冤家了(怨念脸)~ 根据维基百科,APA引用格式是"一个广为接受的研究论文撰 ...

最新文章

  1. 如何在Node.js中退出
  2. SuperTuxKart 1.0 发布,开源赛车游戏
  3. Winform中实现简单的登录成功后跳转到主页面的逻辑
  4. 谷歌技术三宝之BigTable
  5. matlab randomsample,randperm和randsample函数用法对比
  6. python 安装wheel .whl文件
  7. Keepalived实战(3)
  8. scp创建远程目录_如何在 HPC 硬件上远程运行大型仿真?
  9. Android面试题整理
  10. RNA 6. 差异基因表达之-- 火山图 (volcano)
  11. python蓝屏代码_死机、卡顿、蓝屏,Python部门的老江湖告诉我的一些超级变态代码...
  12. musiclink-v1.9 一款php源码的音乐外链程序,musiclink-v1.9 一款PHP源码的音乐外链程序 - 下载 - 搜珍网...
  13. saltstack python3_SaltStack事件驱动(3) – BEACONS
  14. 解决“Error: Too many re-renders. React limits the number of renders to prevent an infinite loop.”
  15. 如何零基础制作一款自己的游戏!(一)
  16. Cesium--倾斜摄影加载详细攻略
  17. dos攻击的工具——pentmenu
  18. K8S-解决报错--总结日记
  19. Flutter自定义Widget之炫酷粒子时钟效果
  20. 云米AI洗碗机Iron A1 AI消毒除菌版上手体验

热门文章

  1. echarts 3d地球 背面光线太暗_国内超炫裸眼3D案例鉴赏,大家更喜欢那一个!
  2. java制作风车图像的main方法_创意图形的绘制 会转的风车
  3. oracle 10g ocp 047解析(精简版),ORACLE 10G OCP 043 笔记
  4. php地址地区选择器,区域选择 - 按大区及省市多选区域,可自定义用于其它业务 – 基于ThinkPHP和Bootstrap的极速后台开发框架...
  5. The Suspects(并查集入门)
  6. .o文件 linux生成,vmlinux.o 生成
  7. python实现logistic增长模型
  8. [机器学习]关联挖掘介绍
  9. Cairngorm 3 libraries 简介 是通过google翻译加上自己的理解得来的
  10. 牛津词典 2018 年度词汇 ——「有毒」!