鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

嗑盐的你,用过Sci-hub吗?

作为一个能免费看论文的学术搜索引擎,Sci-hub是科研人员的秘宝,同时,却也是学术出版商眼中的大毒瘤。

现在,有人站出来,用统计数据为Sci-hub正名:

能通过Sci-hub下载的文章的被引次数,是Sci-hub上下不到的文章的1.72倍

也就是说,Sci-hub的下载量,已经成为论文影响力的重要指标。

这个结果一公布,立刻引发了网友的共鸣:

我总要先能看文章,然后才能引用啊。

Sci-hub,让文章更具影响力

这项针对Sci-hub影响力的研究,被研究人员们公开放在了arXiv上。

研究人员认为,Sci-hub作为一个闻名全球的项目,对于学术体系中的所有人都影响深远。

因为它能绕过大多数学术出版商的付费墙,实际上增强了论文的潜在影响力。

他们希望通过数据证明,Sci-hub的下载量与论文未来的引用量是正相关的。

数据集

研究人员为此准备了两个数据集,其中包含Nature、Science在内的12种顶级期刊上发表的文章信息,横跨神经科学、经济学等多个领域。

第一个数据集包含2015年9月至2016年2月这段时间内,能从Sci-hub上下载到的所有文章。

第二个数据集则来自传统的Scopus数据库,包含同一时段内,在选定期刊上发表的所有文章。

并且,通过跟第一个数据集的对照,研究人员筛掉了其中能在Sci-hub上下载的文章,使其仅包括无法通过Sci-hub免费获取的论文。

对于每一篇论文,研究人员都统计了其中图表的数量。另外,还统计了每篇论文第一作者和通讯作者的H-index、每本期刊的影响因子,以及每个作者所属国家的研究资源等数据。

研究结果

根据引文统计分布,文章引用次数超过2000次的论文被视作离群值。

研究人员通过最小二乘法、离群值影响、带有工具变量的稳健回归、异方差校正等等一系列广义加成模型来评估关系的敏感性。

在控制了所有的偏差来源之后,结果显示,能从Sci-hub下载的论文的被引次数,是不能从Sci-hub下载的论文的1.72倍(p<0.001)。

并且,Sci-hub下载量越高,论文的被引次数也越高。

在所有选定的期刊和涉及的学科中,Sci-hub的影响都很明显。

另外,结果也表明,图表丰富的论文更容易被引用。

研究人员认为,这样的Sci-hub效应具有多重意义。

第一,除了作为一个面对全球开放存取的「线上图书馆」,Sci-hub的下载量也可以作为一个重要的参考数据,用以预测论文未来的引用量。

第二,Sci-hub效应的存在,表明论文的版权限制,很可能会阻碍科研人员的工作。

在过去的几十年里,不仅通过像Sci-hub这样的途径「盗版」的科学论文越来越多,arXiv这样的开放预印本论文平台也越来越受到科研人员的认可。

不过,矛盾的是,Sci-hub的存在也可能反过来维护了当前的出版系统——当人们有途径能获取免费论文时,对封闭出版系统带来的限制感知就没有那么强烈了。

影响全球学术界的Sci-hub

Sci-hub创建于2011年。创始人是一位来自哈萨克斯坦的研究生Alexandra Elbakyan。

科研女神,在线挥手

她的初衷很简单——天下苦学术出版商久矣。

毕竟,学术出版商是这样定价的:

对于一家上市公司来说,赚取多少利润合适,答案是“看市场能承受多少”。

以Elsevier为例,其订阅费每年都在上涨,到了2018年,加州大学(UC)系统平均每年要向Elsevier支付约1100万美元(约合7377万元人民币)的订阅费用。这还没完,在协商签订新协议的时候,这家出版商还要求继续提价。

而早在2012年,Elsevier公布的利润率就已经超过了40%。赚钱能力甚至超过了苹果、微软等科技巨头。

这样的巨额收费,一直被认为是在阻碍科学开放、知识民主。

而Sci-Hub不仅包含Elsevier,还提供Springer、IEEE旗下期刊、ACS等出版商的文章,覆盖范围非常广。

所以,不仅是中国、印度这样的发展中国家给Sci-hub提供了大量下载量,Science网站2016年发布的一份报告显示,在2015年9月到2016年2月期间,美国本土就有115万次Sci-hub下载请求,仅次于俄罗斯位居第五。

这无疑动了学术出版商的蛋糕。单纯站在法律角度,也确属违法。

2015年11月,在Elsevier的控告下,Sci-hub域名遭到封锁。从此Sci-Hub开始了流浪之旅,迁移到美国无法管辖的地方,网址频频更换。

创始人Elbakyan也为了避免被引渡到美国,开始四处躲藏。Science网站评价她是“可敬的利他主义抑或大型犯罪者,而这取决于你的立场。”

但无论如何,学术出版商利用长久以来积累的名望,使科研人员们不得不为职业生涯考虑,接受其昂贵的订阅收费服务,甚至被限制在论文发表后公开免费放出论文,这样的现状,负面影响正在慢慢显现。

正如这项研究中谈到的,对论文的访问限制,可能会导致科学研究无法充分发挥其影响力。

你觉得呢?

传送门

论文地址:
https://arxiv.org/abs/2006.14979

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

特惠福利 | 一站式音视频解决方案

想赶上直播电商、在线教育、小程序直播的风口?腾讯云音视频解决方案为您助力!

腾讯云推出9.9元产品体验包,包括云点播、云直播、实时音视频,总有一款适合你。识别二维码即可体验:

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

SciHub下载量成论文影响力预测指标:能被下载的论文被引次数高出72%相关推荐

  1. APP下载量成空洞,留住用户最关键

    首先请各位扪心自问,自己每天花在移动应用上所占的时间比例是多少,同时笔者通过网上的调查数据得知,很大一部分用户将自己89%的时间都花在了移动设备的应用程序上,虽然数字看似比较夸张,但回头想想,其实你会 ...

  2. 爆!亚马逊美国站又出新功能;TikTok下载量成世界第一;快时尚品牌Forever 21重返中国…|洞悉跨境

    "亚马逊美国站发布公告称为卖家推出"Send to Amazon"功能,帮助卖家更快更轻松补充FBA库存,且无需任何费用也不需要注册. " 每晚八点·洞悉跨境 ...

  3. 获取自己所上传资源的下载量

    import requestsurl = 'https://download-console-api.csdn.net/v1/user/sources/getUploadListByUserName? ...

  4. 开服8小时下载量破600万,App Store免费榜连续7天霸榜,摩尔庄园怎么就突然火了呢?

    最近,有一档游戏可谓是热火朝天.家喻户晓,几乎每天都有与之相关的话题登上微博热搜,这档游戏可以说是真的火了. 今年的六一儿童节,曾经风靡一时的游戏 IP 摩尔庄园正式上线推出手游版本,上线当天,它便喜 ...

  5. 关于“论文他引次数”、“检索号”及“ESI 高被引论文”的查询方法

    关于"论文他引次数"."检索号"及"ESI 高被引论文"的查询方法 (一)国内发表论文他引次数查询方法 为方便各单位查询国内发表论文的他引次 ...

  6. 从数据开始:『安卓读书』8000 万下载量炼成记

    本文引自安卓读书李健俤的原创文章 安卓读书于 2010 年正式上线便接入友盟统计平台,截止到目前,安卓读书在各大应用市场下载量已累计超 8000 万,积累了 5000 万名用户,这样的奇迹是如何炼成的 ...

  7. 超Facebook,TikTok成全球下载量最大应用

    ​作者 | Rei Nakafuji 译者 | 祝涛 出品 | CSDN(ID:CSDNnews) 在东京,一项2020年的全球下载调查显示,自2018年开展这项调查以来,中国开发的视频分享应用Tik ...

  8. 刘强东痛批京东中高层拿 PPT 欺骗自己;拼多多海外版成美国下载量最高应用;腾讯加入 RISC-V 基金会|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  9. “砍一刀”潜力巨大? 拼多多海外版成美国下载量最高应用

    12 月 26 日消息,随着美国消费者对通胀和经济衰退的担忧日益加剧,许多人正在转向来自中国的一款新移动应用,即拼多多海外版 Temu.自从 9 月份上线以来,Temu 在美国人气飙升,最近还成为下载 ...

最新文章

  1. 细思极恐!只需54块钱,你也能让AI伪造一系列联合国发言
  2. CTFshow 命令执行 web56
  3. boost::hana::minimum用法的测试程序
  4. 判断一个字符串是否另一个字符串的右移后的
  5. [html] 举例说明图片懒加载的方案有哪些?
  6. MATLAB自定义画布大小
  7. 【实操手册】一篇文章教你快速开始使用视频点播
  8. Win8 Metro(C#)数字图像处理--2.50图像运动模糊
  9. npm包的语义版本控制(Semantic Versioning of Packages)
  10. React Router学习
  11. 【实习之T100开发】T100 双档程序开发流程
  12. 运动目标跟踪(二)--搜索算法预测模型之粒子滤波
  13. web前端优化--图片优化
  14. Java飞机大战 项目-源码
  15. Java中各种读写文件的方法
  16. 球面投影全景图快速拼接
  17. 微信如何查看是否被删好友,这4种方法简单快捷!
  18. 猕猴桃酵素的功效_过路老熊_新浪博客
  19. androidstudio虚拟机打不开的解决方法,一路坎坷,靠运气成功的!!!
  20. Windows电脑添加和删除路由(附管理员打开cmd方法)

热门文章

  1. python基础(1.5-1.7)
  2. [Bjoi2014]大融合
  3. 探秘Tomcat——连接篇
  4. 避免在WHERE条件中,在索引列上进行计算或使用函数,因为这将导致索引不被使用...
  5. 让jquery中的load不缓存方法
  6. 虚拟内存,虚拟地址空间,用户空间,内核空间
  7. 页面加载进度条改进版
  8. 专家门诊[第258期] 备战2012下半年软考——项目管理、网络工程
  9. pytest框架安装(MacOS)
  10. 计算机查找文件的速度,如何快速搜索文件_怎么加快电脑里的文件搜索速度