摘 要:SCI论文(引用)及期刊“影响因子”,被当今学界视为最权威的学术评估手段,却严重忽视了这两者纯粹的商业性质。本文集中考察三个方面内容:SCI论文(引用)和期刊“影响因子”的历史形成过程;上述两者规则设计的合理性质疑;揭示两者背后的商业化运作机制及学术包装手法。

关键词:SCI(科学引用索引);JCR(期刊引证报告);影响因子;尤金·加菲尔德

 

一、科技信息的商业价值

二、SCI和JCR的历史起源

三、SCI推广之诺奖预测

四、学界对SCI的争议

五、对“影响因子”两项准则合理性的质疑

六、为商业机构打造高端学术形象

七、“黄金俱乐部”的准入门槛

 

  英国《自然》杂志(Nature)创刊于1869年,如今已成科学神话。它在中国科学界更是高居神坛,据2006年《自然》杂志上题为“现金行赏,发表奖励”的文章中说,当年中国科学院对一篇《自然》杂志上的文章给出的奖金是25万人民币,而中国农业大学的类似奖赏高达30万人民币以上,这样的“赏格”让《自然》杂志都感到有点受宠若惊。[[1]]

  《自然》之所以被学界捧上“神坛”,主要的原因,是它在风靡全球的“刊物影响因子(impactfactor)”游戏中,长期以来遥遥领先于世界上绝大部分科学杂志——2014年,它的影响因子高达41.5,在SCI期刊中位居第七。换言之,对《自然》的迷信,很大程度上就是对SCI和期刊“影响因子”的迷信。

  但奇怪的是,与这种“迷信”形成鲜明对照,学界对SCI和期刊“影响因子”的历史形成过程,了解却十分有限,而且几乎完全没有注意到这两者纯粹的商业性质。当前的研究,仍然集中在把SCI和期刊“影响因子”当成理所当然的权威学术评估手段,用于衡量个人、学术团体、研究单位、甚至一个国家的整体学术水平。另一方面,由于对相应历史缺乏必要的了解,即使对“游戏规则”的合理性有所质疑,也难以形成深入的看法。

  本论文将从科学史研究视角出发,结合SCI和期刊“影响因子”的历史形成过程,从源头上对其规则设计的合理性进行深入考察,并揭示这两种学术评估手段背后的商业化运作过程,这是前人未曾涉及的工作。

 

一、科技信息的商业价值

  科学情报研究所(Institute for ScientificInformation,以下按通行习惯简称ISI)逐年发布的科学引用索引(Science CitationIndex,简称SCI)和期刊引证报告(Journal CitationReport,简称JCR),被当今科学界视为两种最权威的学术评估数据。许多人误以为它们是由“科学界权威机构”发布的——尽管实际上这家“科学情报研究所”从一开始就是一家地地道道的商业公司,1992年又被汤森路透(ThomsonReuters)收购。只是ISI的这一性质,多年来一直不太为普通公众和许多学界人士所知。

  行用半个多世纪以来,两种数据已经彻底改变了科学界的学术生态和发表机制。创立者尤金·加菲尔德(EugeneGarfield,1925~),个人经历显得中规中矩,没有任何“出格”之处。他1925年出生于纽约布朗克斯区,1949、1954年先后从哥伦比亚大学获化学学士学位和图书情报学硕士学位,1961年获宾夕法尼亚大学结构语言学博士学位。

  1956年,在职攻读博士的加菲尔德注册成立一家名为DocuMation的小公司,推出的第一款信息产品——目录快讯(CurrentContents,简称CC),是一种对管理类杂志目录进行定期汇编的小册子。除了零售散卖,贝尔实验室(BellLab)成为他第一家企业用户。加菲尔德后来回忆,为了完成与贝尔签订的500份订单,需要先投入500美元作为印刷经费,他靠从私人银行贷款才勉强度过难关。[[2]]

  加菲尔德的事业转折发生在1960年。这年他将公司正式定名“科学情报研究所”,此前曾一度改名“尤金·加菲尔德学会(EugeneGarfield Institute)”,与美国国家健康学会(The NationalInstitute)合作,获得国家科学基金(NSF)30万美元政府资助,共同承担建设基因文献引用索引库(GeneticsCitation Index)项目。

  项目对1961年28个国家出版的613家期刊20000本杂志上的140万条参考文献,建立引用索引,进行编目,最终结果共得五卷,其中基因类文献的引用索引独立成一卷。1963年,基因引用索引数据库顺利结项,加菲尔德原本期望国家科学基金能进一步提供资助,将余下四卷一起出版,但后继申请计划被拒。加菲尔德决定独立承担出版事宜,并将其统一命名为科学引用索引(ScienceCitation Index),即学界现今所熟知的SCI。

二、 SCI和JCR的历史起源

 

  SCI收录一定范围数量的期刊——这通常也被称为“源刊(sourcejournals)”,通过在源刊文本和源刊参考文献之间建立“引用索引(CitationIndex)”,可提供检索学者的SCI论文发表数量和被引用次数——在理工科领域,对学者学术水平的评判现今主要取决于这类数据。

  1964年,ISI首次出版1961年SCI报告,此后逐年出版,延续至今。ISI在1973、1978年相继推出的社会科学引用索引报告(SocialScience Citation Index,简称SSCI)和艺术&人文科学引用索引报告(Arts &Humanities Citation Index,简称A&HCI),完全套用了SCI的产品思路和模式。

  从方法上来说,SCI 采用的“引用索引”受到的是美国一种判例援引法律工具书的启发。美国法律遵照“判例”原则,法院进行判决时,必须与本院或上级法院此前对相似案例做出的判决保持一致。1873年,芝加哥一个叫弗兰克·谢帕德(Frank Shepard1848~1902)的法律出版商,开始出版一种他自己编印的工具书,在判例和援引案例之间建立索引,统一进行编列,并标记判例是否已被推翻、撤销、修改或加入限制条件。这种工具书能帮助律师快速了解一个判例是否仍然适宜援引,出版后大受欢迎,法律人士几乎人手一本。谢帕德的名字甚至衍化成了一个法律术语“Shepardize”,意为“查阅《谢帕德引证》”。[[3]]

  JCR,即“期刊引证报告”,本质上是SCI的衍生产品,它逐年发布的期刊影响因子(详见下文),是基于对SCI(后来包括SSCI和A&HCI)“引用索引”数据进行整合处理后得到的结果,该数据现今已成为学界评判期刊优劣的权威指标。[[4]] 1975年,JCR首次以SCI附卷的形式出版,1993年,它被独立推向市场。

  作为一种期刊评估手段,JCR的思想源头可追溯至格罗斯(Gloss)夫妇1927年《科学》(Science)上的一篇文章。他们试图解决这样一个问题:在图书馆预算有限的情形下,应该参照什么标准为学生购买供查阅的化学期刊?[[5]][[6]]

  最简便的方法,当然是找一个权威专家为图书馆开列一个目录清单,但这会受到专家本人阅读经验和个人好恶的左右,特别在购买范围较大的情形下,并不太适用。

  格罗斯夫妇提出的解决方案是,选取知名刊物《美国化学学会杂志》(Journal ofthe  American ChemicalSociety),对它1926年发表的247篇文章的3633条参考文献进行统计,按引用次数对所有被引刊物进行排序,刊物重要性与排序结果直接对应,图书馆可参照此清单进行购买。这种筛选方式操作简便,且不存在太高专业“门槛”,很快被其他信息科学家借鉴推广到别的学科领域(参见表1先前学者的整理结果)。[[7]]

表1: SCI和JCR出现之前各学科筛选期刊的方式

作者(论文发表年份)

选取期刊数量

参考文献数

学科领域

Gross &Gross,1927

1

3633

化学

Allen,1929

9

2165

数学

McNeely & Crosno,1930

7

17991

电气工程

Gross & Woodford,1931

6

3574

地理

Gregory,1934

~40

26760

医学

Hooker,1935

5

12794

物理学

Hackh,1936

20

22575

牙科

Henkle,1938

1

17198

生物化学

Brown,1956

57

38000

多学科

Garfield,1961

613

约140万

所有科学学科

  SCI作为JCR的数据基础,相较前人有所突破的地方在于,不再区分学科类别,收录期刊海量增加。

  但这并不是它们之间根本的区别,根本区别在于,格罗斯夫妇及其后继者们采用同样的方案对期刊进行筛选时,还保持着非常“纯洁”的动机,为的是创造便利、服务学术。SCI和JCR却不是这样,它们从一出生就是商业信息产品,“赚钱”才是它们与生俱来的属性。

这种属性也是加菲尔德千方百计让它们位居高端,凌驾于学术之上的真正动力。其中力证SCI可以预测诺奖,对帮助实现这一目标,起到了关键作用。

三、SCI推广之诺奖预测

 

  1965年,即SCI推向市场的次年,在美国海军研究办公室(Office for NavalResearch)主办的一次学术会议上,加菲尔德和他的助手提交论文做了大会报告。[[8]] 当时ISI迫切需要打开SCI的市场,所以这次大会报告很大程度上也是一次不失时机的产品推介。加菲尔德的报告从五个方面阐释了SCI的功能:

  1)便于学者了解前人工作,减少不必要的重复研究;2)作为评估研究成果的手段;3)便于追踪发表成果的来源和出处;4)可用于计算期刊的“影响因子”(参见本文第5节);5)为科学史研究提供一种有效的辅助手段。

  在阐述第2项功能时,加菲尔德选择了最能撩拨学界敏感神经的“诺奖预测”来进行论证。他利用1964年首次出版的1961年度SCI报告比较了两组数据:

  1)1961年共有257900位学者的成果被SCI论文引用,统计他们的引用情况;

  2)1962、1963年共产生13位物理、化学和医学诺奖获得者,统计他们1961年度被SCI论文引用的情况。

  从数据结果可看出(参见表2),13位学者在得诺奖的前一年,他们的成果被SCI论文引用的平均数量和次数远高于一般水平。这确实能说明,优秀科学家群体有着更高的SCI论文被引用数,但并不足以支撑加菲尔德的论断:SCI论文引用数可以反过来用于评估单个学者的学术水平。

  事实上,就在两年前的一篇文章中,加菲尔德还主动发出警告,利用论文引用次数评估科学家和科学成果可能存在风险,理由是“论文的影响和论文的重要性及意义是两码事”。他甚至非常恰如其分地引用了苏联李森科(T.D.Lysenko,1898~1976)的例子,说如果引用次数最多的作者应该获得诺奖,那会得出李森科是苏联最伟大科学家的荒谬结论。[[9]]

  其实13位诺奖获得者中,已经存在一个明显的反例。按照加菲尔德的统计,1963年度物理学诺奖获得者,约翰内斯·詹森(J. H.Jensen1907~1973)1961年3篇论文的SCI引用才4次。如果单凭SCI论文引用次数来衡量詹森的成果,会得出一个荒谬的结论,这位诺奖得者的学术水平连平均线(5.51次)都没达到。

表2: 1961年两组SCI引用数据的对比结果

1961年SCI引用情况

人均被引论文

人均被引次数

论文平均被引次数

自引率

257900位学者

3.37篇

5.51次

1.57次

7.8%

13位1962-63 诺奖得主

58.10篇

169次

2.90次

10.5%

比较结果

17.24倍

30.67倍

1.84倍

  但是,加菲尔德在随后持续打造SCI“产品形象”的过程中,却似乎完全忘记了当初发出的警告。从1965至1983年间,他先后撰写了30余篇文章,力图证明SCI论文引用可以“预测”诺奖。在1990年的一篇综述文章中,加菲尔德对这些文章的讨论结果进行了归纳(参见表3)。[[10]]

表3:1961-1990年六组SCI“高引作者”名单预测诺奖的结果

引用年份

1967

1972

1961-72

1961-75

1961-76

1965-78

截取年限

1

1

11

14

15

13

引用排名

前50

前50

前50

前249

前300

前1000

已获诺奖者

8

5

5

13

15

26

起止年份

1967-90

1972-90

1972-90

1975-90

1976-90

1978-90

后获诺奖者

6

7

13

38

22

35

获诺奖总人数

145

118

118

97

89

76

  列表中的数据,以1967年为例,该年度论文被引用数排名前50的学者中,包括8位已获诺奖的人士,1967年至1990年共产生145位科学(物理、化学和医学)诺奖获得者,其中有6位出现在这个名单上。余下5组数据,包含了类似的信息。

  这些结果中,SCI“高引名录”中已获诺奖的人数不能说明问题。因为一旦某位学者获得诺奖,立马会被当成首屈一指的“大权威”供奉起来,他的论文自然会受到更多关注,也就可能获得更多的SCI引用。

  要检验引用是否可以预测诺奖,主要还得看“高引名录”未来究竟产生了多少诺奖获得者。从加菲尔德呈现的6组数据来看,“高引名录”获诺奖的概率确实比较大,两者存在“正相关关系”。如果把抽样年限加长、名单扩大,这种相关性还会得到加强。

  不过,只要稍微深入探究一下,就会发现加菲尔德对数据的处理存在三个问题:

  首先,非常明显的一个问题是,加菲尔德有对结果进行“选择性呈现”的重大嫌疑。我们知道,学界每年新增SCI论文数以万计,这些论文产生的引用会让SCI高引作者名单各年大不相同,而且截取年限不同,高引名单的结果也不一样。加菲尔德6组数据起始年份各不相同(最早为1961年),截止都在1990年(综述写于这一年),截取年限依次为1年、1年、11年、14年、13年和15年,并无章法可循。套用他的做法,如果把1961到1990年30年按所有可能截取的持续年限进行排列,会得到465种结果,对应排列出来的高引名单应该有465份——而加菲尔德仅仅给出了其中6份,呈样率仅为1.2%,他没有交代如此选择的任何理由(哪怕宣称是“随机抽取”)。

  其次,没有说明“高引名单”人数的选取标准。通常情形下,名单越长,出现诺奖得主的概率也就越大。加菲尔德的6组数据,名单人数从最初的50扩大到了后来的1000,并没有给出任何解释理由。

  再次,没有明确预测的有效年限。通常来讲,预测事件发生是有时限要求的。加菲尔德6组数据的预测年份截止于1990年,只是因为他的综述写于这一年,意味着“高引名单”的预测有效期限可能止于任何年份,也可能永久有效,这完全背离了“预测”的基本要求。

在加菲尔德之后,有学者采用相同路径加入“预测”行列,[[11]] 这些研究对引导学界相信SCI论文高引名单可成功预测诺奖,起到推波助澜的作用——实则是在自觉不自觉帮助SCI树立产品形象。

  ISI 2014年最新公布的“高引名录(highlycited-2014)”,包括的科学人士多达3216位。尽管该名录2014诺奖命中为零,但这并不妨碍它继续受学界追捧。因为在“SCI引用”风行整个学界的年代,能进入“高引名录”已经被当成学术水平突出的象征。另一方面,按照加菲尔德早就备好的逻辑,它放眼的是未来,2014不中,但保不准名单上会出现2015、2016乃至未来更远年代的诺奖得主。

  事实上, SCI引用数据究竟能不能预测诺奖,学界当前还存在相当大的异议。学者金格拉斯(Y.Gingras)和华莱士(M.Wallace)2010年做了一项研究,他们对比物理和化学领域的两组数据:逐年统计1901-2007排名前500的高引作者的被引用情况;[[12]] 和1901-2007年330位诺奖得主的被引用情况。统计结果显示,1900-1945年间,诺奖得主在获奖当年的平均被引用次数明显高于其他高引作者,出现一个突出的峰值;但是从1946年至2007年,这样峰值再未出现。这意味着,1900-1945年间,成果引用确实可以看作预测诺奖的有效风向标,但是从1950年代开始,试图凭借成果引用从高引学者中鉴别出诺奖得主,已经完全没有可能。[[13]]

  金格拉斯两人把解释的理由归结为两点:1950年代以来科研人数在急剧增加;物理、化学领域专业分支在不断细化。如果他们的研究结论成立,这会导致一个加菲尔德不愿意看到的事实,在SCI开发出来的大约20年前,它在“预测”诺奖这件事上就已经失效了。

四、学界对SCI的争议

  值得注意的是,SCI还处于早期推广阶段的时候,在学界已经引发争议。1970年,围绕加菲尔德在《自然》杂志上宣传SCI功能的文章《研究科学的引用索引》——其实就是1965年报告的缩减版(参看本文第三节),[[14]] 一些学者表达了异议。

  争论焦点主要集中于这个问题:利用SCI论文引用次数来衡量学者的学术水平,是否是一种合理的做法?科学人士的主要观点可归纳如下:[[15]]

  1)    引用并不仅仅表示赞同,还包括对前人成果的批评或一般性综述。一些作者为了获得引用,可能有意制造耸人听闻的“诈文”。

  2)    引用带有很大主观性,某些情形下,论文被频繁引用只是因为作者是知名学者,和论文学术水平无关。

  3)    一些学者虽然有着可观的论文引用数量,但引用发生在早前的年代,实际情形是他们当前的学术创造力已经枯竭。

  4)    没有出现在论文参考文献中的成果,并不意味着完全没有影响。一些在相关领域被普遍接受的专业术语,同行在论文中提及一般不会给出原始出处。

  5)    论文引用与奖励、基金申请、职位申请等直接挂钩,会导致配合引用等作假手段。

  6)    SCI在收集处理引用数据的过程中,存在不容忽视的误差。

  7)    对于集体成果,只计算论文第一作者引用次数的做法不合道理。典型例证是生化学家奥利弗·罗瑞(O. Lowry1910~1996)1951年与另外三位作者共同发表的一篇论文[[16]],在加菲尔德1967年统计的“高引作者前50名”中,罗瑞因这篇论文位居第一,它当时被引次数已达2350次,但另外三位合作者并没有出现在名单上。

  针对这些质疑,加菲尔德公司团队做出了回应,ISI欧洲分公司高管考克尔(A. E.Cawkell)反驳说,学者们列举的SCI缺陷都属于“可能事件”,而非“必然事件”,所以不会影响SCI作为评估手段的有效性,加菲尔德则再次强调诺奖预测的有效性。[[17]][[18]]

  与《自然》杂志类似,《科学》(Science)杂志上两位学者1972年的一篇文章也引发同样争议,他们利用1965年SCI报告对物理学家的研究成果进行评估,得出结论认为只有少数精英科学家对物理学发展做出贡献。[[19]]

  两份期刊关于SCI的讨论只是短暂一现,随后很快归于沉寂,但这些争议对我们当下重新审视SCI对学界产生的影响及后果,却有很好的参照和启发作用。

  到1990年代,当一些学者开始意识SCI的使用正在失控,并试图重新质疑其合理性时,SCI“权威学术评估手段”的地位已无可动摇。学界最终“跪倒”在SCI面前的结果是,早期少数学者发出的警告不仅一一应验,甚至其它更夸张、更离谱的事情也正在发生。这样的情形下,回头再看学者阿兰·麦凯(AlanMackay)1974年《自然》上的文章《发表还是毁灭》(Publish orPerish)——他把SCI称为“学术独裁(tyranny)”,确实具有超前的预见性。[[20]]

五、对“影响因子”两项准则合理性的质疑

 

  1955年,“影响因子”首次作为一个专门术语出现在加菲尔德在《科学》杂志上的一篇文章中,他在两个地方谈及“影响因子”:[[1]]

  通过该系统(注:指科学引用索引),可以有效检索收录期刊论文被哪些文章引用过,这在历史研究中将发挥明显作用,当人们尝试评估某项研究成果的意义,或它对同时期的文献或思想产生的影响时,“影响因子”应该比科学家出版成果的绝对数量更具说服力。

  对于意义重大的文章,引用索引具有量化价值,它能帮助历史研究者评估文章的影响——这也就是“影响因子”。

  从这两段话可以看出, 加菲尔德最初是将一篇文章的被引用次数当成“影响因子”。

  后来在1963年的一篇文章中,加菲尔德把“影响因子”定义重新修正为“期刊文章的平均被引用次数”。[[2]] 这主要是为了解决期刊“体量(size)”差异带来的问题。按照格罗斯夫妇首创的传统期刊评估方法,期刊优劣取决于它总的被引用次数,但通常情形下,期刊发表文章的数量越多,获得的引用次数也就越多。对一些“体量”小的期刊而言,传统方法无疑是不公平的。

  汤森路透现今逐年发布的JCR报告上,影响因子算法的标准定义是:期刊X在前面两年发表的源刊文本(sourceitems)在当年度的总被引用数,除以期刊X在前面两年发表的文章(article)总数量,即为期刊X当年度影响因子的得数。[[3]] 其中“源刊文本”,指的是SCI(后来包括SSCI 和A&HCI)任一收录期刊上发表的所有文本。算式表达为:

期刊N年度影响因子=【期刊(N-2)+(N-1)年所有源刊文本在N年度的总被引用数】/期刊(N-2)+(N-1)年发表文章总数

  从算式可看出, 计算期刊“影响因子”需遵守两项基本准则:

  第一准则,源刊文本的“引用窗口(citationwindow)”是两年。通俗的解释就是,SCI期刊文本只在发表后第二、三年度发生的引用,对期刊“影响因子”产生有效贡献——尽管实际上它们可能一直会被引用。

  加菲尔德在1972年《科学》杂志上的文章中,对这一准则的设定进行了解释(参见该文注释29)[[4]], 他通过逐年统计1964至1970年SCI收录期刊的参考文献,发现发表年限在三年内的比例依次为:31.09%、30.24%、26.60%、25.91%、25.32%、25.18%和23.95%(换一种呈现方式就是,期刊参考文献和注释发表年限在三年以上的比例依次为:68.91%、69.76%、73.40%、74.09%、74.68%、74.82%、76.05%)。

  从这组数据,加菲尔德还总结出一种趋势,随着SCI收录期刊数量逐渐增加,发表年限三年内的被引用文献比例在逐渐下降——这意味着如果这种趋势保持下去,比例可能越来越小。但不知何故他居然就得出判定,“论文被引用主要发生在发表当年后的两年内”。

  照理来说,“两年有效引用”作为“影响因子”算法非常重要的一项准则,加菲尔德有必要在文章中(或单独撰文)详细说明缘由,但他居然只用一条注释草草带过。这也难怪一些西方学者在讨论中,甚至无从知晓“两年”标准是按什么依据得来的。[[5]]

  事实上,针对这一问题,学者格兰采尔(W. Glanzel)和莫伊德(H.Moed)2002年的一篇论文,已经提供了一个非常有力的反驳案例。[[6]] 他们抽样考察医学期刊《柳叶刀》(Lancet)和社会学期刊《美国社会学评论》(AmericanSociologicalReview),对两份期刊1980年发表文章在之后十年的平均被引用率进行逐年比较。发现在前面三年,《柳叶刀》1980年论文的平均引用率明显高于《美国社会学评论》,但随着年限逐渐累积,《美国社会学评论》的引用率大大高于《柳叶刀》(参见表4)。

  这一结果意味着,对医学期刊和对社会学期刊采用同样的“引用窗口”年限并不合理。医学作为最活跃的研究领域,新旧理论的更迭在频繁发生,其中某些成果发表后引发的关注甚至是“爆发式”的。而是在人文社会学领域,新的思想和观点提出后,往往需要等待若干年的“发酵”,才可能引发关注。换言之,汤森路透-ISI逐年公布的“影响因子”结果,很难讲是一个客观的结论。

表4:两份期刊1980年发表文章不同年限的平均引用率

引用年限

平均引用率

1980-80

1980-81

1980-82

1980-85

1980-89

柳叶刀

0.6

2.4

4.5

9.7

14.0

美国社会学评论

0.2

1.8

4.3

12.1

20.9

  不过,在“影响因子”被捧上神坛的今天,学界即使意识到这一点,“路径依赖”已让他们别无选择。2003年,加菲尔德对“两年有效引用”的回应,就完全是一副“木已成舟能奈我何”的架势:

  我们不想等若干年后才了解一份期刊的被引用情况。ISI完全有能力计算3年、5年的影响因子。我们甚至有10年、15年的影响因子数据库,但它们需要单独订阅。[[7]]

  在这个傲慢的表态中,“影响因子”的合理性是无所谓的,商业利润才是王道——“它们需要单独订阅”。

  第二准则, “影响因子”算式分母的“文章”只包括“原创研究论文(original researchpaper)”和“评论(review)”。

  这一准则专门针对的是那些除了发表原创论文和评论,还发表社论、技术通信、来信、通告、读者来信、科学讯息观察和报告、书评等文本的刊物,当今世界上最知名的几家刊物——《自然》、《科学》、《柳叶刀》、《美国医学会杂志》(TheJournal of the American MedicalAssociation),以及《新英格兰医学杂志》(The New England Journal of Medicine),都属于这一类型。对单纯发表原创论文的期刊,如知名的《现代物理评论》(Reviewsof Modern Physics)和《化学评论》(ChemicalReviews),就不需要进行这种区分,因为它们的“源刊文本”数量就等于“文章”数量。

  这一准则的形成也有一个渐变的过程。1972年,加菲尔德发表在《科学》杂志的一篇文章中,[[8]] 以1967、1968和1969三年的SCI数据为基础,计算1969年度的期刊“影响因子”,他当时的做法是将《自然》、《科学》、《柳叶刀》、《美国医学会杂志》这类刊物上的所有文本都计入算式分母,理由是(参见该文注释28):“全部计入”不失为较为便捷的处理手段;更重要的是,“这些期刊上的非学术文本也是潜在的被引用文本”。

  这种做法显然对《自然》、《科学》之类的期刊非常不利,庞大的分母直接拉低它们的影响因子,排名结果全都落到40之后(参见表5)。

  针对这一情况,在1975年首次作为SCI附卷发布的JCR报告中,加菲尔德对规则进行调整,规定分母项只包括三类“学术文本”:原创研究论文(originalresearch articles)、评论文章(review articles)和技术报告(technicalnotes)。“非学术文本”不再计入的理由是,它们“很难获得引用”。[[9]][[10]]

  分母数量大幅减小对《自然》、《科学》这类期刊的影响因子结果产生了立竿见影的效果——尽管加菲尔德只委婉地承认“部分归结于这个原因”,但相较1969年,它们的排名全部大幅上升,其中《美国医学会杂志》惊人地提升了100位(参见表5)。

  分母规则在1995年度的JCR报告中再次被调整,范围进一步缩小,“技术报告”被剔除,只保留“原创研究论文”和“评论文章”两项——这一做法基本保持到今天。[[11]]

关于“准则二”还有很大的讨论空间,此处姑先指出这一点,后文将做进一步探讨。

表5:1969、1974年五本知名刊物在不同标准下的影响因子排名结果

年份

排名

自然

科学

美国医学会杂志

柳叶刀

新英格兰医学杂志

1969

修改定义前的位数

55

40

127

99

56

1974

修改定义后的位数

38

10

27

8

3

  相较SCI推广阶段引发的争议,一个饶有意味的对比结果是,尽管“影响因子”从提出到算法定则最终确立,与《自然》和《科学》有着极深的渊源——1955年,它首次作为专门术语出现在《科学》上;1972年《科学》刊登了1969年度期刊“影响因子”报告;1976年,《自然》摘载了JCR报告的减缩版——考虑到JCR在1975年才首次出版,这几乎等同于这两份大牌期刊在帮助它进行市场“预热”和产品“推广”了,[[12]] 而且这两份期刊当时没有出现任何对它的质疑或讨论文章。[[13]]

  一种可能的解释是,“影响因子”当时没有引起学界的关注。但这种解释不合常理,因为“影响因子”是基于SCI报告的数据得出的,如果SCI存在诸多不合理之处,“影响因子”当然也会存在缺陷,何况加菲尔德提出把“影响因子”作为衡量学术期刊优劣的标准,涉及的同样是学界非常敏感的问题,很难想象学者们能对SCI提出犀利的质疑,对“影响因子”的缺陷却完全视而不见。

  关于“影响因子”和《自然》杂志之间的微妙关系,笔者将在后续论文“Nature实证研究之四”中,展开进一步的专题研究。

六、 为商业机构打造高端学术形象

  ISI创立之前,美国的科技情报通常由政府学术机构牵头采集、整理和公布,套用今天时髦的话来讲,加菲尔德一手开创了科技情报的商业化经营模式。《科学》杂志1978年的一篇文章称他为“把信息王国建立在脚注上的百万富翁”,可谓十分贴切。[[14]]

  对加菲尔德而言,1964年投产SCI完全是背水一战的商业冒险。为了弥补资金缺口,他把公司20%股权以50万美元价格卖给华尔街风投。SCI当年的市场发售价格为700美元,老年加菲尔德在一次访谈中回忆,它的第一份订单来自美国中央情报局(CIA)图书馆,出人意料的是第二份订单——它来自中国。[[15]][[16]]

  事实证明,加菲尔德对SCI的产品决策堪称“高风险高收益”。SCI从1964年推向市场到1971年短短七年时间,ISI的利润平均每年以27.5%增长,随后又开发了十余款新品,公司业务迅速拓展到全球近十个国家,成为世界第一大科技信息服务咨询公司。[[17]]

  1988年,加菲尔德把ISI超过50%的股权卖给JPT出版公司(JPTPublishing)。1992年4月,汤森路透以2.1亿美元价格收购JPT出版公司。据汤森路透首席运营官说,交易主要是为了得到ISI,“ISI在全球拥有30万客户,每年净利润约为1500万美元”。[[18]]

  当前,汤森路透和英国里德·爱斯维尔集团(Reed Elsevier,成立于1993年)、荷兰威科集团(WoltersKluwer,初建于1836年),共同占据全球情报市场90%的份额。[[19]]

除了SCI和JCR这样的“灵魂产品”,ISI开发的其它知名产品还包括:[[20]]

  目录快讯(CC),1956年首次面市,对各类期刊和书籍的目录进行汇编,以周刊形式出版,订阅者可通过它快速了解相关领域最新发表的前沿消息。CC最早只对管理类期刊的目录进行汇编(前面提到贝尔实验室购买的这就这种),1957年,它将汇编对象拓展到医药、化学、生命科学等领域的学术期刊。作为ISI开发的第一个产品,CC在SCI出现之前一直是公司最赚钱的产品。

  化合物索引库(IndexChemicus,简称IC),这一数据库除了有助研究者了解新出现化合物的相关研究数据,还可获得重要有机化学期刊对它的评价结果。1960年开发推出后尽管一直只赔不赚,但加菲尔德对其倾注巨大热情,手下四名主要副手集体辞职也未能迫使他终止,IC如今已成为汤森路透的又一热门产品。

  由于ISI经营的客户对象以学者和学术机构为主,所以尽可能让自身显得“学术”,也是一种非常重要的营销手段。

  在公司草创阶段,加菲尔德对公司的冠名,已经带有明显的学术包装意味。如果说“尤金·加菲尔德学会”的前用名还显出几分“伪学术”的话,“科学情报研究所”听起来就完全像一家政府科学机构了(这对中国这样的发展中国家来说尤其如此)。加菲尔德非常坦率地承认,他要的就是这种容易引起混淆的效果——为的是与化学摘要(ChemicalAbstracts)和国家医学图书馆这类政府学术机构争夺市场,“特别是在国外,‘科学情报研究所’这样的叫法,很容易被当成一家非盈利机构”。[[21]]

  ISI商业运转正式上轨之后,接纳了两位诺奖获得者成为公司董事会成员,这其中当然也有打造高端“学术”形象的考虑。[[22]]

  此外,为了拉近和学术圈的关系,ISI为学术机构、大学图书馆设立专项奖学金,奖金可作为这些机构购买ISI产品的抵扣——这其实相当于发放某种商业“抵扣券”。[[23]]

  当然,最有效的手段还是发表学术论文和参与学术研讨会,产生的效果可谓一举两得,除了提升企业学术形象,还可以把论文发表期刊和研讨会作为ISI产品的推广平台。

  加菲尔德本人在这方面充分发挥了表率作用,他一生勤奋高产,对倾力打造的各种信息产品相关的科学写作,始终保持着高昂的兴趣——其中不少成果发表在《自然》、《科学》这类被学界认为高端的期刊上。据作者统计,从1950年代至2012年,加菲尔德发表文章400余篇。1986年,他还创办了《科学家》(TheScientist)杂志。

  ISI的学术“包装”是如此卓有成效,以至有被误导的公众经常写信抗议,指责ISI作为一家政府科技情报机构,履行职责并不到位。为此加菲尔德又不得不反复澄清,表示ISI完全是一家以市场盈利为目的的商业公司。[[24]]

七、“黄金俱乐部”的准入门槛

  加菲尔德1985年写过一篇文章专门谈论他的“生意经”,标题是“为你的钱袋子着想”。 [[25]] 大意是,在收录期刊增加、通货膨胀导致成本投入增加的情形下,ISI两种主要产品——CC和SCI的价格涨幅,仍然大大低于行业同类产品的平均增长水平,这主要得自公司不断改进技术,完善产品功能,吸引更多用户,达到了薄利多销的目的。为了贴补成本,《目录快讯》从1982年开始刊登商业广告。[[26]]

  这些做法都表明,ISI经营方式和一般商业公司并无二致,都要参照成本预算、销售业绩的前提下考虑可能赚取的利润。所以ISI每年都要做严格的预算,控制期刊的收录数量,对什么样的期刊满足收录条件,设定相应的准入门槛。

  以SCI为例,早期对收录期刊的选择并没有统一标准,主要由加菲尔德的团队根据经验进行鉴选。但人为经验往往存在很大局限,比如,1964年发布的首期SCI报告,居然没收录在科学界享有很高声誉的《哲学通汇》(PhilosophicalTransactions)[[27]],而另一份当时享有世界声誉的苏联期刊《热工程杂志》(Teploenergetica),直到1968年才首次被收录。[[28]]

  JCR的出现,为SCI筛选期刊提供了一项相对独立的参照评估指标:通过计算待选刊物的“影响因子”,可以了解它被SCI期刊引用的情况。[[29]]

  以此为基础,加菲尔德将SCI筛选收录期刊的标准归纳为三条:

  待选刊物的SCI引用情况;

  杂志本身需要满足的各种形式要件(出版周期、编辑团队、作者国际多样性等);

  相关领域专家的评估意见。[[30]]

  汤森路透基本沿用了这三条筛选标准。[[31]] 其实,按加菲尔德的说法,这样的规则在早期运用过程中,由于存在成本控制的问题,已经存在“灵活操作”的余地:

我们每年做完杂志收录预算,一如既往总有一些杂志出版社或编辑会表达意愿,希望他们的杂志能被收录进来。如果杂志完全满足筛选要求,那怎么办?我们要么告诉杂志主办方等下一年,要么让他们同意自己支付杂志收录的相关费用,这样做可以帮助我们在预算允许的情形下继续经营下去。[[32]]

  当然,加菲尔德也不忘记澄清,“原则上这是好事。但也造成一些下意识的猜测,认为杂志可以靠钱买进CC或SCI的收录名单。”[[33]]

  而这样的事也确有发生,1995年8月,《科学美国人》(ScientificAmerican)在一篇文章中批露,墨西哥一家期刊为了能被SCI收录,每年被要求花10万美元订阅ISI的信息产品。[[34]] 汤森路透为此大为光火,威胁要将《科学美国人》告上法庭,后者迫于压力,在10月号上做了更正声明,才算了结此事。[[35]]、[[36]]

  SCI如今俨然已被打造成学界的“黄金俱乐部”,准入门槛今非昔比,特别在发展中国家,学术期刊一旦被SCI收录,即被看成“权威”的标志。

  日常生活中常见的情形是,一些高级“俱乐部”对申请加入的成员,除了必要的资质考量之外,还要求交纳高昂的“会员费”。在SCI面世不到十年的时候,一些符合收录要求的杂志,已经被要求自己为“准入”费用埋单。而如今,在坐落于美国纽约时代广场的汤森路透公司独家经营下,SCI和JCR背后究竟是怎样的光景,确实给人留有很大的想象空间。

SCI和影响因子:学术评估与商业运作——Nature实证研究相关推荐

  1. jeecg输入中文查询导表为空_学术利器—SCI期刊影响因子查询/中文核心期刊查询系统更新...

    吐槽 想起自己第一次投中文期刊的情形:当时学校最低要求是发表一篇核心级别的期刊论文,但是哪些期刊是核心期刊呢?完全不知道!都怎么投稿呢?也完全不知道!只能问问周围的同学或者师兄师姐.他们也就知道谁谁谁 ...

  2. 国产期刊崛起!上海大学、郑州大学主办期刊IF超15,2021版SCI期刊影响因子出炉...

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新SCI期刊影响因子,正式出炉! 6月30号,科睿唯安发布2020年度<期刊引用报告>(JCR,Journal Citatio ...

  3. 2020年遥感类期刊SCI期刊影响因子排名—遥感, 地理, 水文类

    2020年遥感类期刊SCI期刊影响因子排名-遥感, 地理, 水文类 1. 影响因子 欢迎学习交流! 邮箱: z-@1-6.com 网站: https://zephyrhours.github.io/ ...

  4. 中信所怎么查期刊影响因子_年sci期刊影响因子分区中信所.xls

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp学术论文&nbsp>&nbsp期刊/会议论文 年sci期刊影响因子分区中信所.xls236页 ...

  5. 2015 SCI期刊影响因子出炉

    2019独角兽企业重金招聘Python工程师标准>>> 2015 SCI期刊影响因子出炉 今天,汤森路透< SCI 期刊分析报告>(Journal Citation Re ...

  6. 如何查看SCI期刊影响因子

       近期在看论文时多关注了一下期刊,想着未来肯定会考虑期刊影响因子等因素,于是查到了一个比较好的网站--LetPub    官网介绍: LetPub 是ACCDON(美国)旗下为非英语国家科研学者提 ...

  7. 建议收藏!最新的(2019年)电子/计算机领域SCI期刊影响因子大全

    北京时间6月29日晚,科睿唯安发布了最新的SCI收录期刊影响因子,本文对来自电子/计算机领域的期刊做了汇总,供读者收藏查用! 往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等 ...

  8. [转]2016年度通信类 SCI期刊影响因子公布

    原文链接:http://wap.sciencenet.cn/blog-1315223-1061324.html?mobile=1 IEEE COMMUNICATIONS SURVEYS & T ...

  9. 计算机类sci期刊影响因子排名,【科研】全球最新SCI期刊影响因子排名:第一名187.040!...

    排名 杂志名称 影响因子 1 CA-A CANCER JOURNAL FOR CLINICIANS 187.040 2 NEW ENGLAND JOURNAL OF MEDICINE 72.406 3 ...

最新文章

  1. html5改成块状标签,HTML5基本网页结构以及标签的改变
  2. ListBox combobox的常用功能
  3. 深圳电信网速测试工具
  4. Java和OC的区别
  5. mysql pid_mysql pid文件是什么用途
  6. 1200兆路由器网速_如何选购路由器才能发挥宽带的网速?
  7. js根据name获取value_js 函数的重载
  8. Jenkins学习总结(6)——Jenkins 的安全实践
  9. 【Java从0到架构师】SpringBoot - 入门_配置文件_YAML
  10. javascript 函数2——对象排序
  11. 【STM32 基础实验蜂鸣器发声】
  12. 安装esxi时候的No Network Adapters报错 解决办法
  13. 智慧泵房泵站无线远程监控检测系统方案
  14. excel文件修复工具_文件恢复工具 – 修复文件属性篡改
  15. [问题已处理]-centos7 history命令没有任何记录
  16. 自动刷票工具的实现机理简介
  17. Urllib2库+正则爬取内涵段子
  18. 【2019.05】python 爬取拉钩数据(静态+动态)
  19. Java课程设计_java课设
  20. redhat7磁盘扩容详细步骤

热门文章

  1. Linux策略性路由应用及深入分析(iproute2)
  2. 100小时学会sap傻瓜式入门版生产计划pp篇
  3. python中io中的+模式_Python的高级特性,模块和IO操作
  4. Java编程ture找不到符号,为什么会出现这样的错误呢
  5. python技术分享_分享几个python的使用技巧
  6. 有序列表ol与无序列表ul用法
  7. git21天打卡day11-删除分支
  8. 领导让我重写测试代码,我该怎么办?
  9. 盘点下常用的接口测试工具,有几个你肯定没用过
  10. php启动端口修改,PHP_启动服务端口报错