新生搜索神器Microsoft Academic Search与Google scholar、PubMed、wos、embase大PK!

微软学术搜索(Microsoft Academic Search)的服务器正在迅速扩张,试图覆盖所有学术领域。

初进MSAcademicSearch,简单大方的界面无疑是最吸引人的地方了,很干净而且有条理,这点比很多搜索引擎(Google Sscholar, Arnetminer)的好很多,给人的第一印象很好,应该能吸引挺多无意中逛到这来的用户,赞一下设计人员~
首先说说亮点,先扬后抑,嘻嘻:
1. 搜索框输入时支持逻辑连接(与、或),但是好像概念上存在模糊,不过这点已经能够满足一些特殊需求。
2. 每个author的Co-author graph做的不错,而且能切换到co-author的graph,界面也很炫,这点很赞,是一个很大的亮点~


不过开始使用后还是发现不少问题,有待改进:

1. 搜索框中输入时没有自动补全(automatic completion)功能,对于现在被惯坏了的用户来说这已经是个基本要求了,既方便了用户,同时也可以在无形中提高搜索量,因为可以向用户提供一些与其搜索目标比较接近但原来并不了解的选项。
 ●下图为在MSAcademic、Google、Arnetminer搜索框中输入“shipeng”(搜索“shipeng li”)后的结果显示,Google和Arnetminer都有自动提示(都包含有“shipeng li”),而MSAcademic却没有。


 而作为体现搜索引擎个性化和智能化水平的高级搜索选项,MSAcademic的Advanced search实在让人大跌眼镜,几乎就和基本搜索无异。

●下图显示了MSAcademic和Google Scholar的高级搜索选项,MSAcademic (仅下左图中红色部分)又一次完败。

2. 数据库太小,这是最大的弊端了,大家用搜索引擎不就图个方便么,希望能以最简单高效的方式找到最全面的信息,但是MSAcademicSearch 在这点上远远弱于google,很多知名学者的论文搜索结果居然是个位数,让用户很失望。
 ● 在MSAcademic、Google scholar和Arnetminer中搜索“shimin hu”分别有8条、131条、84条结果,巨大的差距啊!
学科局限性太窄,基本都是计算机专业的相关研究方向,在这一点上google scholar的覆盖面要广得多。虽然说CS很火,但除此之外的广大用户群就这样被无情地抛弃了(比如EE的很多方向,以及走遍天下都不怕的数理化。。。),而且这是一个很大的市场,为什么不考虑去分杯羹呢?不知道是否由于数据库的问题,是否可以考虑利用Bing的搜索结果进行一些相关的分析和处理呢?
3. 搜索结果的排序让人摸不着头脑,名字?引用量?貌似都不是,比如点击进入Organization->Asia&Oceania后的学校排列(好久才找到USTC啊)和进入USTC后的老师排列都没有明确的顺序,而且不能进行关键字搜索。如果用户只知道关于该学校或者老师的部分信息(比如USTC在Asia&Oceanis或者某老师在USTC)时很难快速定位到搜索目标,一般用户希望看到的是按照字典顺序排列的结果并且可以在结果中进行搜索(google 和百度都有此功能,见下图),这样根据用户需求定制搜索结果极大方便了用户,而MSAcademic的搜索结果则让人不知所措。
4. 是否可以考虑将某个author的co-author按照advisor, advisee, coauthor进行分类标注,同时在这个graph中体现出该作者与其他人的relation level(比如用不同长度、粗细的连接线)?比如Arnetminer搜索平台中的视图结构就通过颜色的使用更直观有效地体现了这些信息。

进而考虑根据用户的搜索目标进行一些相关推荐,比如根据其搜索的author的研究领域推荐该领域的其他著名author等,也就是希望能够做到投其所好,这对用户来说是个很不错的体验。
  
5. Paper下载的功能不够强大,显示不够清楚,很多链接点击进入后不能下载,这点应该要向用户明确是能下载全文还是只能看到摘要(通过PDF图标等),希望能够做到IP检测的功能,有权限进入数据库的用户就直接提供下载,否则转入相关会议或杂志的界面。

6. 希望加入course search的功能,向用户提供各知名大学开放课程的搜索结果(如Stanford的Programming Methodology和Yale 的Game Theory等),这对学生来说会有很大的吸引力。


很早就发现了Microsoft Academic Search ,但是以前的它那样弱小,检索出的结果和Google  scholar相比实在是小巫见大巫。所以基本没有,就等着微软将它发展壮大再用了,最近一看,虽然和其他数据库搜索引擎还有差距,但是自身已经长足进步!

最近就自己目前关心的生物力学中的ligament进行检索
虽然从数量上来说谷歌仍是第一,但是不知道你们有没有尝试过,谷歌的检索结果再多,也只能看到100页就在也看不了了。也就是说,其检索结果再多,你也只能看到20000条!

所以在质量上 我个人还无从评价!毕竟各个搜索引擎的检索规则不同!










这是今年science刊登的关于谷歌的帖子:谷歌搜索值得信赖吗?

http://www.sciencemag.org/content/343/6166/14.full
Science 3 January 2014: 
Vol. 343 no. 6166 p. 14 
DOI: 10.1126/science.343.6166.14

  • NEWS & ANALYSIS

SCIENTIFIC PUBLISHING

Google Scholar Wins Raves—But Can It Be Trusted?

  • John Bohannon

View larger version:

In this page 
In a new window
Download PowerPoint Slide for Teaching

At your service. Google Scholar anticipates researchers' interests.
CREDIT: ADAPTED FROM © PCANZO/ISTOCKPHOTO

Over the past year, Jonathan Eisen's reading habits have changed dramatically. For most of the past 2 decades, he has kept up with scientific literature primarily by combing PubMed, the vast trove of online biology abstracts. But these days Eisen, an evolutionary biologist at the University of California, Davis, discovers research relevant to his own work without even looking for it.
The insightful librarian helping keep Eisen up to speed is Google Scholar, a free academic search service maintained by the California-based company. Google Scholar has been studying Eisen closely. It keeps track not only of his own 300 papers and the key words within them—Archaea, Plasmodium, phylogenomics—but also the 38,000 citations to his work in published papers, preprint abstracts, books, and even conference posters. Like a scientific version of the Netflix movie recommendation engine, Google Scholar scours the Internet, scoring all scientific documents for their predicted interest to Eisen, and then sends him a weekly e-mail of recommended reading.
Eisen is part of growing crowd of converts. "Google Scholar is having a great impact on the research-seeking behavior of researchers," says Nicolás Robinson-Garcia, a bibliometric researcher at the University of Granada in Spain. Robinson-Garcia claims that Google Scholar's compendium of articles is at least as comprehensive as the leading commercial academic search databases—Thomson Reuters' Web of Science and Elsevier's Scopus—and for many disciplines in the social sciences and humanities, even better. And by all accounts, it is gobbling up market share. "Google is the dominant referral source for online journal articles, far surpassing the amount of traffic driven by other discovery tools," says David Crotty, senior editor at Oxford University Press in New York City.
But researchers aren't just using Google Scholar as a search engine. Its algorithm provides citation metrics that quantify the impact of their own published work, and these numbers are becoming part of a standard scientific CV. This byproduct of Google Scholar has sparked a new concern: Because it includes sources from across the Internet—not only vetted journals—and has no human curators, Google Scholar's citation metric can be easily gamed.
Robinson-Garcia is part of a team that demonstrated that vulnerability by placing six fake papers with long lists of citations to their own work on a webpage within the University of Granada Internet domain. Google Scholar's algorithm dutifully tallied them as real citations and in a matter of weeks, their Google Scholar citation scores rose significantly. The team's findings appeared online on 11 November in the Journal of the American Society for Information Science and Technology.
If Google Scholar were to provide a breakdown of the sources it tapped for its citation metric, Robinson-Garcia says, "our fraud could have been easily detected." That lack of transparency is a deal breaker for some bibliometric researchers, including Rodrigo Costas Comesa?a of Leiden University in the Netherlands; he calls Google Scholar "an unmanageable tool" for citation analysis.
Google counters that critics are overstating the problem. Anurag Acharya, a co-founder of Google Scholar who leads its development, labels efforts to skew the citation metric as "spam." So far, he says, "the level of spam in scholarly articles remains low." Acharya chalks this up to the "large penalty that would come with being caught" rigging the system in scholarly communities. But if social norms fail to keep academic cheaters in check, he says, "we can and will adjust the level of spam-handling." However, he says, Google has no intention of revealing its algorithm, in part because it is tied up with the company's core search engine.
Google Scholar's ascendance may soon be challenged. "Microsoft is still working in this area too," says Anne-Wil Harzing, the creator of Publish or Perish, a citation analysis tool that uses data from Google Scholar. A service called Microsoft Academic Search is expanding rapidly to cover all academic domains. Meanwhile, Thomson Reuters and Elsevier have a strong financial incentive to keep their services competitive. Many universities are bound by nondisclosure agreements, but Cornell University librarian John Saylor says his institution pays $155,000 per year for access to Web of Science. As Harzing says, "having both Google and Microsoft in this field will surely keep Thomson Reuters and Elsevier on their toes!"
Experts say the competition has another benefit: giving scientists options, so that they don't come to depend on just one service, such as Google Scholar, that may be vulnerable to corporate downsizing. There are "persistent rumors that Google is de-emphasizing or even dismantling the Scholar team," says John Sack, founding director of HighWire, an online publishing platform for more than 1300 journals, including Science. Although Google Scholar generates no direct income, Acharya is upbeat about its future. While he declines to reveal usage figures, he claims that the number of users is growing worldwide, particularly in China. And the Google Scholar team is expanding, not contracting, he says. "Rumors of our demise are greatly exaggerated."

Science:谷歌学术搜索值得信赖吗?

作者:koo

谷歌学术搜索逐渐引起了研究人员的使用兴趣。

在过去一年中,Jonathan Eisen 的阅读习惯发生了显著改变。在之前20年的大部分时间里,他主要通过梳理生物学摘要的在线数据库 PubMed 以了解科学文献。不过最近,身为美国加州大学戴维斯分校进化生物学家的 Eisen 不再从中搜寻资料,但却仍能找到与其工作相关的研究。
帮助 Eisen 实现这一效果的图书管理员就是谷歌学术搜索(Google Scholar),即由位于加州硅谷地区的科技巨头谷歌公司所开发的自由学术搜索服务。谷歌学术搜索密切关注着 Eisen 的研究,它不仅能够跟踪到 Eisen 自己的 300 篇论文及其关键词——古生菌、疟原虫等,还能找到发表的论文、预印摘要、书籍。谷歌学术搜索就像一个科学版的电影推荐引擎,搜索互联网,提供所有其预测会令 Eisen 感兴趣的科学文档,然后每周向他发送推荐阅读的电子邮件。
Eisen 是越来越多支持谷歌学术搜索的人群中的一员。西班牙格拉纳达大学的文献计量研究人员 Nicolas Robinson-Garcia 说:“谷歌学术搜索对研究人员的学术搜索行为有很大影响。” Robinson-Garcia 认为,谷歌学术搜索中的文献纲要至少与领先的商业学术搜索资料库——汤森路透科学网络(Thomson Reuters' Web of Science)和爱思唯尔的斯高帕斯数据库(Elsevier's Scopus)同样全面,在社会科学和人类学领域甚至比其做得更好。据说,谷歌学术搜索正在吞噬市场份额。牛津大学出版社高级编辑 David Crotty 说:“谷歌是在线期刊文章的主要推介来源,远远超过其他搜索工具。”
但研究人员并不只将谷歌学术搜索作为搜索引擎。其算法提供了引文指标,可以量化他们发表的作品的影响,而且这些数字逐渐成为了标准科学简历的一部分。谷歌学术搜索的这一副产品引发了一个新担忧:因为它涵盖了互联网上的数据来源,而不只来自审查期刊,但却没有管理者,因此谷歌学术搜索的量化引用很容易被人操纵。
Robinson-Garcia 参与的一个团队通过在格拉纳达大学网站的一个网页上放置了 6 篇有着多次引用条目的假论文,从而证明了这一漏洞。谷歌学术搜索的算法忠实地记录了这些引用,在几周后,这些研究人员在谷歌学术搜索中的分数显著上升。该团队的发现于 2013 年 11 月 11 日在线发表在《美国科学与技术信息学会期刊》上。
Robinson-Garcia 称,如果谷歌学术搜索中存在对引文指标的分析,“那么我们的欺诈就应该很容易被检测到”。包括荷兰莱顿大学的 Rodrigo Costas Comesana 在内的文献计量研究人员曾因为谷歌学术搜索缺乏透明度而无法接受它,称谷歌学术搜索是针对引文分析的“一个难以管理的工具”。
谷歌反驳称,批评人士夸大了这一问题。引领这一项目的谷歌联合创始人 Anurag Acharya 将那些使引文分析数据出现偏差的数据称为“垃圾信息”。他说:“到目前为止,学术文章中垃圾信息的数量水平还是很低的。” Acharya 将其归咎于学术界对操纵数据进行的“巨大惩罚”。他认为,如果社会规范无法抑制学术骗子,那么“我们可以并将会调整操纵垃圾信息的水平”。不过,他说,谷歌无意透露其算法,部分原因是这涉及到公司的核心搜索引擎。
谷歌学术搜索的优势地位可能很快会遇到挑战。“发表还是灭亡”的创建者 Anne-Wil Harzing 说:“微软也在攻克这一领域。”“发表还是灭亡”是使用谷歌学术搜索数据的一种引文分析工具。被称为微软学术搜索(Microsoft Academic Search)的服务器正在迅速扩张,试图覆盖所有学术领域。与此同时,汤森路透和爱思唯尔用强大财务激励以保持服务器的竞争力。许多大学都受保密协议限制,不过康奈尔大学的图书管理员 John Saylor 称,他所在的机构每年会支付 15.5 万美元以使用科学网数据库的资源。正如 Harzing 所说,“谷歌和微软进入这一领域必将会使汤森路透和爱思唯尔如坐针毡”。
专家称,竞争有另一个好处:让科学家有得选择,这样他们不用只依赖一个服务,例如谷歌学术搜索也许因公司裁员而受到影响。包括《科学》(Science)杂志在内的 1300 多种期刊的在线发布平台 HighWire 的创始董事 John Sack 表示,“有长期的传言称谷歌正在淡化甚至解散学术搜索团队”。虽然谷歌学术搜索并没有带来直接的收入,但 Acharya 仍对其未来持乐观态度。他拒绝透露使用的数据,但声称全球用户数量正在增长,尤其是在中国。而谷歌学术搜索的团队正在扩大,而不是收缩。“关于我们这一项目将会灭亡的谣言是极度夸张的。”

微软学术搜索Microsoft Academic Search

在查询文献时,除了常见的PubMed,Google学术搜索可能是最常用的搜索引擎。但是除了Google学术搜索,微软也有学术搜索Microsoft Academic Search,而且微软学术分析功能很强大,数据全面、清晰、动态、实时。

微软学术搜索Microsoft Academic Search是由微软自己研发的一种搜索引擎,它不同于微软的Bing,Bing也可以搜索学术内容,但是并不局限于此。

微软学术搜索的查询结果排序主要是基于两个方面。1、查询关键词的相关性;2、微软自己的评级。下面简要介绍一下如何使用微软学术搜索。

搜索方式

首先进入微软学术搜索的入口http://academic.research.microsoft.com/,微软学术搜索提供了一般搜索和高级搜索两个搜索方式。当然高级搜索与PubMed比起来根本没法比。

一般搜索直接在搜索框中输入关键词搜索即可

高级搜索可以限制作者、会议、期刊、组织、年代和DOI

其中还有个向下的箭头,可以定制更多的搜索内容。

当然如果你自己很牛X的话,可以一般搜索中直接编辑搜索式进行高级搜索,我不会,也记不住那么搜索式。

搜索结果

微软学术搜索的搜索结果比较简单明了,如以「Syphilis」为关键词搜索,可以得到如下界面。

① 右侧的一栏可以看到每个学科的文献数量,可以点击再次搜索

② 可以看到每篇文章的引用次数

③ 可以看到每篇文章的发表杂志和年代

④ 如果有免费全文的话会有提示并且可以直接下载

⑤ 可以看到迄今为止共有多少类似的文献

⑥ 右上方的「anytime」可以限制发表年代

⑦ 可以订阅搜索结果,通过RSS阅读器及时了解此方面的最新进展

文献详细信息

如果微软搜索仅做到这些那太小儿科了,点击一篇文献进入详细页面,可以看到更详细的信息。

① 可以看到本文历年的引用情况

② 「Citation Context」可以看到哪些方面在什么地方引用了该文献。利用这个功能可以看看是不是有人乱引用

③ 「Citations」可以看到都是哪些文章引用了本文献

作者详信息

点击作者可以进入作者详细页面,如这位大牛

可以看到这位大牛发表了226篇文章,曲线图表示了该牛人的文章被引用情况,总共被引用了2万多次。这位大牛从1912年~2012年共与2034名作者合作过。1912?!100岁了?!是不是有重名的?

通过「Export」还可以把这位大牛的文献下载导入到EndNote,详细的拜读一下。

另外,作者有自己的主页的话,还可以去作者的主页看看,膜拜一下大神。

Co-author Graph

右侧还有一个「Co-author Graph」

进入来看看

可以看到与这位大牛相关的合作作者网络图,通过「Co-Author Path」还可以合作的途径,「Citation Graph」看到与这位大牛合作的单线图。

小结

微软学术搜索相对来说可以一用,尤其是在Google偶而被墙的情况下。而且微软学术搜索的分析功能是其特色,可以利用微软的分析功能来追踪作者。

微软学术搜索相对于Google学术搜索,其搜索文献的质量相对较高,这是我个人的感觉。

新生搜索神器Microsoft Academic Search与Google scholar、PubMed、wos、embase大PK!相关推荐

  1. Microsoft Academic Search vs Google Scholar

    一直以来找论文等学术资料都是去校图书馆的,校图书馆对于在校生是最好不过的了,内容针对性强,又对学生免费.但是不方便访问学校图书馆的人们通常通过免费的学术搜索引擎来查找学术文献.本篇文章对微软的Micr ...

  2. Microsoft Academic Search 微软学术搜索体验

    初进MSAcademicSearch,简单大方的界面无疑是最吸引人的地方了,很干净而且有条理,这点比很多搜索引擎(Google Sscholar, Arnetminer)的好很多,给人的第一印象很好, ...

  3. 软件测试之微软学术搜索(Microsoft Academic Search)

    微软学术搜索:http://academic.research.microsoft.com 测试人员: 北航计算机学院  100616班 胡仁君  100617班 全风楠 我们在软件工程上和其他团队互 ...

  4. how to identify keywords for search on Google Scholar?

  5. 再见,Microsoft Academic——你好,开放式研究基础设施?

    [翻译于 Aaron Tay.Alberto Martín-Martín 和 Sven E. Hug 的<Goodbye, Microsoft Academic – Hello, open re ...

  6. Google数据集搜索神器上线,和搜索论文一样简单 | 还不去训练网络?

    圆栗子 发自 凹非寺  量子位 出品 | 公众号 QbitAI 谷歌数据集搜索工具,上线了. 在发布这个消息的博客里,团队大概表达了这样的意思: 现在啊,许多领域的科学家,每天呼吸的不是空气,是数据集 ...

  7. 从Google Scholar看各大科技公司科研水平

    作者 | Flood Sung 整理 | NewBeeNLP 周末愉快!最近校招开奖季,有同学来问offer选择的问题,分享一篇从Google Scholar来看国内外各大公司科研水平的文章,欢迎讨论 ...

  8. 谷歌推出数据集搜索专用引擎Dataset Search

    谷歌推出数据集搜索专用引擎Dataset Search 9 月 5 日,谷歌发布了一个帮助研究者查找在线数据的免费搜索引擎 Dataset Search.谷歌表示,该引擎面向「科学家.数据记者.数据极 ...

  9. 三大 Windows 文件搜索神器 Everything、Listary、AnyTXT Searcher 功能特色与区别详解

    前言 Everything.Listary 和 AnyTXT Searcher 这三个软件堪称 Windows 电脑三大文件搜索神器,而且都是最好用的! 前两个软件熟悉的人比较多了,AnyTXT 有点 ...

最新文章

  1. 跨年之际,中文版畅销书《TensorFlow深度学习实战大全》分享,直接送!
  2. python 和 matlab的caffe读数据细节
  3. CentOS下python-mysqldb安装
  4. hypermill后处理构造器安装_UG NX后处理安装方法(新手入门)
  5. Microsoft Exchange 2010 安装配置
  6. rtl support
  7. 查看Servlet 3.0的新增功能
  8. 前端学习(607):javascript导读
  9. 二叉树非递归后序遍历算法
  10. 【管理】如何有效管理自己的时间
  11. JBoss + EJB3 + MySql : 开发第一个EJB
  12. 电脑会在哪些地方暴露你的隐私
  13. dao获取到mysql存储函数_GreenDao3.0使用
  14. android 弱网测试工具,app弱网测试及使用的工具
  15. 720s ideapad 黑苹果_Hackintosh 黑苹果长期维护机型 EFI 及安装教程整理
  16. java 获取本机地址_java如何获取本机IP地址
  17. 机器学习中的泛化误差
  18. 三星手机android版本怎么升级,如何在三星Galaxy手机上更新软件
  19. 【自动驾驶】高级辅助驾驶系统与车联网
  20. 热力地图高德_高德地图

热门文章

  1. faker假数据php,Yii2 使用 faker 生成假数据
  2. 小米笔记本适合计算机专业吗,小米电脑笔记本好吗应该选哪个,小米入手使用感受...
  3. 连线:iPhone研发不为人知的故事 原型机纰漏百出-译文~iPhone秘史
  4. htm显示日期与农历 html,获取当前日期和农历的js代码
  5. baxter机器人连接
  6. Praat:强大的语音处理工具。
  7. GM300铁损仪与目前同类机型直读式铁损测试仪的比较
  8. 【英语释疑】et al. 的发音以及全称
  9. 全球与中国1,3-环己二甲胺行业需求动态及投资前景预测报告(2022-2027)
  10. R语言怎么写积分_会员积分规则怎么写?