在这个信息爆炸,而我们还缺乏信息的时代,搜索引擎几乎成了我们日常生活不能或缺的一部分,但是其返回的结果往往不能尽如人意,无法区分相似但不相关信息及无法有针对性的理解用户需求是现阶段搜索引擎的两个大问题。而作为搜索软件的一个特例,学术搜索的结果在这两个方面似乎也没什么长进,甚至更差。比如搜作者,有很多重名的人无法区分,导致一个计算机的研究者名下会有生物的、地理的文章,何其怪哉;搜某一种方法,而这种方法可能在有很多研究方向都会使用,这种情况下用户想要信息会被混在很多的不想要的信息之中,难以挑选。当然这些都是搜索引擎领域很难解决的问题,但是学术搜索相比普通搜索有其特别之处。由于学术的专业性,学术搜索的使用者大多只会搜索与他自己研究方向相关的内容,而这些内容的范围往往很小。比如,研究计算机视觉的使用者,搜索的内容绝大多数都是计算机视觉领域的相关问题,这就为我们解决以上两个问题提供了一个很好的前提条件。

  基于这个特性,我们可以根据用户信息来优化搜索结果。

下面基于NABC模型, 来分析我们的想法:

1) N (Need 需求)

学术搜索用户对于搜索精度,和搜索引擎对用于用户键入关键字理解能力的高要求

2) A (Approach 做法)

最基本容易实现的做法:在用户机器上实现搜索引擎的客户端,或者侧边栏应用等,记录下用户的搜索信息,比如研究方向、方法等,然后进行相关分析,进而对以后用户搜索的关键字、返回结果等进行适当处理以达到精确搜索的结果。

如果有条件的话,可以在搜索引擎上设置用户账号,在搜索引擎内部处理。

3)B (Benefit  好处)

提高了搜索的精度,和对用户的理解能力。例如上面所说的重名的问题,通过对用户研究方向的限定可以排除绝大多数不同领域方向的重名

4) C (Competitors 竞争)

各学术搜索引擎可能有类似小功能,但是似乎没有着重做这方面的内容,所以还是有可以开发的空间

由以上分析我们可以得出一个初步的结论,基于用户信息的学术搜索在可行性及前景方面都有可作为之处。

by Shaoqing

转载于:https://www.cnblogs.com/ustc_msra_ase/archive/2010/12/03/1895747.html

Team Project 设想 -- 基于用户信息的学术搜索相关推荐

  1. 推荐系统:综述【一、基于用户信息】【二、基于物品/内容(CB)】【三、协同过滤(CF):①、基于近邻(User-CF、Item-CF);②、基于模型(隐语义模型/LFM:SVD、pLSA、LDA)】

  2. 微软学术搜索项目 10个版本的历程

    这是我在微软亚洲研究院参与的项目之一, 从 2009 年秋天开始, 我们小组把它从一个研究原型发展为涵盖全学科的学术搜索门户. 它索引了 4千万论文, 2千万作者, 6 大实体类型, 8 种数据可视化 ...

  3. 洞察科技,感知未来:人工智能将如何改变学术搜索?

    科技信息是创新的基础,而学术搜索使得科研工作者可以从海量资料中更快捷.更精准地搜集所需要的信息. 近年来,学术搜索的内涵和外延不断扩大,从文献检索一直扩展到科研人员画像.交叉学科发现.学术趋势分析等. ...

  4. 一直在构建工作空间_基于用户场景构建的建筑工程弱电设计工作设想

    [摘要]因为弱电产品更新速度快,功能差异变化大,往往会出现设计成果同预期有所区别的情况.针对类似情形,文章提出借鉴发展变化更加迅速的互联网行业中产品设计的理念,通过业主方或者设计方构建用户场景的手段, ...

  5. 基于区块链技术的数据安全共享网络体系研究_基于区块链技术的用户信息隐私保护与共享方案...

    随着互联网信息技术的飞速发展,网络数据量迅猛增长,不可避免的数据隐私保护成为用户关注的重点.在金融领域,经历了纸质信息到电子用户交易档案的转变,用户使用云服务器来存储个人数据,但是交易数据包含有众多的 ...

  6. 基于飞书组织架构和用户信息同步构建本地LDAP服务

    目前飞书社交办公应用成为公司日常沟通办公的协作工具,以及作为各种流程的审批处理系统,HR 也会在飞书上去管理所有员工的状态及组织架构. 随着公司内新部署的业务系统越来越多,例如Jenkins.JIRA ...

  7. python爬取微博用户正文_基于Python的新浪微博用户信息爬取与分析

    基于 Python 的新浪微博用户信息爬取与分析 邓文萍 [摘 要] 摘要:本文设计并实现了一个微博用户信息爬取与分析系统 , 利用 Cookie 实现了用户的模拟登录 , 使用 Python 语言的 ...

  8. 爬虫项目实战一:基于Scrapy+MongDB爬取并存储糗事百科用户信息

    爬虫项目实战一:基于Scrapy+MongDB爬取并存储糗事百科用户信息 一.前言 二.项目目标 三.项目的环境配置 四.项目实现 1. 创建QSBK项目 2. 实现Spider 1. 实现一页网页上 ...

  9. 【Java项目】——基于SpringBoot的用户信息管理系统

    一.项目简介 用户信息管理系统: 1.根据权限的不同,将用户角色划分为:超级管理员和普通管理员: 2.当管理员或者普通管理员在登录页面登录成功之后,进入相应的系统主页面,查看到自己权限之内的用户列表信 ...

  10. 实现微信打开网页时,获取当前微信用户信息(Java)(基于snsapi_userinfo方式)

    /*** 1 第一步:用户同意授权,获取code* 2 第二步:通过code换取网页授权access_token* 3 第三步:刷新access_token(如果需要)* 4 第四步:拉取用户信息(需 ...

最新文章

  1. winxp运行html代码,关于WinXP系统实现自动化运行的操作技巧
  2. 微服务开发中的数据架构设计
  3. golang 读写文件的四种方式
  4. python常用的集成开发环境有哪些_python IDE有哪些?哪个好用?
  5. X1000应用程序打包流程
  6. 不要在facelets中重复表情
  7. linux 热拔插硬盘,带电热插拔硬盘造成硬盘故障
  8. 项目实战-使用PySpark处理文本多分类问题
  9. php MySQLDB类
  10. 回调函数的概念及使用
  11. 【2020牛客多校5:D】Drop Voicing(LIS+推理)
  12. TCP和UDP数据包结构
  13. pdf转word转换器绿色版
  14. 问卷:城市名 转换成 城市线:一线、新一线、二三四五线
  15. 主机服务器信息控制台,服务器的监控控制台
  16. 小码哥《恋上数据结构与算法》笔记(十五):哈希表(Hash Table)
  17. 中国语言地图集 c1-12,中国语言地图集介绍——网上收集整理
  18. 使用条件随机场模型解决文本分类问题(附Python代码)
  19. Elastic开源社区:开发者招募
  20. 关于mysql 联表使用count的一个问题

热门文章

  1. 如何在Rancher 2.0上快速部署Datadog
  2. python笔记之循环控制
  3. 网络基础---网络层
  4. 算法题-字符串匹配算法
  5. Redis基础、应用场景、数据结构及案例
  6. moss form验证 配置文件关键部分
  7. 阿里影业“灯塔平台”今日正式启动,阿里影视云解决方案强势推出
  8. 使用jvisualvm通过JMX的方式监控远程JVM运行状况
  9. QA: 自闭合标签要不要手动闭合?
  10. NSObject的load和initialize方法(转)