《Constructing plausible innocuous pseudo queries to protect user query intention》

Information Sciences 325 (2015) 215–226

《构建合理的无害的伪查询来保护用户的查询意图》

摘要:

本文提出了一个基于客户机的方法来保护用户查询意图。主要思想是构建一些合理无害的伪查询放在用户的查询词中,来达到掩盖用户意图的目的。

1. Introduction

本文的方法有两个基本点:

1).不改变原有的收索引擎;

2)此方法的返回结果是查询意图的真实结果的一个超集[注释2],所以不影响性能(准确率和召回率)

未查询词必须具有:合理性、无害性(和真是查询词不相干)

2. Methodology

1)隐私模型(7个定义)Q代表查询空间,P代表话题空间

①Re(q,pi):查询-话题相关度函数,返回值:语义相关性的度量

②P(q)={pi|pi∈P∧Re(q,pi)>λu}:用户意图的组成,其中λu是一个阈值

③Re(p1,p2):话题-话题相关度函数,返回值:语义相关性的度量

④Inn(pi,q):无害性(需要多的话题和查询词无语义相关性)

⑤F(q)= [F(t1),F(t2),...,F(tn) ],where n=|T(q)|and t1,t2,...,tn∈T(q). :q的特征分布

⑥Pla(q1,q2):两个查询词的合理性,由两个词的特征向量分布的相识度来计算

⑦G⊆Q:和查询q有关的一组未查询词

2)方法:

①识别用户意图:Re ( q, p i ) ;为用户查询识别相关意图

②查询无害话题:

③生成伪查询词:

3. Experiment
 
4. Conclusion

改进:1)根据用户一系列查询词而不是单个词来进行保护用户意图

2)使用其它资源库,不只是使用维基百科

注释:

1.a client-based approach:构建一些合理的无害的伪查询和用户的一个查询结合在一起,达到掩盖用户查询意图。

2.Superset(超集):如果一个集合S2中的每一个元素都在集合S1中,且集合S1中可能包含S2中没有的元素,则集合S1就是S2的一个超集。 S1是S2的超集,若S1中一定有S2中没有的元素,则S1是S2的真超集,S2是S1的真子集。

用户意图——《Constructing plausible innocuous pseudo queries to protect user query intention》相关推荐

  1. 比 GPT-3 更擅长理解用户意图,OpenAI发布 InstructGPT

    作者 | 青苹果 来源 | 数据实战派 近日,OpenAI 发布了一项令人瞩目的研究-- InstructGPT. 在这项研究中,相比 GPT-3 而言,OpenAI 采用对齐研究(alignment ...

  2. 最新进展概述:澄清式提问辅助理解信息检索中的用户意图

    ©PaperWeekly 原创 · 作者|金金 单位|阿里巴巴研究实习生 研究方向|推荐系统 用户使用搜索引擎的过程中,通常很难用单一的查询表达复杂的信息需求.在真实应用的过程中,用户需要根据当前搜索 ...

  3. 这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。

    XEIM这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的 ...

  4. 《SEO的艺术(原书第2版)》——3.3 理解搜索引擎流量和用户意图

    3.3 理解搜索引擎流量和用户意图 正如1.1节所讨论的,搜索者会输入许多不同种类的查询.这些查询通常可以分为3个大类. 导航型查询 这种查询的意图是访问一个特定的网站或者网页(例如,有人输入你的公司 ...

  5. 智能语音识别系统_语音识别技术原理_智能语音识别系统如何识别用户意图_企业服务汇...

    编者按:智能语音识别系统目前已经实现商业化应用,广泛应用于客服行业,包括智能语音客服和智能客服呼叫中心.那么智能语音识别系统如何识别客户意图,如何判断智能客服系统的语音识别能力呢?本文我们将结合语音识 ...

  6. 如何来做用户意图识别

    什么是用户意图识别?就是让搜索引擎能够识别出与用户输入的查询最相关的信息,例如用户输入查询"仙剑奇侠传"时,我们知道"仙剑奇侠传"既有游戏又有电视剧还有新闻.图 ...

  7. 基于维基百科的用户意图分类

    关于"用户查询意图分类(识别)",在很久以前就开始关注了,最近开始阅读一些文章.前期得文章中,多半在特征抽取中,提到的都是用其他得资源比如查询日志比较多.今天偶然读了一篇文章,以一 ...

  8. 对话系统-“问答型”单轮对话:FAQ检索式对话系统【步骤:①用户意图判断、②文本检索召回、③文本匹配计算排序】【搜索引擎的最终形态】

    一.基本概念 文本匹配:计算文本之间的相似度,主要分为两大类: 1)基于句子向量表示的相似度模型(适合初始召回): 2)基于词级别匹配的相似度模型(适合对召回结果重排) 问答系统:信息检索的一种高级形 ...

  9. 掌握新技能的义肢-只需通过用户意图就可以移动单个手指

    神经系统与机器对接依靠人体主要有三个部分:大脑.肌肉和周围神经.埃隆-马斯克的Neuralink大脑植入是BCI系统的一个例子,在所有接口系统方法中,侵入性接口尽管提供了最全面的人机交互,但存在较大的 ...

最新文章

  1. 杂记2:VS2013创建Windows服务实现自动发送邮件
  2. python中文编码-python中文编码json中文输出问题
  3. 外观模式(Facade)
  4. MFC多线程各种线程用法 .
  5. TCP/IP(一):数据链路层
  6. 看透这个世界--数据封装与解封装过程
  7. 邮政管理部门发话:未获用户同意投放快递柜属违法行为
  8. HTML+CSS之iframe
  9. (*(void(*)())0)();
  10. java后端使用freemarker生成echarts图表word
  11. coturn NAT穿透服务器搭建
  12. 《数据库原理与应用》复习总结
  13. 智能名片小程序创建名片页功能实现关键代码
  14. A股数据日级前复权数据补全
  15. Android设置TabLayout及下划线宽度
  16. 微信做音乐相册html5,如何制作微信音乐相册 微信音乐相册制作软件的精品教程...
  17. [Objective-C] 010_Foundation框架之NSSet与NSMutableSet
  18. OpenCV开发笔记(六十二):红胖子8分钟带你深入了解亚像素角点检测(图文并茂+浅显易懂+程序源码)
  19. php GD库做水印功能,合并图片
  20. 华大单片机HC32L130 / HC32L136 / HC32F030 系列硬件开发指南

热门文章

  1. 基于AidLux+Yolov8,实现安卓手机检测纺织物瑕疵
  2. 传苹果向三星购买5G基带芯片遭拒;ofo否认破产;阿里大股东宣布清算,抛售全部股份|雷锋早报...
  3. 我的世界java版合成表_《我的世界》基础攻略 JAVA版合成系统详解
  4. mysql中phpmyadmin安装教程_安装phpMyAdmin图文教程
  5. [入门]树(treeview)控件制作导航的做法(三)
  6. Maya的建模小技巧(二)
  7. 网站推广的100个实用方法
  8. 猿人学题库十九题——css加密-雪碧图/数据干扰等——地毯式采坑学习
  9. 杭州职业技术学院:“企业人才智选库”助力恩施职院毕业生就业
  10. 电脑文件夹需要权限才能删除怎么处理?(已解决)